folha de dicas de criação de computação
Este artigo tem o objetivo de fornecer orientações claras e opinativas para a criação do site compute. Usando os tipos certos de compute para seu fluxo de trabalho, o senhor pode melhorar o desempenho e economizar nos custos.
Melhor prática | Impacto | Documentos |
---|---|---|
Se o senhor for novo no site Databricks, comece usando tipos de instância gerais para todos os fins | Selecionar o tipo de instância apropriado para a carga de trabalho resulta em maior eficiência. | |
Use o modo de acesso padrão, a menos que a funcionalidade necessária não seja suportada | O computador com modo de acesso padrão pode ser usado por vários usuários com isolamento de dados entre os usuários. | |
Use os tipos de instância Graviton se estiverem disponíveis | Os tipos de instância com processadores Graviton têm a melhor relação preço/desempenho de qualquer tipo de instância, de acordo com a AWS. | |
Use os tipos de instância de última geração se houver disponibilidade suficiente | A última geração de tipos de instância oferece o melhor desempenho e o recurso mais recente. | |
Defina seu equilíbrio de instâncias pontuais e sob demanda com base na rapidez com que o senhor precisa que sua carga de trabalho seja executada | As instâncias pontuais economizam em custos, mas podem afetar o tempo total de execução de uma operação se as instâncias pontuais forem recuperadas. | |
Escolha o tamanho de seus nós e o número de trabalhadores com base nos tipos de operações que sua carga de trabalho executa | Por exemplo, se você espera muitos embaralhamentos, pode ser mais eficiente usar um único nó grande em vez de vários nós menores. | |
execução vacuum em um clustering com escalonamento automático definido para 1-4 trabalhadores, em que cada worker tem 8 núcleos. Selecione um driver com entre 8 e 32 núcleos. Aumente o tamanho do driver se você receber erros de falta de memória (OOM). | vacuum As declarações acontecem em duas fases, a segunda das quais é mais intensa para o motorista. Se o senhor não usar o cluster de tamanho correto, as operações poderão causar lentidão e talvez não sejam bem-sucedidas. | |
Avalie se seus lotes fluxo de trabalho se beneficiariam de Photon | O Photon oferece consultas mais rápidas e reduz seu custo total por carga de trabalho. |