Pular para o conteúdo principal

folha de dicas de criação de computação

Este artigo tem o objetivo de fornecer orientações claras e opinativas para a criação do site compute. Usando os tipos certos de compute para seu fluxo de trabalho, o senhor pode melhorar o desempenho e economizar nos custos.

Melhor prática

Impacto

Documentos

Se o senhor for novo no site Databricks, comece usando tipos de instância gerais para todos os fins

Selecionar o tipo de instância apropriado para a carga de trabalho resulta em maior eficiência.

Use o modo de acesso padrão, a menos que a funcionalidade necessária não seja suportada

O computador com modo de acesso padrão pode ser usado por vários usuários com isolamento de dados entre os usuários.

Use os tipos de instância Graviton se estiverem disponíveis

Os tipos de instância com processadores Graviton têm a melhor relação preço/desempenho de qualquer tipo de instância, de acordo com a AWS.

Use os tipos de instância de última geração se houver disponibilidade suficiente

A última geração de tipos de instância oferece o melhor desempenho e o recurso mais recente.

Defina seu equilíbrio de instâncias pontuais e sob demanda com base na rapidez com que o senhor precisa que sua carga de trabalho seja executada

As instâncias pontuais economizam em custos, mas podem afetar o tempo total de execução de uma operação se as instâncias pontuais forem recuperadas.

Escolha o tamanho de seus nós e o número de trabalhadores com base nos tipos de operações que sua carga de trabalho executa

Por exemplo, se você espera muitos embaralhamentos, pode ser mais eficiente usar um único nó grande em vez de vários nós menores.

execução vacuum em um clustering com escalonamento automático definido para 1-4 trabalhadores, em que cada worker tem 8 núcleos. Selecione um driver com entre 8 e 32 núcleos. Aumente o tamanho do driver se você receber erros de falta de memória (OOM).

vacuum As declarações acontecem em duas fases, a segunda das quais é mais intensa para o motorista. Se o senhor não usar o cluster de tamanho correto, as operações poderão causar lentidão e talvez não sejam bem-sucedidas.

Avalie se seus lotes fluxo de trabalho se beneficiariam de Photon

O Photon oferece consultas mais rápidas e reduz seu custo total por carga de trabalho.