Pular para o conteúdo principal

Comportamento de dimensionamento, escala e enfileiramento do SQL warehouse

Este artigo explica como dimensionar, escalonar e gerenciar filas de consulta para Databricks SQL warehouses para otimizar o desempenho e o custo. Databricks recomenda o uso de um serverless SQL warehouse para a maioria das cargas de trabalho. O armazém sem servidor SQL oferece o melhor desempenho e eficiência ao gerenciar dinamicamente o recurso para suas consultas.

sem servidor SQL warehouse management

O armazém sem servidor SQL usa o Intelligent Workload Management (IWM) para gerenciar automaticamente as cargas de trabalho de consulta. O IWM é um conjunto de recursos com tecnologia AIque processa consultas de forma rápida e econômica sem exigir que o senhor gerencie a infraestrutura.

Gerenciamento inteligente de carga de trabalho e dimensionamento automático

O IWM usa o modelo de aprendizado de máquina para gerenciar dinamicamente o recurso compute:

  • Quando uma nova consulta chega, o IWM prevê seus requisitos de recurso e verifica a capacidade disponível.

    • Se houver capacidade, a consulta começará imediatamente.
    • Caso contrário, a consulta será colocada em uma fila.
  • O IWM monitora continuamente a fila. Se o tempo de espera aumentar, o autoscaler provisionará rapidamente mais clustering para processar as consultas em fila.

  • Quando a demanda cai, a IWM reduz o recurso para reduzir os custos, mantendo a capacidade suficiente para lidar com os picos de carga recentes.

Essa abordagem fornece:

  • Aumento rápido de escala para manter a baixa latência de consulta.
  • Alta taxa de transferência, admitindo consultas assim que o hardware estiver disponível.
  • Redução rápida de escala para economizar custos durante a baixa demanda.

Dimensionando um serverless SQL warehouse

tamanho do clustering (por exemplo, X-Small, Medium, Large) determina o compute recurso disponível para um único clustering. O autoscaler adiciona ou remove o clustering desse tamanho conforme necessário.

Use as diretrizes a seguir para ajudar a escolher o tamanho certo:

  • começar com um único depósito maior e deixar que o serverless recurso gerencie a simultaneidade e o desempenho. Geralmente, é mais eficiente reduzir o tamanho, se necessário, do que começar pequeno e aumentar a escala.
  • Se as consultas estiverem sendo transferidas para o disco, aumente o tamanho do clustering. Verifique se há vazamentos no perfil de consulta.
  • Para cargas de trabalho com muitas consultas concorrentes, configure um número máximo suficiente de clustering para lidar com cargas de pico. Monitore as métricas de Peak Queued Queries na página de monitoramento do warehouse.
nota

Para serverless SQL warehouse, os tamanhos de clustering podem, em alguns casos, usar tipos de instância diferentes dos listados na documentação para pro e classic SQL warehouse para tamanho de clustering equivalente. Em geral, a relação preço/desempenho dos tamanhos de clustering para o serverless SQL warehouse é semelhante à do pro e do classic SQL warehouse.

monitoramento warehouse desempenho

O senhor pode monitorar e dimensionar corretamente qualquer SQL warehouse usando essas ferramentas. O número máximo de consultas em uma fila para todos os tipos de depósito é 1.000.

  • página de monitoramento: Na página SQL warehouse monitoramento tab, verifique Peak Queued Queries (Consultas de pico enfileiradas ). Um valor consistente acima de 0 indica que o senhor pode precisar de um tamanho maior de clustering ou de mais clustering.
  • Histórico de consultas: Analise o desempenho histórico da consulta para identificar gargalos.
  • Perfil da consulta: Inspecionar os planos de execução em busca de métricas como Bytes spilled to disk , o que indica que o tamanho do warehouse pode ser muito pequeno.

Armazém clássico e profissional SQL

Os depósitos clássicos e profissionais usam um modelo de dimensionamento manual em que o usuário configura o número de clusters.

Dimensionamento e provisionamento de clustering

Ao criar um depósito clássico ou profissional, escolha um tamanho de cluster e defina o número mínimo e máximo de cluster. Essas SKUs têm um limite fixo de um clustering para cada 10 consultas concorrentes.

Tamanho do cluster

Tipo de instância do driver

contagem de trabalhadores

Total de vCPU

Total de SSD de disco persistente (TB)

Total local SSD (TB)

XXS

n2-highmem-8

1 x n2-highmem-8

16

.2

1.5

XS

n2-highmem-8

2 x n2-highmem-8

24

.3

2,25

Pequeno

n2-highmem-16

4 x n2-highmem-8

48

5.

4.5

Médio

n2-highmem-32

8 x n2-highmem-8

96

9.

9

Grande

n2-highmem-32

16 x n2-highmem-8

160

1.7

18

X-Large

n2-highmem-64

32 x n2-highmem-8

320

3.3

30

XXL

n2-highmem-64

64 x n2-highmem-8

576

6.5

54

XXXL

n2-highmem-64

128 x n2-highmem-8

1088

12,9

102

XXXXL

n2-highmem-64

256 x n2-highmem-8

2112

25,7

198

O tamanho da instância de todos os trabalhadores é n2-highmem-8.

nota

As informações dessa tabela podem variar de acordo com a disponibilidade do produto ou região e o tipo de workspace.

Compute Engine API requisitos de cota

Os campos de cota relevantes do Compute Engine API são:

  • CPUs N2
  • Disco persistente SSD (GB)
  • SSD local (GB)

Para obter mais informações sobre os requisitos de cota, consulte o mecanismo de computação API.

atenção

SQL O warehouse não começará se o senhor não provisionar a CPU e o recurso de armazenamento necessários. Consulte o mecanismo de computação API. Se necessário, o senhor pode aumentar as cotas de recurso para apoiar o uso do SQL warehouse. Consulte Revisar e aumentar as cotas. Para obter informações sobre o custo do workspace, consulte o custo por workspace.

Lógica de enfileiramento e autoescala

Para armazéns clássicos e profissionais, o autoscale adiciona clustering com base no tempo estimado para processar todas as consultas em execução e em fila:

  • 2 a 6 minutos de carga de consulta: Adicionar 1 clustering.
  • 6-12 minutos: Adicionar 2 agrupamentos.
  • 12 a 22 minutos: Adicionar 3 agrupamentos.
  • Mais de 22 minutos: Adicione 3 clusters e mais 1 para cada 15 minutos adicionais de carga.

Regras adicionais:

  • Se uma consulta aguardar na fila por 5 minutos, o armazém aumenta.
  • Se a carga permanecer baixa por 15 minutos consecutivos, o armazém reduz ao mínimo necessário para lidar com o pico de carga daquele período.