escala automática

info

Visualização

Este recurso está em Pré-visualização Pública nas seguintes regiões: us-east-1, us-west-2, eu-west-1.

O Lakebase autoscale é a nova versão do Lakebase com recursos como autoscale compute, escala-to-zero, branching e instant restore. Para comparação de recursos com o provisionamento do Lakebase, veja escolhendo entre versões.

O recurso de dimensionamento automático ajusta dinamicamente a quantidade de recursos compute alocados ao seu ambiente de computação Lakebase em resposta às demandas de carga de trabalho atuais. À medida que sua aplicação experimenta diferentes níveis de atividade ao longo do dia, o dimensionamento automático aumenta automaticamente a capacidade compute durante os períodos de pico de uso e a reduz durante os períodos de menor movimento, eliminando a necessidade de intervenção manual.

Esta visualização mostra como o dimensionamento automático funciona ao longo de um dia típico, com os recursos compute aumentando ou diminuindo conforme a demanda para garantir que seu banco de dados tenha os recursos necessários, ao mesmo tempo que conserva recursos durante os horários de menor movimento.

visualização de escala automática

A função de dimensionamento automático opera dentro de um intervalo definido pelo usuário. Por exemplo, você pode configurar um compute para escalar entre 2 e 8 Unidades de Computação (UCs), com cada UC fornecendo 2 GB de RAM. Seu compute se ajusta automaticamente dentro desses limites com base na carga de trabalho, nunca caindo abaixo do mínimo nem excedendo o máximo, independentemente da demanda.

nota

Provisionamento Lakebase vs escalonamento automático : No provisionamento Lakebase, cada unidade de computação alocou aproximadamente 16 GB de RAM. No Lakebase com escalonamento automático, cada Unidade de Computação (CU) aloca 2 GB de RAM. Essa mudança proporciona opções de dimensionamento mais detalhadas e maior controle de custos.

Como funciona o dimensionamento automático

Ajuste automático de recursos

Ao ativar o dimensionamento automático e definir os tamanhos mínimo e máximo compute , o Lakebase monitora continuamente sua carga de trabalho e ajusta os recursos automaticamente. O sistema monitora três métricas key para tomar decisões de escalabilidade:

Carga da CPU: Monitora a utilização do processador para garantir que seu banco de dados tenha poder de processamento adequado.
Utilização da memória: Monitora o consumo de RAM para evitar limitações de memória.
Tamanho do conjunto de trabalho: Estima os dados acessados com frequência para otimizar o desempenho do cache.

Com base nesses parâmetros, o Lakebase aumenta a capacidade compute quando a demanda aumenta e a reduz quando a atividade diminui, sempre mantendo-se dentro do intervalo configurado.

Limites de escala

Você define o intervalo de escala configurando os tamanhos mínimo e máximo compute . Esta gama oferece:

garantias de desempenho: O mínimo garante o desempenho básico mesmo durante baixa atividade.
Controle de custos: O limite máximo impede o consumo ilimitado de recursos e os consequentes custos.
Otimização automática: Dentro desses limites, o Lakebase lida com todas as decisões de escalabilidade.

Por exemplo, com uma gama de 2 a 8 CUs (4 a 16 GB de RAM), o seu compute aumenta automaticamente para atender à demanda, mas nunca ultrapassa 8 CUs, independentemente da carga.

Sem tempo de inatividade ou intervenção manual

Os ajustes de escala automática ocorrem sem a necessidade de reinicializações compute ou interrupções de conexão. Uma vez configurado, o sistema opera de forma autônoma, permitindo que você se concentre em seus aplicativos em vez do gerenciamento da infraestrutura.

benefícios da balança automática

Relação custo-benefício: você paga apenas pelos recursos compute que realmente utiliza. Durante os horários de menor movimento, o uso de recursos compute é reduzido, diminuindo os custos. Durante os períodos de pico, a demanda aumenta para manter o desempenho.

Otimização de desempenho: Seu banco de dados recebe automaticamente recursos adicionais quando a carga de trabalho aumenta, evitando a degradação do desempenho durante picos de tráfego ou operações intensivas.

Custos previsíveis: Ao definir um tamanho máximo compute , você controla o limite superior dos seus custos compute , evitando despesas inesperadas decorrentes do consumo descontrolado de recursos.

Operações simplificadas: o dimensionamento automático elimina a necessidade de monitorar manualmente os padrões de carga de trabalho e ajustar os tamanhos compute , reduzindo a sobrecarga operacional e o risco de erro humano.

Configurando o dimensionamento automático

A configuração de dimensionamento automático requer a definição de limites mínimos e máximos para o tamanho compute . O dimensionamento automático está disponível para computação de até 32 CUs.

Para obter instruções detalhadas sobre como ativar e configurar o dimensionamento automático, consulte gerenciar computação.

Cenários comuns de dimensionamento automático

AgenteAI e cargas de trabalho de aplicativos

Agentes AI e aplicativos interativos construídos no Databricks frequentemente experimentam padrões de requisição variáveis. O dimensionamento automático garante que seu banco de dados lide com picos de tráfego durante sessões de usuários ativos, reduzindo custos durante períodos de baixa atividade.

Ambientes de desenvolvimento e teste

Os branches de desenvolvimento para testar alterações de esquema ou validar o pipeline de dados normalmente apresentam atividade intermitente. a escala automática minimiza recursos durante períodos de parada, ao mesmo tempo que garante desempenho adequado durante o desenvolvimento ativo.

Painéis e aplicativos voltados para o cliente

Aplicações que fornecem informações analíticas ou operacionais aos usuários finais geralmente apresentam padrões de uso ao longo do dia. O dimensionamento automático ajusta automaticamente os recursos para corresponder à atividade do usuário ao longo do dia.

dimensionamento automático e escala para zero

O autoscale funciona em conjunto com o escala to zero. Embora o dimensionamento automático ajuste os recursos com base na demanda da carga de trabalho, a opção "escalar para zero" suspende completamente um compute após um período de inatividade, reduzindo os custos compute a zero durante os períodos de paralisação.

Ao configurar ambos os recursos:

Período ativo: o dimensionamento automático ajusta o tamanho compute com base na carga de trabalho dentro do intervalo definido.
Período de inatividade: Após o tempo limite de escalonamento para zero, o compute é totalmente suspenso.
Atividade retomada: O compute é reiniciado no tamanho mínimo de dimensionamento automático quando novas consultas chegam.

Essa combinação maximiza a eficiência de custos, especialmente para ambientes de desenvolvimento, teste ou homologação que apresentam longos períodos de inatividade.

Próximos passos

Gerencie o sistema de computação para aprender como habilitar e configurar o dimensionamento automático.
Painel de métricas para view CPU, RAM e tamanho do conjunto de trabalho.
escalar para zero para entender como o processamento pode ser suspenso durante a inatividade
Ramificações de banco de dados para aprender sobre a criação de ambientes de banco de dados isolados.

Como funciona o dimensionamento automático​

Ajuste automático de recursos​

Limites de escala​

Sem tempo de inatividade ou intervenção manual​

benefícios da balança automática​

Configurando o dimensionamento automático​

Cenários comuns de dimensionamento automático​

AgenteAI e cargas de trabalho de aplicativos​

Ambientes de desenvolvimento e teste​

Painéis e aplicativos voltados para o cliente​

dimensionamento automático e escala para zero​

Próximos passos​