escala automática
Lakebase autoscale é a versão mais recente do Lakebase, com recursos como autoscale compute, escala-to-zero, branching e instant restore. Para regiões compatíveis, consulte Disponibilidade por região. Se você é usuário de provisionamento Lakebase , consulte ProvisionamentoLakebase.
O recurso de dimensionamento automático ajusta dinamicamente a quantidade de recursos compute alocados ao seu ambiente de computação Lakebase em resposta às demandas de carga de trabalho atuais. À medida que sua aplicação experimenta diferentes níveis de atividade ao longo do dia, o dimensionamento automático aumenta automaticamente a capacidade compute durante os períodos de pico de uso e a reduz durante os períodos de menor movimento, eliminando a necessidade de intervenção manual.
Esta visualização mostra como o dimensionamento automático funciona ao longo de um dia típico, com os recursos compute aumentando ou diminuindo conforme a demanda para garantir que seu banco de dados tenha os recursos necessários, ao mesmo tempo que conserva recursos durante os horários de menor movimento.

A função de dimensionamento automático opera dentro de um intervalo definido pelo usuário. Por exemplo, você pode configurar um compute para escalar entre 2 e 8 Unidades de Computação (UCs), com cada UC fornecendo 2 GB de RAM. Seu compute se ajusta automaticamente dentro desses limites com base na carga de trabalho, nunca caindo abaixo do mínimo nem excedendo o máximo, independentemente da demanda. O dimensionamento automático está disponível para computação de até 32 CUs.
Provisionamento Lakebase vs escalonamento automático : No provisionamento Lakebase, cada unidade de computação alocou aproximadamente 16 GB de RAM. No Lakebase com escalonamento automático, cada Unidade de Computação (CU) aloca 2 GB de RAM. Essa mudança proporciona opções de dimensionamento mais detalhadas e maior controle de custos.
Como funciona o dimensionamento automático
Ajuste automático de recursos
Ao ativar o dimensionamento automático e definir os tamanhos mínimo e máximo compute , o Lakebase monitora continuamente sua carga de trabalho e ajusta os recursos automaticamente. O sistema monitora três métricas key para tomar decisões de escalabilidade:
- Carga da CPU: Monitora a utilização do processador para garantir que seu banco de dados tenha poder de processamento adequado.
- Utilização da memória: Monitora o consumo de RAM para evitar limitações de memória.
- Tamanho do conjunto de trabalho: Estima os dados acessados com frequência para otimizar o desempenho do cache.
Com base nesses parâmetros, o Lakebase aumenta a capacidade compute quando a demanda aumenta e a reduz quando a atividade diminui, sempre mantendo-se dentro do intervalo configurado.
Limites de escala
Você define o intervalo de escala configurando os tamanhos mínimo e máximo compute . Esta gama oferece:
- garantias de desempenho: O mínimo garante o desempenho básico mesmo durante baixa atividade.
- Controle de custos: O limite máximo impede o consumo ilimitado de recursos e os consequentes custos.
- Otimização automática: Dentro desses limites, o Lakebase lida com todas as decisões de escalabilidade.
A diferença entre o seu máximo e mínimo não pode exceder 16 CU (ou seja, max - min ≤ 16 CU).
Sem tempo de inatividade ou intervenção manual
Os ajustes de escala automática dentro do intervalo configurado ocorrem sem a necessidade de reinicializações compute ou interrupções de conexão. No entanto, alterar a configuração mínima ou máxima da CU pode causar uma breve interrupção nas conexões ativas. Uma vez configurado, o sistema opera de forma autônoma, permitindo que você se concentre em seus aplicativos em vez do gerenciamento da infraestrutura.
benefícios da balança automática
Relação custo-benefício: você paga apenas pelos recursos compute que realmente utiliza. Durante os horários de menor movimento, o uso de recursos compute é reduzido, diminuindo os custos. Durante os períodos de pico, a demanda aumenta para manter o desempenho.
Otimização de desempenho: Seu banco de dados recebe automaticamente recursos adicionais quando a carga de trabalho aumenta, evitando a degradação do desempenho durante picos de tráfego ou operações intensivas.
Custos previsíveis: Ao definir um tamanho máximo compute , você controla o limite superior dos seus custos compute , evitando despesas inesperadas decorrentes do consumo descontrolado de recursos.
Operações simplificadas: o dimensionamento automático elimina a necessidade de monitorar manualmente os padrões de carga de trabalho e ajustar os tamanhos compute , reduzindo a sobrecarga operacional e o risco de erro humano.
Configurando o dimensionamento automático
A configuração de dimensionamento automático requer a definição de limites mínimos e máximos para o tamanho compute . O dimensionamento automático está disponível para computação de até 32 CUs. Para cargas de trabalho que exigem mais de 32 CUs, estão disponíveis capacidades computacionais fixas maiores, de 36 a 112 CUs.
Para obter instruções detalhadas sobre como ativar e configurar o dimensionamento automático, consulte gerenciar computação.
Cenários comuns de dimensionamento automático
AgenteAI e cargas de trabalho de aplicativos
Agentes AI e aplicativos interativos construídos no Databricks frequentemente experimentam padrões de requisição variáveis. O dimensionamento automático garante que seu banco de dados lide com picos de tráfego durante sessões de usuários ativos, reduzindo custos durante períodos de baixa atividade.
Para obter detalhes sobre como conectar Lakebase com Databricks AI e o serviço de aplicativos, consulte IntegraçõesDatabricks.
Ambientes de desenvolvimento e teste
Os branches de desenvolvimento para testar alterações de esquema ou validar o pipeline de dados normalmente apresentam atividade intermitente. a escala automática minimiza recursos durante períodos de parada, ao mesmo tempo que garante desempenho adequado durante o desenvolvimento ativo.
Painéis e aplicativos voltados para o cliente
Aplicações que fornecem informações analíticas ou operacionais aos usuários finais geralmente apresentam padrões de uso ao longo do dia. O dimensionamento automático ajusta automaticamente os recursos para corresponder à atividade do usuário ao longo do dia.
dimensionamento automático e escala para zero
O autoscale funciona em conjunto com o escala to zero. Embora o dimensionamento automático ajuste os recursos com base na demanda da carga de trabalho, a opção "escalar para zero" suspende completamente um compute após um período de inatividade, reduzindo os custos compute a zero durante os períodos de paralisação.
Ao configurar ambos os recursos:
- Período ativo: o dimensionamento automático ajusta o tamanho compute com base na carga de trabalho dentro do intervalo definido.
- Período de inatividade: Após o tempo limite de escalonamento para zero, o compute é totalmente suspenso.
- Atividade retomada: O compute é reiniciado no tamanho mínimo de dimensionamento automático quando novas consultas chegam.
Essa combinação maximiza a eficiência de custos, especialmente para ambientes de desenvolvimento, teste ou homologação que apresentam longos períodos de inatividade.
dimensionamento automático e alta disponibilidade
O dimensionamento automático é compatível com endpoints de alta disponibilidade. Os ajustes de tamanho da CU (Unidade de Computação) se aplicam uniformemente a todos os servidores de computação em uma configuração de alta disponibilidade — o intervalo de dimensionamento automático que você configurar se aplica ao servidor primário e a todos os servidores secundários em conjunto.
Duas restrições se aplicam quando o dimensionamento automático é combinado com alta disponibilidade:
- As contas secundárias não podem aumentar abaixo do tamanho atual da unidade de contagem (UC) da conta primária. Isso garante que os times secundários estejam sempre prontos para assumir o time principal sem que haja uma lacuna de desempenho após a promoção.
- A opção "escala para zero" não está disponível para computação em uma configuração de alta disponibilidade. Para reduzir custos durante períodos de inatividade, considere usar a opção "escala para zero" em branches que não sejam de alta disponibilidade.
Próximos passos
- Gerencie o sistema de computação para aprender como habilitar e configurar o dimensionamento automático.
- Painel de métricas para view CPU, RAM e tamanho do conjunto de trabalho.
- escalar para zero para entender como o processamento pode ser suspenso durante a inatividade
- Alta disponibilidade para entender como o dimensionamento automático funciona em uma configuração de alta disponibilidade.
- Ramificações de banco de dados para aprender sobre a criação de ambientes de banco de dados isolados.
- IntegraçõesDatabricks para conectar Lakebase com Databricks AI e o serviço de aplicativos.