escala automática
Beta
O Lakebase Postgres (beta com escalonamento automático) é a próxima versão do Lakebase, disponível apenas para avaliação. Para cargas de trabalho de produção, utilize a versão de pré-visualização pública do Lakebase. Consulte a seção "Como escolher entre as versões" para entender qual versão é a mais adequada para você.
O recurso de dimensionamento automático ajusta dinamicamente a quantidade de recursos compute alocados ao seu ambiente de computação Lakebase em resposta às demandas de carga de trabalho atuais. À medida que sua aplicação experimenta diferentes níveis de atividade ao longo do dia, o dimensionamento automático aumenta automaticamente a capacidade compute durante os períodos de pico de uso e a reduz durante os períodos de menor movimento, eliminando a necessidade de intervenção manual.
Esta visualização mostra como o dimensionamento automático funciona ao longo de um dia típico, com os recursos compute aumentando ou diminuindo conforme a demanda para garantir que seu banco de dados tenha os recursos necessários, ao mesmo tempo que conserva recursos durante os horários de menor movimento.

A função de dimensionamento automático opera dentro de um intervalo definido pelo usuário. Por exemplo, você pode configurar um compute para escalar entre 2 e 8 Unidades de Computação (UCs), com cada UC fornecendo 2 GB de RAM. Seu compute se ajusta automaticamente dentro desses limites com base na carga de trabalho, nunca caindo abaixo do mínimo nem excedendo o máximo, independentemente da demanda.
Lakebase Public Preview vs. Beta com escalonamento automático : No Lakebase Public Preview, cada unidade de computação alocava aproximadamente 16 GB de RAM. Na versão Beta do Lakebase com escalonamento automático, cada Unidade de Computação (CU) aloca 2 GB de RAM. Essa mudança proporciona opções de dimensionamento mais detalhadas e maior controle de custos.
Como funciona o dimensionamento automático
Ajuste automático de recursos
Ao ativar o dimensionamento automático e definir os tamanhos mínimo e máximo compute , o Lakebase monitora continuamente sua carga de trabalho e ajusta os recursos automaticamente. O sistema monitora três métricas key para tomar decisões de escalabilidade:
- Carga da CPU: Monitora a utilização do processador para garantir que seu banco de dados tenha poder de processamento adequado.
- Utilização da memória: Monitora o consumo de RAM para evitar limitações de memória.
- Tamanho do conjunto de trabalho: Estima os dados acessados com frequência para otimizar o desempenho do cache.
Com base nesses parâmetros, o Lakebase aumenta a capacidade compute quando a demanda aumenta e a reduz quando a atividade diminui, sempre mantendo-se dentro do intervalo configurado.
Limites de escala
Você define o intervalo de escala configurando os tamanhos mínimo e máximo compute . Esta gama oferece:
- garantias de desempenho: O mínimo garante o desempenho básico mesmo durante baixa atividade.
- Controle de custos: O limite máximo impede o consumo ilimitado de recursos e os consequentes custos.
- Otimização automática: Dentro desses limites, o Lakebase lida com todas as decisões de escalabilidade.
Por exemplo, com uma gama de 2 a 8 CUs (4 a 16 GB de RAM), o seu compute aumenta automaticamente para atender à demanda, mas nunca ultrapassa 8 CUs, independentemente da carga.
Sem tempo de inatividade ou intervenção manual
Os ajustes de escala automática ocorrem sem a necessidade de reinicializações compute ou interrupções de conexão. Uma vez configurado, o sistema opera de forma autônoma, permitindo que você se concentre em seus aplicativos em vez do gerenciamento da infraestrutura.
benefícios da balança automática
Relação custo-benefício: você paga apenas pelos recursos compute que realmente utiliza. Durante os horários de menor movimento, o uso de recursos compute é reduzido, diminuindo os custos. Durante os períodos de pico, a demanda aumenta para manter o desempenho.
Otimização de desempenho: Seu banco de dados recebe automaticamente recursos adicionais quando a carga de trabalho aumenta, evitando a degradação do desempenho durante picos de tráfego ou operações intensivas.
Custos previsíveis: Ao definir um tamanho máximo compute , você controla o limite superior dos seus custos compute , evitando despesas inesperadas decorrentes do consumo descontrolado de recursos.
Operações simplificadas: o dimensionamento automático elimina a necessidade de monitorar manualmente os padrões de carga de trabalho e ajustar os tamanhos compute , reduzindo a sobrecarga operacional e o risco de erro humano.
Configurando o dimensionamento automático
A configuração de dimensionamento automático requer a definição de limites mínimos e máximos para o tamanho compute . O dimensionamento automático está disponível para computação de até 32 CUs.
Para obter instruções detalhadas sobre como ativar e configurar o dimensionamento automático, consulte gerenciar computação.
Cenários comuns de dimensionamento automático
AgenteAI e cargas de trabalho de aplicativos
Agentes AI e aplicativos interativos construídos no Databricks frequentemente experimentam padrões de requisição variáveis. O dimensionamento automático garante que seu banco de dados lide com picos de tráfego durante sessões de usuários ativos, reduzindo custos durante períodos de baixa atividade.
Ambientes de desenvolvimento e teste
Os branches de desenvolvimento para testar alterações de esquema ou validar o pipeline de dados normalmente apresentam atividade intermitente. a escala automática minimiza recursos durante períodos de parada, ao mesmo tempo que garante desempenho adequado durante o desenvolvimento ativo.
Painéis e aplicativos voltados para o cliente
Aplicações que fornecem informações analíticas ou operacionais aos usuários finais geralmente apresentam padrões de uso ao longo do dia. O dimensionamento automático ajusta automaticamente os recursos para corresponder à atividade do usuário ao longo do dia.
dimensionamento automático e escala para zero
O autoscale funciona em conjunto com o escala to zero. Embora o dimensionamento automático ajuste os recursos com base na demanda da carga de trabalho, a opção "escalar para zero" suspende completamente um compute após um período de inatividade, reduzindo os custos compute a zero durante os períodos de paralisação.
Ao configurar ambos os recursos:
- Período ativo: o dimensionamento automático ajusta o tamanho compute com base na carga de trabalho dentro do intervalo definido.
- Período de inatividade: Após o tempo limite de escalonamento para zero, o compute é totalmente suspenso.
- Atividade retomada: O compute é reiniciado no tamanho mínimo de dimensionamento automático quando novas consultas chegam.
Essa combinação maximiza a eficiência de custos, especialmente para ambientes de desenvolvimento, teste ou homologação que apresentam longos períodos de inatividade.
Próximos passos
- Gerencie o sistema de computação para aprender como habilitar e configurar o dimensionamento automático.
- escalar para zero para entender como o processamento pode ser suspenso durante a inatividade
- Ramificações de banco de dados para aprender sobre a criação de ambientes de banco de dados isolados.