escalar para zero
Beta
O Lakebase Postgres (beta com escalonamento automático) é a próxima versão do Lakebase, disponível apenas para avaliação. Para cargas de trabalho de produção, utilize a versão de pré-visualização pública do Lakebase. Consulte a seção "Como escolher entre as versões" para entender qual versão é a mais adequada para você.
O recurso "escala to zero" suspende automaticamente o compute do Lakebase após um período de inatividade, minimizando os custos para bancos de dados que não estão continuamente ativos. Este recurso é particularmente valioso para ambientes de desenvolvimento, teste e homologação, bem como para bancos de dados de produção com períodos de inatividade previsíveis.
Quando a escala para zero está ativada:
- Seu compute será suspenso automaticamente após um período de inatividade (default é de 5 minutos, o mínimo é de 60 segundos).
- Você paga apenas pelo tempo compute ativo, não pelos períodos de parado.
- O compute é reativado automaticamente em algumas centenas de milissegundos quando você executa uma nova consulta.
Este diagrama ilustra o comportamento do escalonamento para zero juntamente com o escalonamento automático, mostrando um período de inatividade seguido de suspensão automática até que o banco de dados seja acessado novamente.

A função "escala to zero" funciona independentemente da função "autoscale". Embora o dimensionamento automático ajuste os recursos compute durante períodos de atividade com base na demanda de carga de trabalho, a opção "escalar para zero" suspende completamente a compute durante períodos de inatividade, reduzindo os custos compute a zero.
Como funciona a redução da escala para zero
Suspensão automática
Quando seu compute permanece inativo — ou seja, não recebe consultas nem conexões — durante o período de tempo limite configurado, o Lakebase o suspende automaticamente. Durante a suspensão:
- O compute não consome recursos e não incorre em custos compute .
- Seus dados permanecem armazenados com segurança e disponíveis.
- strings de conexão e as credenciais permanecem válidas.
- O endpoint compute permanece acessível, mas inativo.
Reativação automática
Quando uma nova consulta ou solicitação de conexão chega a um compute suspenso, o Lakebase o reativa automaticamente. O processo de reativação:
- Não requer intervenção manual.
- Gerencia de forma transparente a solicitação de conexão assim que estiver ativa.
- Restaura o compute ao seu tamanho mínimo configurado (se o dimensionamento automático estiver ativado).
Os aplicativos devem implementar uma lógica de repetição de conexão para lidar adequadamente com o breve período de reativação.
Configuração de tempo limite
Você configura o tempo limite de escalada para zero para controlar a rapidez com que um compute é suspenso após entrar em estado parado. O tempo limite determina o equilíbrio entre:
- Tempos limite mais curtos (60 segundos a 5 minutos) : Uma suspensão mais rápida reduz custos, mas pode causar reativações mais frequentes para cargas de trabalho intermitentes.
- Tempos limite mais longos (5 minutos a 1 hora) : Menos reativações melhoram a experiência do usuário para atividades esporádicas, mas podem aumentar os custos durante períodos prolongados de inatividade.
O tempo limite mínimo é de 60 segundos. O valor máximo é configurável com base no seu caso de uso.
escalar para zero benefícios
- Redução de custos: ao suspender os recursos computacionais inativos, você paga apenas pelo tempo de uso real. Um banco de dados de desenvolvimento usado 8 horas por dia custa um terço do preço de um compute sempre ativo.
- Implantação flexível: o recurso Escala to Zero permite a implantação econômica de múltiplos ambientes. Você pode manter ambientes separados de desenvolvimento, teste, homologação e pré-visualização sem incorrer em custos compute 24 horas por dia, 7 dias por semana, para cada um deles.
- Sem necessidade de gerenciamento manual: o sistema lida automaticamente com a suspensão e reativação, eliminando a necessidade de iniciar e parar manualmente os recursos com base nos padrões de uso.
- Configuração preservada: Todas as configurações compute , detalhes de conexão e configurações de banco de dados permanecem intactas durante a suspensão. Quando o compute é reativado, ele retoma a operação com a mesma configuração.
Configurando a escala para zero
A opção "escalar para zero" pode ser ativada ou desativada para qualquer compute. Quando ativada, essa opção permite configurar o tempo limite de inatividade que aciona a suspensão (default é de 5 minutos e o mínimo é de 60 segundos).
Uma configuração comum é que os ramos de produção tenham o escalonamento para zero desativado para garantir disponibilidade contínua, enquanto os ramos de desenvolvimento o têm ativado para otimizar custos.
Para obter instruções detalhadas sobre como configurar as definições de escala-to-zero, consulte gerenciar compute.
Cenários de escala comum para zero
Ambientes de desenvolvimento e teste
Os branches de desenvolvimento para testar alterações de esquema, validar o pipeline de dados ou experimentar novos recursos normalmente apresentam atividade intermitente. O recurso "escala to zero" suspende automaticamente esses processamentos computacionais durante as noites, fins de semana e entre as sessões de trabalho, reduzindo significativamente os custos.
Ambientes de teste e pré-visualização
Os ambientes de teste usados para validação antes da implantação ou os ambientes de pré-visualização criados para solicitações de pull request frequentemente permanecem inativos entre os ciclos de teste. A escala para zero garante que esses ambientes consumam recursos apenas durante os períodos de teste ativos.
Agentes e aplicaçõesAI com períodos paradoxais
Agentes AI , chatbots ou ferramentas internas que operam em horários comerciais específicos ou apresentam padrões previsíveis de inatividade podem se beneficiar da escalação para zero. O compute é suspenso fora do horário de expediente e reativado automaticamente quando os usuários retornam.
Bancos de dados de aplicativos multi-tenant
Aplicações que atendem a vários clientes podem usar o recurso "escala para zero" para bancos de dados específicos tenant . O processamento de dados para tenants inativos é suspenso automaticamente, reduzindo os custos compute agregados em todos os tenants.
Considerações importantes
Redefinir contexto da sessão
Quando um compute é suspenso e posteriormente reativado, o contexto da sessão é redefinido. Isso inclui:
- Estatísticas na memória e conteúdo do cache
- Tabelas temporárias e declarações preparadas
- Configurações específicas da sessão
- Conjunto de conexões e transações ativas
Se sua aplicação requer dados de sessão persistentes, considere desativar a escalabilidade para zero para manter a disponibilidade contínua compute .
latência de inicialização
O breve período de reativação (normalmente algumas centenas de milissegundos) pode afetar a experiência do usuário na primeira consulta após a suspensão. Para aplicações que exigem tempos de resposta imediatos, você pode:
- Desative a escalação para zero para computação sempre disponível.
- Implementar aviso de conexão em nível de aplicação
- Use períodos de inatividade mais longos para reduzir a frequência de reativação.
comportamento do ramo padrão
A ramificação default (normalmente de produção) tem o escalonamento para zero desativado por default para garantir a disponibilidade contínua. Você pode habilitá-lo se sua carga de trabalho de produção tiver períodos de parado previsíveis, mas considere cuidadosamente o impacto na experiência do usuário.
escalar para zero e escala automática
A escala para zero complementa o autoscale para otimizar tanto o desempenho quanto os custos:
- Durante períodos de alta atividade: o dimensionamento automático ajusta o tamanho compute com base na demanda de carga de trabalho dentro do intervalo configurado, aumentando a escala durante períodos de alta atividade e diminuindo durante períodos de menor carga.
- Durante períodos de inatividade: Após o tempo limite de escalonamento para zero, o compute é totalmente suspenso e os custos compute caem para zero, independentemente do intervalo de escalonamento automático configurado.
- Ao ser reativado: o compute é reiniciado no tamanho mínimo de dimensionamento automático (se o dimensionamento automático estiver ativado), e o dimensionamento automático ajusta os recursos com base na nova carga de trabalho.
Essa combinação maximiza a eficiência: o dimensionamento automático otimiza o uso de recursos durante a atividade, enquanto a redução para zero elimina custos durante a inatividade.
Próximos passos
- Gerencie o computador para aprender como configurar as opções de escalonamento para zero.
- O autodimensionamento permite compreender como o poder computacional ajusta os recursos durante períodos de atividade.
- Ramificações de banco de dados para aprender sobre a criação de ambientes de banco de dados isolados.