Pular para o conteúdo principal

escalar para zero

O recurso "escala to zero" suspende automaticamente o compute do Lakebase após um período de inatividade, minimizando os custos para bancos de dados que não estão continuamente ativos. Este recurso é particularmente valioso para ambientes de desenvolvimento, teste e homologação, bem como para bancos de dados de produção com períodos de inatividade previsíveis.

Quando a escala para zero está ativada:

  • Seu compute será suspenso automaticamente após um período de inatividade. O tempo limite de inatividade é definido por padrão para 24 horas e pode ser configurado entre 60 segundos e 7 dias.
  • Você paga apenas pelo tempo compute ativo, não pelos períodos de parado.
  • O compute é reativado automaticamente em algumas centenas de milissegundos quando você executa uma nova consulta.

Este diagrama ilustra o comportamento do escalonamento para zero juntamente com o escalonamento automático, mostrando um período de inatividade seguido de suspensão automática até que o banco de dados seja acessado novamente.

Visualização em escala zero

A função "escala to zero" funciona independentemente da função "autoscale". O dimensionamento automático ajusta os recursos compute durante períodos de atividade com base na demanda de carga de trabalho. A opção "escala to zero" suspende completamente o compute durante períodos de inatividade, reduzindo os custos compute a zero.

Como funciona a redução da escala para zero

Suspensão automática

Quando seu compute permanece inativo (sem receber consultas ou conexões) durante o período de tempo limite configurado, Lakebase o suspende automaticamente. Durante a suspensão:

  • O compute não consome recursos e não incorre em custos compute .
  • Seus dados permanecem armazenados com segurança e disponíveis.
  • strings de conexão e as credenciais permanecem válidas.
  • O endpoint compute permanece acessível, mas inativo.

Reativação automática

Quando uma nova consulta ou solicitação de conexão chega a um compute suspenso, o Lakebase o reativa automaticamente. O processo de reativação:

  • Não requer intervenção manual.
  • Gerencia de forma transparente a solicitação de conexão após se tornar ativa.
  • Restaura o compute ao seu tamanho mínimo configurado (se o dimensionamento automático estiver ativado).

Os aplicativos devem implementar uma lógica de repetição de conexão para lidar adequadamente com o breve período de reativação.

Configuração de tempo limite

Você configura o tempo limite de escalada para zero para controlar a rapidez com que um compute é suspenso após entrar em estado parado. Você pode definir um intervalo entre 60 segundos (1 minuto) e 7 dias. O tempo limite determina o equilíbrio entre:

  • Tempos limite mais curtos (da ordem de minutos) : Uma suspensão mais rápida reduz custos, mas pode causar reativações mais frequentes para cargas de trabalho intermitentes.
  • Tempos limite mais longos (horas a dias) : Menos reativações melhoram a experiência do usuário para atividades esporádicas. O tempo limite default de 24 horas é adequado para a maioria dos bancos de dados de produção. Você pode estender o período até o máximo de 7 dias quando desejar que o compute permaneça ativo por mais tempo durante períodos de parado.

escalar para zero benefícios

  • Redução de custos: ao suspender os recursos computacionais inativos, você paga apenas pelo tempo de uso real. Um banco de dados de desenvolvimento usado 8 horas por dia custa um terço do preço de um compute sempre ativo.
  • Implantação flexível: o recurso Escala to Zero permite a implantação econômica de múltiplos ambientes. Você pode manter ambientes separados de desenvolvimento, teste, homologação e pré-visualização sem incorrer em custos compute 24 horas por dia, 7 dias por semana, para cada um deles.
  • Sem necessidade de gerenciamento manual: o sistema lida automaticamente com a suspensão e reativação, eliminando a necessidade de iniciar e parar manualmente os recursos com base nos padrões de uso.
  • Configuração preservada: Todas as configurações compute , detalhes de conexão e configurações de banco de dados permanecem intactas durante a suspensão. Quando o compute é reativado, ele retoma a operação com a mesma configuração.

Configure a escala para zero.

A opção "escala para zero" pode ser ativada ou desativada para qualquer compute. Ao ativar essa opção, você configura o tempo limite de inatividade que aciona a suspensão. O default é de 24 horas, e o intervalo permitido é de 60 segundos a 7 dias.

O tempo limite default de 24 horas funciona bem para a maioria dos bancos de dados, reduzindo custos durante períodos prolongados de inatividade e mantendo as reativações pouco frequentes. Se sua carga de trabalho exigir disponibilidade contínua sem latência startup , desative o recurso de escalonamento automático para zero nesse compute. Para branches de desenvolvimento, tempos limite mais curtos, como 30 minutos, reduzem ainda mais os custos.

Para obter instruções detalhadas sobre como configurar as definições de escala-to-zero, consulte gerenciar compute.

Cenários de escala comum para zero

Ambientes de desenvolvimento e teste

Os branches de desenvolvimento para testar alterações de esquema, validar o pipeline de dados ou experimentar novos recursos normalmente apresentam atividade intermitente. O recurso "escala to zero" suspende automaticamente esses processamentos computacionais durante as noites, fins de semana e entre as sessões de trabalho, reduzindo significativamente os custos.

Ambientes de teste e pré-visualização

Os ambientes de teste usados para validação antes da implantação ou os ambientes de pré-visualização criados para solicitações de pull request frequentemente permanecem inativos entre os ciclos de teste. A escala para zero garante que esses ambientes consumam recursos apenas durante os períodos de teste ativos.

Agentes e aplicaçõesAI com períodos paradoxais

Agentes AI , chatbots ou ferramentas internas que operam em horários comerciais específicos ou apresentam padrões previsíveis de inatividade podem se beneficiar da escalação para zero. O compute é suspenso fora do horário de expediente e reativado automaticamente quando os usuários retornam.

Bancos de dados de aplicativos multi-tenant

Aplicações que atendem a vários clientes podem usar o recurso "escala para zero" para bancos de dados específicos tenant . O processamento de dados para tenants inativos é suspenso automaticamente, reduzindo os custos compute agregados em todos os tenants.

Considerações importantes

Redefinir contexto da sessão

Quando um compute é suspenso e posteriormente reativado, o contexto da sessão é redefinido. Isso inclui:

  • Estatísticas na memória e conteúdo do cache
  • Tabelas temporárias e declarações preparadas
  • Configurações específicas da sessão
  • Conjunto de conexões e transações ativas

Se sua aplicação requer dados de sessão persistentes, considere desativar o recurso de escalabilidade para zero a fim de manter a disponibilidade contínua compute .

latência de inicialização

O breve período de reativação (normalmente algumas centenas de milissegundos) pode afetar a experiência do usuário na primeira consulta após a suspensão. Para aplicações que exigem tempos de resposta imediatos, você pode:

  • Desative a escalabilidade para zero para garantir disponibilidade constante de recursos computacionais.
  • Implementar aviso de conexão em nível de aplicação
  • Use períodos de inatividade mais longos para reduzir a frequência de reativação.

Comportamento do ramo de produção

Ao criar um projeto, a ramificação production é criada com a opção de escalar para zero ativada por default, com um tempo limite de inatividade de 24 horas. Você pode ajustar o tempo limite ou desativar o escalonamento para zero na ramificação de produção se sua carga de trabalho exigir disponibilidade contínua.

escalar para zero e escala automática

A escala para zero complementa o autoscale para otimizar tanto o desempenho quanto os custos:

  • Durante períodos de alta atividade: o dimensionamento automático ajusta o tamanho compute com base na demanda de carga de trabalho dentro do intervalo configurado, aumentando a escala durante períodos de alta atividade e diminuindo durante períodos de menor carga.
  • Durante períodos de inatividade: Após o tempo limite de escalonamento para zero, o compute é totalmente suspenso e os custos compute caem para zero, independentemente do intervalo de escalonamento automático configurado.
  • Ao ser reativado: o compute é reiniciado no tamanho mínimo de dimensionamento automático (se o dimensionamento automático estiver ativado), e o dimensionamento automático ajusta os recursos com base na nova carga de trabalho.

Essa combinação maximiza a eficiência: o dimensionamento automático otimiza o uso de recursos durante a atividade, enquanto a redução para zero elimina custos durante a inatividade.

Próximos passos

  • Configure as definições de escalonamento para zero : Saiba como ativar, ajustar ou desativar o escalonamento para zero no seu sistema computacional. Veja escalar para zero.
  • Visualizar métricas compute : Veja como as métricas refletem períodos compute inativa e o comportamento de escalonamento para zero. Consulte o painel de métricas.
  • Autodimensionamento : Entenda como o processamento ajusta os recursos durante períodos de atividade intensa. See autoscale.
  • Ramificações de banco de dados : Crie ambientes de banco de dados isolados para desenvolvimento e teste. Ver Ramos.