Pular para o conteúdo principal

Conceitos básicos

O Lakebase é construído sobre um conjunto de recursos que permitem desenvolver, testar e escalar suas aplicações de banco de dados de forma eficiente. Esta seção apresenta os conceitos fundamentais que diferenciam o Lakebase dos sistemas de banco de dados tradicionais.

Projetos

Um projeto Lakebase é o contêiner de nível superior para todos os seus recursos de banco de dados. Cada projeto pertence a um workspace Databricks e contém uma ou mais ramificações, cada uma com seus próprios compute e bancos de dados.

Project
└── Branch (e.g., production)
├── Compute (read-write)
└── Database (e.g., databricks_postgres)

Saiba mais: Projetos | gerenciar projetos

escala automática

O Lakebase ajusta automaticamente os recursos compute com base nas demandas da sua carga de trabalho. Conforme o tráfego do seu aplicativo aumenta ou diminui, o recurso compute escala para cima ou para baixo dentro do intervalo configurado, sem intervenção manual ou tempo de inatividade.

Principais benefícios:

  • Ajuste automático: recurso escala com base na demanda real.
  • Sem tempo de inatividade: o escalonamento dentro do intervalo configurado ocorre sem interromper as conexões. No entanto, alterar a configuração mínima ou máxima da CU pode causar uma breve interrupção.
  • Otimização de custos: pague apenas pelo recurso que você realmente utiliza.
  • consistência de desempenho: Mantenha o desempenho responsivo durante picos de tráfego.

Saiba mais: dimensionamento automático | Configurar dimensionamento automático

escalar para zero

Quando seu banco de dados está parado, o Lakebase pode reduzir automaticamente os recursos compute a zero, eliminando custos com capacidade não utilizada. Quando a atividade for retomada, seu compute aumentará automaticamente de volta à capacidade máxima em segundos.

Principais benefícios:

  • Custos zero de parado: Sem cobranças compute quando seu banco de dados estiver inativo.
  • Retomada instantânea: os bancos de dados são ativados automaticamente quando acessados.
  • Ideal para desenvolvimento: Perfeito para ambientes de desenvolvimento e teste com uso intermitente.
  • Gestão automática: Não requer intervenção manual.

Saiba mais: escalar para zero | Configurar escalar para zero

Ramos do banco de dados

Os branches de banco de dados no Lakebase funcionam de maneira semelhante aos branches do Git para o seu código. Você pode criar ramificações isoladas e instantâneas para desenvolvimento, teste ou experimentação sem duplicar dados ou afetar seu ambiente de produção.

Principais benefícios:

  • Criação instantânea: as ramificações são criadas em segundos usando a tecnologia copy-on-write.
  • Relação custo-benefício: Somente os dados modificados são armazenados separadamente, minimizando os custos de armazenamento.
  • Ambientes isolados: Teste alterações com segurança sem afetar seu banco de dados principal.
  • Colaboração facilitada: os membros da equipe podem trabalhar em ramificações separadas simultaneamente.

Saiba mais: Filiais de banco de dados | Gerenciar filiais

computação e ponto final

Um endpoint do Lakebase é o ponto de conexão estável que seu aplicativo usa para acessar um banco de dados. Por trás de cada endpoint, uma ou mais instâncias compute lidam com o processamento de consultas. Suas strings de conexão permanecem as mesmas mesmo ao aumentar os recursos compute ou adicionar alta disponibilidade.

Normalmente, uma ramificação possui um endpoint de leitura e gravação (seu compute principal) e, opcionalmente, um ou mais pontos de extremidade somente leitura (réplicas de leitura).

Saiba mais: computação e endpoint | gerenciar computação

Alta disponibilidade

A alta disponibilidade combina um compute primário de leitura/gravação com uma ou mais instâncias compute secundárias distribuídas em diferentes zonas de disponibilidade. Quando o servidor primário fica indisponível, um servidor secundário é automaticamente promovido e sua aplicação continua a partir da última transação confirmada. Suas strings de conexão permanecerão inalteradas durante todo o processo.

Principais benefícios:

  • Failover automático: Uma instância compute secundária é promovida sem intervenção manual.
  • Sem perda de dados: o failover preserva todas as transações confirmadas.
  • strings de conexão estáveis: Seu aplicativo não precisa alterar a configuração de conexão após uma falha.

Saiba mais: Alta disponibilidade | gerenciar alta disponibilidade

Leia as réplicas

As réplicas de leitura são unidades de computação independentes, somente para leitura, que executam operações de leitura nos mesmos dados que sua compute primária de leitura e gravação. Ao contrário das réplicas tradicionais, as réplicas de leitura do Lakebase não duplicam dados — elas leem da mesma camada de armazenamento, permitindo a criação instantânea e eliminando custos adicionais de armazenamento.

Principais benefícios:

  • Escalabilidade horizontal: Distribua as solicitações de leitura entre várias réplicas.
  • Sem duplicação de dados: Todas as réplicas leem do mesmo armazenamento.
  • Criação instantânea: Disponível em segundos, sem necessidade de copiar dados.
  • Custo-benefício: Sem custos adicionais de armazenamento, além de suporte para escalonamento automático e redução gradual de custos.

Saiba mais: Leia as réplicas | Gerenciar leia as réplicas

Como eles trabalham juntos

Esses conceitos fundamentais trabalham em conjunto para criar uma plataforma de banco de dados poderosa e flexível:

  1. Os projetos organizam todos os seus recursos de banco de dados e pertencem a um workspace Databricks .
  2. O dimensionamento automático garante que cada filial tenha a quantidade certa de compute com base na demanda.
  3. O recurso escala-to-zero reduz os custos em branches do Parado, suspendendo compute quando não estiver em uso.
  4. Os branches de banco de dados permitem criar ambientes isolados para desenvolvimento e teste sem duplicar dados.
  5. Os recursos de computação e endpoint fornecem pontos de conexão estáveis à medida que você expande ou reconfigura sua infraestrutura.
  6. A alta disponibilidade adiciona failover automático entre zonas de disponibilidade para cargas de trabalho de produção.
  7. As réplicas de leitura distribuem o tráfego de leitura entre instâncias compute adicionais.

Essa arquitetura permite criar e escalar aplicações de banco de dados com maior flexibilidade, custos mais baixos e menos sobrecarga operacional do que os sistemas de banco de dados tradicionais.