Conceitos básicos

O Lakebase é construído sobre um conjunto de recursos que permitem desenvolver, testar e escalar suas aplicações de banco de dados de forma eficiente. Esta seção apresenta os conceitos fundamentais que diferenciam o Lakebase dos sistemas de banco de dados tradicionais.

Projetos

Um projeto Lakebase é o contêiner de nível superior para todos os seus recursos de banco de dados. Cada projeto pertence a um workspace Databricks e contém uma ou mais ramificações, cada uma com seus próprios compute e bancos de dados.

Project
└── Branch (e.g., production)
    ├── Compute (read-write)
    └── Database (e.g., databricks_postgres)

Saiba mais: Projetos | gerenciar projetos

escala automática

O Lakebase ajusta automaticamente os recursos compute com base nas demandas da sua carga de trabalho. Conforme o tráfego do seu aplicativo aumenta ou diminui, o recurso compute escala para cima ou para baixo dentro do intervalo configurado, sem intervenção manual ou tempo de inatividade.

Principais benefícios:

Ajuste automático: recurso escala com base na demanda real.
Tempo de inatividade zero: O dimensionamento dentro da sua faixa configurada ocorre sem interromper as conexões. No entanto, a alteração da configuração mínima ou máxima da CU pode causar uma breve interrupção.
Otimização de custos: pague apenas pelo recurso que você realmente utiliza.
consistência de desempenho: Mantenha o desempenho responsivo durante picos de tráfego.

Saiba mais: dimensionamento automático | Configurar dimensionamento automático

escalar para zero

Quando seu banco de dados está parado, o Lakebase pode reduzir automaticamente os recursos compute a zero, eliminando custos com capacidade não utilizada. Quando a atividade for retomada, seu compute aumentará automaticamente de volta à capacidade máxima em segundos.

Principais benefícios:

Custos zero de parado: Sem cobranças compute quando seu banco de dados estiver inativo.
Retomada instantânea: os bancos de dados são ativados automaticamente quando acessados.
Ideal para desenvolvimento: Perfeito para ambientes de desenvolvimento e teste com uso intermitente.
Gestão automática: Não requer intervenção manual.

Saiba mais: escalar para zero | Configurar escalar para zero

Ramos do banco de dados

Os branches de banco de dados no Lakebase funcionam de maneira semelhante aos branches do Git para o seu código. Você pode criar ramificações isoladas e instantâneas para desenvolvimento, teste ou experimentação sem duplicar dados ou afetar seu ambiente de produção.

Principais benefícios:

Criação instantânea: as ramificações são criadas em segundos usando a tecnologia copy-on-write.
Relação custo-benefício: Somente os dados modificados são armazenados separadamente, minimizando os custos de armazenamento.
Ambientes isolados: Teste alterações com segurança sem afetar seu banco de dados principal.
Colaboração: os integrantes da equipe podem trabalhar em ramificações separadas simultaneamente.

Saiba mais: Filiais de banco de dados | Gerenciar filiais

computação e ponto final

Um endpoint do Lakebase é o ponto de conexão estável que seu aplicativo usa para acessar um banco de dados. Por trás de cada endpoint, uma ou mais instâncias compute lidam com o processamento de consultas. Suas strings de conexão permanecem as mesmas mesmo ao aumentar os recursos compute ou adicionar alta disponibilidade.

Normalmente, uma ramificação possui um endpoint de leitura e gravação (seu compute principal) e, opcionalmente, um ou mais pontos de extremidade somente leitura (réplicas de leitura).

Saiba mais: computação e endpoint | gerenciar computação

Arquitetura de armazenamento

Lakebase armazena dados em uma camada de armazenamento distribuída que é separada do compute. Armazenamento é redundante por zona e persiste independentemente do status do compute, esteja o compute em execução, em pausa ou em failover. Essa separação de armazenamento permite ramificações instantâneas, réplicas de leitura e escala até zero sem duplicação de dados.

Principais benefícios:

Armazenamento altamente disponível: O Databricks mantém o armazenamento altamente disponível independentemente da sua configuração de compute de HA.
Persiste através de alterações de compute: O armazenamento permanece disponível durante falhas de compute, pausas ou alterações de configuração.
**Base para ramificações e réplicas:** A criação instantânea de ramificações e as réplicas de leitura dependem de várias instâncias de compute compartilhando a mesma camada de armazenamento.

Saiba mais: arquitetura de armazenamento

Alta disponibilidade

A alta disponibilidade associa um compute primário de leitura/gravação a uma ou mais instâncias de compute secundárias distribuídas por zonas de disponibilidade. Quando o principal se torna indisponível, a Lakebase automaticamente promove um secundário e seu aplicativo continua da última transação confirmada. Sua string de conexão permanece inalterada. O armazenamento já está altamente disponível. Habilitar HA adiciona redundância em nível de compute para failover automático.

Principais benefícios:

Failover automático: o Lakebase promove uma instância de compute secundária sem intervenção manual.
Sem perda de dados: o failover preserva todas as transações confirmadas.
strings de conexão estáveis: Seu aplicativo não precisa alterar a configuração de conexão após uma falha.

Saiba mais: Alta disponibilidade | gerenciar alta disponibilidade

Leia as réplicas

As réplicas de leitura são unidades de computação independentes, somente para leitura, que executam operações de leitura nos mesmos dados que sua compute primária de leitura e gravação. Ao contrário das réplicas tradicionais, as réplicas de leitura do Lakebase não duplicam dados — elas leem da mesma camada de armazenamento, permitindo a criação instantânea e eliminando custos adicionais de armazenamento.

Principais benefícios:

Escalabilidade horizontal: Distribua as solicitações de leitura entre várias réplicas.
Sem duplicação de dados: Todas as réplicas leem do mesmo armazenamento.
Criação instantânea: Disponível em segundos, sem necessidade de copiar dados.
Custo-benefício: Sem custos adicionais de armazenamento, além de suporte para escalonamento automático e redução gradual de custos.

Saiba mais: Leia as réplicas | Gerenciar leia as réplicas

Como eles trabalham juntos

Esses conceitos fundamentais trabalham em conjunto para criar uma plataforma de banco de dados poderosa e flexível:

Projetos organizam todos os seus recursos de banco de dados e pertencem a um workspace do Databricks.
O dimensionamento automático garante que cada filial tenha a quantidade certa de compute com base na demanda.
O recurso escala-to-zero reduz os custos em branches do Parado, suspendendo compute quando não estiver em uso.
Os branches de banco de dados permitem criar ambientes isolados para desenvolvimento e teste sem duplicar dados.
Os recursos de computação e endpoint fornecem pontos de conexão estáveis à medida que você expande ou reconfigura sua infraestrutura.
A arquitetura de armazenamento mantém seus dados com redundância de zona e altamente disponíveis, independentemente do estado do compute.
Alta disponibilidade adiciona redundância no nível do compute e failover automático entre zonas de disponibilidade para cargas de trabalho de produção.
As réplicas de leitura distribuem o tráfego de leitura entre instâncias compute adicionais.

Essa arquitetura permite criar e escalar aplicações de banco de dados com maior flexibilidade, custos mais baixos e menos sobrecarga operacional do que os sistemas de banco de dados tradicionais.

Projetos​

escala automática​

escalar para zero​

Ramos do banco de dados​

computação e ponto final​

Arquitetura de armazenamento​

Alta disponibilidade​

Leia as réplicas​

Como eles trabalham juntos​

Projetos

escala automática

escalar para zero

Ramos do banco de dados

computação e ponto final

Arquitetura de armazenamento

Alta disponibilidade

Leia as réplicas

Como eles trabalham juntos