Pular para o conteúdo principal

projetos de banco de dados

info

Beta

O Lakebase Postgres (beta com escalonamento automático) é a próxima versão do Lakebase, disponível apenas para avaliação. Para cargas de trabalho de produção, utilize a versão de pré-visualização pública do Lakebase. Consulte a seção "Como escolher entre as versões" para entender qual versão é a mais adequada para você.

Um projeto de banco de dados é o contêiner de nível superior para seu recurso do Lakebase, incluindo branches, computação, bancos de dados e funções. Esta página explica como criar projetos, entender sua estrutura, configurar as definições e gerenciar seu ciclo de vida.

Se você é novo no Lakebase, comece com "Obter início" para criar seu primeiro projeto.

Estrutura do projeto de banco de dados

Compreender a estrutura do projeto Lakebase ajuda você a organizar e gerenciar seus recursos de forma eficaz. Um projeto de banco de dados é o contêiner de nível superior para seus bancos de dados, ramificações, computação e recursos relacionados. Cada projeto inclui configurações para valores padrão compute , janelas de restauração e atualizações que se aplicam a todas as ramificações dentro do projeto.

No nível mais alto, um projeto contém uma ou mais ramificações. Dentro de um projeto, você pode criar ramificações para diferentes ambientes, como desenvolvimento, teste, homologação e produção. Cada filial contém seus próprios recursos computacionais, funções e bancos de dados.

Project
└── Branches (production, development, etc.)
├── Computes (R/W compute)
├── Roles (Postgres roles)
└── Databases (Postgres databases)

Galhos

Os dados residem nas filiais. Cada projeto Lakebase é criado com um ramo raiz chamado production, que não pode ser excluído. Embora seja possível criar ramificações adicionais e designar uma ramificação diferente como ramificação default , a ramificação raiz não pode ser excluída.

Você pode criar ramificações filhas a partir de qualquer ramificação do seu projeto. Ao criar uma ramificação filha, ela herda todos os bancos de dados, funções e dados da ramificação pai no momento da criação. Alterações subsequentes na ramificação principal não se propagam automaticamente para a ramificação filha, permitindo desenvolvimento, teste ou experimentação isolados.

Cada ramificação pode conter vários bancos de dados e funções. Saiba mais: gerenciar agências

calcular

Um compute é um recurso computacional virtualizado que inclui vCPU e memória para executar o Postgres. Ao criar um projeto, um compute primário de leitura/gravação é criado para o branch default do projeto. Cada filial possui um único compute primário de leitura/gravação. Para se conectar a um banco de dados que reside em uma filial, você deve se conectar através do compute leitura/gravação associado à filial.

Além do compute primário de leitura/gravação, você pode adicionar uma ou mais réplicas de leitura (somente leitura) a qualquer ramificação. As réplicas de leitura permitem descarregar cargas de trabalho somente leitura do seu compute principal para casos de uso como escalonamento horizontal de leitura, consultas analíticas e de geração de relatórios, e acesso somente leitura para usuários ou aplicativos. Saiba mais: gerenciar computação, ler réplicas

Funções

Os papéis são papéis do Postgres. É necessário ter uma função para criar e acessar um banco de dados. Uma função pertence a uma filial. Ao criar um projeto, uma função do Postgres é criada automaticamente para sua identidade Databricks (por exemplo, user@databricks.com), que é o proprietário do banco de dados default databricks_postgres . Qualquer função criada na interface do usuário do Lakebase é criada com privilégios databricks_superuser . Existe um limite de 500 funções por filial. Saiba mais: funções gerenciais

Bancos de dados

Um banco de dados é um contêiner para objetos SQL , como esquemas, tabelas, visualizações, funções e índices. No Lakebase, um banco de dados pertence a uma ramificação. O branch default do seu projeto é criado com um banco de dados chamado databricks_postgres. Existe um limite de 500 bases de dados por filial. Saiba mais: gerenciamento de bancos de dados

Esquemas

Todos os bancos de dados no Lakebase são criados com um esquema public , que é o comportamento default para qualquer instância padrão do Postgres. Os objetos SQL são criados no esquema public por default.

Limites do projeto

O Lakebase Postgres impõe os seguintes limites para projetos de banco de dados:

Recursos

Limite

Número máximo de operações de computação ativas simultaneamente

5

Número máximo de filiais por projeto

500

Número máximo de funções do Postgres por branch

500

Número máximo de bancos de dados Postgres por filial

500

Tamanho máximo de dados lógicos por ramificação

8 TB

Número máximo de projetos por workspace

1000

Número máximo de ramos protegidos

5

Número máximo de ramos da raiz

5

Número máximo de instantâneos

10

Período máximo de retenção da história

35 dias

Escalada mínima para tempo zero

60 segundos

limite compute ativa simultaneamente

O limite compute ativa simultaneamente restringe a quantidade de cálculos que podem ser executados ao mesmo tempo para evitar o esgotamento de recursos. Esse limite protege contra picos acidentais de recursos, como iniciar muitos pontos de extremidade compute simultaneamente. O limite default é de 5 processos computacionais ativos simultaneamente por projeto.

Importante: O branch default está isento desse limite, garantindo que permaneça disponível em todos os momentos.

Ao ultrapassar o limite, os recursos computacionais adicionais que excedem esse limite permanecem suspensos e você verá um erro ao tentar se conectar a eles. Para resolver isso:

  1. Suspenda outros processos de computação ativos e tente novamente.
  2. Se você se deparar com esse erro frequentemente, entre em contato com o Suporte da Databricks para solicitar um aumento de limite.
nota

Com o recurso "Escalar para zero" ativado, o processamento computacional é suspenso automaticamente após um período de inatividade, ajudando você a se manter dentro do limite de compute ativo simultaneamente.

Disponibilidade

disponibilidade na nuvem

O Lakebase Postgres (Beta) está atualmente disponível apenas na AWS.

Disponibilidade regional

O Lakebase Postgres (Beta) está disponível nas seguintes regiões da AWS:

  • us-east-1 (Leste dos EUA - Norte da Virgínia)
  • us-west-2 (Oeste dos EUA - Oregon)
  • eu-west-1 (Europa - Irlanda)

Seu projeto Lakebase foi criado na sua região workspace Databricks .

Suporte à versão do Postgres

O Lakebase Postgres (versão beta com escalonamento automático) é compatível com Postgres 16 e Postgres 17.

Criar um projeto de banco de dados

Você pode criar vários projetos de banco de dados no Lakebase Postgres para manter aplicativos ou clientes totalmente isolados, garantindo uma separação clara de dados e recursos.

Para criar um projeto de banco de dados:

  1. Clique no seletor de aplicativos no canto superior direito para abrir o aplicativo Lakebase.
  2. Clique em Novo projeto .
  3. Configure as definições do seu projeto:
    • Nome do projeto : Insira um nome descritivo para o seu projeto. Os padrões de nomenclatura comuns incluem nomear de acordo com o aplicativo (por exemplo, my-analytics-app) ou o cliente ou tenant que o projeto atende (por exemplo, acme-corp-db).
    • Versão do Postgres : Selecione a versão do Postgres que deseja usar.

A caixa de diálogo Criar projeto exibe as opções de configuração do projeto.

Diálogo de criação de projeto

A região do seu projeto Lakebase está definida como a região do seu workspace Databricks e não pode ser modificada.

Um novo projeto inclui o seguinte recurso por default:

  • Dois ramos: production (ramo principal) e development (ramo filho)

  • Um único compute primário de leitura e gravação associado a cada ramificação com as seguintes configurações default :

    Ramo

    Unidades de computação (UC)

    BATER

    Dimensionamento automático

    escalar para zero

    production

    8 - 32 CU

    16 - 64 GB

    Ativada

    Desativada

    development

    2 - 4 CU

    4 - 8 GB

    Ativada

    Ativada

  • Um banco de dados Postgres (chamado databricks_postgres)

  • Uma função do Postgres para sua identidade do Databricks (por exemplo, user@databricks.com)

Para alterar as configurações compute de um projeto existente, consulte Configurar configurações do projeto. Para modificar as configurações compute default para novos projetos, consulte "Configurações de computação padrão" em "Configurar configurações do projeto".

Configurar as definições do projeto

Após criar um projeto, você pode modificar várias configurações no painel de controle do projeto, acessando Configurações :

Configurações gerais

Você pode atualizar o nome do projeto. O ID do projeto não pode ser modificado.

Configurações de nome e ID do projeto

calcular padrão

Defina as configurações iniciais para o computador principal, incluindo:

  • Tamanho do computador (medido em Unidades de Computação)
  • escalar para tempo limite zero (default é 5 minutos)

Essas configurações são usadas quando você cria um novo computador primário.

nota

Para modificar as configurações de um compute existente, consulte gerenciar compute.

O Lakebase Postgres suporta tamanhos compute de 0,5 CU a 32 CU (0,5, seguido de incrementos inteiros: 1, 2, 3... 16, depois 24, 28, 32). Cada Unidade de Computação (UC) fornece 2 GB de RAM.

nota

Lakebase Public Preview vs. Beta com escalonamento automático : No Lakebase Public Preview, cada unidade de computação alocava aproximadamente 16 GB de RAM. Na versão Beta do Lakebase com escalonamento automático, cada Unidade de Computação (CU) aloca 2 GB de RAM. Essa mudança proporciona opções de dimensionamento mais detalhadas e maior controle de custos.

Tamanhos representativos:

Unidades de cálculo

BATER

0,5 CU

1 GB

1 CU

2 GB

4 CU

8 GB

16 CU

32 GB

32 CU

64 GB

  • Para ativar o dimensionamento automático, defina um intervalo de tamanho compute usando o controle deslizante. O dimensionamento automático ajusta dinamicamente os recursos compute com base na demanda da carga de trabalho. Saiba mais: autodimensionamento
  • Ajuste a configuração de "escala para zero" para aumentar ou diminuir o tempo de inatividade compute antes que compute seja suspenso. Você também pode desativar o recurso de escalação para zero para um compute sempre ativo. Saiba mais: Reduzir a escala a zero

configurações padrão de cálculo

Restauração instantânea

Configure a duração da janela de restauração para o seu projeto. Por default, o Lakebase mantém um histórico de alterações para todos os branches do seu projeto, permitindo a restauração pontual para recuperar dados perdidos, consultas de histórico para investigar problemas de dados e ramificação a partir de estados anteriores para otimizar o fluxo de trabalho de desenvolvimento.

Você pode definir o período de restauração de 2 a 35 dias. Observe que:

  • Estender a janela de restauração aumenta seu espaço de armazenamento.
  • A configuração de restauração da janela afeta todas as ramificações do seu projeto.

Restaurar configurações instantaneamente

Atualizações

Para manter suas instâncias de computação e Postgres do Lakebase atualizadas, o Lakebase aplica automaticamente atualizações agendadas, que incluem atualizações de versão secundária do Postgres, patches de segurança e recursos da plataforma. As atualizações são aplicadas aos recursos computacionais do seu projeto e exigem uma breve reinicialização compute , que leva apenas alguns segundos.

As atualizações são aplicadas automaticamente, mas você pode definir um dia e horário preferenciais para que elas sejam realizadas. As reinicializações ocorrem dentro do intervalo de tempo selecionado.

Para obter informações detalhadas sobre atualizações, consulte Atualizações.

Atualiza as configurações

Excluir um projeto

Excluir um projeto é uma ação permanente que também exclui todos os recursos computacionais, ramificações, bancos de dados, funções e dados pertencentes ao projeto.

important

Esta ação não pode ser desfeita. Tenha cuidado ao excluir um projeto de banco de dados, pois isso exclui todas as ramificações e dados associados.

Antes de excluir

A Databricks recomenda excluir todos os catálogos do Unity Catalog e as tabelas sincronizadas associadas antes de excluir o projeto do banco de dados. Caso contrário, tentar view catálogos ou executar consultas SQL que os referenciem resultará em erros.

Se você não for o proprietário das tabelas ou catálogos, deverá reatribuir a propriedade a si mesmo antes de excluí-los.

nota

Na versão beta do Lakebase com escalonamento automático, qualquer identidade Databricks com acesso ao workspace onde o projeto de banco de dados foi criado pode excluir projetos de banco de dados.

Excluir um projeto

Para excluir um projeto:

  1. Acesse as Configurações do seu projeto de banco de dados no aplicativo Lakebase.
  2. Na seção Excluir projeto , clique em Excluir e digite o nome do projeto para confirmar a exclusão.