Gerenciar o Lakebase com pacotes de automação declarativa

Este guia ajuda você a começar com Pacotes de Automação Declarativa para gerenciar recursos Lakebase usando infraestrutura como código. Você criará um projeto Lakebase, adicionará uma ramificação de desenvolvimento e endpoint, e aprenderá como gerenciar esses recursos de forma declarativa. Este é um fluxo de trabalho típico para o gerenciamento programático de recursos Databricks em ambientes de desenvolvimento e teste.

Para obter a referência completa do recurso de pacote e todas as opções de configuração disponíveis, consulte recurso de pacote.

nota

postgres_projects é o recurso DABs para escala automática Lakebase . Se você já possui automação usando database_instances, ela continuará funcionando, mas novas instâncias serão criadas como projetos de escalonamento automático Lakebase em vez de instâncias de provisionamento Lakebase . Veja a opção de dimensionamento automático por default.

Pré-requisitos

Antes de começar, você precisa de:

Databricks CLI versão 0.287.0 ou acima. Para verificar a versão instalada, execute databricks -v. Para instalar a CLI do Databricks, consulte Instalar ou atualizar a CLI do Databricks.
Autenticação configurada para seu workspace Databricks . Este guia utiliza a autenticação OAuth de usuário para máquina (U2M). Consulte o tutorial "Configurar o acesso ao seu workspace na CLI Databricks .
CAN MANAGE a permissão em projetos do Lakebase. Consulte as permissões de gerenciamento do projeto.

hierarquia de recursos

Os recursos Lakebase seguem uma hierarquia pai-filho: você cria o recurso pai antes dos filhos. Para o modelo completo de recursos (projetos, filiais, computação, bancos de dados e muito mais), consulte Projetos.

Ordem de operações para este guia: Projeto → Filial → endpoint

1. Criar uma configuração de pacote

Inicialize um pacote configurável usando o padrão -minimal default . Isso cria uma pasta de pacote com um databricks.yml e obtém sua configuração CLI (incluindo o host workspace ).

Bash
databricks bundle init default-minimal

Quando solicitado, insira um nome para o seu projeto de pacote (por exemplo, lakebase-bundle). A CLI cria um diretório com esse nome. Acesse o diretório do pacote:

Bash
cd lakebase-bundle

Modifique seu arquivo databricks.yml para definir um projeto, branch e endpoint do Lakebase. Adicione ou atualize a seção resources (e o nome do pacote, se desejar). Por exemplo:

YAML
bundle:
  name: lakebase-app

resources:
  postgres_projects:
    my_app:
      project_id: 'my-app'
      display_name: 'My Application'
      pg_version: 17
      enable_pg_native_login: false

  postgres_branches:
    dev_branch:
      parent: ${resources.postgres_projects.my_app.id}
      branch_id: 'dev'
      no_expiry: true

  postgres_endpoints:
    dev_endpoint:
      parent: ${resources.postgres_branches.dev_branch.id}
      endpoint_id: 'primary'
      endpoint_type: 'ENDPOINT_TYPE_READ_WRITE'
      autoscaling_limit_min_cu: 0.5
      autoscaling_limit_max_cu: 2

nota

enable_pg_native_login: false é o default para novos projetos. Para permitir que as funções nativas do Postgres se conectem com senhas estáticas, defina-o como true. Consulte Gerenciar conexões de senha.

Sobre o endpoint : Ao criar um projeto Lakebase, Databricks provisiona automaticamente uma branch de produção default com um endpoint de leitura e gravação. No entanto, quaisquer branches adicionais que você criar (como a branch dev acima) devem ter seu endpoint definido explicitamente na configuração do seu pacote.

Os valores project_id, branch_id e endpoint_id devem seguir as regras de nomenclatura de recursos (por exemplo, 1–63 caracteres, letras minúsculas, números e hífenes).

2. Valide o pacote

Verifique se a configuração do pacote é válida:

Bash
databricks bundle validate

Se um resumo da configuração do pacote for retornado, a validação foi bem-sucedida. Se algum erro for retornado, corrija-o e repita este passo. Consulte o comando `databricks bundle validate`.

3. implantar o feixe

Implante o projeto Lakebase em seu workspace Databricks :

Bash
databricks bundle deploy

Isso cria:

Um projeto Lakebase chamado "my-app"
Uma ramificação de produção default com um endpoint de leitura e gravação (criada automaticamente).
Uma ramificação de desenvolvimento chamada "dev"
Um endpoint primário para a branch de desenvolvimento com escalonamento automático de 0,5 a 2 CUs.

Veja pacote de databricks implantado.

4. Verifique a implantação

Confirme se os recursos foram criados:

No seu workspace Databricks , navegue até Lakebase → Projetos .
Clique em Minha Candidatura .
Verifique se você vê duas ramificações:
- produção (padrão) - Criado automaticamente com 1 CU computeprimária
- dev - Criado pelo seu pacote com computede escalonamento automático de 0,5 a 2 CUs

5. Atualize a configuração

Para modificar seu recurso, atualize o arquivo databricks.yml e reimplemente:

Bash
databricks bundle validate
databricks bundle deploy

O pacote atualizará apenas o recurso que foi alterado.

6. Limpar recurso

Quando terminar de usar o projeto Lakebase, você pode excluí-lo para liberar recursos.

O comando padrão para remover um recurso de pacote é databricks bundle destroy. No entanto, esse comando não funciona para projetos Lakebase porque os endpoints de leitura e gravação não podem ser excluídos individualmente. Em vez disso, use a CLI do Databricks para excluir o projeto Lakebase diretamente:

Bash
databricks postgres delete-project projects/my-app

Isso se propaga automaticamente para excluir todos os branches e endpoints.

substituições de recurso

A configuração do pacote usa substituições para referenciar o recurso:

${resources.postgres_projects.my_app.id} - Faz referência ao nome do recurso do projeto Lakebase
${resources.postgres_branches.dev_branch.id} - Faz referência ao nome do recurso da ramificação

Isso garante a ordenação correta das dependências durante a implantação. Para obter mais informações sobre substituições de pacotes, consulte Substituições.

Recurso disponível

Para obter a lista completa de recursos do Lakebase suportados em pacotes e suas opções de configuração, consulte o pacote recurso (postgres_projects, postgres_branches, postgres_endpoints).

gerenciar permissões do projeto

Permissões de projeto (CAN_USE, CAN_MANAGE) não podem ser declaradas em um pacote. O campo permissions não é suportado no recurso postgres_projects . Gerenciar permissões separadamente usando a API de permissões, CLI ou SDK como etapa pós-implantada.

Pré-requisitos​

hierarquia de recursos​

1. Criar uma configuração de pacote​

2. Valide o pacote​

3. implantar o feixe​

4. Verifique a implantação​

5. Atualize a configuração​

6. Limpar recurso​

substituições de recurso​

Recurso disponível​

gerenciar permissões do projeto​

Próximos passos​