Automatize a configuração Unity Catalog usando o Terraform

Você pode automatizar a configuração Unity Catalog usando o provedor Databricks Terraform. Este artigo fornece links para o guia de implantação Unity Catalog do provedor Terraform e documentação de referência de recursos, juntamente com requisitos (“Antes de começar”) e dicas de validação e implantação.

Antes de começar

Para automatizar a configuração do Unity Catalog usando o Terraform, você deve ter o seguinte:

Para usar o provedor Databricks Terraform para configurar um metastore para Unity Catalog, armazenamento para o metastore, qualquer armazenamento externo e todas as suas credenciais de acesso relacionadas, você deve ter o seguinte:

  • Uma conta do AWS.

  • Uma conta do Databricks no AWS.

  • Uma entidade de serviço que tem a função de administrador de conta em sua conta do Databricks.

  • A CLI do Terraform. Consulte Download do Terraform no site do Terraform.

  • As sete variáveis de ambiente do Databricks a seguir:

    • DATABRICKS_CLIENT_IDdefinido como o valor da ID do cliente, também conhecida como ID do aplicativo, da entidade de serviço. Consulte a autenticação OAuth máquina a máquina (M2M).

    • DATABRICKS_CLIENT_SECRETdefinido como o valor do segredo do cliente da entidade de serviço. Consulte a autenticação OAuth máquina a máquina (M2M).

    • DATABRICKS_ACCOUNT_ID, definido como o valor da ID da sua conta do Databricks. Esse valor encontra-se no canto do console da sua conta no Databricks.

    • TF_VAR_databricks_account_id, também definido como o valor da ID da sua conta no Databricks.

    • AWS_ACCESS_KEY_ID, definido como o valor do ID da chave de acesso do usuário do AWS. Consulte Acesso programático no AWS General Reference.

    • AWS_SECRET_ACCESS_KEY, definido como o valor da chave de acesso secreta do usuário do AWS. Consulte Acesso programático no AWS General Reference.

    • AWS_REGION, definido como o valor do código da região do AWS para sua conta no Databricks. Consulte Endpoints regionais no AWS General Reference.

    Observação

    O nome de usuário e a senha de um administrador account também podem ser usados para autenticação no provedor Terraform. Databricks recomenda enfaticamente que você use OAuth para entidade de serviço. Para usar um nome de usuário e senha, você deve ter a seguinte variável de ambiente:

    • DATABRICKS_USERNAME, definido como o valor do nome de usuário do administrador no nível da conta do Databricks.

    • DATABRICKS_PASSWORD, definido como o valor da senha do usuário administrador no nível da conta do Databricks.

    Para definir essas variáveis de ambiente, consulte a documentação do sistema operacional.

Para usar o provedor Databricks Terraform para configurar todos os outros componentes de infraestrutura do Unity Catalog, você deve ter o seguinte:

Guia de implantação do Unity Catalog do provedor Terraform e documentação de referência de recursos

Para saber como implantar todos os pré-requisitos e habilitar Unity Catalog para um workspace, consulte recurso de pré-requisito implantado e habilitação Unity Catalog na documentação do provedor Databricks Terraform.

Se você já possui alguns componentes de infraestrutura do Unity Catalog, poderá usar o Terraform para implantar componentes adicionais de infraestrutura do Unity Catalog conforme necessário. Consulte cada seção do guia referenciado no parágrafo anterior e a seçãoUnity Catalog da documentação do provedor Databricks Terraform.

Validar, planejar, aprimorar ou destruir os recursos

  • Para validar a sintaxe das configurações do Terraform sem aprimorá-las, execute o comando terraform validate .

  • Para mostrar as ações que o Terraform tomaria para implantar as configurações, execute o comando terraform plan . Este comando na verdade não implantou as configurações.

  • Para aprimorar as configurações, execute o comando terraform deploy .

  • Para excluir os recursos implantados, execute o comando terraform destroy .