Autorizar uma entidade de serviço a acessar as pastas do Git
Uma entidade de serviço é uma identidade não humana usada para autenticar fluxo de trabalho automatizado em Databricks. Esta página explica como autorizar uma entidade de serviço a usar credenciais do Git para operações em pastas do Git.
Adicione as credenciais do Git usando a interface do Databricks.
Para vincular as credenciais do Git a uma entidade de serviço:
- Como administrador do workspace, faça login no workspace do Databricks.
- Clique no seu nome de usuário na barra superior e selecione Configurações .
- Clique na guia Identidade e acesso .
- Ao lado de Entidades de serviço , clique em Gerenciar .
- Selecione a entidade de serviço que você deseja atualizar com as credenciais do Git.
- Clique na tab de integraçãoGit .
- Clique em Adicionar credencial Git .
- Selecione o provedor Git no menu dropdown e preencha os campos obrigatórios.
- Clique em Salvar ou Vincular , dependendo do provedor que você escolheu.
A entidade de serviço agora utiliza as credenciais Git vinculadas ao acessar o recurso da pasta Git do seu workspace Databricks como parte da sua automação.
Adicione as credenciais do Git usando a CLI do Databricks
Configure o acesso Git da entidade de serviço usando a CLI Databricks para automação do fluxo de trabalho.
Antes de começar, verifique se você tem:
- A CLI do Databricks foi instalada e configurada.
- Um access token pessoal do seu provedor Git . Consulte Configurar credenciais Git e conectar um repo remoto ao Databricks.
Para conceder acesso autorizado às suas pastas Git para entidade de serviço usando a CLI Databricks :
-
Crie uma entidade de serviço no seu workspace:
Bashdatabricks service-principals create --display-name "Git Automation Service Principal"Observe os valores
applicationIdeidna saída. Você precisará deles nos próximos passos. -
Gere um segredo OAuth para a entidade de serviço:
Bashdatabricks service-principal-secrets-proxy create <service-principal-id>Substitua
<service-principal-id>pelo valor de 15 dígitosiddo passo anterior.Copie o valor
secretda saída. -
Adicione as credenciais do provedor Git para a entidade de serviço.
Configure a CLI do Databricks para autenticar como a entidade de serviço usando OAuth:
Bashexport DATABRICKS_HOST=<workspace-url>
export DATABRICKS_CLIENT_ID=<application-id>
export DATABRICKS_CLIENT_SECRET=<oauth-secret>Substituir:
<workspace-url>com o URL do seu workspace<application-id>com o ID do aplicativo do passo 1<oauth-secret>com o segredo OAuth do passo 2
Em seguida, adicione as credenciais do Git:
Bashdatabricks git-credentials create <git-provider> \
--personal-access-token <git-pat> \
--git-email <git-email>Substituir:
<git-provider>com seu provedor, comogitHubougitLab<git-pat>com seu access tokenpessoal do provedor Git<git-email>com seu endereço email Git
Alguns provedores Git exigem
--git-usernameou--git-emailpara autenticação adequada. O GitHub, por exemplo, exige pelo menos um desses parâmetros.
A entidade de serviço agora pode acessar as pastas Git usando as credenciais vinculadas.
Recuperar entidade de serviço programaticamente
Recupere a entidade de serviço para seu workspace usando o SDK Databricks , APIs REST ou CLI.
Para usar o SDK Databricks a partir de um Notebook:
- Instale o SDK do Databricks:
%pip install databricks-sdk --upgrade - Importe
ApiClientdedatabricks.sdk.core. - Ligue para a API da entidade de serviço.
Para exemplos de código, consulte a documentação do SDK Databricks para Python.
Você também pode usar curl, a CLI Databricks ou Terraform para trabalhar com entidade de serviço programaticamente.