Pular para o conteúdo principal

Autorizar uma entidade de serviço a acessar as pastas do Git

Uma entidade de serviço é uma identidade não humana usada para autenticar fluxo de trabalho automatizado em Databricks. Esta página explica como autorizar uma entidade de serviço a usar credenciais do Git para operações em pastas do Git.

Adicione as credenciais do Git usando a interface do Databricks.

Para vincular as credenciais do Git a uma entidade de serviço:

  1. Como administrador do workspace, faça login no workspace do Databricks.
  2. Clique no seu nome de usuário na barra superior e selecione Configurações .
  3. Clique na guia Identidade e acesso .
  4. Ao lado de Entidades de serviço , clique em Gerenciar .
  5. Selecione a entidade de serviço que você deseja atualizar com as credenciais do Git.
  6. Clique na tab de integraçãoGit .
  7. Clique em Adicionar credencial Git .
  8. Selecione o provedor Git no menu dropdown e preencha os campos obrigatórios.
  9. Clique em Salvar ou Vincular , dependendo do provedor que você escolheu.

A entidade de serviço agora utiliza as credenciais Git vinculadas ao acessar o recurso da pasta Git do seu workspace Databricks como parte da sua automação.

Adicione as credenciais do Git usando a CLI do Databricks

Configure o acesso Git da entidade de serviço usando a CLI Databricks para automação do fluxo de trabalho.

nota

Antes de começar, verifique se você tem:

Para conceder acesso autorizado às suas pastas Git para entidade de serviço usando a CLI Databricks :

  1. Crie uma entidade de serviço no seu workspace:

    Bash
    databricks service-principals create --display-name "Git Automation Service Principal"

    Observe os valores applicationId e id na saída. Você precisará deles nos próximos passos.

  2. Gere um segredo OAuth para a entidade de serviço:

    Bash
    databricks service-principal-secrets-proxy create <service-principal-id>

    Substitua <service-principal-id> pelo valor de 15 dígitos id do passo anterior.

    Copie o valor secret da saída.

  3. Adicione as credenciais do provedor Git para a entidade de serviço.

    Configure a CLI do Databricks para autenticar como a entidade de serviço usando OAuth:

    Bash
    export DATABRICKS_HOST=<workspace-url>
    export DATABRICKS_CLIENT_ID=<application-id>
    export DATABRICKS_CLIENT_SECRET=<oauth-secret>

    Substituir:

    • <workspace-url> com o URL do seu workspace
    • <application-id> com o ID do aplicativo do passo 1
    • <oauth-secret> com o segredo OAuth do passo 2

    Em seguida, adicione as credenciais do Git:

    Bash
    databricks git-credentials create <git-provider> \
    --personal-access-token <git-pat> \
    --git-email <git-email>

    Substituir:

    • <git-provider> com seu provedor, como gitHub ou gitLab
    • <git-pat> com seu access tokenpessoal do provedor Git
    • <git-email> com seu endereço email Git

    Alguns provedores Git exigem --git-username ou --git-email para autenticação adequada. O GitHub, por exemplo, exige pelo menos um desses parâmetros.

A entidade de serviço agora pode acessar as pastas Git usando as credenciais vinculadas.

Recuperar entidade de serviço programaticamente

Recupere a entidade de serviço para seu workspace usando o SDK Databricks , APIs REST ou CLI.

Para usar o SDK Databricks a partir de um Notebook:

  1. Instale o SDK do Databricks: %pip install databricks-sdk --upgrade
  2. Importe ApiClient de databricks.sdk.core.
  3. Ligue para a API da entidade de serviço.

Para exemplos de código, consulte a documentação do SDK Databricks para Python.

Você também pode usar curl, a CLI Databricks ou Terraform para trabalhar com entidade de serviço programaticamente.

Próximos passos