Integração do Git para pastas Git do Databricks
As pastas Git do Databricks são um cliente Git visual e uma API no Databricks. Ele oferece suporte a operações comuns do Git, como clonagem de um repositório, commit e push, pull, gerenciamento de ramificações e comparação visual de diferenças ao fazer o commit.
Nas pastas Git, o senhor pode desenvolver código no Notebook ou em outros arquivos e seguir as práticas recomendadas de desenvolvimento de código de ciência de dados e engenharia usando Git para controle de versão, colaboração e CI/CD.
Git As pastas (Repos) são projetadas principalmente para a criação e o fluxo de trabalho colaborativo.
O que o senhor pode fazer com as pastas Git da Databricks?
Databricks Git As pastas oferecem controle de origem para dados e projetos AI, integrando-se aos provedores Git.
Nas pastas Git do Databricks, o senhor pode usar a funcionalidade do Git para:
- Clone, push e pull de um repositório Git remoto.
- Crie e gerencie filiais para trabalhos de desenvolvimento, incluindo fusão, reformulação e resolução de conflitos.
- Crie Notebook (incluindo o ipynb Notebook) e edite-os e outros arquivos.
- Compare visualmente as diferenças em commit e resolva os conflitos de merge.
Para obter instruções passo a passo, consulte a execução Git operações em Databricks Git pastas (Repos).
As pastas Git da Databricks também têm uma API que pode ser integrada ao seu pipeline de CI/CD. Por exemplo, o senhor pode atualizar programaticamente um repositório do Databricks para que ele sempre tenha a versão mais recente do código. Para obter informações sobre as práticas recomendadas para o desenvolvimento de código usando as pastas Databricks Git , consulte as técnicas deCI/CD com as pastas Git e Databricks Git (Repos).
Para obter informações sobre os tipos de Notebook suportados em Databricks, consulte Exportar e importar o Notebook de Databricks.
Provedores de Git compatíveis
As pastas Git da Databricks são apoiadas por um repositório Git integrado. O repositório pode ser hospedado por qualquer um dos provedores de Git corporativos e de nuvem listados na seção a seguir.
O que é um "provedor Git"?
Um "provedor Git" é o serviço específico (nomeado) que hospeda um modelo de controle de origem baseado no Git. Git-As plataformas de controle de código-fonte baseadas em software são hospedadas de duas maneiras: como um serviço em nuvem hospedado pela empresa desenvolvedora ou como um serviço local instalado e gerenciado por sua própria empresa em seu próprio hardware. Muitos provedores de Git, como GitHub, Microsoft, GitLab e Atlassian, oferecem serviços SaaS baseados na nuvem e no local (às vezes chamados de "autogerenciar") Git.
Ao escolher o provedor do Git durante a configuração, o senhor deve estar ciente das diferenças entre os provedores do Git na nuvem (SaaS) e no local. As soluções locais geralmente são hospedadas atrás de uma VPN da empresa e podem não ser acessíveis pela Internet. Normalmente, os provedores locais de Git têm um nome que termina em "Server" (Servidor) ou "Self-gerenciar" (Autogerenciar), mas se o senhor não tiver certeza, entre em contato com os administradores da empresa ou examine a documentação do provedor de Git.
Se o seu provedor Git for baseado na nuvem e não estiver listado como um provedor compatível, selecionar "GitHub" como seu provedor pode funcionar, mas não é garantido.
Se estiver usando o "GitHub" como provedor e ainda não tiver certeza se está usando a versão na nuvem ou no local, consulte Sobre o GitHub Enterprise Server nos documentos do GitHub.
Provedores de Cloud Git suportados pela Databricks
-
GitHub, GitHub AE e GitHub Enterprise Cloud
-
Atlassian Bitbucket Cloud
-
GitLab e GitLab EE
-
Microsoft Azure DevOps (Azure Repos)
-
AWS CodeCommit
Provedores de Git no local compatíveis com a Databricks
- GitHub Enterprise Server
- Atlassian Bitbucket Server and Data Center
- GitLab Autogerenciar
- Servidor de DevOps do Microsoft Azure: Um administrador de workspace deve permitir explicitamente os prefixos de domínio de URL para seu Microsoft Azure DevOps Server se o URL não corresponder a
dev.azure.com/*
ouvisualstudio.com/*
. Para obter mais detalhes, consulte Restringir o uso a URLs em uma lista de permissões
Se o senhor estiver integrando um repositório Git local que não seja acessível pela Internet, um proxy para solicitações de autenticação do Git também deverá ser instalado na VPN da sua empresa. Para obter mais detalhes, consulte Configurar conectividade Git privada para pastas Git do Databricks (Repos).
Para saber como usar tokens de acesso com seu provedor Git, consulte Configurar credenciais do Git & conectar um repositório remoto à Databricks.
recurso para Git integração
Use o Databricks CLI 2.0 para integração do Git com o Databricks:
Leia os seguintes documentos de referência: