Pular para o conteúdo principal

Conceitos de pastas Git do Databricks

Databricks Git Folders é um cliente Git visual e API que integra repositórios Git ao seu workspace. Utilize pastas Git para desenvolver código em Notebooks e arquivos, seguindo as melhores práticas de desenvolvimento software e usando Git para controle de versão, colaboração e CI/CD. Git Folders oferece suporte a operações comuns Git , como clonar um repositório, fazer commits e pushes, pulls, gerenciamento de branches e comparação visual de diffs durante os commits.

Esta página aborda:

Recursos de pastas Git

As pastas Git Databricks fornecem controle de versão para projetos de dados e AI , integrando-se a provedores Git .

Utilize a funcionalidade Git do seu workspace Databricks para:

  • Clone, push e pull de um repositório Git remoto.
  • Crie e gerencie filiais para trabalhos de desenvolvimento, incluindo fusão, reformulação e resolução de conflitos.
  • Crie notebooks, incluindo notebooks ipynb , e edite-os, assim como outros arquivos.
  • Compare visualmente as diferenças após o commit e resolva os conflitos de merge.

Para obter instruções passo a passo, consulte execução de operações Git em pastas Git Databricks.

API de pastas Git

As pastas Git do Databricks possuem uma API para integração com seu pipeline de CI/CD. Por exemplo, atualize programaticamente uma pasta Git workspace para que ela sempre contenha a versão mais recente do código. Para obter informações sobre as melhores práticas para desenvolvimento de código usando pastas Git Databricks , consulte CI/CD com pastas Git Databricks.

provedores Git

Um provedor Git é um serviço que hospeda um sistema de controle de versão baseado em Git. Essas plataformas se apresentam em duas formas principais: um serviço cloud hospedado pelo fornecedor ou um serviço on-premises que sua organização instala e gerencia em seu próprio hardware. Muitos fornecedores, incluindo GitHub, Microsoft, GitLab e Atlassian, oferecem opções tanto cloud SaaS quanto on-premises (frequentemente chamadas de "autogerenciadas").

As pastas Git do Databricks utilizam um repositório Git integrado. Qualquer um dos provedores Git cloud ou corporativos listados nas seções a seguir pode hospedar o repositório.

Ao selecionar um provedor Git durante a configuração, certifique-se de compreender as diferenças entre sistemas cloud (SaaS) e sistemas on-premises . As organizações frequentemente hospedam provedores autogerenciáveis por trás de uma VPN, o que pode torná-los inacessíveis pela internet pública. Essas versões geralmente incluem "Servidor" ou "Autogerenciar" em seus nomes. Se você não tiver certeza de qual sua organização utiliza, consulte a documentação do seu fornecedor ou pergunte aos administradores da sua empresa.

Se o seu provedor Git cloud não aparecer na lista de provedores compatíveis, escolher GitHub pode funcionar como fallback, embora isso não seja garantido.

nota

Se você estiver usando GitHub como provedor e ainda não tiver certeza se está usando a versão cloud ou on-premises , consulte Sobre GitHub Enterprise Server na documentação GitHub .

Provedores Git cloud suportados

As pastas Git Databricks integram-se com os seguintes provedores Git baseados em cloud :

  • GitHub, GitHub Advanced Enterprise e GitHub Enterprise Cloud

  • Nuvem Atlassian Bitbucket

  • GitLab e GitLab Enterprise Edition

  • Microsoft Azure DevOps (Azure Repos)

  • AWS CodeCommit

Provedores Git on-premises suportados

As pastas Git Databricks integram-se com os seguintes provedores Git on-premises :

  • Servidor empresarial GitHub
  • Atlassian Bitbucket Server e Data Center
  • Autogerenciamento GitLab
  • Microsoft Azure DevOps Server: Um administrador workspace deve adicionar explicitamente à lista de permissões os prefixos de domínio de URL para o seu Microsoft Azure DevOps Server se a URL não corresponder a dev.azure.com/* ou visualstudio.com/*. Consulte Restringir o uso a URLs em uma lista de permissões.

Se você estiver integrando um repo Git on-premises que não é acessível pela internet, também deverá instalar um proxy para solicitações de autenticação Git dentro da VPN da sua empresa. Consulte Configurar conectividade Git privada para pastas Git Databricks (Repos).

Para aprender como usar access tokens com seu provedor Git , consulte Configurar credenciais Git e conectar um repo remoto ao Databricks.

Próximos passos