Pular para o conteúdo principal

Erros e solução de problemas das pastas Git do Databricks

Siga as orientações abaixo para responder a mensagens de erro comuns ou para solucionar problemas com as pastas Git do Databricks.

Invalid credentials

Experimente o seguinte:

  • Confirme se as configurações de integração do Git (Settings > Linked account ) estão corretas.

    • O senhor deve inserir o nome de usuário e os tokens do provedor Git.
  • Confirme se o senhor selecionou o provedor Git correto em Settings > Linked account ( Configurações > Conta vinculada).

  • Certifique-se de que seus tokens de acesso pessoal ou a senha do aplicativo tenham o acesso correto ao repositório.

  • Se o SSO estiver ativado em seu provedor Git, autorize seus tokens para SSO.

  • Teste seus tokens com a linha de comando Git. Substitua o texto strings entre colchetes angulares:

    Bash
    git clone https://<username>:<personal-access-token>@github.com/<org>/<repo-name>.git

Secure connection...SSL problems

Esse erro ocorre se o servidor Git não estiver acessível a partir do Databricks. Para acessar um servidor Git privado, entre em contato com sua equipe Databricks account

Console
<link>: Secure connection to <link> could not be established because of SSL problems

Erros de tempo limite

Operações caras, como a clonagem de um repositório grande ou o check-out de uma ramificação grande, podem resultar em erros de tempo limite, mas as operações podem ser concluídas em segundo plano. O senhor também pode tentar novamente mais tarde se o site workspace estiver sob carga pesada no momento.

Para trabalhar com um repositório grande, experimente o checkout esparso.

404 erros

Se o senhor receber um erro 404 ao tentar abrir um arquivo que não seja do Notebook, tente aguardar alguns minutos e tentar novamente. Há um atraso de alguns minutos entre o momento em que o site workspace é ativado e o momento em que o aplicativo da Web obtém o sinalizador de configuração.

Estado principal separado

Uma pasta Git da Databricks pode entrar no estado de cabeça desconectada se:

  • A ramificação remota é excluída . Databricks tentou recuperar as alterações locais não confirmadas na ramificação, aplicando essas alterações à ramificação default. Se a ramificação default tiver alterações conflitantes, Databricks aplicará as alterações em um instantâneo da ramificação default (cabeça desanexada).
  • Um usuário ou entidade de serviço fez check-out de um repositório remoto em uma tag usando o update repo API.

Para se recuperar desse estado:

  1. Clique no botão create branch para criar uma nova ramificação com base no site atual commit, ou use o botão "Select branch" dropdown para verificar uma ramificação existente.
  2. Faça commit e push se quiser manter as alterações. Para descartar as alterações, clique no kebab em Alterações.

Resolver conflitos de nome do Notebook

Notebooks diferentes com nomes de arquivos idênticos ou semelhantes podem causar um erro quando o usuário cria um repositório ou uma solicitação pull, como Cannot perform Git operation due to conflicting names ou A folder cannot contain a notebook with the same name as a notebook, file, or folder (excluding file extensions).

Um conflito de nomenclatura pode ocorrer mesmo com extensões de arquivo diferentes. Por exemplo, esses dois arquivos estão em conflito:

  • notebook.ipynb
  • notebook.py

Diagrama: Conflito de nomes para Notebook, arquivo ou pasta.

Para corrigir o conflito de nomes

  • Renomeie o Notebook, o arquivo ou a pasta que está contribuindo para o estado de erro.
    • Se esse erro ocorrer quando o usuário clonar o repositório, será necessário renomear o Notebook, os arquivos ou as pastas no repositório Git remoto.

Erros sugerem contabilização

Console
There was a problem with deleting folders. The repo could be in an inconsistent state and re-cloning is recommended.

Esse erro indica que ocorreu um problema ao excluir pastas do repositório. Isso pode deixar o repositório em um estado inconsistente, onde as pastas que deveriam ter sido excluídas ainda existem. Se esse erro ocorrer, o site Databricks recomenda excluir e clonar novamente o repositório para redefinir seu estado.

No experiment...found ou erros da interface do usuário do MLflow

O senhor poderá ver uma mensagem de erro Databricks No experiment for node found ou um erro em MLflow quando trabalhar em um experimento do Notebook MLflow com os últimos logs antes do lançamento da plataforma 3.72. Para resolver o erro, log uma nova execução no Notebook associado a esse experimento.

nota

Isso se aplica somente a experimentos com Notebook. Não há suporte para a criação de novos experimentos em pastas Git.

O notebook aparece como modificado sem nenhuma edição visível do usuário

Se todas as linhas de um Notebook aparecerem modificadas sem nenhuma edição do usuário, as modificações podem ser alterações nos caracteres de final de linha. O Databricks usa caracteres de final de linha LF no estilo Linux e isso pode ser diferente dos finais de linha em arquivos enviados de sistemas Windows.

Se o Notebook aparecer como modificado, mas não for possível ver nenhuma edição óbvia do usuário, as "modificações" podem ser alterações nos caracteres de "fim de linha" normalmente invisíveis. Os caracteres de fim de linha podem ser diferentes entre sistemas operacionais e formatos de arquivo.

Para diagnosticar esse problema, verifique se você tem um arquivo .gitattributes. Se você fizer:

  • Ele não deve conter * text eol=crlf.
  • Se o senhor não estiver usando o Windows como ambiente, remova a configuração. Tanto seu ambiente de desenvolvimento nativo quanto o Databricks usam caracteres de fim de linha do Linux.
  • Se o senhor estiver usando o Windows, altere a configuração para * text=auto. O Git agora armazenará internamente todos os arquivos com finais de linha no estilo do Linux, mas fará o checkout para caracteres de final de linha específicos da plataforma (como o Windows) automaticamente.

Se o senhor já tiver feito o commit de arquivos com caracteres de fim de linha do Windows no Git, execute as seguintes etapas:

  1. Limpe todas as alterações pendentes.
  2. Atualize o arquivo .gitattributes com a recomendação acima. confirmar a alteração.
  3. execução git add --renormalize. confirmar e enviar todas as alterações.