Erros e solução de problemas das pastas Git do Databricks
Siga as orientações abaixo para responder a mensagens de erro comuns ou para solucionar problemas com as pastas Git do Databricks.
Invalid credentials
Experimente o seguinte:
-
Confirme se as configurações de integração do Git (Settings > Linked account ) estão corretas.
- O senhor deve inserir o nome de usuário e os tokens do provedor Git.
-
Confirme se o senhor selecionou o provedor Git correto em Settings > Linked account ( Configurações > Conta vinculada).
-
Certifique-se de que seus tokens de acesso pessoal ou a senha do aplicativo tenham o acesso correto ao repositório.
-
Se o SSO estiver ativado em seu provedor Git, autorize seus tokens para SSO.
-
Teste seus tokens com a linha de comando Git. Substitua o texto strings entre colchetes angulares:
Bashgit clone https://<username>:<personal-access-token>@github.com/<org>/<repo-name>.git
Secure connection...SSL problems
Esse erro ocorre se o servidor Git não estiver acessível a partir do Databricks. Para acessar um servidor Git privado, entre em contato com sua equipe Databricks account
<link>: Secure connection to <link> could not be established because of SSL problems
Erros de tempo limite
Operações caras, como a clonagem de um repositório grande ou o check-out de uma ramificação grande, podem resultar em erros de tempo limite, mas as operações podem ser concluídas em segundo plano. O senhor também pode tentar novamente mais tarde se o site workspace estiver sob carga pesada no momento.
Para trabalhar com um repositório grande, experimente o checkout esparso.
404 erros
Se o senhor receber um erro 404 ao tentar abrir um arquivo que não seja do Notebook, tente aguardar alguns minutos e tentar novamente. Há um atraso de alguns minutos entre o momento em que o site workspace é ativado e o momento em que o aplicativo da Web obtém o sinalizador de configuração.
Estado principal separado
Uma pasta Git da Databricks pode entrar no estado de cabeça desconectada se:
- A ramificação remota é excluída . Databricks tentou recuperar as alterações locais não confirmadas na ramificação, aplicando essas alterações à ramificação default. Se a ramificação default tiver alterações conflitantes, Databricks aplicará as alterações em um instantâneo da ramificação default (cabeça desanexada).
- Um usuário ou entidade de serviço fez check-out de um repositório remoto em uma tag usando o
update repo
API.
Para se recuperar desse estado:
- Clique no botão
create branch
para criar uma nova ramificação com base no site atual commit, ou use o botão "Select branch" dropdown para verificar uma ramificação existente. - Faça commit e push se quiser manter as alterações. Para descartar as alterações, clique no kebab em Alterações.
Resolver conflitos de nome do Notebook
Notebooks diferentes com nomes de arquivos idênticos ou semelhantes podem causar um erro quando o usuário cria um repositório ou uma solicitação pull, como Cannot perform Git operation due to conflicting names
ou A folder cannot contain a notebook with the same name as a notebook, file, or folder (excluding file extensions).
Um conflito de nomenclatura pode ocorrer mesmo com extensões de arquivo diferentes. Por exemplo, esses dois arquivos estão em conflito:
notebook.ipynb
notebook.py
Para corrigir o conflito de nomes
- Renomeie o Notebook, o arquivo ou a pasta que está contribuindo para o estado de erro.
- Se esse erro ocorrer quando o usuário clonar o repositório, será necessário renomear o Notebook, os arquivos ou as pastas no repositório Git remoto.
Erros sugerem contabilização
There was a problem with deleting folders. The repo could be in an inconsistent state and re-cloning is recommended.
Esse erro indica que ocorreu um problema ao excluir pastas do repositório. Isso pode deixar o repositório em um estado inconsistente, onde as pastas que deveriam ter sido excluídas ainda existem. Se esse erro ocorrer, o site Databricks recomenda excluir e clonar novamente o repositório para redefinir seu estado.
No experiment...found
ou erros da interface do usuário do MLflow
O senhor poderá ver uma mensagem de erro Databricks No experiment for node found
ou um erro em MLflow quando trabalhar em um experimento do Notebook
MLflow com os últimos logs antes do lançamento da plataforma 3.72.
Para resolver o erro, log uma nova execução no Notebook associado a esse experimento.
Isso se aplica somente a experimentos com Notebook. Não há suporte para a criação de novos experimentos em pastas Git.
O notebook aparece como modificado sem nenhuma edição visível do usuário
Se todas as linhas de um Notebook aparecerem modificadas sem nenhuma edição do usuário, as modificações podem ser alterações nos caracteres de final de linha. O Databricks usa caracteres de final de linha LF no estilo Linux e isso pode ser diferente dos finais de linha em arquivos enviados de sistemas Windows.
Se o Notebook aparecer como modificado, mas não for possível ver nenhuma edição óbvia do usuário, as "modificações" podem ser alterações nos caracteres de "fim de linha" normalmente invisíveis. Os caracteres de fim de linha podem ser diferentes entre sistemas operacionais e formatos de arquivo.
Para diagnosticar esse problema, verifique se você tem um arquivo .gitattributes
. Se você fizer:
- Ele não deve conter
* text eol=crlf
. - Se o senhor não estiver usando o Windows como ambiente, remova a configuração. Tanto seu ambiente de desenvolvimento nativo quanto o Databricks usam caracteres de fim de linha do Linux.
- Se o senhor estiver usando o Windows, altere a configuração para
* text=auto
. O Git agora armazenará internamente todos os arquivos com finais de linha no estilo do Linux, mas fará o checkout para caracteres de final de linha específicos da plataforma (como o Windows) automaticamente.
Se o senhor já tiver feito o commit de arquivos com caracteres de fim de linha do Windows no Git, execute as seguintes etapas:
- Limpe todas as alterações pendentes.
- Atualize o arquivo
.gitattributes
com a recomendação acima. confirmar a alteração. - execução
git add --renormalize
. confirmar e enviar todas as alterações.