Pular para o conteúdo principal

sync grupo de comando

nota

Essas informações se aplicam ao site Databricks CLI versões 0.205 e superiores. A CLI da Databricks está em visualização pública.

Databricks CLI O uso está sujeito à LicençaDatabricks e ao Aviso de PrivacidadeDatabricks, incluindo qualquer provisionamento de Dados de Uso.

O grupo de comando sync dentro do Databricks CLI permite a sincronização unidirecional de alterações de arquivos em um diretório do sistema de arquivos local para um diretório em um site remoto Databricks workspace.

nota
  • sync O comando não pode sincronizar alterações de arquivos de um diretório em um sistema de arquivos remoto Databricks workspace, de volta para um diretório em um sistema de arquivos local.
  • sync O comando pode sincronizar as alterações de arquivos de uma máquina de desenvolvimento local somente para os arquivos do usuário workspace (/Users) em seu Databricks workspace. Não é possível sincronizar com arquivos DBFS (dbfs:/). Para sincronizar as alterações de arquivos de um computador de desenvolvimento local para DBFS (dbfs:/) em seu Databricks workspace, use os utilitários dbx sync.

O senhor executa sync comando anexando-os a databricks sync. Para exibir a ajuda do comando sync, execute databricks sync -h.

Sincronize incrementalmente as alterações do arquivo local em um diretório remoto

Para realizar uma sincronização única, incremental e unidirecional das alterações de arquivos em um diretório do sistema de arquivos local para um diretório remoto Databricks workspace, execute o comando sync, como segue:

Bash
databricks sync <local-directory-path> <remote-directory-path>

Por exemplo, para fazer uma sincronização incremental, unidirecional e única de todas as alterações de arquivos na pasta denominada my-folder no diretório de trabalho atual local, para um caminho específico no site remoto workspace, execute o seguinte comando:

Bash
databricks sync ./my-folder/ /Users/someone@example.com/

Neste exemplo, somente as alterações de arquivo desde a última execução do comando sync são sincronizadas com /Users/someone@example.com/. Por default, o URL workspace no perfil DEFAULT do chamador é usado para determinar o workspace remoto com o qual sincronizar.

Sincronize totalmente as alterações do arquivo local em um diretório remoto

Para executar uma sincronização única, completa e unidirecional das alterações de arquivos em um diretório do sistema de arquivos local para um diretório em um site remoto Databricks workspace, independentemente de quando o último comando sync foi executado, use a opção --full, por exemplo:

Bash
databricks sync ./my-folder/ /Users/someone@example.com/ --full

Sincronize continuamente as alterações do arquivo local em um diretório remoto

Para ativar a sincronização contínua e unidirecional das alterações de arquivos em um diretório do sistema de arquivos local para um diretório em um site remoto Databricks workspace, use a opção --watch, por exemplo:

Bash
databricks sync ./my-folder/ /Users/someone@example.com/ --watch

A sincronização unidirecional continua até que o comando seja interrompido no terminal, normalmente pressionando Ctrl + c ou Ctrl + z.

A pesquisa de possíveis eventos de sincronização ocorre uma vez por segundo pelo site default. Para alterar esse intervalo, use a opção --interval junto com o número de segundos para pesquisar seguido pelo caractere s, por exemplo, por cinco segundos:

Bash
databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s

Alterar o formato de saída do progresso da sincronização

As informações sobre o progresso da sincronização são enviadas ao terminal em formato de texto pelo site default. Para especificar o formato de saída do progresso da sincronização, use a opção --output, especificando text (o default, se --output não for especificado de outra forma) ou json, por exemplo:

Bash
databricks sync ./my-folder/ /Users/someone@example.com/ --output json