sync
grupo de comando
Essas informações se aplicam ao site Databricks CLI versões 0.205 e superiores. A CLI da Databricks está em visualização pública.
Databricks CLI O uso está sujeito à LicençaDatabricks e ao Aviso de PrivacidadeDatabricks, incluindo qualquer provisionamento de Dados de Uso.
O grupo de comando sync
dentro do Databricks CLI permite a sincronização unidirecional de alterações de arquivos em um diretório do sistema de arquivos local para um diretório em um site remoto Databricks workspace.
sync
O comando não pode sincronizar alterações de arquivos de um diretório em um sistema de arquivos remoto Databricks workspace, de volta para um diretório em um sistema de arquivos local.sync
O comando pode sincronizar as alterações de arquivos de uma máquina de desenvolvimento local somente para os arquivos do usuário workspace (/Users
) em seu Databricks workspace. Não é possível sincronizar com arquivos DBFS (dbfs:/
). Para sincronizar as alterações de arquivos de um computador de desenvolvimento local para DBFS (dbfs:/
) em seu Databricks workspace, use os utilitários dbx sync.
O senhor executa sync
comando anexando-os a databricks sync
. Para exibir a ajuda do comando sync
, execute databricks sync -h
.
Sincronize incrementalmente as alterações do arquivo local em um diretório remoto
Para realizar uma sincronização única, incremental e unidirecional das alterações de arquivos em um diretório do sistema de arquivos local para um diretório remoto Databricks workspace, execute o comando sync
, como segue:
databricks sync <local-directory-path> <remote-directory-path>
Por exemplo, para fazer uma sincronização incremental, unidirecional e única de todas as alterações de arquivos na pasta denominada my-local-folder
no diretório de trabalho atual local para a pasta my-workspace-folder
no diretório remoto workspace, execute o seguinte comando:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder
Neste exemplo, somente as alterações de arquivo desde a última execução do comando sync
são sincronizadas com /Users/someone@example.com/my-workspace-folder
. Em default, o URL workspace no perfil DEFAULT
do chamador é usado para determinar o workspace remoto para sincronizar.
Sincronize somente arquivos específicos
Para incluir ou excluir arquivos específicos para sincronização com base em padrões especificados, use as opções --include
, --include-from
, --exclude
ou --exclude-from
.
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --exclude-from .gitignore
Se você quiser sincronizar arquivos em um pacote, use o mapeamento de configuração sync
. Consulte sincronização.
Sincronize totalmente as alterações do arquivo local em um diretório remoto
Para executar uma sincronização única, completa e unidirecional das alterações de arquivos em um diretório do sistema de arquivos local para um diretório em um site remoto Databricks workspace, independentemente de quando o último comando sync
foi executado, use a opção --full
, por exemplo:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --full
Sincronize continuamente as alterações do arquivo local em um diretório remoto
Para ativar a sincronização contínua e unidirecional das alterações de arquivos em um diretório do sistema de arquivos local para um diretório em um site remoto Databricks workspace, use a opção --watch
, por exemplo:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch
A sincronização unidirecional continua até que o comando seja interrompido no terminal, normalmente pressionando Ctrl + c
ou Ctrl + z
.
A pesquisa de possíveis eventos de sincronização ocorre uma vez por segundo pelo site default. Para alterar esse intervalo, use a opção --interval
junto com o número de segundos para pesquisar seguido pelo caractere s
, por exemplo, por cinco segundos:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch --interval 5s
Alterar o formato de saída do progresso da sincronização
As informações sobre o progresso da sincronização são enviadas ao terminal em formato de texto pelo site default. Para especificar o formato de saída do progresso da sincronização, use a opção --output
, especificando text
(o default, se --output
não for especificado de outra forma) ou json
, por exemplo:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --output json
Visualizar operações de arquivos para uma sincronização
Para visualizar uma sincronização sem realmente executar as operações de sincronização de arquivos, use a opção --dry-run
, por exemplo:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --dry-run
Warn: Running in dry-run mode. No actual changes will be made.
Action: PUT: test.txt
Uploaded test.txt
Initial Sync Complete