sync
grupo de comando
Observação
Essas informações se aplicam ao site Databricks CLI versões 0.205 e superiores. A CLI da Databricks está em visualização pública.
Databricks CLI O uso está sujeito à LicençaDatabricks e ao Aviso de PrivacidadeDatabricks , incluindo qualquer provisionamento de Dados de Uso.
O grupo de comandos sync
na CLI do Databricks permite a sincronização unidirecional de alterações de arquivo em um diretório do sistema de arquivos local para um diretório em um workspace remoto do Databricks.
Observação
sync
Os comandos não podem sincronizar alterações de arquivo de um diretório dentro de um workspace remoto do Databricks, de volta para um diretório dentro de um sistema de arquivos local.sync
O comando pode sincronizar as alterações de arquivos de uma máquina de desenvolvimento local somente para os arquivos do usuário workspace (/Users
) em seu Databricks workspace. Não é possível sincronizar com arquivos DBFS (dbfs:/
). Para sincronizar as alterações de arquivos de um computador de desenvolvimento local para DBFS (dbfs:/
) em seu Databricks workspace, use os utilitários dbx sync.
Você executa sync
comandos anexando-os a databricks sync
. Para exibir ajuda para o comando sync
, execução databricks sync -h
.
Sincronize gradualmente as alterações de arquivo local para um diretório remoto
Para executar uma sincronização única, incremental e unidirecional de alterações de arquivo em um diretório do sistema de arquivos local, para um diretório em um workspace remoto do Databricks, execute o comando sync
, da seguinte maneira:
databricks sync <local-directory-path> <remote-directory-path>
Por exemplo, para fazer uma sincronização incremental única e unidirecional de todas as alterações de arquivo na pasta chamada my-folder
dentro do diretório de trabalho atual local, para um caminho específico dentro do workspace remoto, execute o seguinte comando:
databricks sync ./my-folder/ /Users/someone@example.com/
Neste exemplo, apenas as alterações de arquivo desde a última execução do comando sync
são sincronizadas com /Users/someone@example.com/
. Por default, o URL workspace no perfil DEFAULT
do chamador é usado para determinar o workspace remoto com o qual sincronizar.
Sincronize totalmente as alterações de arquivos locais em um diretório remoto
Para executar uma sincronização única, completa e unidirecional das alterações de arquivo em um diretório do sistema de arquivos local para um diretório em um workspace remoto do Databricks, independentemente de quando o último comando sync
foi executado, use a opção --full
, por exemplo:
databricks sync ./my-folder/ /Users/someone@example.com/ --full
Sincronize continuamente as alterações de arquivos locais em um diretório remoto
Para ativar a sincronização contínua e unidirecional de alterações de arquivo em um diretório de sistema de arquivos local, para um diretório em um workspace remoto do Databricks, use a opção --watch
, por exemplo:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch
A sincronização unidirecional continua até que o comando seja interrompido no terminal, geralmente pressionando Ctrl + c
ou Ctrl + z
.
A sondagem de possíveis eventos de sincronização ocorre uma vez por segundo por default. Para alterar esse intervalo, use a opção --interval
junto com o número de segundos para a pesquisa seguido do caractere s
, por exemplo, por cinco segundos:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s
Altere o formato de saída do andamento da sincronização
A informação de progresso de sincronização é enviada para o terminal em formato de texto por default. Para especificar o formato de saída do andamento da sincronização, use a opção --output
, especificando text
(o default, se --output
não for especificado de outra forma) ou json
, por exemplo:
databricks sync ./my-folder/ /Users/someone@example.com/ --output json