sync grupo de comando

Observação

Esta informação se aplica às versões 0.205 e acima do Databricks CLI, que estão em Public Preview. Para encontrar sua versão da CLI do Databricks, execute databricks -v.

Além disso, observe que o grupo de comando sync pode sincronizar as alterações de arquivos de uma máquina de desenvolvimento local somente para os arquivos do usuário workspace (/Users) em seu Databricks workspace. Não é possível sincronizar com arquivos DBFS (dbfs:/). Para sincronizar as alterações de arquivo de uma máquina de desenvolvimento local para o DBFS (dbfs:/) em seu Databricks workspace, use os utilitários dbx sync.

O grupo de comandos sync na CLI do Databricks permite a sincronização unidirecional de alterações de arquivo em um diretório do sistema de arquivos local para um diretório em um workspace remoto do Databricks.

Observação

sync Os comandos não podem sincronizar alterações de arquivo de um diretório dentro de um workspace remoto do Databricks, de volta para um diretório dentro de um sistema de arquivos local.

Você executa sync comandos anexando-os a databricks sync. Para exibir ajuda para o comando sync , execução databricks sync -h.

Importante

Antes de usar a CLI do Databricks, certifique-se de configurar a CLI do Databricks e configurar a autenticação para a CLI do Databricks.

Sincronize gradualmente as alterações de arquivo local para um diretório remoto

Para executar uma sincronização única, incremental e unidirecional de alterações de arquivo em um diretório do sistema de arquivos local, para um diretório em um workspace remoto do Databricks, execute o comando sync, da seguinte maneira:

databricks sync <local-directory-path> <remote-directory-path>

Por exemplo, para fazer uma sincronização incremental única e unidirecional de todas as alterações de arquivo na pasta chamada my-folder dentro do diretório de trabalho atual local, para um caminho específico dentro do workspace remoto, execute o seguinte comando:

databricks sync ./my-folder/ /Users/someone@example.com/

Neste exemplo, apenas as alterações de arquivo desde a última execução do comando sync são sincronizadas com /Users/someone@example.com/. Por default, o URL workspace no perfil DEFAULT do chamador é usado para determinar o workspace remoto com o qual sincronizar.

Sincronize totalmente as alterações de arquivos locais em um diretório remoto

Para executar uma sincronização única, completa e unidirecional das alterações de arquivo em um diretório do sistema de arquivos local para um diretório em um workspace remoto do Databricks, independentemente de quando o último comando sync foi executado, use a opção --full, por exemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --full

Sincronize continuamente as alterações de arquivos locais em um diretório remoto

Para ativar a sincronização contínua e unidirecional de alterações de arquivo em um diretório de sistema de arquivos local, para um diretório em um workspace remoto do Databricks, use a opção --watch, por exemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch

A sincronização unidirecional continua até que o comando seja interrompido no terminal, geralmente pressionando Ctrl + c ou Ctrl + z.

A sondagem de possíveis eventos de sincronização ocorre uma vez por segundo por default. Para alterar esse intervalo, use a opção --interval junto com o número de segundos para a pesquisa seguido do caractere s, por exemplo, por cinco segundos:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s

Altere o formato de saída do andamento da sincronização

A informação de progresso de sincronização é enviada para o terminal em formato de texto por default. Para especificar o formato de saída do andamento da sincronização, use a opção --output, especificando text (o default, se --output não for especificado de outra forma) ou json, por exemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --output json