sync grupo de comando

Observação

Essas informações se aplicam ao site Databricks CLI versões 0.205 e superiores. A CLI da Databricks está em visualização pública.

Databricks CLI O uso está sujeito à LicençaDatabricks e ao Aviso de PrivacidadeDatabricks , incluindo qualquer provisionamento de Dados de Uso.

O grupo de comandos sync na CLI do Databricks permite a sincronização unidirecional de alterações de arquivo em um diretório do sistema de arquivos local para um diretório em um workspace remoto do Databricks.

Observação

  • sync Os comandos não podem sincronizar alterações de arquivo de um diretório dentro de um workspace remoto do Databricks, de volta para um diretório dentro de um sistema de arquivos local.

  • sync O comando pode sincronizar as alterações de arquivos de uma máquina de desenvolvimento local somente para os arquivos do usuário workspace (/Users) em seu Databricks workspace. Não é possível sincronizar com arquivos DBFS (dbfs:/). Para sincronizar as alterações de arquivos de um computador de desenvolvimento local para DBFS (dbfs:/) em seu Databricks workspace, use os utilitários dbx sync.

Você executa sync comandos anexando-os a databricks sync. Para exibir ajuda para o comando sync , execução databricks sync -h.

Sincronize gradualmente as alterações de arquivo local para um diretório remoto

Para executar uma sincronização única, incremental e unidirecional de alterações de arquivo em um diretório do sistema de arquivos local, para um diretório em um workspace remoto do Databricks, execute o comando sync, da seguinte maneira:

databricks sync <local-directory-path> <remote-directory-path>

Por exemplo, para fazer uma sincronização incremental única e unidirecional de todas as alterações de arquivo na pasta chamada my-folder dentro do diretório de trabalho atual local, para um caminho específico dentro do workspace remoto, execute o seguinte comando:

databricks sync ./my-folder/ /Users/someone@example.com/

Neste exemplo, apenas as alterações de arquivo desde a última execução do comando sync são sincronizadas com /Users/someone@example.com/. Por default, o URL workspace no perfil DEFAULT do chamador é usado para determinar o workspace remoto com o qual sincronizar.

Sincronize totalmente as alterações de arquivos locais em um diretório remoto

Para executar uma sincronização única, completa e unidirecional das alterações de arquivo em um diretório do sistema de arquivos local para um diretório em um workspace remoto do Databricks, independentemente de quando o último comando sync foi executado, use a opção --full, por exemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --full

Sincronize continuamente as alterações de arquivos locais em um diretório remoto

Para ativar a sincronização contínua e unidirecional de alterações de arquivo em um diretório de sistema de arquivos local, para um diretório em um workspace remoto do Databricks, use a opção --watch, por exemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch

A sincronização unidirecional continua até que o comando seja interrompido no terminal, geralmente pressionando Ctrl + c ou Ctrl + z.

A sondagem de possíveis eventos de sincronização ocorre uma vez por segundo por default. Para alterar esse intervalo, use a opção --interval junto com o número de segundos para a pesquisa seguido do caractere s, por exemplo, por cinco segundos:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s

Altere o formato de saída do andamento da sincronização

A informação de progresso de sincronização é enviada para o terminal em formato de texto por default. Para especificar o formato de saída do andamento da sincronização, use a opção --output, especificando text (o default, se --output não for especificado de outra forma) ou json, por exemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --output json