Pular para o conteúdo principal

sync grupo de comando

nota

Essas informações se aplicam ao site Databricks CLI versões 0.205 e superiores. A CLI da Databricks está em visualização pública.

Databricks CLI O uso está sujeito à LicençaDatabricks e ao Aviso de PrivacidadeDatabricks, incluindo qualquer provisionamento de Dados de Uso.

O grupo de comando sync dentro do Databricks CLI permite a sincronização unidirecional de alterações de arquivos em um diretório do sistema de arquivos local para um diretório em um site remoto Databricks workspace.

nota
  • sync O comando não pode sincronizar alterações de arquivos de um diretório em um sistema de arquivos remoto Databricks workspace, de volta para um diretório em um sistema de arquivos local.
  • sync O comando pode sincronizar as alterações de arquivos de uma máquina de desenvolvimento local somente para os arquivos do usuário workspace (/Users) em seu Databricks workspace. Não é possível sincronizar com arquivos DBFS (dbfs:/). Para sincronizar as alterações de arquivos de um computador de desenvolvimento local para DBFS (dbfs:/) em seu Databricks workspace, use os utilitários dbx sync.

O senhor executa sync comando anexando-os a databricks sync. Para exibir a ajuda do comando sync, execute databricks sync -h.

Sincronize incrementalmente as alterações do arquivo local em um diretório remoto

Para realizar uma sincronização única, incremental e unidirecional das alterações de arquivos em um diretório do sistema de arquivos local para um diretório remoto Databricks workspace, execute o comando sync, como segue:

Bash
databricks sync <local-directory-path> <remote-directory-path>

Por exemplo, para fazer uma sincronização incremental, unidirecional e única de todas as alterações de arquivos na pasta denominada my-local-folder no diretório de trabalho atual local para a pasta my-workspace-folder no diretório remoto workspace, execute o seguinte comando:

Bash
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder

Neste exemplo, somente as alterações de arquivo desde a última execução do comando sync são sincronizadas com /Users/someone@example.com/my-workspace-folder. Em default, o URL workspace no perfil DEFAULT do chamador é usado para determinar o workspace remoto para sincronizar.

Sincronize somente arquivos específicos

Para incluir ou excluir arquivos específicos para sincronização com base em padrões especificados, use as opções --include, --include-from, --exclude ou --exclude-from.

Bash
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --exclude-from .gitignore

Se você quiser sincronizar arquivos em um pacote, use o mapeamento de configuração sync. Consulte sincronização.

Sincronize totalmente as alterações do arquivo local em um diretório remoto

Para executar uma sincronização única, completa e unidirecional das alterações de arquivos em um diretório do sistema de arquivos local para um diretório em um site remoto Databricks workspace, independentemente de quando o último comando sync foi executado, use a opção --full, por exemplo:

Bash
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --full

Sincronize continuamente as alterações do arquivo local em um diretório remoto

Para ativar a sincronização contínua e unidirecional das alterações de arquivos em um diretório do sistema de arquivos local para um diretório em um site remoto Databricks workspace, use a opção --watch, por exemplo:

Bash
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch

A sincronização unidirecional continua até que o comando seja interrompido no terminal, normalmente pressionando Ctrl + c ou Ctrl + z.

A pesquisa de possíveis eventos de sincronização ocorre uma vez por segundo pelo site default. Para alterar esse intervalo, use a opção --interval junto com o número de segundos para pesquisar seguido pelo caractere s, por exemplo, por cinco segundos:

Bash
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch --interval 5s

Alterar o formato de saída do progresso da sincronização

As informações sobre o progresso da sincronização são enviadas ao terminal em formato de texto pelo site default. Para especificar o formato de saída do progresso da sincronização, use a opção --output, especificando text (o default, se --output não for especificado de outra forma) ou json, por exemplo:

Bash
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --output json

Visualizar operações de arquivos para uma sincronização

Para visualizar uma sincronização sem realmente executar as operações de sincronização de arquivos, use a opção --dry-run, por exemplo:

Bash
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --dry-run
Output
Warn: Running in dry-run mode. No actual changes will be made.
Action: PUT: test.txt
Uploaded test.txt
Initial Sync Complete