sync
comando
Esta informação se aplica a Databricks CLI versões 0.205 e acima. A CLI do Databricks está em pré-visualização pública.
Databricks CLI O uso está sujeito à LicençaDatabricks e à Política de PrivacidadeDatabricks, incluindo qualquer disposição sobre Dados de Uso.
O grupo de comandos sync
dentro do Databricks CLI permite a sincronização unidirecional de alterações no código local e nos arquivos em um diretório em sua máquina de desenvolvimento local para uma pasta em seu Databricks remoto workspace.
sync
Não é possível sincronizar as alterações de arquivos de uma pasta em um Databricks workspace remoto de volta para um diretório em sua máquina de desenvolvimento local.sync
É possível sincronizar alterações de arquivos de uma máquina de desenvolvimento local apenas para arquivos de um usuário workspace (/Users
) em seu Databricks workspace. Não é possível sincronizar com arquivos DBFS (dbfs:/
). Para sincronizar as alterações de arquivos de uma máquina de desenvolvimento local para DBFS (dbfs:/
) em seu Databricks workspace, utilize os utilitários dbx sync.
sincronização de databricks
Sincronize um diretório local com um diretório do workspace.
databricks sync [flags] SRC DST
Argumentos
SRC
O caminho do diretório de origem
DST
O caminho do diretório de destino
Opções
--dry-run
Simule a execução da sincronização sem fazer alterações reais
--exclude strings
Padrões a serem excluídos da sincronização (podem ser especificados várias vezes)
--exclude-from string
Arquivo contendo padrões a serem excluídos da sincronização (um padrão por linha)
--full
Realizar sincronização completa (default é incremental)
--include strings
Padrões a serem incluídos na sincronização (podem ser especificados várias vezes)
--include-from string
Arquivo contendo padrões a serem incluídos na sincronização (um padrão por linha)
--interval duration
Intervalo de pesquisa do sistema de arquivos (para --watch) (default 1s)
--watch
Observe as alterações no sistema de arquivos local
Exemplos
As seções a seguir mostram como utilizar o comando “ sync
”.
Sincronize incrementalmente as alterações do arquivo local em um diretório remoto
Para realizar uma sincronização única, incremental e unidirecional das alterações de arquivos dentro de um diretório local para uma pasta em um Databricks workspace remoto, execute o comando sync
, conforme descrito a seguir:
databricks sync <local-directory-path> <remote-directory-path>
Por exemplo, para realizar uma sincronização incremental única e unidirecional de todas as alterações de arquivos na pasta denominada “ my-local-folder
” no diretório de trabalho local atual para a pasta “ my-workspace-folder
” no diretório remoto “ workspace”, execute o seguinte comando:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder
Neste exemplo, apenas as alterações nos arquivos desde a última execução do comando “ sync
” são sincronizadas para “ /Users/someone@example.com/my-workspace-folder
”. Por default, o URL workspace no perfil DEFAULT
do autor da chamada é utilizado para determinar o workspace remoto com o qual se deve sincronizar.
Sincronize somente arquivos específicos
Para incluir ou excluir arquivos específicos para sincronização com base em padrões especificados, use as opções --include
, --include-from
, --exclude
ou --exclude-from
.
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --exclude-from .gitignore
Se você quiser sincronizar arquivos em um pacote, use o mapeamento de configuração sync
em vez disso. Consulte sincronização.
O exemplo a seguir exclui determinados padrões de arquivo da sincronização:
databricks sync --exclude "*.pyc" --exclude "__pycache__" ./my-local-folder /Users/someone@example.com/my-workspace-folder
Sincronize totalmente as alterações do arquivo local em um diretório remoto
Para realizar uma sincronização única, completa e unidirecional das alterações de arquivos dentro de um diretório local para uma pasta em um Databricks workspace remoto, independentemente de quando o último comando sync
foi executado, utilize a opção --full
, por exemplo:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --full
Sincronize continuamente as alterações do arquivo local em um diretório remoto
Para ativar a sincronização contínua e unidirecional das alterações de arquivos em um diretório local para uma pasta em um Databricks workspace remoto, utilize a opção --watch
, por exemplo:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch
A sincronização unidirecional continua até que o comando seja interrompido no terminal, normalmente pressionando “ Ctrl + c
” ou “ Ctrl + z
”.
A pesquisa por possíveis eventos de sincronização ocorre uma vez por segundo por default. Para alterar esse intervalo, use a opção --interval
junto com o número de segundos para pesquisar seguido pelo caractere s
, por exemplo, por cinco segundos:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch --interval 5s
Alterar o formato de saída do progresso da sincronização
As informações de progresso da sincronização são enviadas para o terminal em formato de texto por default. Para especificar o formato de saída do progresso da sincronização, utilize a opção “ --output
”, especificando “ text
” ( default, se “ --output
” não estiver especificado) ou “ json
”, por exemplo:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --output json
Visualizar operações de arquivo para uma sincronização
Para visualizar uma sincronização sem realmente executar as operações de sincronização de arquivos, utilize a opção “ --dry-run
”, por exemplo:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --dry-run
Warn: Running in dry-run mode. No actual changes will be made.
Action: PUT: test.txt
Uploaded test.txt
Initial Sync Complete
Bandeiras globais
--debug
Se deve habilitar o registro de depuração.
-h
ou --help
Exibir ajuda para o comando Databricks CLI ou para o grupo de comandos relacionado ou para o comando relacionado.
--log-file
string
Uma string que representa o arquivo no qual a saída logs deve ser gravada. Se este sinalizador não for especificado, o default deverá gravar a saída logs no stderr.
--log-format
Formato
O tipo de formato do log, text
ou json
. O valor de default é text
.
--log-level
string
Uma string que representa o nível de formato do log. Se não for especificado, o nível de formato do log será desativado.
-o, --output
Tipo
O tipo de saída do comando, text
ou json
. O valor de default é text
.
-p, --profile
string
O nome do perfil no arquivo ~/.databrickscfg
a ser utilizado para executar o comando. Se esse sinalizador não for especificado, se existir, o perfil chamado DEFAULT
será usado.
--progress-format
Formato
O formato para exibir o progresso logs: default
, append
, inplace
ou json
-t, --target
string
Se aplicável, o destino do pacote a ser usado