sync comando
Esta informação se aplica a Databricks CLI versões 0.205 e acima. A CLI do Databricks está em pré-visualização pública.
Databricks CLI O uso está sujeito à LicençaDatabricks e à Política de PrivacidadeDatabricks, incluindo qualquer disposição sobre Dados de Uso.
O grupo de comandos sync dentro do Databricks CLI permite a sincronização unidirecional de alterações no código local e nos arquivos em um diretório em sua máquina de desenvolvimento local para uma pasta em seu Databricks remoto workspace.
syncNão é possível sincronizar as alterações de arquivos de uma pasta em um Databricks workspace remoto de volta para um diretório em sua máquina de desenvolvimento local.syncÉ possível sincronizar alterações de arquivos de uma máquina de desenvolvimento local apenas para arquivos de um usuário workspace (/Users) em seu Databricks workspace. Não é possível sincronizar com arquivos DBFS (dbfs:/). Para sincronizar as alterações de arquivos de uma máquina de desenvolvimento local para DBFS (dbfs:/) em seu Databricks workspace, utilize os utilitários dbx sync.
sincronização de databricks
Sincronize um diretório local com um diretório do workspace.
databricks sync [flags] SRC DST
Argumentos
SRC
O caminho do diretório de origem
DST
O caminho do diretório de destino
Opções
--dry-run
Simule a execução da sincronização sem fazer alterações reais
--exclude strings
Padrões a serem excluídos da sincronização (podem ser especificados várias vezes)
--exclude-from string
Arquivo contendo padrões a serem excluídos da sincronização (um padrão por linha)
--full
Realizar sincronização completa (default é incremental)
--include strings
Padrões a serem incluídos na sincronização (podem ser especificados várias vezes)
--include-from string
Arquivo contendo padrões a serem incluídos na sincronização (um padrão por linha)
--interval duration
Intervalo de pesquisa do sistema de arquivos (para --watch) (default 1s)
--watch
Observe as alterações no sistema de arquivos local
Exemplos
As seções a seguir mostram como utilizar o comando “ sync ”.
Sincronize incrementalmente as alterações do arquivo local em um diretório remoto
Para realizar uma sincronização única, incremental e unidirecional das alterações de arquivos dentro de um diretório local para uma pasta em um Databricks workspace remoto, execute o comando sync, conforme descrito a seguir:
databricks sync <local-directory-path> <remote-directory-path>
Por exemplo, para realizar uma sincronização incremental única e unidirecional de todas as alterações de arquivos na pasta denominada “ my-local-folder ” no diretório de trabalho local atual para a pasta “ my-workspace-folder ” no diretório remoto “ workspace”, execute o seguinte comando:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder
Neste exemplo, apenas as alterações nos arquivos desde a última execução do comando “ sync ” são sincronizadas para “ /Users/someone@example.com/my-workspace-folder”. Por default, o URL workspace no perfil DEFAULT do autor da chamada é utilizado para determinar o workspace remoto com o qual se deve sincronizar.
Sincronize somente arquivos específicos
Para incluir ou excluir arquivos específicos para sincronização com base em padrões especificados, use as opções --include, --include-from, --exclude ou --exclude-from.
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --exclude-from .gitignore
Se você quiser sincronizar arquivos em um pacote, use o mapeamento de configuração sync em vez disso. Consulte sincronização.
O exemplo a seguir exclui determinados padrões de arquivo da sincronização:
databricks sync --exclude "*.pyc" --exclude "__pycache__" ./my-local-folder /Users/someone@example.com/my-workspace-folder
Sincronize totalmente as alterações do arquivo local em um diretório remoto
Para realizar uma sincronização única, completa e unidirecional das alterações de arquivos dentro de um diretório local para uma pasta em um Databricks workspace remoto, independentemente de quando o último comando sync foi executado, utilize a opção --full, por exemplo:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --full
Sincronize continuamente as alterações do arquivo local em um diretório remoto
Para ativar a sincronização contínua e unidirecional das alterações de arquivos em um diretório local para uma pasta em um Databricks workspace remoto, utilize a opção --watch, por exemplo:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch
A sincronização unidirecional continua até que o comando seja interrompido no terminal, normalmente pressionando “ Ctrl + c ” ou “ Ctrl + z”.
A pesquisa por possíveis eventos de sincronização ocorre uma vez por segundo por default. Para alterar esse intervalo, use a opção --interval junto com o número de segundos para pesquisar seguido pelo caractere s, por exemplo, por cinco segundos:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch --interval 5s
Alterar o formato de saída do progresso da sincronização
As informações de progresso da sincronização são enviadas para o terminal em formato de texto por default. Para especificar o formato de saída do progresso da sincronização, utilize a opção “ --output ”, especificando “ text ” ( default, se “ --output ” não estiver especificado) ou “ json”, por exemplo:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --output json
Visualizar operações de arquivo para uma sincronização
Para visualizar uma sincronização sem realmente executar as operações de sincronização de arquivos, utilize a opção “ --dry-run ”, por exemplo:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --dry-run
Warn: Running in dry-run mode. No actual changes will be made.
Action: PUT: test.txt
Uploaded test.txt
Initial Sync Complete
Bandeiras globais
--debug
Se deve habilitar o registro de depuração.
-h ou --help
Exibir ajuda para o comando Databricks CLI ou para o grupo de comandos relacionado ou para o comando relacionado.
--log-file string
Uma string que representa o arquivo no qual a saída logs deve ser gravada. Se este sinalizador não for especificado, o default deverá gravar a saída logs no stderr.
--log-format Formato
O tipo de formato do log, text ou json. O valor de default é text.
--log-level string
Uma string que representa o nível de formato do log. Se não for especificado, o nível de formato do log será desativado.
-o, --output Tipo
O tipo de saída do comando, text ou json. O valor de default é text.
-p, --profile string
O nome do perfil no arquivo ~/.databrickscfg a ser utilizado para executar o comando. Se esse sinalizador não for especificado, se existir, o perfil chamado DEFAULT será usado.
--progress-format Formato
O formato para exibir o progresso logs: default, append, inplace ou json
-t, --target string
Se aplicável, o destino do pacote a ser usado