Pular para o conteúdo principal

sync comando

nota

Esta informação se aplica a Databricks CLI versões 0.205 e acima. A CLI do Databricks está em pré-visualização pública.

Databricks CLI O uso está sujeito à LicençaDatabricks e à Política de PrivacidadeDatabricks, incluindo qualquer disposição sobre Dados de Uso.

O grupo de comandos sync dentro do Databricks CLI permite a sincronização unidirecional de alterações no código local e nos arquivos em um diretório em sua máquina de desenvolvimento local para uma pasta em seu Databricks remoto workspace.

nota
  • sync Não é possível sincronizar as alterações de arquivos de uma pasta em um Databricks workspace remoto de volta para um diretório em sua máquina de desenvolvimento local.
  • sync É possível sincronizar alterações de arquivos de uma máquina de desenvolvimento local apenas para arquivos de um usuário workspace (/Users) em seu Databricks workspace. Não é possível sincronizar com arquivos DBFS (dbfs:/). Para sincronizar as alterações de arquivos de uma máquina de desenvolvimento local para DBFS (dbfs:/) em seu Databricks workspace, utilize os utilitários dbx sync.

sincronização de databricks

Sincronize um diretório local com um diretório do workspace.

databricks sync [flags] SRC DST

Argumentos

SRC

O caminho do diretório de origem

DST

O caminho do diretório de destino

Opções

--dry-run

Simule a execução da sincronização sem fazer alterações reais

--exclude strings

Padrões a serem excluídos da sincronização (podem ser especificados várias vezes)

--exclude-from string

Arquivo contendo padrões a serem excluídos da sincronização (um padrão por linha)

--full

Realizar sincronização completa (default é incremental)

--include strings

Padrões a serem incluídos na sincronização (podem ser especificados várias vezes)

--include-from string

Arquivo contendo padrões a serem incluídos na sincronização (um padrão por linha)

--interval duration

Intervalo de pesquisa do sistema de arquivos (para --watch) (default 1s)

--watch

Observe as alterações no sistema de arquivos local

Bandeiras globais

Exemplos

As seções a seguir mostram como utilizar o comando “ sync ”.

Sincronize incrementalmente as alterações do arquivo local em um diretório remoto

Para realizar uma sincronização única, incremental e unidirecional das alterações de arquivos dentro de um diretório local para uma pasta em um Databricks workspace remoto, execute o comando sync, conforme descrito a seguir:

Bash
databricks sync <local-directory-path> <remote-directory-path>

Por exemplo, para realizar uma sincronização incremental única e unidirecional de todas as alterações de arquivos na pasta denominada “ my-local-folder ” no diretório de trabalho local atual para a pasta “ my-workspace-folder ” no diretório remoto “ workspace”, execute o seguinte comando:

Bash
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder

Neste exemplo, apenas as alterações nos arquivos desde a última execução do comando “ sync ” são sincronizadas para “ /Users/someone@example.com/my-workspace-folder”. Por default, o URL workspace no perfil DEFAULT do autor da chamada é utilizado para determinar o workspace remoto com o qual se deve sincronizar.

Sincronize somente arquivos específicos

Para incluir ou excluir arquivos específicos para sincronização com base em padrões especificados, use as opções --include, --include-from, --exclude ou --exclude-from.

Bash
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --exclude-from .gitignore
nota

Se você quiser sincronizar arquivos em um pacote, use o mapeamento de configuração sync em vez disso. Consulte sincronização.

O exemplo a seguir exclui determinados padrões de arquivo da sincronização:

Bash
databricks sync --exclude "*.pyc" --exclude "__pycache__" ./my-local-folder /Users/someone@example.com/my-workspace-folder

Sincronize totalmente as alterações do arquivo local em um diretório remoto

Para realizar uma sincronização única, completa e unidirecional das alterações de arquivos dentro de um diretório local para uma pasta em um Databricks workspace remoto, independentemente de quando o último comando sync foi executado, utilize a opção --full, por exemplo:

Bash
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --full

Sincronize continuamente as alterações do arquivo local em um diretório remoto

Para ativar a sincronização contínua e unidirecional das alterações de arquivos em um diretório local para uma pasta em um Databricks workspace remoto, utilize a opção --watch, por exemplo:

Bash
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch

A sincronização unidirecional continua até que o comando seja interrompido no terminal, normalmente pressionando “ Ctrl + c ” ou “ Ctrl + z”.

A pesquisa por possíveis eventos de sincronização ocorre uma vez por segundo por default. Para alterar esse intervalo, use a opção --interval junto com o número de segundos para pesquisar seguido pelo caractere s, por exemplo, por cinco segundos:

Bash
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch --interval 5s

Alterar o formato de saída do progresso da sincronização

As informações de progresso da sincronização são enviadas para o terminal em formato de texto por default. Para especificar o formato de saída do progresso da sincronização, utilize a opção “ --output ”, especificando “ text ” ( default, se “ --output ” não estiver especificado) ou “ json”, por exemplo:

Bash
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --output json

Visualizar operações de arquivo para uma sincronização

Para visualizar uma sincronização sem realmente executar as operações de sincronização de arquivos, utilize a opção “ --dry-run ”, por exemplo:

Bash
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --dry-run
Output
Warn: Running in dry-run mode. No actual changes will be made.
Action: PUT: test.txt
Uploaded test.txt
Initial Sync Complete

Bandeiras globais

--debug

Se deve habilitar o registro de depuração.

-h ou --help

Exibir ajuda para o comando Databricks CLI ou para o grupo de comandos relacionado ou para o comando relacionado.

--log-file string

Uma string que representa o arquivo no qual a saída logs deve ser gravada. Se este sinalizador não for especificado, o default deverá gravar a saída logs no stderr.

--log-format Formato

O tipo de formato do log, text ou json. O valor de default é text.

--log-level string

Uma string que representa o nível de formato do log. Se não for especificado, o nível de formato do log será desativado.

-o, --output Tipo

O tipo de saída do comando, text ou json. O valor de default é text.

-p, --profile string

O nome do perfil no arquivo ~/.databrickscfg a ser utilizado para executar o comando. Se esse sinalizador não for especificado, se existir, o perfil chamado DEFAULT será usado.

--progress-format Formato

O formato para exibir o progresso logs: default, append, inplace ou json

-t, --target string

Se aplicável, o destino do pacote a ser usado