`bundle` grupo de comando

nota

Essas informações se aplicam ao site Databricks CLI versões 0.205 e superiores. A CLI da Databricks está em visualização pública.

Databricks CLI O uso está sujeito à LicençaDatabricks e ao Aviso de PrivacidadeDatabricks, incluindo qualquer provisionamento de Dados de Uso.

O grupo de comando bundle dentro do Databricks CLI permite que o senhor valide, implante e execute de forma programática Databricks fluxos de trabalho como Databricks Job, DLT pipeline e MLOps Pilhas. Veja o que são Databricks ativo Bundles?

O senhor executa bundle comando anexando-os a databricks bundle. Para exibir a ajuda do comando bundle, execute databricks bundle -h.

Criar um pacote a partir de um projeto padrão

Para criar um Databricks ativo Bundle usando o default Databricks ativo Bundle padrão para Python, execute o comando bundle init da seguinte forma e, em seguida, responda aos avisos na tela:

Bash

databricks bundle init

Para criar um Databricks ativo Bundle usando um padrão Databricks ativo Bundle personalizado, execute o comando bundle init da seguinte forma:

Bash
databricks bundle init <project-template-local-path-or-url> \
--project-dir="</local/path/to/project/template/output>"

Veja também:

Exibir o esquema de configuração do pacote

Para exibir o esquema de configuração do pacote, execute o comando bundle schema, como segue:

Bash

databricks bundle schema

Para gerar o esquema de configuração do pacote ativo Databricks como um arquivo JSON, execute o comando bundle schema e redirecione a saída para um arquivo JSON. Por exemplo, você pode gerar um arquivo chamado bundle_config_schema.json no diretório atual, da seguinte forma:

Bash
databricks bundle schema > bundle_config_schema.json

Validar um pacote

Para validar se os arquivos de configuração do pacote estão sintaticamente corretos, execute o comando bundle validate a partir da raiz do projeto do pacote, como segue:

Bash

databricks bundle validate

Em default, esse comando retorna um resumo da identidade do pacote:

Output
Name: MyBundle
Target: dev
Workspace:
  Host: https://my-host.cloud.databricks.com
  User: someone@example.com
  Path: /Users/someone@example.com/.bundle/MyBundle/dev

Validation OK!

nota

O comando bundle validate emite avisos se as propriedades do recurso forem definidas nos arquivos de configuração do pacote e não forem encontradas no esquema do objeto correspondente.

Se o senhor quiser gerar apenas um resumo da identidade e do recurso do pacote, use bundle summary.

Sincronizar a árvore de um pacote com um workspace

Use o comando bundle sync para fazer a sincronização unidirecional das alterações de arquivo de um pacote em um diretório do sistema de arquivos local para um diretório em um Databricks workspace remoto.

nota

bundle sync O comando não pode sincronizar alterações de arquivos de um diretório em um sistema de arquivos remoto Databricks workspace, de volta para um diretório em um sistema de arquivos local.

databricks bundle sync comando funcionam da mesma forma que databricks sync comando e são fornecidos como uma conveniência de produtividade. Para obter informações sobre o uso do comando, consulte sync comando group.

Gere um arquivo de configuração de pacote

O senhor pode usar o comando bundle generate para gerar a configuração de um recurso que já existe em seu site Databricks workspace. Os seguintes recursos são suportados:

Em default, esse comando gera um arquivo *.yml para o recurso na pasta resources do projeto do pacote e também downloads todos os arquivos, como o Notebook, referenciados na configuração.

important

O bundle generate comando é fornecido como uma conveniência para gerar automaticamente a configuração do recurso. Entretanto, quando a configuração do recurso é incluída no pacote e implantada, ela cria um novo recurso e não atualiza o recurso existente, a menos que o site bundle deployment bind tenha sido usado primeiro. Consulte Vincular um recurso de pacote.

Gere a configuração do aplicativo

Para gerar a configuração de um aplicativo existente no site workspace, execute bundle generate app, especificando o nome do aplicativo no site workspace:

Bash
databricks bundle generate app --existing-app-name [app-name]

O senhor pode obter o nome do aplicativo na página de computação > Apps tab da interface do usuário workspace.

Por exemplo, o comando a seguir gera um novo arquivo hello_world.app.yml na pasta do projeto do pacote resources e downloads os arquivos de código do aplicativo, como o arquivo de configuração do comando do aplicativo app.yaml e o arquivo principal app.py. Em default, os arquivos de código são copiados para a pasta src do pacote.

Bash

databricks bundle generate app --existing-app-name "hello_world"

YAML
# This is the contents of the resulting /resources/hello-world.app.yml file.
resources:
  apps:
    hello_world:
      name: hello-world
      description: A basic starter application.
      source_code_path: ../src/app

Gerar configuração do painel

Para gerar a configuração de um dashboard existente no site workspace, execute bundle generate dashboard, especificando o ID ou o caminho workspace do dashboard:

Bash
databricks bundle generate dashboard --existing-id [dashboard-id]

Bash
databricks bundle generate dashboard --existing-path [dashboard-workspace-path]

O senhor pode copiar o caminho workspace de um painel na UI workspace.

Por exemplo, o comando a seguir gera um novo arquivo baby_gender_by_county.dashboard.yml na pasta resources do projeto do pacote que contém o YAML abaixo e downloads o arquivo baby_gender_by_county.lvdash.json na pasta src do projeto.

Bash

databricks bundle generate dashboard --existing-path "/Workspace/Users/someone@example.com/baby_gender_by_county.lvdash.json"

YAML
# This is the contents of the resulting baby_gender_by_county.dashboard.yml file.
resources:
  dashboards:
    baby_gender_by_county:
      display_name: 'Baby gender by county'
      warehouse_id: aae11o8e6fe9zz79
      file_path: ../src/baby_gender_by_county.lvdash.json

dica

Para atualizar o arquivo .lvdash.json depois que o senhor já tiver implantado um painel, use a opção --resource ao executar bundle generate dashboard para gerar esse arquivo para o recurso de painel existente. Para pesquisar e recuperar continuamente as atualizações em um painel, use as opções --force e --watch.

Gerar configuração de trabalho ou pipeline

Para gerar a configuração de um Job ou pipeline, execute o comando bundle generate job ou bundle generate pipeline:

Bash
databricks bundle generate [job|pipeline] --existing-[job|pipeline]-id [job-id|pipeline-id]

nota

Atualmente, apenas o trabalho com a tarefa Notebook é suportado por esse comando.

Por exemplo, o comando a seguir gera um novo arquivo hello_job.yml na pasta resources do projeto do pacote que contém o YAML abaixo e downloads o simple_notebook.py na pasta src do projeto.

Bash

databricks bundle generate job --existing-job-id 6565621249

YAML
# This is the contents of the resulting hello_job.yml file.
resources:
  jobs:
    6565621249:
      name: Hello Job
      format: MULTI_TASK
      tasks:
        - task_key: run_notebook
          existing_cluster_id: 0704-xxxxxx-yyyyyyy
          notebook_task:
            notebook_path: ./src/simple_notebook.py
            source: WORKSPACE
          run_if: ALL_SUCCESS
      max_concurrent_runs: 1

Vincular um recurso de pacote

O comando bundle deployment bind permite que o senhor vincule os recursos definidos pelo pacote aos recursos existentes no Databricks workspace para que eles sejam gerenciados pelo Databricks ativo Bundles. Se o senhor vincular um recurso, o recurso Databricks existente no workspace será atualizado com base na configuração definida no pacote ao qual está vinculado após o próximo bundle deploy.

dica

É uma boa ideia confirmar o recurso no site workspace antes de executar o bind.

O Bind é compatível com os seguintes recursos:

Bash
databricks bundle deployment bind [resource-key] [resource-id]

Por exemplo, o comando a seguir vincula o recurso hello_job à sua contraparte remota no site workspace. O comando gera uma diferença e permite que o senhor negue a vinculação do recurso, mas, se confirmada, todas as atualizações da definição do trabalho no pacote serão aplicadas ao trabalho remoto correspondente quando o pacote for implantado novamente.

Bash
databricks bundle deployment bind hello_job 6565621249

Desvincular um recurso de pacote

Se o senhor quiser remover o vínculo entre o recurso em um pacote e sua contraparte remota em um workspace, use bundle deployment unbind:

Bash
databricks bundle deployment unbind [resource-key]

Por exemplo, para desvincular o recurso hello_job com um ID 6565621249:

Bash

databricks bundle deployment unbind 6565621249

Produzir um resumo do pacote

O comando bundle summary gera um resumo da identidade e do recurso de um pacote, incluindo links profundos para o recurso, para que o senhor possa navegar facilmente até o recurso no Databricks workspace.

Bash

databricks bundle summary

O exemplo de saída a seguir é o resumo de um pacote chamado my_pipeline_bundle que define um Job e um pipeline:

Name: my_pipeline_bundle
Target: dev
Workspace:
  Host: https://myworkspace.cloud.databricks.com
  User: someone@example.com
  Path: /Users/someone@example.com/.bundle/my_pipeline/dev
Resources:
  Jobs:
    my_project_job:
      Name: [dev someone] my_project_job
      URL:  https://myworkspace.cloud.databricks.com/jobs/206000809187888?o=6051000018419999
  Pipelines:
    my_project_pipeline:
      Name: [dev someone] my_project_pipeline
      URL:  https://myworkspace.cloud.databricks.com/pipelines/7f559fd5-zztz-47fa-aa5c-c6bf034b4f58?o=6051000018419999

dica

O senhor também pode usar bundle open para navegar até um recurso no site Databricks workspace. Consulte Abrir um recurso de pacote.

implantado a bundle

Para implantar um pacote no site remoto workspace, execute o comando bundle deploy na raiz do projeto do pacote. Se nenhuma opção de comando for especificada, será usado o destino default conforme declarado nos arquivos de configuração do pacote.

Bash

databricks bundle deploy

Para implantar o pacote em um alvo específico, defina a opção -t (ou --target) junto com o nome do alvo, conforme declarado nos arquivos de configuração do pacote. Por exemplo, para um alvo declarado com o nome dev:

Bash
databricks bundle deploy -t dev

Um pacote pode ser implantado em vários espaços de trabalho, como o espaço de trabalho de desenvolvimento, de preparação e de produção. Fundamentalmente, a propriedade root_path é o que determina a identidade exclusiva de um pacote, cujo padrão é ~/.bundle/${bundle.name}/${bundle.target}. Portanto, pelo site default, a identidade de um pacote é composta pela identidade do implantador, pelo nome do pacote e pelo nome do destino do pacote. Se eles forem idênticos em pacotes diferentes, a implantação desses pacotes interferirá entre si.

Além disso, uma implantação de pacote rastreia o recurso que cria no destino workspace por seus IDs como um estado que é armazenado no sistema de arquivos workspace. Os nomes de recurso não são usados para correlacionar entre uma implantação de pacote e uma instância de recurso, portanto:

Se um recurso na configuração do pacote não existir no destino workspace, ele será criado.
Se um recurso na configuração do pacote existir no destino workspace, ele será atualizado no workspace.
Se um recurso for removido da configuração do feixe, ele será removido do alvo workspace se tiver sido implantado anteriormente.
A associação de um recurso a um pacote só pode ser esquecida se o senhor alterar o nome do pacote, o destino do pacote ou o endereço workspace. O senhor pode executar bundle validate para gerar um resumo com esses valores.

execução de um trabalho ou pipeline

Para executar um trabalho específico ou pipeline, use o comando bundle run. O senhor deve especificar o recurso key do Job ou pipeline declarado nos arquivos de configuração do pacote. Em default, é usado o ambiente declarado nos arquivos de configuração do pacote. Por exemplo, para executar um Job hello_job no ambiente default, execute o seguinte comando:

Bash

databricks bundle run hello_job

Para executar um trabalho com key hello_job no contexto de um destino declarado com o nome dev:

Bash
databricks bundle run -t dev hello_job

Se o senhor quiser fazer uma execução de validação de pipeline, use a opção --validate-only, conforme mostrado no exemplo a seguir:

Bash

databricks bundle run --validate-only my_pipeline

Para passar parâmetros de trabalho, use a opção --params, seguida por parâmetros separados por vírgula key-value, em que key é o nome do parâmetro. Por exemplo, o comando a seguir define o parâmetro com o nome message para HelloWorld para o Job hello_job:

Bash
databricks bundle run --params message=HelloWorld hello_job

nota

O senhor pode passar parâmetros para o Job tarefa usando as opções do Job tarefa, mas a opção --params é o método recomendado para passar parâmetros do Job. Ocorrerá um erro se os parâmetros de tarefa forem especificados para uma tarefa que não tenha parâmetros de tarefa definidos ou se os parâmetros de tarefa forem especificados para uma tarefa que tenha parâmetros de tarefa definidos.

Para cancelar e reiniciar a execução de um trabalho existente ou a atualização do site pipeline, use a opção --restart:

Bash
databricks bundle run --restart hello_job

Anexe -- (hífen duplo) após bundle run para executar scripts com as credenciais de autenticação configuradas do pacote. Por exemplo, o comando a seguir mostra o diretório de trabalho atual do usuário atual:

Bash
databricks bundle run -- python3 -c 'import os; print(os.getcwd())'

As informações de autenticação do pacote são transmitidas aos processos secundários usando a variável de ambiente. Consulte Autenticação unificada do cliente Databricks.

Abrir um recurso de pacote

Para navegar até um recurso do pacote no site workspace, execute o comando bundle open a partir da raiz do projeto do pacote, especificando o recurso a ser aberto. Se um recurso key não for especificado, esse comando exibirá uma lista de recursos do pacote para escolha.

Bash
databricks bundle open [resource-key]

Por exemplo, o comando a seguir inicia um navegador e navega até o painel baby_gender_by_county do pacote no site Databricks workspace que está configurado para o pacote:

Bash
databricks bundle open baby_gender_by_county

Destrua um pacote

atenção

A destruição de um pacote exclui permanentemente o trabalho, o pipeline e os artefatos implantados anteriormente no pacote. Essa ação não pode ser desfeita.

Para excluir o trabalho, o pipeline e os artefatos que foram implantados anteriormente, execute o comando bundle destroy. O comando a seguir exclui todos os trabalhos, pipelines e artefatos implantados anteriormente que estão definidos nos arquivos de configuração do pacote:

Bash

databricks bundle destroy

nota

A identidade de um pacote é composta pelo nome do pacote, o destino do pacote e o endereço workspace. Se o senhor tiver alterado algum desses itens e tentar destruir um pacote antes de implantá-lo, ocorrerá um erro.

Em default, o senhor é solicitado a confirmar a exclusão permanente do Job, do pipeline e dos artefatos implantados anteriormente. Para ignorar esses avisos e realizar a exclusão permanente automática, adicione a opção --auto-approve ao comando bundle destroy.

Criar um pacote a partir de um projeto padrão​

Exibir o esquema de configuração do pacote​

Validar um pacote​

Sincronizar a árvore de um pacote com um workspace​

Gere um arquivo de configuração de pacote​

Gere a configuração do aplicativo​

Gerar configuração do painel​

Gerar configuração de trabalho ou pipeline​

Vincular um recurso de pacote​

Desvincular um recurso de pacote​

Produzir um resumo do pacote​

implantado a bundle​

execução de um trabalho ou pipeline​

Abrir um recurso de pacote​

Destrua um pacote​

Criar um pacote a partir de um projeto padrão

Exibir o esquema de configuração do pacote

Validar um pacote

Sincronizar a árvore de um pacote com um workspace

Gere um arquivo de configuração de pacote

Gere a configuração do aplicativo

Gerar configuração do painel

Gerar configuração de trabalho ou pipeline

Vincular um recurso de pacote

Desvincular um recurso de pacote

Produzir um resumo do pacote

implantado a bundle

execução de um trabalho ou pipeline

Abrir um recurso de pacote

Destrua um pacote