`bundle` コマンドグループ

注記

この情報は、Databricks CLI バージョン 0.205 以降に適用されます。 Databricks CLI はパブリックプレビュー段階です。

Databricks CLI 使用には、 Databricks ライセンスおよび Databricks プライバシー通知(使用データのプロビジョニングを含む)が適用されます。

内のbundle コマンドグループを使用すると、DatabricksCLI DatabricksDatabricksジョブ、Lakeflow 宣言型パイプライン、スタックなどのMLOps ワークフローをプログラムで検証、デプロイ、および実行できます。「Databricks アセットバンドルとは」を参照してください。

bundleコマンドを実行するには、コマンドを databricks bundleに追加します。bundle コマンドのヘルプを表示するには、databricks bundle -hを実行します。

プロジェクトテンプレートからバンドルを作成する

Databricksのデフォルトアセットバンドルテンプレートを使用してアセットDatabricks Pythonバンドルを作成するには、次のようにbundle init コマンドを実行し、画面のプロンプトに応答します。

Bash

databricks bundle init

カスタム Databricks アセットバンドルテンプレートを使用して Databricks アセットバンドルを作成するには、次のように bundle init コマンドを実行します。

Bash
databricks bundle init <project-template-local-path-or-url> \
--project-dir="</local/path/to/project/template/output>"

関連項目は次を参照してください。

バンドル設定スキーマを表示します

バンドル構成スキーマを表示するには、次のように bundle schema コマンドを実行します。

Bash

databricks bundle schema

Databricks Asset Bundle 構成スキーマを JSON ファイルとして出力するには、 bundle schema コマンドを実行し、出力を JSON ファイルにリダイレクトします。たとえば、次のように、現在のディレクトリに bundle_config_schema.json という名前のファイルを生成できます。

Bash
databricks bundle schema > bundle_config_schema.json

バンドルの検証

バンドル構成ファイルが構文的に正しいことを検証するには、次のように、バンドル・プロジェクトのルートから bundle validate コマンドを実行します。

Bash

databricks bundle validate

デフォルトでは、このコマンドはバンドル ID の要約を返します。

Output
Name: MyBundle
Target: dev
Workspace:
  Host: https://my-host.cloud.databricks.com
  User: someone@example.com
  Path: /Users/someone@example.com/.bundle/MyBundle/dev

Validation OK!

注記

bundle validate コマンドは、リソース・プロパティーがバンドル構成ファイルに定義されており、対応するオブジェクトのスキーマに見つからない場合に警告を出力します。

バンドルの ID とリソースの概要のみを出力する場合は、 bundle summary を使用します。

バンドルのツリーをワークスペースに同期する

bundle sync コマンドは、ローカルファイルシステムディレクトリ内のバンドルのファイル変更を、リモート Databricks ワークスペース内のディレクトリに一方向に同期します。

注記

bundle sync コマンドでは、リモート Databricks ワークスペース内のディレクトリからローカルファイルシステム内のディレクトリにファイルの変更を同期することはできません。

databricks bundle sync コマンドは databricks sync コマンドと同じように機能し、生産性の便宜のために提供されています。コマンドの使用方法については、「 sync コマンドグループ」を参照してください。

バンドル設定ファイルの生成

bundle generate コマンドは、Databricks ワークスペースに既に存在するリソースの構成を生成します。次のリソースがサポートされています。

デフォルトでは、このコマンドはバンドルプロジェクトの resources フォルダーにリソースの *.yml ファイルを生成し、構成で参照されるノートブックなどのファイルもダウンロードします。

important

bundle generate コマンドは、リソース構成を自動生成するための便宜上提供されています。ただし、リソース構成がバンドルに含まれてデプロイされると、新しいリソースが作成され、最初に使用 bundle deployment bind ない限り、既存のリソースは更新されません。バンドル・リソースのバインドを参照してください。

アプリ構成の生成

ワークスペース内の既存のアプリの設定を生成するには、ワークスペース内のアプリの名前を指定して bundle generate appを実行します。

Bash
databricks bundle generate app --existing-app-name [app-name]

アプリ名は、ワークスペース UI の [コンピュート ] > [アプリ ] タブから取得できます。

たとえば、次のコマンドは、resources bundle プロジェクトフォルダーに新しい hello_world.app.yml ファイルを生成し、アプリのコマンドコンフィギュレーションファイル (app.yaml や main app.pyなど) アプリのコードファイルをダウンロードします。デフォルトでは、コードファイルはバンドルの src フォルダにコピーされます。

Bash

databricks bundle generate app --existing-app-name "hello_world"

YAML
# This is the contents of the resulting /resources/hello-world.app.yml file.
resources:
  apps:
    hello_world:
      name: hello-world
      description: A basic starter application.
      source_code_path: ../src/app

ダッシュボード構成の生成

ワークスペース内の既存のダッシュボードの設定を生成するには、 bundle generate dashboardを実行し、ダッシュボードの ID またはワークスペースパスを指定します。

Bash
databricks bundle generate dashboard --existing-id [dashboard-id]

Bash
databricks bundle generate dashboard --existing-path [dashboard-workspace-path]

ダッシュボードのワークスペースパスは、ワークスペース UI からコピーできます。

たとえば、次のコマンドは、以下の YAML を含む resources バンドルプロジェクトフォルダーに新しい baby_gender_by_county.dashboard.yml ファイルを生成し、baby_gender_by_county.lvdash.json ファイルを src プロジェクトフォルダーにダウンロードします。

Bash

databricks bundle generate dashboard --existing-path "/Workspace/Users/someone@example.com/baby_gender_by_county.lvdash.json"

YAML
# This is the contents of the resulting baby_gender_by_county.dashboard.yml file.
resources:
  dashboards:
    baby_gender_by_county:
      display_name: 'Baby gender by county'
      warehouse_id: aae11o8e6fe9zz79
      file_path: ../src/baby_gender_by_county.lvdash.json

ヒント

ダッシュボードを既にデプロイした後で .lvdash.json ファイルを更新するには、bundle generate dashboard を実行して既存のダッシュボードリソースのファイルを生成するときに --resource オプションを使用します。ダッシュボードの更新を継続的にポーリングして取得するには、 --force オプションと --watch オプションを使用します。

ジョブまたはパイプライン設定の生成

ジョブまたはパイプラインの設定を生成するには、 bundle generate job コマンドまたは bundle generate pipeline コマンドを実行します。

Bash
databricks bundle generate [job|pipeline] --existing-[job|pipeline]-id [job-id|pipeline-id]

注記

現在、このコマンドでサポートされているのは、ノートブックタスクを持つジョブのみです。

たとえば、次のコマンドは、以下の YAML を含む resources バンドルプロジェクトフォルダーに新しい hello_job.yml ファイルを生成し、simple_notebook.py を src プロジェクトフォルダーにダウンロードします。

Bash

databricks bundle generate job --existing-job-id 6565621249

YAML
# This is the contents of the resulting hello_job.yml file.
resources:
  jobs:
    hello_job:
      name: 'Hello Job'
      tasks:
        - task_key: run_notebook
          email_notifications: {}
          notebook_task:
            notebook_path: ../src/simple_notebook.py
            source: WORKSPACE
          run_if: ALL_SUCCESS
      max_concurrent_runs: 1

バンドル・リソースのバインド

bundle deployment bind コマンドを使用すると、バンドル定義のリソースを Databricks ワークスペース内の既存のリソースにリンクして、Databricks Asset Bundle によって管理されるようにすることができます。リソースをバインドすると、ワークスペース内の既存の Databricks リソースは、バインド先のバンドルで定義されている構成に基づいて更新されます bundle deploy。

Bash
databricks bundle deployment bind [resource-key] [resource-id]

バインドではデータは再作成されません。たとえば、カタログ内のデータを含むパイプラインにバインドが適用されている場合、既存のデータを失うことなくそのパイプラインにデプロイできます。また、たとえばマテリアライズドビューを再計算する必要がないため、パイプラインを再実行する必要がありません。

bind コマンドは、 --target フラグとともに使用する必要があります。たとえば、本番運用デプロイを本番運用パイプラインにバインドするには、次のようにします。 databricks bundle deployment bind --target prod my_pipeline 7668611149d5709ac9-2906-1229-9956-586a9zed8929

ヒント

bind を実行する前に、ワークスペース内のリソースを確認することをお勧めします。

バインドは、次のリソースでサポートされています。

次のコマンドは、リソース hello_job をワークスペース内の対応するリモートにバインドします。このコマンドは diff を出力し、リソース・バインディングを拒否できますが、確認された場合、バンドル内のジョブ定義に対する更新は、バンドルが次にデプロイされるときに対応するリモート・ジョブに適用されます。

Bash
databricks bundle deployment bind hello_job 6565621249

バンドル・リソースのバインド解除

バンドル内のリソースとワークスペース内の対応するリモートリソースとの間のリンクを削除する場合は、次の bundle deployment unbindを使用します。

Bash
databricks bundle deployment unbind [resource-key]

たとえば、 hello_job リソースのバインドを解除するには、次のようにします。

Bash

databricks bundle deployment unbind hello_job

バンドルの概要を出力する

bundle summary コマンドは、バンドルの ID とリソースの概要を出力し、リソースのディープリンクを含むため、Databricks ワークスペース内のリソースに簡単に移動できます。

Bash

databricks bundle summary

次の出力例は、ジョブとパイプラインを定義する my_pipeline_bundle という名前のバンドルの概要です。

Name: my_pipeline_bundle
Target: dev
Workspace:
  Host: https://myworkspace.cloud.databricks.com
  User: someone@example.com
  Path: /Users/someone@example.com/.bundle/my_pipeline/dev
Resources:
  Jobs:
    my_project_job:
      Name: [dev someone] my_project_job
      URL:  https://myworkspace.cloud.databricks.com/jobs/206000809187888?o=6051000018419999
  Pipelines:
    my_project_pipeline:
      Name: [dev someone] my_project_pipeline
      URL:  https://myworkspace.cloud.databricks.com/pipelines/7f559fd5-zztz-47fa-aa5c-c6bf034b4f58?o=6051000018419999

ヒント

bundle open を使用して、Databricks ワークスペース内のリソースに移動することもできます。「ワークスペースでリソースを開く」を参照してください。

バンドルをデプロイする

バンドルをリモートワークスペースにデプロイするには、バンドルプロジェクトのルートから bundle deploy コマンドを実行します。コマンド・オプションが指定されていない場合は、バンドル構成ファイル内で宣言されているデフォルト・ターゲットが使用されます。

Bash

databricks bundle deploy

バンドルを特定のターゲットにデプロイするには、バンドル構成ファイル内で宣言されているターゲットの名前と共に、 -t (または --target) オプションを設定します。たとえば、 devという名前で宣言されたターゲットの場合、次のようになります。

Bash
databricks bundle deploy -t dev

バンドルは、開発、ステージング、本番運用ワークスペースなど、複数のワークスペースにデプロイできます。基本的に、 root_path プロパティはバンドルの一意の ID を決定するもので、デフォルトは ~/.bundle/${bundle.name}/${bundle.target}です。したがって、デフォルトでは、バンドルの ID は、デプロイヤの ID、バンドルの名前、およびバンドルのターゲット名で構成されます。これらが異なるバンドル間で同一である場合、これらのバンドルのデプロイは互いに干渉します。

さらに、バンドル・デプロイメントは、ターゲット・ワークスペースに作成したリソースを、ワークスペース・ファイル・システムに格納されている状態として ID によって追跡します。リソース名は、バンドル・デプロイメントとリソース・インスタンスの相関関係には使用されないため、次のようになります。

バンドル構成内のリソースがターゲットワークスペースに存在しない場合は、そのリソースが作成されます。
バンドル構成内のリソースがターゲットワークスペースに存在する場合、そのリソースはワークスペースで更新されます。
リソースがバンドル構成から削除されると、そのリソースは以前にデプロイされていた場合はターゲットワークスペースから削除されます。
リソースとバンドルの関連付けを忘れることができるのは、バンドル名、バンドル・ターゲット、またはワークスペースを変更した場合のみです。bundle validate を実行して、これらの値を含む概要を出力できます。

ジョブまたはパイプラインを実行する

特定のジョブまたはパイプラインを実行するには、 bundle run コマンドを使用します。バンドル設定ファイル内で宣言されているジョブまたはパイプラインのリソースキーを指定する必要があります。デフォルトでは、バンドル設定ファイル内で宣言された環境が使用されます。たとえば、デフォルト環境でジョブ hello_job を実行するには、次のコマンドを実行します。

Bash

databricks bundle run hello_job

キー hello_job を持つジョブを、 devという名前で宣言されたターゲットのコンテキスト内で実行するには、次のようにします。

Bash
databricks bundle run -t dev hello_job

パイプラインの検証

パイプライン検証の実行を行う場合は、次の例に示すように、--validate-only オプションを使用します。

Bash

databricks bundle run --validate-only my_pipeline

Pass ジョブパラメーター

ジョブパラメーターを渡すには、--params オプションを使用し、その後にコンマ区切りのキーと値のペア (キーはパラメーター名) を付けます。たとえば、次のコマンドは、ジョブhello_jobの名前が message のパラメーターを HelloWorld に設定します。

Bash
databricks bundle run --params message=HelloWorld hello_job

注記

ジョブタスクオプションを使用してパラメーターをジョブタスクに渡すこともできますが、ジョブパラメーターを渡すには --params オプションを使用することをお勧めします。ジョブ・パラメーターが定義されていないジョブにジョブ・パラメーターが指定されている場合、またはジョブ・パラメーターが定義されているジョブにタスク・パラメーターが指定されている場合は、エラーが発生します。

実行のキャンセル

既存のジョブ実行またはパイプラインの更新をキャンセルして再開するには、 --restart オプションを使用します。

Bash
databricks bundle run --restart hello_job

スクリプトの実行

bundle runの後に--(ダブルハイフン)を追加して、バンドルに設定された認証資格情報でスクリプトを実行します。たとえば、次のコマンドは、現在のユーザーの現在の作業ディレクトリを出力します。

Bash
databricks bundle run -- python3 -c 'import os; print(os.getcwd())'

バンドル認証情報は、環境変数を使用して子プロセスに渡されます。「Databricks クライアント統合認証」を参照してください。

ワークスペースでリソースを開く

ワークスペース内のバンドル・リソースに移動するには、バンドル・プロジェクトのルートから bundle open コマンドを実行し、開くリソースを指定します。リソースキーが指定されていない場合、このコマンドは、選択するバンドルのリソースの一覧を出力します。

Bash
databricks bundle open [resource-key]

たとえば、次のコマンドはブラウザーを起動し、バンドル用に構成されている Databricks ワークスペース内のバンドル内の baby_gender_by_county ダッシュボードに移動します。

Bash
databricks bundle open baby_gender_by_county

バンドルを破壊する

警告

バンドルを破棄すると、バンドルの以前にデプロイされたジョブ、パイプライン、およびアーティファクトが完全に削除されます。この操作は元に戻せません。

以前にデプロイされたジョブ、パイプライン、およびアーティファクトを削除するには、 bundle destroy コマンドを実行します。次のコマンドは、バンドル構成ファイルで定義されている、以前にデプロイされたすべてのジョブ、パイプライン、およびアーティファクトを削除します。

Bash

databricks bundle destroy

注記

バンドルの ID は、バンドル名、バンドルターゲット、およびワークスペースで構成されます。これらのいずれかを変更し、デプロイ前にバンドルを破棄しようとすると、エラーが発生します。

デフォルトでは、以前にデプロイされたジョブ、パイプライン、およびアーティファクトの完全な削除を確認するように求められます。これらのプロンプトをスキップして自動的に完全削除を実行するには、bundle destroy コマンドに --auto-approve オプションを追加します。

プロジェクト テンプレートからバンドルを作成する​

バンドル設定スキーマを表示します​

バンドルの検証​

バンドルのツリーをワークスペースに同期する​

バンドル設定ファイルの生成​

アプリ構成の生成​

ダッシュボード構成の生成​

ジョブまたはパイプライン設定の生成​

バンドル・リソースのバインド​

バンドル・リソースのバインド解除​

バンドルの概要を出力する​

バンドルをデプロイする​

ジョブまたはパイプラインを実行する​

パイプラインの検証​

Pass ジョブ パラメーター​

実行のキャンセル​

スクリプトの実行​

ワークスペースでリソースを開く​

バンドルを破壊する​

プロジェクトテンプレートからバンドルを作成する

バンドル設定スキーマを表示します

バンドルの検証

バンドルのツリーをワークスペースに同期する

バンドル設定ファイルの生成

アプリ構成の生成

ダッシュボード構成の生成

ジョブまたはパイプライン設定の生成

バンドル・リソースのバインド

バンドル・リソースのバインド解除

バンドルの概要を出力する

バンドルをデプロイする

ジョブまたはパイプラインを実行する

パイプラインの検証

Pass ジョブパラメーター

実行のキャンセル

スクリプトの実行

ワークスペースでリソースを開く

バンドルを破壊する