メインコンテンツまでスキップ

ワークスペースでのバンドルの作成

備考

プレビュー

ワークスペース内の Databricks アセット バンドルは パブリック プレビュー段階です。

Databricks アセット バンドルは、ワークスペースで直接作成および変更できます。

ワークスペースでバンドルを使用するための要件については、 ワークスペースでのDatabricks アセット バンドルの要件を参照してください。

バンドルの詳細については、Databricks アセットバンドルとはを参照してください。

バンドルを作成する

Databricks ワークスペースにバンドルを作成するには:

  1. バンドルを作成するGitフォルダに移動します。

  2. 作成 ボタンをクリックし、 アセットバンドル をクリックします。または、ワークスペースツリーで Git フォルダまたはそれに関連するケバブを右クリックし、 作成 > アセットバンドル をクリックします。

    アセットバンドルを作成

  3. [ アセットバンドルの作成 ] ダイアログで、アセットバンドルに名前を付けます ( 例: totally-awesome-bundle )。バンドル名には、文字、数字、ダッシュ、アンダースコアのみを含めることができます。空のバンドル、サンプルの Python ノートブックを実行するバンドル、または SQL を実行するバンドルのいずれを作成するかを選択します。

    「新規アセットバンドルの作成」ダイアログ

  4. 作成 をクリックします。

    🆕

これにより、Git フォルダーに初期バンドルが作成され、これには .gitignore Git 構成ファイルと必要な Databricks アセット バンドル databricks.yml ファイルが含まれます。databricks.ymlファイルには、バンドルのメイン設定が含まれています。詳細については、「 Databricks アセット バンドルの構成」を参照してください。

バンドル内のファイルに加えられた変更は、Git フォルダに関連付けられたリモートリポジトリと同期できます。Git フォルダーには、多数のバンドルを含めることができます。

バンドルに新しいファイルを追加する

バンドルには、デプロイメントとワークスペースの構成を定義する databricks.yml ファイル、ソース・ファイル (ノートブック、 Python ・ファイル、テスト・ファイルなど)、 Databricks リソースの定義と設定 ( LakeFlow ジョブや宣言型パイプラインなど) が含まれます LakeFlow 。 他のワークスペースフォルダと同様に、バンドルに新しいファイルを追加できます。

ヒント

バンドル ビューの新しいタブを開いてバンドル ファイルを変更するには、ワークスペース内のバンドル フォルダーに移動し、バンドル名の右側にある エディターで開く をクリックします。

ソースコードファイルの追加

ワークスペース UI で新しいノートブックまたはその他のファイルをバンドルに追加するには、バンドル フォルダーに移動し、次の操作を行います。

  • 右上の 作成 をクリックし、バンドルに追加するファイル タイプとして [ノートブック]、[ファイル]、[クエリ]、[ダッシュボード] のいずれかを選択します。
  • または、[ 共有 ] の左側にあるケバブをクリックして、ファイルをインポートします。
注記

ファイルをバンドル デプロイメントの一部にするには、バンドル フォルダにファイルを追加した後、そのファイルを databricks.yml バンドル設定に追加するか、そのファイルを含むジョブまたはパイプライン定義ファイルを作成する必要があります。バンドルへの既存のリソースの追加を参照してください。

ジョブ定義を追加する

バンドルには、デプロイに含めるジョブやパイプラインなどのリソースの定義が含まれています。これらの定義は YAML または Python で指定され、UI で直接これらの構成を作成および編集できます。

ジョブを定義するバンドル設定ファイルを作成するには、次のようにします。

  1. 新しいジョブを定義するワークスペース内のバンドルフォルダーに移動します。

  2. バンドル名の右側にある「 エディターで開く 」をクリックして、バンドル・エディター・ビューに移動します。

  3. バンドルのデプロイメント・アイコンをクリックして、 デプロイメント パネルに切り替えます。

    デプロイパネルのアイコン

  4. 「バンドル・リソース 」で、「 作成 」をクリックし、「 新規ジョブ定義の作成 」をクリックします。

    ジョブ定義を作成

  5. ジョブ定義の作成 ダイアログの ジョブ名 フィールドにジョブの名前を入力します。 作成 をクリックします。

  6. 作成したジョブ定義ファイルに YAML を追加します。次の YAML の例は、ノートブックを実行するジョブを定義しています。

    YAML
    resources:
    jobs:
    run_notebook:
    name: run-notebook
    queue:
    enabled: true
    tasks:
    - task_key: my-notebook-task
    notebook_task:
    notebook_path: ../helloworld.ipynb

YAML でのジョブの定義の詳細については、「 ジョブ」を参照してください。 サポートされている他のジョブ タスク タイプの YAML 構文については、「Databricks Asset Bundles のジョブにタスクを追加する」を参照してください。

パイプライン定義を追加する

パイプラインを定義するバンドル設定ファイルを作成するには、次のようにします。

  1. 新しいパイプラインを定義するワークスペース内のバンドル フォルダーに移動します。

  2. バンドル名の右側にある「 エディターで開く 」をクリックして、バンドル・エディター・ビューに移動します。

  3. バンドルのデプロイメント・アイコンをクリックして、 デプロイメント パネルに切り替えます。

    デプロイパネルのアイコン

  4. バンドル リソース で、 作成 をクリックし、 新しいパイプライン定義の作成 をクリックします。

  5. パイプライン定義の作成 ダイアログの パイプライン名 フィールドに、パイプラインの名前を入力します。

  6. ソース コード フィールドの右側にあるフォルダー アイコンをクリックし、このパイプラインで実行するコードを選択します。 作成 をクリックします。

ノートブックを実行する test_pipeline という名前のパイプラインの場合、次の YAML がファイル test_pipeline.pipeline.ymlに作成されます。

YAML
resources:
pipelines:
test_pipeline:
name: test_pipeline
libraries:
- notebook:
path: ../helloworld.ipynb
serverless: true
catalog: main
target: test_pipeline_${bundle.environment}

YAML でのパイプラインの定義の詳細については、「 パイプライン」を参照してください。

既存のリソースをバンドルに追加する

パイプラインなどの既存のリソースや、ノートブックやその他のソース ファイルなどのアセットをバンドルに追加できます。ただし、バンドルデプロイメントに含めるには、バンドル設定で定義する必要があります。次の例では、既存のパイプラインをバンドルに追加します。

共有ワークスペースで taxifilter.ipynb ノートブックを実行する taxifilter という名前のパイプラインがあるとします。

  1. ワークフロー に移動し、 パイプライン に移動します。

  2. 既存の taxifilter パイプラインを選択します。

  3. パイプライン ページで、 開発 、デプロイメントモードボタンの左側にあるケバブをクリックします。次に、[ 設定 YAML の表示 ] をクリックします。

  4. コピーアイコンをクリックして、パイプラインのバンドル設定をコピーします。

  5. ワークスペース でバンドルに移動します。

  6. バンドルのデプロイメント・アイコンをクリックして、 デプロイメント パネルに切り替えます。

  7. バンドル リソース で、 作成 をクリックし、 新しいパイプライン定義の作成 をクリックします。

  8. パイプライン定義の作成 ダイアログの パイプライン名 フィールドに「taxifilter」と入力します。 作成 をクリックします。

  9. 既存のパイプラインの構成をファイルに貼り付けます。このパイプライン例は、 taxifilter ノートブックを実行するように定義されています。

    YAML
    resources:
    pipelines:
    taxifilter:
    name: taxifilter
    catalog: main
    libraries:
    - notebook:
    path: /Workspace/Shared/taxifilter.ipynb
    target: taxifilter_${bundle.environment}

これで、バンドルをデプロイし、UI を使用してパイプライン リソースを実行できます。