ワークスペースでのバンドルの作成
Databricks アセット バンドルは、ワークスペースで直接作成および変更できます。
ワークスペースでバンドルを使用するための要件については、 ワークスペースでのDatabricks アセット バンドルの要件を参照してください。
バンドルの詳細については、Databricks アセットバンドルとはを参照してください。
バンドルを作成する
Databricks ワークスペースにバンドルを作成するには:
-
バンドルを作成するGitフォルダに移動します。
-
作成 ボタンをクリックし、 アセットバンドル をクリックします。または、ワークスペースツリーで Git フォルダまたはそれに関連するケバブを右クリックし、 作成 > アセットバンドル をクリックします。

-
[ アセットバンドルの作成 ] ダイアログで、アセットバンドルに名前を付けます ( 例: totally-awesome-bundle )。バンドル名には、文字、数字、ダッシュ、アンダースコアのみを含めることができます。
-
[ テンプレート] で、空のバンドル、サンプル Python ノートブックを実行するバンドル、または SQL を実行するバンドルのどれを作成するかを選択します。Lakeflow Pipelines エディターが有効になっている場合は、ETL パイプライン プロジェクトを作成するオプションも表示されます。

-
一部のテンプレートには追加の設定が必要です。[ 次へ ] をクリックして、プロジェクトの構成を完了します。
テンプレート | 構成オプション |
|---|---|
Lakeflow Spark宣言型パイプライン |
|
デフォルトのPython |
|
デフォルト SQL |
|
- [ 作成とデプロイ ] をクリックします。
これにより、選択したプロジェクト テンプレートのファイル、 .gitignore Git 構成ファイル、および必要な Databricks アセット バンドル databricks.yml ファイルを含む初期バンドルが Git フォルダーに作成されます。databricks.ymlファイルには、バンドルのメイン構成が含まれています。詳細については、「 Databricks 資産バンドルの構成」を参照してください。
🆕
バンドル内のファイルに加えられた変更は、Git フォルダに関連付けられたリモートリポジトリと同期できます。Git フォルダーには、多数のバンドルを含めることができます。
バンドルに新しいファイルを追加する
バンドルには、デプロイメントおよびワークスペース構成を定義するdatabricks.ymlファイル、ノートブック、 Pythonファイル、テスト ファイルなどのソース ファイル、 LakeflowジョブやLakeflow Spark宣言型パイプラインなどのDatabricksリソースの定義と設定が含まれています。 他のワークスペース フォルダーと同様に、バンドルに新しいファイルを追加できます。
バンドル ビューの新しいタブを開いてバンドル ファイルを変更するには、ワークスペース内のバンドル フォルダーに移動し、バンドル名の右側にある エディターで開く をクリックします。
ソースコードファイルの追加
ワークスペース UI で新しいノートブックまたはその他のファイルをバンドルに追加するには、バンドル フォルダーに移動し、次の操作を行います。
- 右上の 作成 をクリックし、バンドルに追加するファイル タイプとして [ノートブック]、[ファイル]、[クエリ]、[ダッシュボード] のいずれかを選択します。
- または、[ 共有 ] の左側にあるケバブをクリックして、ファイルをインポートします。
ファイルをバンドル デプロイメントの一部にするには、バンドル フォルダにファイルを追加した後、そのファイルを databricks.yml バンドル設定に追加するか、そのファイルを含むジョブまたはパイプライン定義ファイルを作成する必要があります。バンドルへの既存のリソースの追加を参照してください。
リソース定義を作成する
バンドルには、デプロイメントに含めるジョブやパイプラインなどのリソースの定義が含まれています。バンドルがデプロイされると、バンドルで定義されたリソースがワークスペースに作成されます (すでにデプロイされている場合は更新されます)。これらの定義は YAML または Python で指定され、UI で直接これらの構成を作成および編集できます。
- 新しいリソースを定義するワークスペース内のバンドル フォルダーに移動します。
以前にワークスペースのエディターでバンドルを開いたことがある場合は、ワークスペース・ブラウザーのオーサリング・コンテキスト・リストを使用して、バンドル・フォルダーにナビゲートできます。オー サリングコンテキストを参照してください。
-
バンドル名の右側にある「 エディターで開く 」をクリックして、バンドル・エディター・ビューに移動します。
-
バンドルのデプロイメント・アイコンをクリックして、 デプロイメント パネルに切り替えます。

-
[バンドル リソース] セクションで、 [追加] をクリックし、作成するリソース定義を選択します。
新しいジョブ定義
ジョブを定義するバンドル設定ファイルを作成するには、次のようにします。
-
[デプロイメント] パネルの [バンドル リソース] セクションで、 [追加] をクリックし、 [新しいジョブ定義] を クリックします。

-
ジョブ定義の作成 ダイアログの ジョブ名 フィールドにジョブの名前を入力します。 作成 をクリックします。
-
作成されたジョブ定義ファイルに YAML を追加します。次の YAML の例では、ノートブックを実行するジョブを定義しています。
YAMLresources:
jobs:
run_notebook:
name: run-notebook
queue:
enabled: true
tasks:
- task_key: my-notebook-task
notebook_task:
notebook_path: ../helloworld.ipynb
YAML でのジョブの定義の詳細については、「 ジョブ」を参照してください。 サポートされている他のジョブ タスク タイプの YAML 構文については、「Databricks Asset Bundles のジョブにタスクを追加する」を参照してください。
新しいパイプラインの定義
ワークスペースでLakeFlow Pipelines Editorを有効にしている場合は、 「新しいETLパイプライン」を参照してください。
バンドルにパイプライン定義を追加するには:
-
[デプロイメント] パネルの [バンドル リソース] セクションで、 [追加] をクリックし、 [新しいパイプライン定義] を クリックします。
-
[既存のバンドルにパイプラインを追加] ダイアログ の [パイプライン 名] フィールドにパイプライン の名前を入力します。
-
[追加してデプロイ]を クリックします。
ノートブックを実行するtest_pipelineという名前のパイプラインの場合、ファイルtest_pipeline.pipeline.ymlに次の YAML が作成されます。
resources:
pipelines:
test_pipeline:
name: test_pipeline
libraries:
- notebook:
path: ../test_pipeline.ipynb
serverless: true
catalog: main
target: test_pipeline_${bundle.environment}
既存のノートブックを実行するように構成を変更できます。YAML でのパイプラインの定義の詳細については、 「パイプライン」を参照してください。
新しいETLパイプライン
新しい ETL パイプライン定義を追加するには:
-
デプロイメント パネルの バンドル リソース セクションで、 [追加] をクリックし、 [新しい ETL パイプライン] を クリックします。
-
[既存のバンドルにパイプラインを追加] ダイアログ の [名前] フィールドにパイプラインの名前を入力します。名前はワークスペース内で一意である必要があります。
-
個人スキーマの使用 フィールドで、開発シナリオの場合は はい を選択し、本番運用シナリオの場合は いいえ を選択します。
-
パイプラインの デフォルトカタログ と デフォルトスキーマ を選択します。
-
パイプラインソースコードの言語を選択します。
-
[追加してデプロイ]を クリックします。

-
「Dev にデプロイ」 確認ダイアログで詳細を確認し、 「デプロイ」 をクリックします。
ETL パイプラインは、探索テーブルと変換テーブルの例を使用して作成されます。

rad_pipelineという名前のパイプラインの場合、次の YAML がファイルrad_pipeline.pipeline.ymlに作成されます。このパイプラインはサーバレスコンピュート上で実行するように設定されています。 パイプライン構成のリファレンスについては、 「パイプライン」を参照してください。
resources:
pipelines:
rad_pipeline:
name: rad_pipeline
libraries:
- glob:
include: transformations/**
serverless: true
catalog: main
schema: ${workspace.current_user.short_name}
root_path: .
新しいダッシュボードの定義
ダッシュボードを定義するバンドル構成ファイルを作成するには:
-
[デプロイメント] パネルの [バンドル リソース] セクションで、 [追加] をクリックし、 [新しいダッシュボード定義] を クリックします。
-
「既存のバンドルにダッシュボードを追加」ダイアログ の 「ダッシュボード名」 フィールドにダッシュボードの名前を入力します。
-
ダッシュボードの ウェアハウス を選択します。 [追加してデプロイ] をクリックします。
新しい空のダッシュボードと構成*.dashboard.ymlファイルがバンドルに作成されます。ダッシュボードは、構成ファイルで指定されたウェアハウスに保存されます。
ダッシュボードの詳細については、 「ダッシュボード」を参照してください。ダッシュボード構成の YAML 構文については、 dashboard を参照してください。
既存のリソースをバンドルに追加する
ワークスペース UI を使用するか、バンドルにリソース構成を追加することによって、既存のリソースをバンドルに追加できます。
バンドルのワークスペース UI を使用する
既存のジョブ、パイプライン、またはダッシュボードをバンドルに追加するには:
- リソースを追加するワークスペース内のバンドル フォルダーに移動します。
以前にワークスペースのエディターでバンドルを開いたことがある場合は、ワークスペース・ブラウザーのオーサリング・コンテキスト・リストを使用して、バンドル・フォルダーにナビゲートできます。オー サリングコンテキストを参照してください。
-
バンドル名の右側にある「 エディターで開く 」をクリックして、バンドル・エディター・ビューに移動します。
-
バンドルのデプロイメント・アイコンをクリックして、 デプロイメント パネルに切り替えます。
-
バンドル リソース セクションで、 [追加] をクリックし、 [既存のジョブの追加] 、 [既存のパイプラインの追加] 、または [既存のダッシュボードの追加] を クリックします。

-
[既存の追加...] ダイアログで、ドロップダウンから既存のリソースを選択します。
-
既存のリソースをバンドルに追加すると、Databricks によってバンドル構成ファイルにこのリソースの定義が作成されます。この定義はバンドル内で変更できるため、バンドル内で定義されたリソースは、バンドルの作成に使用されたリソースと異なる場合があります。
バンドル リソース構成の更新を処理する方法のオプションを選択します。
- 本番運用デプロイに関する更新 : 既存のリソースはバンドル内のリソースにリンクされ、バンドル内のリソースに加えた変更は、
prodターゲットにデプロイするときに既存のリソースに適用されます。 - 開発デプロイ時の更新 : 既存のリソースはバンドル内のリソースにリンクされ、バンドル内のリソースに加えた変更は、
devターゲットにデプロイするときに既存のリソースに適用されます。 - (詳細) 更新しない : 既存のリソースはバンドルにリンクされていません。バンドル内のリソースに加えられた変更は、既存のリソースには適用されません。代わりに、コピーが作成されます。バンドル リソースを対応するワークスペース リソースにバインドする方法の詳細については、 「 databricks バンドル展開バインド 」を参照してください。
- 本番運用デプロイに関する更新 : 既存のリソースはバンドル内のリソースにリンクされ、バンドル内のリソースに加えた変更は、
-
既存のリソースをバンドルに追加するには、 [追加...] をクリックします。
バンドル設定を追加する
バンドル構成を定義してバンドルのデプロイメントに含めることで、既存のリソースをバンドルに追加することもできます。次の例では、既存のパイプラインをバンドルに追加します。
共有ワークスペースで taxifilter.ipynb ノートブックを実行する taxifilter という名前のパイプラインがあるとします。
-
Databricks ワークスペースのサイドバーで、[ ジョブとパイプライン] をクリックします。
-
必要に応じて、 [パイプライン ] フィルターと [自分が所有 ] フィルターを選択します。
-
既存の
taxifilterパイプラインを選択します。 -
パイプライン ページで、 開発 、デプロイメントモードボタンの左側にあるケバブをクリックします。次に、[ 設定 YAML の表示 ] をクリックします。
-
コピーアイコンをクリックして、パイプラインのバンドル設定をコピーします。
-
ワークスペース でバンドルに移動します。
-
バンドルのデプロイメント・アイコンをクリックして、 デプロイメント パネルに切り替えます。
-
バンドル リソース セクションで、 [追加] をクリックし、 [新しいパイプライン定義] を クリックします。
代わりに [新しいETLパイプライン] メニュー項目が表示される場合は、 Lakeflow Pipelinesエディターが有効になっています。 バンドルに ETL パイプラインを追加するには、 「ソース管理されたパイプラインを作成する」を参照してください。
-
「既存のバンドルにパイプラインを追加」ダイアログ の 「パイプライン名」 フィールドに
taxifilterと入力します。 [作成]を クリックします。 -
既存のパイプラインの構成をファイルに貼り付けます。このパイプライン例は、
taxifilterノートブックを実行するように定義されています。YAMLresources:
pipelines:
taxifilter:
name: taxifilter
catalog: main
libraries:
- notebook:
path: /Workspace/Shared/taxifilter.ipynb
target: taxifilter_${bundle.environment}
これで、バンドルをデプロイし、UI を使用してパイプライン リソースを実行できます。