ワークスペースでのバンドルの作成
プレビュー
ワークスペース内の Databricks アセット バンドルは パブリック プレビュー段階です。
Databricks アセット バンドルは、ワークスペースで直接作成および変更できます。
ワークスペースでバンドルを使用するための要件については、 ワークスペースでのDatabricks アセット バンドルの要件を参照してください。
バンドルの詳細については、Databricks アセットバンドルとはを参照してください。
バンドルを作成する
Databricks ワークスペースにバンドルを作成するには:
-
バンドルを作成するGitフォルダに移動します。
-
作成 ボタンをクリックし、 アセットバンドル をクリックします。または、ワークスペースツリーで Git フォルダまたはそれに関連するケバブを右クリックし、 作成 > アセットバンドル をクリックします。
-
[ アセットバンドルの作成 ] ダイアログで、アセットバンドルに名前を付けます ( 例: totally-awesome-bundle )。バンドル名には、文字、数字、ダッシュ、アンダースコアのみを含めることができます。空のバンドル、サンプルの Python ノートブックを実行するバンドル、または SQL を実行するバンドルのいずれを作成するかを選択します。
-
作成 をクリックします。
🆕
これにより、Git フォルダーに初期バンドルが作成され、これには .gitignore
Git 構成ファイルと必要な Databricks アセット バンドル databricks.yml
ファイルが含まれます。databricks.yml
ファイルには、バンドルのメイン設定が含まれています。詳細については、「 Databricks アセット バンドルの構成」を参照してください。
バンドル内のファイルに加えられた変更は、Git フォルダに関連付けられたリモートリポジトリと同期できます。Git フォルダーには、多数のバンドルを含めることができます。
バンドルに新しいファイルを追加する
バンドルには、デプロイメントとワークスペースの構成を定義する databricks.yml
ファイル、ソース・ファイル (ノートブック、 Python ・ファイル、テスト・ファイルなど)、 Databricks リソースの定義と設定 ( LakeFlow ジョブや宣言型パイプラインなど) が含まれます LakeFlow 。 他のワークスペースフォルダと同様に、バンドルに新しいファイルを追加できます。
バンドル ビューの新しいタブを開いてバンドル ファイルを変更するには、ワークスペース内のバンドル フォルダーに移動し、バンドル名の右側にある エディターで開く をクリックします。
ソースコードファイルの追加
ワークスペース UI で新しいノートブックまたはその他のファイルをバンドルに追加するには、バンドル フォルダーに移動し、次の操作を行います。
- 右上の 作成 をクリックし、バンドルに追加するファイル タイプとして [ノートブック]、[ファイル]、[クエリ]、[ダッシュボード] のいずれかを選択します。
- または、[ 共有 ] の左側にあるケバブをクリックして、ファイルをインポートします。
ファイルをバンドル デプロイメントの一部にするには、バンドル フォルダにファイルを追加した後、そのファイルを databricks.yml
バンドル設定に追加するか、そのファイルを含むジョブまたはパイプライン定義ファイルを作成する必要があります。バンドルへの既存のリソースの追加を参照してください。
ジョブ定義を追加する
バンドルには、デプロイに含めるジョブやパイプラインなどのリソースの定義が含まれています。これらの定義は YAML または Python で指定され、UI で直接これらの構成を作成および編集できます。
ジョブを定義するバンドル設定ファイルを作成するには、次のようにします。
-
新しいジョブを定義するワークスペース内のバンドルフォルダーに移動します。
-
バンドル名の右側にある「 エディターで開く 」をクリックして、バンドル・エディター・ビューに移動します。
-
バンドルのデプロイメント・アイコンをクリックして、 デプロイメント パネルに切り替えます。
-
「バンドル・リソース 」で、「 作成 」をクリックし、「 新規ジョブ定義の作成 」をクリックします。
-
ジョブ定義の作成 ダイアログの ジョブ名 フィールドにジョブの名前を入力します。 作成 をクリックします。
-
作成したジョブ定義ファイルに YAML を追加します。次の YAML の例は、ノートブックを実行するジョブを定義しています。
YAMLresources:
jobs:
run_notebook:
name: run-notebook
queue:
enabled: true
tasks:
- task_key: my-notebook-task
notebook_task:
notebook_path: ../helloworld.ipynb
YAML でのジョブの定義の詳細については、「 ジョブ」を参照してください。 サポートされている他のジョブ タスク タイプの YAML 構文については、「Databricks Asset Bundles のジョブにタスクを追加する」を参照してください。
パイプライン定義を追加する
パイプラインを定義するバンドル設定ファイルを作成するには、次のようにします。
-
新しいパイプラインを定義するワークスペース内のバンドル フォルダーに移動します。
-
バンドル名の右側にある「 エディターで開く 」をクリックして、バンドル・エディター・ビューに移動します。
-
バンドルのデプロイメント・アイコンをクリックして、 デプロイメント パネルに切り替えます。
-
バンドル リソース で、 作成 をクリックし、 新しいパイプライン定義の作成 をクリックします。
-
パイプライン定義の作成 ダイアログの パイプライン名 フィールドに、パイプラインの名前を入力します。
-
ソース コード フィールドの右側にあるフォルダー アイコンをクリックし、このパイプラインで実行するコードを選択します。 作成 をクリックします。
ノートブックを実行する test_pipeline
という名前のパイプラインの場合、次の YAML がファイル test_pipeline.pipeline.yml
に作成されます。
resources:
pipelines:
test_pipeline:
name: test_pipeline
libraries:
- notebook:
path: ../helloworld.ipynb
serverless: true
catalog: main
target: test_pipeline_${bundle.environment}
YAML でのパイプラインの定義の詳細については、「 パイプライン」を参照してください。
既存のリソースをバンドルに追加する
パイプラインなどの既存のリソースや、ノートブックやその他のソース ファイルなどのアセットをバンドルに追加できます。ただし、バンドルデプロイメントに含めるには、バンドル設定で定義する必要があります。次の例では、既存のパイプラインをバンドルに追加します。
共有ワークスペースで taxifilter.ipynb
ノートブックを実行する taxifilter
という名前のパイプラインがあるとします。
-
ワークフロー に移動し、 パイプライン に移動します。
-
既存の
taxifilter
パイプラインを選択します。 -
パイプライン ページで、 開発 、デプロイメントモードボタンの左側にあるケバブをクリックします。次に、[ 設定 YAML の表示 ] をクリックします。
-
コピーアイコンをクリックして、パイプラインのバンドル設定をコピーします。
-
ワークスペース でバンドルに移動します。
-
バンドルのデプロイメント・アイコンをクリックして、 デプロイメント パネルに切り替えます。
-
バンドル リソース で、 作成 をクリックし、 新しいパイプライン定義の作成 をクリックします。
-
パイプライン定義の作成 ダイアログの パイプライン名 フィールドに「
taxifilter
」と入力します。 作成 をクリックします。 -
既存のパイプラインの構成をファイルに貼り付けます。このパイプライン例は、
taxifilter
ノートブックを実行するように定義されています。YAMLresources:
pipelines:
taxifilter:
name: taxifilter
catalog: main
libraries:
- notebook:
path: /Workspace/Shared/taxifilter.ipynb
target: taxifilter_${bundle.environment}
これで、バンドルをデプロイし、UI を使用してパイプライン リソースを実行できます。