チュートリアル: ワークスペースでのバンドルの作成とデプロイ
プレビュー
ワークスペース内の Databricks アセット バンドルは パブリック プレビュー段階です。
ワークスペースで Databricks Asset Bundle の使用を開始するために、このチュートリアルでは、ジョブを含むバンドルの作成、デプロイ、バンドルでのジョブの実行をすべてワークスペースから行う手順について説明します。
ワークスペースでバンドルを使用するための要件については、 ワークスペースのDatabricks アセット バンドルの要件を参照してください。
バンドルの詳細については、Databricks アセットバンドルとはを参照してください。
バンドルを作成する
まず、Databricks ワークスペースにバンドルを作成します。
-
バンドルを作成するGitフォルダに移動します。
-
作成 ボタンをクリックし、 アセットバンドル をクリックします。または、ワークスペースツリーで Git フォルダまたはそれに関連するケバブを右クリックし、 作成 > アセットバンドル をクリックします。
-
[ アセットバンドルの作成 ] ダイアログで、アセットバンドルに名前を付けます ( 例: totally-awesome-bundle )。バンドル名には、文字、数字、ダッシュ、アンダースコアのみを含めることができます。 空のプロジェクト を選択します。
-
作成 をクリックします。
これにより、Git フォルダーに初期バンドルが作成され、 .gitignore
Git 構成ファイルと必要な Databricks アセット バンドル databricks.yml
ファイルが含まれます。databricks.yml
ファイルには、バンドルのメイン設定が含まれています。詳細については、「 Databricks アセット バンドルの構成」を参照してください。
ノートブックを実行するジョブを定義する
次に、ノートブックを実行するジョブをバンドルに追加します。次の例のノートブックでは、"Hello World!" と印刷されています。
-
バンドル プロジェクトの ノートブックの作成 タイルをクリックします。または、目次でバンドルのケバブをクリックし、 作成 > ノートブック をクリックします。
-
ノートブックの名前を helloworld に変更します。
-
ノートブックの言語を Python に設定し、ノートブックのセルに次のものを貼り付けます。
Pythonprint("Hello World!")
-
バンドルのデプロイメント・アイコンをクリックして、 デプロイメント パネルに切り替えます。
-
バンドル・リソース で、 作成 をクリックし、 新規ジョブ定義の作成 をクリックします。
-
ジョブ定義の作成 ダイアログの ジョブ名 フィールドに run-notebook と入力します。 作成 をクリックします。ジョブ定義ファイル
run-notebook.job.yml
が作成され、ジョブの基本的な YAML と、ジョブのコメントアウトされた YAML の例がいくつか追加されます。 -
次に、ノートブック タスクをジョブ定義に追加します。次の YAML をコピーして
run-notebook.job.yml
ファイルに貼り付け、基本的な YAML を置き換えます。YAMLresources:
jobs:
run_notebook:
name: run-notebook
queue:
enabled: true
tasks:
- task_key: my-notebook-task
notebook_task:
notebook_path: ../helloworld.ipynb
YAML でのジョブの定義の詳細については、「 ジョブ」を参照してください。 サポートされている他のジョブ タスク タイプの YAML 構文については、「Databricks Asset Bundles のジョブにタスクを追加する」を参照してください。
バンドルをデプロイする
次に、バンドルをデプロイし、 helloworld
ノートブック タスクを含むジョブを実行します。
-
ターゲット のバンドルの デプロイメント ペインで、ドロップダウンをクリックして
dev
ターゲットワークスペースを選択します(まだ選択されていない場合)。ターゲット ワークスペースは、バンドルのdatabricks.yml
のtargets
マッピングで定義されます。Databricks アセット バンドルのデプロイ モードを参照してください。 -
デプロイ ボタンをクリックします。バンドルが検証され、検証の詳細がダイアログに表示されます。
-
この devへのデプロイ 確認ダイアログでデプロイの詳細を確認し、 デプロイ をクリックします。
バンドルをデプロイし、バンドル リソースを実行すると、現在のユーザーとしてコードが実行されます。バンドル内のコード (コマンドを実行する構成設定を含む YAML) を信頼していることを確認します。
デプロイメントのステータスは、 プロジェクト出力 ウィンドウに出力されます。
ジョブを実行する
デプロイされたバンドルリソースは 、バンドルリソース の下にリストされます。ジョブリソースに関連付けられている再生アイコンをクリックして、ジョブリソースを実行します。
[ワークフロー ] > [ジョブ 実行 ] に移動して、バンドルの実行を確認します。バンドル・ジョブ実行の名前には、接頭部が付きます (例: [dev someone] run-notebook
.