メインコンテンツまでスキップ

チュートリアル: ワークスペースでのバンドルの作成とデプロイ

備考

プレビュー

ワークスペース内の Databricks アセット バンドルは パブリック プレビュー段階です。

ワークスペースで Databricks Asset Bundle の使用を開始するために、このチュートリアルでは、ジョブを含むバンドルの作成、デプロイ、バンドルでのジョブの実行をすべてワークスペースから行う手順について説明します。

ワークスペースでバンドルを使用するための要件については、 ワークスペースのDatabricks アセット バンドルの要件を参照してください。

バンドルの詳細については、Databricks アセットバンドルとはを参照してください。

バンドルを作成する

まず、Databricks ワークスペースにバンドルを作成します。

  1. バンドルを作成するGitフォルダに移動します。

  2. 作成 ボタンをクリックし、 アセットバンドル をクリックします。または、ワークスペースツリーで Git フォルダまたはそれに関連するケバブを右クリックし、 作成 > アセットバンドル をクリックします。

    アセットバンドルを作成

  3. [ アセットバンドルの作成 ] ダイアログで、アセットバンドルに名前を付けます ( 例: totally-awesome-bundle )。バンドル名には、文字、数字、ダッシュ、アンダースコアのみを含めることができます。 空のプロジェクト を選択します。

    「新規アセットバンドルの作成」ダイアログ

  4. 作成 をクリックします。

    新しいアセットバンドル

これにより、Git フォルダーに初期バンドルが作成され、 .gitignore Git 構成ファイルと必要な Databricks アセット バンドル databricks.yml ファイルが含まれます。databricks.ymlファイルには、バンドルのメイン設定が含まれています。詳細については、「 Databricks アセット バンドルの構成」を参照してください。

ノートブックを実行するジョブを定義する

次に、ノートブックを実行するジョブをバンドルに追加します。次の例のノートブックでは、"Hello World!" と印刷されています。

  1. バンドル プロジェクトの ノートブックの作成 タイルをクリックします。または、目次でバンドルのケバブをクリックし、 作成 > ノートブック をクリックします。

  2. ノートブックの名前を helloworld に変更します。

  3. ノートブックの言語を Python に設定し、ノートブックのセルに次のものを貼り付けます。

    Python
    print("Hello World!")
  4. バンドルのデプロイメント・アイコンをクリックして、 デプロイメント パネルに切り替えます。

    デプロイパネルのアイコン

  5. バンドル・リソース で、 作成 をクリックし、 新規ジョブ定義の作成 をクリックします。

    ジョブ定義を作成

  6. ジョブ定義の作成 ダイアログの ジョブ名 フィールドに run-notebook と入力します。 作成 をクリックします。ジョブ定義ファイル run-notebook.job.yml が作成され、ジョブの基本的な YAML と、ジョブのコメントアウトされた YAML の例がいくつか追加されます。

  7. 次に、ノートブック タスクをジョブ定義に追加します。次の YAML をコピーして run-notebook.job.yml ファイルに貼り付け、基本的な YAML を置き換えます。

    YAML
    resources:
    jobs:
    run_notebook:
    name: run-notebook
    queue:
    enabled: true
    tasks:
    - task_key: my-notebook-task
    notebook_task:
    notebook_path: ../helloworld.ipynb

    ジョブ ノートブック タスク構成 YAML

YAML でのジョブの定義の詳細については、「 ジョブ」を参照してください。 サポートされている他のジョブ タスク タイプの YAML 構文については、「Databricks Asset Bundles のジョブにタスクを追加する」を参照してください。

バンドルをデプロイする

次に、バンドルをデプロイし、 helloworld ノートブック タスクを含むジョブを実行します。

  1. ターゲット のバンドルの デプロイメント ペインで、ドロップダウンをクリックしてdevターゲットワークスペースを選択します(まだ選択されていない場合)。ターゲット ワークスペースは、バンドルのdatabricks.ymltargetsマッピングで定義されます。Databricks アセット バンドルのデプロイ モードを参照してください。

    ターゲットデプロイメントの選択

  2. デプロイ ボタンをクリックします。バンドルが検証され、検証の詳細がダイアログに表示されます。

  3. この devへのデプロイ 確認ダイアログでデプロイの詳細を確認し、 デプロイ をクリックします。

    開発へのデプロイダイアログ

important

バンドルをデプロイし、バンドル リソースを実行すると、現在のユーザーとしてコードが実行されます。バンドル内のコード (コマンドを実行する構成設定を含む YAML) を信頼していることを確認します。

デプロイメントのステータスは、 プロジェクト出力 ウィンドウに出力されます。

ジョブを実行する

デプロイされたバンドルリソースは 、バンドルリソース の下にリストされます。ジョブリソースに関連付けられている再生アイコンをクリックして、ジョブリソースを実行します。

デプロイされたリソースの一覧表示

[ワークフロー ] > [ジョブ 実行 ] に移動して、バンドルの実行を確認します。バンドル・ジョブ実行の名前には、接頭部が付きます (例: [dev someone] run-notebook.

次のステップ