メインコンテンツまでスキップ

Databricks アセット バンドルのチュートリアル

Databricks アセットバンドルは、ジョブやパイプラインなどの Databricks リソースをソースファイルとして記述し、これらのソースファイルと一緒にメタデータを含めてインフラストラクチャやその他のリソースをプロビジョニングし、プロジェクトのエンドツーエンドの定義を提供し、すべて 1 つのデプロイ可能なプロジェクトとしてパッケージ化します。「Databricks アセットバンドルとは」を参照してください。

このページでは、Databricks アセット バンドルの開発方法の学習に役立つチュートリアルの概要を示します。

チュートリアル

説明

Databricks Asset Bundles を使用したジョブの開発

ジョブをプログラムで管理するためのバンドルを作成します。バンドルは、ノートブックとそれを実行するためのジョブの定義で構成されるPythonの Databricks Asset Bundlesの デフォルト バンドル テンプレートを使用して作成されます。その後、デプロイされたジョブを Databricks ワークスペースで検証、デプロイ、実行します。

Databricks Asset Bundles を使用した DLT パイプラインの開発

DLT パイプラインをプログラムで管理するためのバンドルを作成します。バンドルは、ノートブックと、それを実行するためのパイプラインおよびジョブの定義で構成される Pythonの Databricks Asset Bundles デフォルト バンドル テンプレートを使用して作成されます。次に、デプロイされたパイプラインを Databricks ワークスペースで検証、デプロイ、実行します。

Databricks Asset Bundles を使用して Python wheel ファイルを作成する

Python wheelDatabricksAsset Bundles プロジェクトの一部として をビルド、デプロイ、および実行します。

Databricks アセットバンドルを使用した Scala JAR の構築

Scala JAR を Databricks Asset Bundles プロジェクトの一部としてビルド、デプロイ、実行します。

MLOpsスタックのDatabricksアセットバンドル

MLOps スタックバンドルを作成します。MLOpsスタックは、本番運用のベストプラクティスに準拠したDatabricksですぐに利用できるMLOpsプロジェクトです。

バンドルを手動で作成する

テンプレートを使用せずに、バンドルを最初から作成します。この単純なバンドルは、2 つのノートブックと、これらのノートブックを実行するための Databricks ジョブの定義で構成されています。その後、Databricks ワークスペースでジョブを検証、デプロイ、実行します。

カスタム Databricks アセット バンドル テンプレートを作成する

Databricks特定のPython アセット バンドル テンプレートを作成して、特定の コンテナ イメージを使用して、クラスタリング上の特定の タスクでジョブを実行するバンドルを作成します。Dockerカスタムバンドルテンプレートに関する情報については、「 カスタムバンドルテンプレート」を参照してください。