メインコンテンツまでスキップ

Databricks アセット バンドルのチュートリアル

Databricks アセットバンドルは、ジョブやパイプラインなどの Databricks リソースをソースファイルとして記述し、これらのソースファイルと一緒にメタデータを含めてインフラストラクチャやその他のリソースをプロビジョニングし、プロジェクトのエンドツーエンドの定義を提供し、すべて 1 つのデプロイ可能なプロジェクトとしてパッケージ化します。「Databricks アセットバンドルとは」を参照してください。

このページでは、Databricks アセット バンドルの開発方法の学習に役立つチュートリアルの概要を示します。

チュートリアル

説明

Databricks Asset Bundles を使用したジョブの開発

ジョブをプログラムで管理するためのバンドルを作成します。バンドルは、 Databricks Asset Bundles のPython用バンドル テンプレートを使用して作成され、ノートブックとそれを実行するジョブの定義で構成されます。 次に、Databricks ワークスペースでデプロイされたジョブを検証、デプロイ、実行します。

Databricksアセット バンドルを使用してLakeflow Spark宣言型パイプラインを開発する

パイプラインをプログラムで管理するためのバンドルを作成します。バンドルは、 Python用のDatabricks Asset Bundles 当然バンドル テンプレートを使用して作成され、サンプル パイプライン コード、パイプラインの定義とそれを実行するジョブで構成されます。 次に、デプロイされたパイプラインを Databricks ワークスペースで検証、デプロイ、実行します。

Databricks Asset Bundles を使用して Python wheel ファイルを作成する

Databricks Asset Bundles プロジェクトの一部としてPython wheelをビルド、デプロイ、および実行します。

Databricks アセットバンドルを使用した Scala JAR の構築

Scala JAR を Databricks Asset Bundles プロジェクトの一部としてビルド、デプロイ、実行します。

MLOpsスタックのDatabricksアセットバンドル

MLOps スタックバンドルを作成します。MLOpsスタックは、本番運用のベストプラクティスに準拠したDatabricksですぐに利用できるMLOpsプロジェクトです。

バンドルを手動で作成する

テンプレートを使用せずに、バンドルを最初から作成します。この単純なバンドルは、2 つのノートブックと、これらのノートブックを実行するための Databricks ジョブの定義で構成されています。その後、Databricks ワークスペースでジョブを検証、デプロイ、実行します。

カスタム Databricks アセット バンドル テンプレートを作成する

Databricks特定のPython アセット バンドル テンプレートを作成して、特定の コンテナ イメージを使用して、クラスター上の特定の タスクでジョブを実行するバンドルを作成します。Dockerカスタムバンドルテンプレートに関する情報については、「 カスタムバンドルテンプレート」を参照してください。