Databricks アセット バンドルのチュートリアル
Databricks アセットバンドルは、ジョブやパイプラインなどの Databricks リソースをソースファイルとして記述し、これらのソースファイルと一緒にメタデータを含めてインフラストラクチャやその他のリソースをプロビジョニングし、プロジェクトのエンドツーエンドの定義を提供し、すべて 1 つのデプロイ可能なプロジェクトとしてパッケージ化します。「Databricks アセットバンドルとは」を参照してください。
このページでは、Databricks アセット バンドルの開発方法の学習に役立つチュートリアルの概要を示します。
チュートリアル | 説明 |
---|---|
ジョブをプログラムで管理するためのバンドルを作成します。バンドルは、ノートブックとそれを実行するためのジョブの定義で構成されるPythonの Databricks Asset Bundlesの デフォルト バンドル テンプレートを使用して作成されます。その後、デプロイされたジョブを Databricks ワークスペースで検証、デプロイ、実行します。 | |
DLT パイプラインをプログラムで管理するためのバンドルを作成します。バンドルは、ノートブックと、それを実行するためのパイプラインおよびジョブの定義で構成される Pythonの Databricks Asset Bundles デフォルト バンドル テンプレートを使用して作成されます。次に、デプロイされたパイプラインを Databricks ワークスペースで検証、デプロイ、実行します。 | |
Python wheelDatabricksAsset Bundles プロジェクトの一部として をビルド、デプロイ、および実行します。 | |
Scala JAR を Databricks Asset Bundles プロジェクトの一部としてビルド、デプロイ、実行します。 | |
MLOps スタックバンドルを作成します。MLOpsスタックは、本番運用のベストプラクティスに準拠したDatabricksですぐに利用できるMLOpsプロジェクトです。 | |
テンプレートを使用せずに、バンドルを最初から作成します。この単純なバンドルは、2 つのノートブックと、これらのノートブックを実行するための Databricks ジョブの定義で構成されています。その後、Databricks ワークスペースでジョブを検証、デプロイ、実行します。 | |
Databricks特定のPython アセット バンドル テンプレートを作成して、特定の コンテナ イメージを使用して、クラスタリング上の特定の タスクでジョブを実行するバンドルを作成します。Dockerカスタムバンドルテンプレートに関する情報については、「 カスタムバンドルテンプレート」を参照してください。 |