Databricks アセット バンドルのチュートリアル
Databricks アセットバンドルは、ジョブやパイプラインなどの Databricks リソースをソースファイルとして記述し、これらのソースファイルと一緒にメタデータを含めてインフラストラクチャやその他のリソースをプロビジョニングし、プロジェクトのエンドツーエンドの定義を提供し、すべて 1 つのデプロイ可能なプロジェクトとしてパッケージ化します。「Databricks アセットバンドルとは」を参照してください。
このページでは、Databricks アセット バンドルの開発方法の学習に役立つチュートリアルの概要を示します。
チュートリアル | 説明 |
|---|---|
ジョブをプログラムで管理するためのバンドルを作成します。バンドルは、 Databricks Asset Bundles のPython用バンドル テンプレートを使用して作成され、ノートブックとそれを実行するジョブの定義で構成されます。 次に、Databricks ワークスペースでデプロイされたジョブを検証、デプロイ、実行します。 | |
パイプラインをプログラムで管理するためのバンドルを作成します。バンドルは、 Python用のDatabricks Asset Bundles 当然バンドル テンプレートを使用して作成され、サンプル パイプライン コード、パイプラインの定義とそれを実行するジョブで構成されます。 次に、デプロイされたパイプラインを Databricks ワークスペースで検証、デプロイ、実行します。 | |
Databricks Asset Bundles プロジェクトの一部としてPython wheelをビルド、デプロイ、および実行します。 | |
Scala JAR を Databricks Asset Bundles プロジェクトの一部としてビルド、デプロイ、実行します。 | |
MLOps スタックバンドルを作成します。MLOpsスタックは、本番運用のベストプラクティスに準拠したDatabricksですぐに利用できるMLOpsプロジェクトです。 | |
テンプレートを使用せずに、バンドルを最初から作成します。この単純なバンドルは、2 つのノートブックと、これらのノートブックを実行するための Databricks ジョブの定義で構成されています。その後、Databricks ワークスペースでジョブを検証、デプロイ、実行します。 | |
Databricks特定のPython アセット バンドル テンプレートを作成して、特定の コンテナ イメージを使用して、クラスター上の特定の タスクでジョブを実行するバンドルを作成します。Dockerカスタムバンドルテンプレートに関する情報については、「 カスタムバンドルテンプレート」を参照してください。 |