メインコンテンツまでスキップ

宣言型自動化バンドルのチュートリアル

Declarative Automation Bundle (以前はDatabricks Asset Bundle として知られていました) は、ジョブやパイプラインなどのDatabricksリソースをソース ファイルとして記述し、これらのソース ファイルと一緒にメタデータをプロビジョニング インフラストラクチャやその他のリソースに含めることができ、プロジェクトのエンドツーエンドの定義を提供し、すべて単一のデプロイ可能なプロジェクトとしてパッケージ化されます。 「宣言型自動化バンドルとは何か?」を参照してください。

このページでは、宣言型自動化バンドルの開発方法を学ぶのに役立つチュートリアルの概要を説明します。

チュートリアル

説明

宣言型自動化バンドルを使用してジョブを開発する

ジョブをプログラムで管理するためのバンドルを作成します。このバンドルは、Python 用の Declarative Automation Bundles のデフォルトバンドルテンプレートを使用して作成され、ノートブックと、それを実行するためのジョブの定義で構成されています。次に、 Databricksワークスペースでデプロイされたジョブを検証、デプロイ、実行します。

宣言型自動化バンドルを使用してパイプラインを開発する

パイプラインをプログラムで管理するためのバンドルを作成します。このバンドルは、Python 用の Declarative Automation Bundles のデフォルトバンドルテンプレートを使用して作成され、サンプルパイプラインコード、パイプラインの定義、およびパイプラインを実行するためのジョブの定義で構成されています。次に、 Databricksワークスペースでデプロイされたパイプラインを検証、デプロイ、および実行します。

宣言型自動化バンドルを使用してPython wheelファイルを作成する

宣言型自動化バンドルプロジェクトの一部として、 Python wheelを構築、デプロイ、および実行します。

宣言型自動化バンドルを使用してScala JARを構築する

宣言型自動化バンドルプロジェクトの一環として、Scala JARファイルを構築、デプロイ、実行します。

宣言型自動化バンドルを使用してDatabricksアプリを管理する

Databricks アプリをローカルで開発し、バンドルを構成して、Databricks ワークスペースへのアプリのデプロイを管理します。

MLOpsスタック向け宣言型自動化バンドル

MLOps スタックバンドルを作成します。MLOpsスタックは、本番運用のベストプラクティスに準拠したDatabricksですぐに利用できるMLOpsプロジェクトです。

バンドルを手動で作成する

テンプレートを使用せずに、バンドルを最初から作成します。この単純なバンドルは、2 つのノートブックと、これらのノートブックを実行するための Databricks ジョブの定義で構成されています。その後、Databricks ワークスペースでジョブを検証、デプロイ、実行します。

カスタムバンドルテンプレートを作成する

特定のDockerコンテナー イメージを使用してクラスター上の特定のPythonタスクでジョブを実行するバンドルを作成するためのカスタムの宣言的オートメーション バンドル テンプレートを作成します。 カスタムバンドルテンプレートに関する情報については、 「カスタムバンドルテンプレート」を参照してください。