ジョブコンピュートの設定

この記事には、 Lakeflow ジョブのコンピュートを構成するための推奨事項とリソースが含まれています。

important

ジョブ用サーバレスコンピュートには、次のような制限があります。

継続的な スケジューリングはサポートされていません。
構造化ストリーミングでは、デフォルトまたは時間ベースのインターバルトリガーはサポートされていません。

その他の制限事項については、サーバレスコンピュートの制限事項を参照してください。

各ジョブには、1 つ以上のタスクを含めることができます。コンピュートリソースは、タスクごとに定義します。同じジョブに対して定義された複数のタスクは、同じコンピュートリソースを使用できます。

複数のテイクと関連するクラウドコンピュートリソースを持つジョブを示す画像

各タスクの推奨コンピュート

次の表は、各タスクの種類で推奨およびサポートされているコンピュートの種類を示しています。

注記

サーバレスコンピュート for ジョブには制限があり、すべてのワークロードをサポートしているわけではありません。サーバレスコンピュートの制限事項を参照してください。

タスク	推奨コンピュート	対応コンピュート
ノートブック	サーバレスジョブ	ジョブ用サーバレス、ジョブ用クラシック、汎用クラシック
Pythonスクリプト	サーバレスジョブ	ジョブ用サーバレス、ジョブ用クラシック、汎用クラシック
Python Wheel	サーバレスジョブ	ジョブ用サーバレス、ジョブ用クラシック、汎用クラシック
SQL	サーバレス SQLウェアハウス	サーバレス SQLウェアハウス、pro SQLウェアハウス
Lakeflow 宣言型パイプライン	サーバレスパイプライン	サーバレスパイプライン、クラシックパイプライン
dbt	サーバレス SQLウェアハウス	サーバレス SQLウェアハウス、pro SQLウェアハウス
dbt CLI コマンド	サーバレスジョブ	ジョブ用サーバレス、ジョブ用クラシック、汎用クラシック
JAR	クラシックジョブ	クラシックジョブ、クラシック汎用
Spark Submit	クラシックジョブ	クラシックジョブ

Lakeflowジョブの価格は、タスクの実行に使用されるコンピュートに関連付けられています。詳細については、「 Databricks の価格」を参照してください。

ジョブのコンピュートを設定するにはどうすればよいですか?

クラシックジョブコンピュートは Lakeflow ジョブ UI から直接設定され、これらの設定はジョブ定義の一部です。他のすべての使用可能なコンピュートタイプは、他のワークスペースアセットと共に構成を保存します。次の表に詳細を示します。

クラスタータイプ	詳細
クラシックジョブコンピュート	クラシックジョブのコンピュートは、汎用コンピュートと同じUIと設定を使用して設定します。コンピュート設定リファレンスを参照してください。
ジョブ用サーバレスコンピュート	ジョブ用サーバレスコンピュートは、それをサポートするすべてのタスクのデフォルトです。 Databricks サーバレスコンピュートのコンピュート設定を管理します。ワークフローについては、サーバレスコンピュートによるLakeflowジョブの実行を参照してください。このオプションを表示するには、ワークスペース管理者がサーバレスコンピュートを有効にする必要があります。サーバレスコンピュートの有効化を参照してください。
SQLウェアハウス	サーバレスと Pro SQLウェアハウスは、ワークスペース管理者または無制限のクラスター作成権限を持つユーザーによって構成されます。既存の SQLウェアハウスに対してタスクを実行するように構成します。 SQLウェアハウスへの接続を参照してください。
Lakeflow 宣言型パイプラインコンピュート	Lakeflow 宣言型パイプラインのコンピュート設定は、パイプラインの構成時に構成します。Lakeflow宣言型パイプラインのコンピュートの構成を参照してください。Databricks は、サーバレスの Lakeflow 宣言型パイプラインのコンピュートリソースを管理します。サーバレスパイプラインの設定を参照してください。
汎用コンピューティング	オプションで、従来の汎用コンピュートを使用してタスクを設定できます。 Databricks では、この構成を本番運用ジョブにはお勧めしません。コンピュート設定リファレンスおよび汎用コンピュートをジョブに使用すべきかを参照してください。

タスクにおけるコンピュートの共有

同じジョブコンピュートリソースを使用するようにタスクを構成して、複数のタスクを調整するジョブでリソースの使用を最適化します。タスク間でコンピュートを共有すると、起動時間に関連するレイテンシーを短縮できます。

1 つのジョブコンピュートリソースを使用して、ジョブの一部であるすべてのタスクを実行したり、特定のワークロード用に最適化された複数のジョブリソースを実行したりできます。ジョブの一部として設定されたジョブコンピュートは、ジョブ内の他のすべてのタスクで使用できます。

次の表は、1 つのタスク用に構成されたジョブコンピュートと、タスク間で共有されるジョブコンピュートの違いを示しています。

	1 つのタスク	タスク間で共有
起動	タスクの実行が開始されたとき。	コンピュートリソースを使用するように構成された最初のタスク実行が開始されると、そのタスク実行が開始されます。
終了	タスクの実行後。	最後のタスクの後、コンピュートリソースを使用するように構成しました。
アイドルコンピュート	該当なし。	コンピュートはオンでアイドル状態のままで、タスクはコンピュートリソースを使用していません。

共有ジョブクラスターは、スコープが 1 つのジョブ実行に限定され、他のジョブや同じジョブの実行では使用できません。

ライブラリは、共有ジョブクラスター構成で宣言することはできません。タスク設定で依存ライブラリを追加する必要があります。

ジョブコンピュートのレビュー、構成、スワップ

ジョブ詳細 パネルの コンピュート セクションには、現在のジョブのタスクに設定されたすべてのコンピュートが一覧表示されます。

コンピュートリソースを使用するように構成されたタスクは、コンピュート仕様にカーソルを合わせると、タスクグラフで強調表示されます。

スワップ ボタンを使用して、コンピュートリソースに関連付けられているすべてのタスクのコンピュートを変更します。

クラシックジョブコンピュートリソースには [構成] オプションがあります。その他のコンピュートリソースには、コンピュート構成の詳細を表示および変更するオプションがあります。

詳細情報

クラシックジョブの設定の詳細についてはDatabricksクラシックLakeflowジョブの設定に関するベストプラクティスを参照してください。

各タスクの推奨コンピュート​

ジョブのコンピュートを設定するにはどうすればよいですか?​

タスクにおけるコンピュートの共有​

ジョブコンピュートのレビュー、構成、スワップ​

詳細情報​

各タスクの推奨コンピュート

ジョブのコンピュートを設定するにはどうすればよいですか?

タスクにおけるコンピュートの共有

ジョブコンピュートのレビュー、構成、スワップ

詳細情報