Lakeflowジョブ内のタスクのフローを制御する

一部のジョブは、完了する必要があるタスクのリストです。タスクの実行順序を制御するには、タスク間の依存関係を指定します。タスクを順番に実行するように設定したり、並列して実行するように設定したりすることができます。

ただし、条件付きタスク、エラー修正、またはクリーンアップを含む分岐フローを作成することもできます。Lakeflowジョブは、ジョブ内のタスクのフローを制御する機能を提供します。次のトピックでは、タスクのフローを制御する方法について説明します。

再試行

再試行は、タスクがエラーメッセージで失敗した場合に、特定のタスクを再実行する回数を指定します。多くの場合、エラーは一時的なもので、再起動によって解決されます。 Databricksの一部の機能 (スキーマ進化と構造化ストリーミングなど) では、ジョブを再試行して環境をリセットし、ワークフローを続行することを前提としています。

タスクの再試行を指定した場合、エラーが発生した場合、タスクは指定された回数まで再起動します。すべてのジョブ構成がタスクの再試行をサポートしているわけではありません。再試行ポリシーの設定を参照してください。

連続トリガーモードで実行されている場合、Databricks はエクスポネンシャルバックオフを使用して自動的に再試行します。連続ジョブの障害処理を参照してください。

条件付きタスクの場合に実行

Run if タスクタイプを使用すると、他のタスクの結果に基づいて、後のタスクの条件を指定できます。ジョブにタスクを追加し、上流に依存するタスクを指定します。これらのタスクのステータスに基づいて、実行する 1 つ以上のダウンストリームタスクを構成できます。ジョブは、次の依存関係をサポートします。

すべて成功しました
少なくとも1つが成功しました
失敗したものはありません
すべて完了
少なくとも1回失敗しました
すべて失敗しました

タスクの依存関係を構成するを参照してください

if/else 条件付きタスク

If/else タスクタイプを使用して、ある値に基づいて条件を指定できます。「 If/else タスクを使用してジョブに分岐ロジックを追加する」を参照してください。

Lakeflow ジョブは、ロジックで定義する taskValues をサポートし、タスクから一部の計算または状態の結果をジョブ環境に戻すことができます。 If/else 条件は、taskValues、ジョブ・パラメーター、または動的値に対して定義できます。

Lakeflowジョブは、条件子として以下のオペランドをサポートします。

==
!=
>
>=
<
<=

関連項目は次を参照してください。

各タスク

For each タスクを使用して、ループ内で別のタスクを実行し、タスクの各反復に異なるパラメーターのセットを渡します。

For eachタスクをジョブに追加するには、For eachタスクと ネストされたタスク を定義する必要があります。ネストされたタスクは、 For each タスクの各イテレーションに対して実行するタスクであり、標準の Databricks タスクの種類の 1 つです。入れ子になったタスクにパラメーターを渡すために、複数のメソッドがサポートされています。

For eachタスクを使用してループ内の別のタスクを実行するを参照してください。

無効化されたタスク

タスクを無効にすると、ジョブから削除することなく、実行時にそのタスクをスキップできます。タスクはその構成と実行履歴を保持し、 LakeFlowジョブはそのRun if条件に照らしてダウンストリームタスクを評価し、それらも実行されるかどうかを判断します。

LakeFlowジョブの無効なタスクを参照してください。

再試行​

条件付きタスクの場合に実行​

if/else 条件付きタスク​

各タスク​

無効化されたタスク​

再試行

条件付きタスクの場合に実行

if/else 条件付きタスク

各タスク

無効化されたタスク