ジョブの連続的な実行

連続モードを使用して、ワークロードを継続的に実行するようにスケジュールします。 Databricks では、常時オンのストリーミングワークロードに連続モードを使用することをお勧めします。

連続モードは、構造化ストリーミングワークロードの従来の推奨事項を置き換えて、無制限の再試行ポリシーと最大 1 つの並列実行を使用してジョブを構成します。

重要

連続ジョブの動作は、今後のリリースで変更されます。詳細については、連続ジョブとパイプラインの動作変更を参照してください。

注記

サーバレスコンピュートの継続的なスケジュールを持つジョブは、 Trigger.AvailableNowなどの制限された構造化ストリーミングトリガーで動作します。ジョブスケジューラはタスクが完了するとタスクを再開し、ストリーミングチェックポイントはデータが再処理されないことを保証します。

Trigger.ProcessingTimeやTrigger.Continuousなどの時間ベースのトリガーは、サーバレスコンピュートではサポートされていません。「サーバレスコンピュートの制限」を参照してください。

サーバレスコンピュートでの低レイテンシー要件を備えた連続ストリーミングの場合は、連続モードでトリガーモードと連続パイプラインモードを使用します。

連続モードで実行するようにジョブを構成する

ジョブを連続モードで実行するように構成するには、次の操作を行います。

Databricks ワークスペースのサイドバーで、[ ジョブとパイプライン] をクリックします。
必要に応じて、[ ジョブ ] と [自分が所有] フィルターを選択します。
ジョブ の [名前 ] リンクをクリックします。
ジョブの詳細 ウィンドウで トリガーの追加 をクリックし、 トリガーの種類 で連続を選択します。
必要に応じて、 タスク再試行モード を選択します。ジョブ内の失敗したタスクを再試行するには、 「失敗時に 再試行」を選択するか、ジョブレベルでのみ再試行するには 「しない」 を選択できます。連続モードでは、 タスク再試行モード は デフォルトで「失敗時」 に設定されます。

注記

既存のジョブの場合は、最初に [再試行モードの構成] をクリックしてから、タスクの再試行モードを選択する必要がある場合があります。

保存をクリックします。

連続したジョブを停止するには、「 一時停止 」ボタンをクリックします。 「再開」 をクリックして、ジョブを連続モードで再開します。

注記

連続ジョブの実行中のインスタンスは 1 つだけです。
実行の終了と新しい実行の開始の間には遅延があります。この遅延は 60 秒未満にする必要があります。
タスク依存関係は、連続ジョブでは使用できません。
連続ジョブでは再試行ポリシーを使用することはできません。代わりに、連続ジョブは、指数バックオフアルゴリズムを使用して、失敗時にジョブ全体を自動的に再試行します。
タスクの 再試行モード を失敗時に設定することで、タスクレベルでの再試行を追加で構成できます。
[ 今すぐ実行 ] を選択して、停している連続ジョブで新しいジョブの実行をトリガーします。
継続的ジョブに新しい構成を適用するには、 [ランの再開] をクリックして、更新された構成でランを再開します。Jobs APIのrun-nowリクエストにジョブIDを渡すことで、プログラムでこれを実行することもできます。

連続ジョブの障害処理

障害は、 指数バックオフ アルゴリズムを使用して管理されます。

タスクの 再試行モード が 失敗時 に設定されている場合、失敗したタスクは、許可される再試行の最大回数 (1 つのタスクジョブの場合は 3 回) に達するまで、指数関数的に増加する遅延で再試行されます。最大再試行回数に達すると、実行はキャンセルされ、新しい実行がトリガーされます。複数のタスクを持つジョブの場合、他のタスクが実行されていない場合、または他のすべての未完了タスクも失敗または再試行状態にある場合、失敗したタスクは新しい実行をトリガーします。

ジョブレベルでの連続した失敗も指数バックオフを使用して管理されるため、連続したジョブを一時停止せずに実行し、回復可能な障害が発生したときに正常な状態に戻ることができます。

連続ジョブが連続失敗の許容しきい値を超えた場合、後続のジョブ実行の管理方法について以下で説明します。

ジョブは、システムによって設定された再試行期間が経過すると再開されます。
次のジョブ実行が失敗した場合、再試行期間は延長され、この新しい再試行期間の後にジョブが再開されます。
1. 後続のジョブ実行が失敗するたびに、再試行期間は、システムによって設定された最大再試行期間まで延長されます。最大再試行期間に達した後も、ジョブは最大再試行期間を使用して再試行され続けます。連続ジョブの再試行回数に制限はありません。
2. ジョブの実行が正常に完了して新しい実行が開始された場合、または実行が失敗せずにしきい値を超えた場合、ジョブは正常であると見なされ、バックオフシーケンスはリセットされます。

ジョブ UIで、またはジョブAPIで実行-nowリクエストにジョブ ID を渡すことによって、指数バックオフ状態で連続ジョブを再開できます。

連続モードで実行するようにジョブを構成する​

連続ジョブの障害処理​

連続モードで実行するようにジョブを構成する

連続ジョブの障害処理