スケジュールに従ってジョブを実行する
時間ベースのスケジュールでジョブを実行するように、**スケジュール済み**トリガーでジョブを設定します。
スケジュールされたトリガーの種類には、次の 2 つのオプションがあります。
- 指定した時間単位と間隔に基づいてジョブを定期的に実行する単純なスケジュールを定義します。 たとえば、ジョブが最初に実行された時点から 12 時間ごとにジョブが実行されるようにスケジュールします。
- ジョブを実行する期間、時間、およびタイム・ゾーンをより詳細に制御できる拡張スケジュールを定義します。
注記
単純なスケジュールでは、最初の実行の時間を指定することはできません。 スケジューラは、スケジュールを構成するときに時間を選択します。
ジョブ スケジュールを追加する
ジョブのスケジュールを定義するには、次のようにします。
-
Databricks ワークスペースのサイドバーで、[ ジョブとパイプライン] をクリックします。
-
必要に応じて、[ ジョブ ] と [自分が所有] フィルターを選択します。
-
ジョブ の [名前 ] リンクをクリックします。
-
ジョブの詳細 ウィンドウで、 トリガーの追加 をクリックします。
-
[トリガーの種類 ] で、 [ スケジュール済み ] を選択します。
-
[スケジュールの種類 ] で、[ シンプル ] または [詳細] を選択します。
- シンプル : ジョブを実行する間隔と時間単位を指定します。
- 詳細 : 期間、開始時刻、およびタイム ゾーンを指定します。 オプションで、「 Show Cron Syntax 」チェックボックスを選択して、 Quartz Cron Syntaxでスケジュールを表示および編集します。
-
[ 保存 ]をクリックします。
ノートブックの UI で直接ノートブック ジョブをスケジュールすることもできます。
注記
- Databricks では、cron 式の構成に関係なく、ジョブのスケジュールによってトリガーされる後続の実行間に 10 秒の最小間隔が適用されます。
- 夏時間に対応しているタイムゾーンまたはUTCを選択できます。サマータイムを採用しているタイムゾーンを選択した場合、サマータイムが開始または終了すると、時間ごとのジョブはスキップされるか、または1〜2時間遅れて表示されることがあります。毎時(絶対時間)に実行するには、UTCを選択します。
- ジョブ スケジューラは、待機時間の短いジョブ用ではありません。 ネットワークまたはクラウドの問題により、ジョブの実行が最大で数分遅れることがあります。 このような状況では、スケジュールされたジョブは、サービスが利用可能になるとすぐに実行されます。