ジョブのパイプライン タスク
Lakeflow ジョブは、 タスク 間の関係を定義するための手続き型アプローチを提供します。 Lakeflow 宣言型パイプラインは、 データセット と 変換 の間の関係を定義するための宣言型アプローチを提供します。 このページでは、ジョブUI、Lakeflow宣言型パイプラインのUI、SQLを用いて、ジョブのタスクとしてLakeflow宣言型パイプラインが起動されるようにスケジュールする方法を説明します。
トリガーされた パイプラインは、継続的に実行されないパイプラインですが、開始するにはトリガーする必要があります。パイプライン タスクは、トリガーされたパイプラインのトリガー メカニズムにすることができます。連続パイプラインはトリガーする必要がないため、タスクを通じてパイプラインをトリガーするのは冗長です。トリガーされたパイプラインと連続パイプラインの詳細については、「 トリガーされたパイプライン モードと連続パイプライン モード」を参照してください。
ジョブ UI を使用したパイプライン タスクの構成
Lakeflow 宣言型パイプラインは、パイプライン定義内のソース コードとコンピュートのすべての構成を管理します。
ジョブにパイプラインを追加するには、次の手順を実行します。
- 新しいタスクを作成して名前を付け、 種類 で パイプライン を選択します。
- パイプライン ドロップダウン メニューで、既存のパイプラインを選択します。パイプラインは、トリガーされたパイプラインである必要があります。連続パイプラインは、ジョブ タスクとしてサポートされていません。
- 必要に応じて、パイプラインの完全更新をトリガーできます。
タスクの作成時に、 タスクの追加 ペインまたはタスク の種類 ドロップダウンから + 新しいインジェストパイプライン を選択して、新しいインジェストパイプラインを作成することもできます。
パイプライン UI を使用したパイプラインのスケジュール設定
パイプラインにスケジュールを追加すると、1 つのパイプライン タスクを持つジョブが作成されます。時間ベースのスケジュールトリガーは、このUIを使用してのみ設定できます。より高度なトリガー オプションについては、「 ジョブ UI を使用してパイプライン タスクを構成する」を参照してください。
パイプライン UI を使用してスケジュールされたジョブでパイプライン タスクを構成するには、次の手順を実行します。
-
ワークスペースで、サイドバーの
ジョブ & パイプライン をクリックします。
-
パイプラインの 名前 をクリックします。パイプライン UI が表示されます。
-
スケジュール をクリックします。
- パイプラインにスケジュールが存在しない場合は、[ 新しいスケジュール ] ダイアログが表示されます。
- 1 つ以上のスケジュールがすでに存在する場合は、[ スケジュールの追加 ] をクリックします。
-
ジョブ名 フィールドにジョブの一意の名前を入力します。
-
(オプション)スケジュールの頻度を更新します。
- [ 詳細 ] を選択すると、cron 構文を含むより詳細なオプションが表示されます。
-
(オプション) その他のオプション で、パイプラインの開始、成功、または失敗時にアラートを受け取るように 1 つ以上の Eメール アドレスを構成します。
-
作成 をクリックします。
パイプラインが 1 つ以上のスケジュールされたジョブに含まれている場合、[ スケジュール ] ボタンには既存のスケジュールの数が表示されます ( 例: スケジュール (5) )。