1 つのジョブ実行をトリガーする
今すぐ実行 ボタンを使用して、1 つのジョブの実行をトリガーします。
また、 別のパラメーターで今すぐ実行 を選択して、デフォルト ジョブ パラメーターをオーバーライドすることもできます。
Databricks では、ジョブごとに 1 つの並列実行を強制するデフォルト設定を使用することをお勧めします。 ワークロードでジョブの複数の並列実行が必要な場合は、「 最大並列実行の設定」を参照してください。
ジョブをすぐに実行する
ジョブをすぐに実行するには、[ ] をクリックします。
ノートブック タスクを使用してジョブのテスト実行を実行するには、 今すぐ実行 をクリックします。 ノートブックを編集した後でもう一度 実行 をクリックして、最新バージョンのノートブックを実行します。
異なる設定でジョブを実行する
別の設定で今すぐ実行 では、実行するタスク、実行するパラメータの選択、既存のパラメータのデフォルト値の上書き、 パフォーマンス最適化 サーバレス ワークロードの実行を選択できます。
- 今すぐ実行 の横にある青いキャレット
をクリックして 別の設定で今すぐ実行 を選択するか、アクティブな実行テーブルで 別の設定で今すぐ実行 をクリックします。
- (オプション)グラフ内でタスクをクリックして、実行するタスクを選択またはクリアします。アップストリームまたはダウンストリームのタスクと一緒にタスクを実行するには、タスクのサブセットとその依存関係を実行するを参照してください。
- (オプション)新しいジョブ・パラメーターをキーと値のペアとして入力します。ジョブ・パラメーターの構成を参照してください。
- (オプション) [パフォーマンスの最適化 ] 設定を変更します。ワークフローについては、 Run your Lakeflow Jobs with サーバレス コンピュート を参照してください。
- 実行 をクリックします。
タスクの選択を解除しても、今回の実行時のみに影響します。タスクを削除せずに実行ごとにスキップするには、ジョブ設定でそのタスクを無効にします。LakeFlowジョブの「無効なタスク」を参照してください。
[ 異なるパラメーターで今すぐ実行 ] ダイアログには、現在のジョブにタスク パラメーターのみがあり、ジョブ パラメーターが定義されていない場合に、 従来のパラメーターに切り替える オプションが含まれています。 この従来の動作は推奨されなくなりました。
タスクのサブセットとその依存関係を実行する
異なるパラメーターで実行する場合、実行するタスクのサブセットを選択できます。必要に応じて、選択範囲を拡張して、各タスクの依存関係、すなわちその 上流 タスク(それに先行し、それが依存するタスク)またはその 下流 タスク(それに続き、それが依存されるタスク)を含めることができます。
API または CLI でキーによってタスクを選択すると、+ 修飾子がこの展開を制御します:
タスクキー | 実行されるタスク |
|---|---|
|
|
|
|
|
|
|
|
+の拡張機能は無効化されたタスクを除外します。無効化されたタスクを含めるには、明示的に選択する必要があります。Lakeflowジョブの無効化されたタスクを参照してください。
UI、REST API、Databricks CLI、SDK、または宣言型自動化バンドルから部分実行を開始します。
- UI
- REST API
- CLI
- 「 別の設定で今すぐ実行 」ダイアログを開き、「 すべて選択解除 」をクリックします。異なる設定でのジョブの実行を参照してください。
- グラフ内で実行したい「タスク」をクリックします。
- 選択したタスクにカーソルを合わせます。タスクの上のメニューバーで、
をクリックしてアップストリーム タスクも実行するか、
をクリックしてダウンストリーム タスクも実行します。両方をクリックして、アップストリーム タスクとダウンストリーム タスクを含めます。これらのボタンは、
+my_taskおよびmy_task+構文に相当します。 - 実行 をクリックします。
onlyフィールドのjobs/run-nowリクエストでタスクキーを渡します。onlyを省略すると、ジョブはすべてのタスクを実行します。
次のリクエストは、task_1をその上流タスクとともに実行し、task_2をそのダウンストリーム タスクとともに実行します。
POST /api/2.2/jobs/run-now
{
"job_id": 11223344,
"only": ["+task_1", "task_2+"]
}
SDKは同じonlyフィールドを受け入れます。
databricks bundle runの--onlyフラグに、タスクキーをカンマ区切りのリストとして渡します。宣言型オートメーションバンドルで定義されたジョブを実行する場合も、同じフラグが適用されます:
databricks bundle run my_job --only +task_1,task_2+
手動トリガーと連続ジョブ
連続ジョブは、常に 1 つの並列実行のデフォルト設定を保持する必要があります。 そのため、連続トリガーがアクティブな場合、 実行 ボタンは 実行の再開 ボタンに置き換えられます。
連続トリガーを一時停止すると、[ 今すぐ実行 ] ボタンが使用可能になります。
連続トリガーが再開されたときにいずれかの実行がアクティブである場合、ジョブ・スケジューラーは、その実行が完了するまで待機して新しい実行をトリガーします。