オートスケールを使用した Lakeflow 宣言型パイプラインのクラスター利用の最適化

この記事では、強化オートスケールを使用して、Lakeflow で宣言型パイプラインを最適化する方法について説明します。Databricks

強化オートスケールは、すべての新しいパイプラインのデフォルトによって有効になります。サーバレスパイプラインも垂直オートスケールを使用します。垂直オートスケールとはを参照してください。

サーバレスパイプラインの場合、強化オートスケールは常にオンになっており、無効にすることはできません。サーバレスパイプラインの設定を参照してください。

強化オートスケールとは?

Databricks 強化オートスケールは、ワークロードの量に基づいてクラスターリソースを自動的に割り当てることで、パイプラインのデータ処理レイテンシへの影響を最小限に抑えながら、クラスターの使用率を最適化します。

強化オートスケールは、Databricksクラスターオートスケールの機能を強化し、次の機能を備えています。

強化オートスケールは、ストリーミングワークロードの最適化を実装し、バッチワークロードのパフォーマンスを向上させるための拡張機能を追加します。強化オートスケールは、ワークロードの変化に応じてマシンを追加または削除することでコストを最適化します。
拡張オートスケールは、使用率の低いノードをプロアクティブにシャットダウンし、シャットダウン中にタスクが失敗しないことを保証します。既存のクラスターオートスケール機能は、ノードがアイドル状態の場合にのみノードをスケールダウンします。

強化オートスケールは、 Lakeflow 宣言型パイプライン UI で新しいパイプラインを作成するときのデフォルトオートスケールモードです。既存のパイプラインの強化オートスケールを有効にするには、UIでパイプライン設定を編集します。強化オートスケールは、Lakeflow 宣言型パイプライン APIを使用してパイプラインを作成または編集するときにも有効にできます。

強化オートスケールはスケールアップやスケールダウンの判断にどのメトリクスを使用していますか?

強化オートスケールは、2つのメトリクスを使用してスケールアップまたはスケールダウンを決定します。

タスクスロット使用率 : これは、クラスターで使用可能なタスクスロットの合計 に対する ビジータスクスロットの数 の平均比率です。
タスクキューサイズ :これは、タスクスロットで実行を待機しているタスクの数です。

Lakeflow 宣言型パイプラインの強化オートスケールを有効にする

強化オートスケールは、 Lakeflow 宣言型パイプライン UI で新しいパイプラインを作成するときのデフォルトオートスケールモードです。既存のパイプラインの強化オートスケールを有効にするには、UIでパイプライン設定を編集します。強化オートスケールは、 Lakeflow 宣言型パイプラインを使用してパイプラインを作成または編集するときにも有効にできます API。

強化オートスケールを使用するには、次のいずれかの操作を行います。

Lakeflow宣言型パイプライン UI でパイプラインを作成または編集するときは、 クラスターモード を 強化オートスケール に設定します。
autoscale 設定をパイプラインクラスター構成に追加し、mode フィールドを ENHANCEDに設定します。Lakeflow宣言型パイプラインのコンピュートの構成を参照してください。

強化オートスケールを本番運用パイプラインに設定する場合は、次のガイドラインを使用してください。

Min workers設定はデフォルトのままにします。
Max workers設定を、予算とパイプラインの優先度に基づく値に設定します。

次の例では、最小 5 人のワーカーと最大 10 人のワーカーを持つ強化オートスケールクラスターを構成します。 max_workers は min_workers以上である必要があります。

注記

強化オートスケールは、 updates クラスターでのみ使用できます。レガシーオートスケールは、 maintenance クラスターに使用されます。
autoscale構成には、次の 2 つのモードがあります。
- LEGACY: クラスターオートスケールを使用します。
- ENHANCED:強化オートスケールを使用します。

JSON
{
  "clusters": [
    {
      "autoscale": {
        "min_workers": 5,
        "max_workers": 10,
        "mode": "ENHANCED"
      }
    }
  ]
}

パイプラインが連続実行に設定されている場合は、オートスケールの設定が変更されると自動的に再開されます。再起動後、待機時間が短時間増加することが予想されます。この短い待機時間の増加の後、クラスターサイズは autoscale 構成に基づいて更新され、パイプラインの待機時間は以前の待機時間特性に戻る必要があります。

強化オートスケールを使用するパイプラインのコストを制限する

注記

ワーカーをサーバレスパイプラインに設定することはできません。

パイプラインの コンピュート ペインで ワーカーの最大数 パラメーターを設定すると、オートスケールの上限が設定されます。使用可能なワーカーの数を減らすと、一部のワークロードのレイテンシーが増加する可能性がありますが、コンピュートを集中的に使用する操作中にコンピュートリソースのコストがバーストするのを防ぐことができます。

Databricks では、特定のニーズに合わせてコストと待機時間のトレードオフのバランスを取るために、 最大ワーカー数 の設定を調整することをお勧めします。

パイプラインUIのコンピュートペインでは、オートスケールのワーカーの最大数を設定できます

強化オートスケール有効化クラシックパイプラインの監視

Lakeflow 宣言型パイプラインユーザーインターフェイスのイベントログを使用して、クラシックパイプラインの強化オートスケールメトリクスを監視できます。強化オートスケールイベントのイベント・タイプは autoscale です。イベントの例を次に示します。

イベント	メッセージ
クラスターサイズ変更要求が開始されました	`Scaling [up or down] to <y> executors from current cluster size of <x>`
クラスターサイズ変更要求が成功しました	`Achieved cluster size <x> for cluster <cluster-id> with status SUCCEEDED`
クラスターサイズ変更要求が部分的に成功しました	`Achieved cluster size <x> for cluster <cluster-id> with status PARTIALLY_SUCCEEDED`
クラスターサイズ変更要求が失敗しました	`Achieved cluster size <x> for cluster <cluster-id> with status FAILED`

強化オートスケールイベントを表示するには、イベントログを直接クエリします。

イベントログでバックログメトリクスのクエリを実行するには、「イベントログのクエリによるデータバックログの監視」を参照してください。
強化オートスケール操作中のクラスターサイズ変更要求と応答を監視するには、サーバレスが有効になっていないパイプラインのイベントログから強化オートスケールイベントの監視を参照してください。

垂直オートスケールとは?

サーバレスパイプラインは、 Databricks 強化オートスケールが提供する水平方向のオートスケールに加えて、メモリ不足エラーによる失敗なしに Lakeflow 宣言型パイプラインを実行できる最もコスト効率の高いインスタンスタイプを自動的に割り当てます。垂直オートスケールは、パイプライン更新を実行するためにより大きなインスタンスタイプが必要な場合にスケールアップし、小さなインスタンスタイプで更新を実行できると判断した場合にもスケールダウンします。垂直オートスケールは、ドライバーノード、ワーカーノード、またはドライバーノードとワーカーノードの両方をスケールアップまたはスケールダウンするかどうかを決定します。

垂直オートスケールは、Lakeflow Databricks SQLマテリアライズドビューやストリーミングテーブルで使用されるパイプラインを含む、すべてのサーバレス宣言型パイプラインで使用されます。

垂直オートスケールは、メモリ不足エラーが原因で失敗したパイプライン更新を検出することで機能します。垂直オートスケールは、失敗した更新から収集されたメモリ不足データに基づいて、これらの障害が検出された場合に、より大きなインスタンスタイプを割り当てます。本番運用モードでは、新しいコンピュートリソースを使用した新しい更新が自動的に開始されます。開発モードでは、新しい更新プログラムを手動で開始するときに、新しいコンピュートリソースが使用されます。

垂直オートスケールは、割り当てられたインスタンスのメモリが一貫して十分に活用されていないことを検出した場合、インスタンスタイプをスケールダウンして次回のパイプライン更新で使用します。

強化 オートスケールとは?​

強化 オートスケールはスケールアップやスケールダウンの判断にどのメトリクスを使用していますか?​

Lakeflow 宣言型パイプラインの強化オートスケールを有効にする​

強化オートスケールを使用するパイプラインのコストを制限する​

強化オートスケール有効化クラシックパイプラインの監視​

垂直 オートスケールとは?​