メインコンテンツまでスキップ

高いQPSでエンドポイントのスループットを拡張

備考

プレビュー

この機能は パブリック プレビュー段階です。

デフォルトでは、標準エンドポイントはインデックスサイズに応じて20~200 QPSをサポートします。検索バー、レコメンデーションシステム、エンティティマッチングなどのリアルタイムアプリケーションでは、100~1000QPS以上の処理能力が求められることが多い。標準エンドポイントでのみ、目標QPSを設定できます。Databricksは、そのスループットレベルに最も適したインフラストラクチャをプロビジョニングします(ベストエフォート型であり、保証されるものではありません)。

重要

ターゲット QPS プロビジョニングの追加容量を設定すると、エンドポイントのコストが増加します。 実際のクエリトラフィック量に関わらず、この追加容量に対して料金が発生します。これらの料金が発生しないようにするには、 target_qps=-1を使用してエンドポイントをデフォルト設定にリセットしてください。パブリックプレビュー期間中は、スループットのスケーリングはベストエフォート型であり、保証されるものではありません。

次の場合には高い QPS を使用します。

  • アプリケーションでは 50 QPS を超える持続的なスループットが必要です。
  • 通常の負荷では 429 (リクエストが多すぎます) エラーが発生します。
  • 平均使用率が低いように見えても、トラフィックが増加するとレイテンシは低下します。

要件

  • 高 QPS は標準エンドポイントでのみ利用できます。ストレージ最適化エンドポイントはサポートされていません。
  • 70~100 QPS を超える処理を実行するエンドポイントには OAuth 認証が必要です。Personal ACCESS (PAT) のレートは 70 ~ 100 QPS に制限されています。 OAuthクラウドでサービスプリンシパルを使用する」を参照してください。

ターゲットQPSを構成する

新しいエンドポイントを作成する場合、または既存のエンドポイントを更新する場合は、目標QPSを設定してください。目標スループットに最も適した追加容量は、自動的にプロビジョニングされます。パブリックプレビュー版では、スループットのスケーリングはベストエフォート型であり、保証されるものではありません。実際のQPSは、インデックスサイズ、ベクトル次元数、クエリの複雑さ、およびフィルタの使用状況によって異なります。

新しいエンドポイントを作成する場合:

  1. 左側のサイドバーで 「コンピュート」 をクリックします。

  2. [検索] タブをクリックし、 [エンドポイントの作成] をクリックします。

    通用検索コンピュートを作成します。

  3. 詳細設定 で、 目標QPS 値を入力します。

    「ベクトル検索エンドポイントの作成」ダイアログを作成します。

既存のエンドポイントを更新する場合:

  1. エンドポイントの詳細ページに移動します。

  2. 右側のパネルで、鉛筆アイコンをクリックします。鉛筆アイコン。 Target QPS の隣。

    目標QPSを編集します。

  3. 新しい値を入力し、 「保存」 をクリックします。

    目標QPS値を入力してください。

スケーリングの適用方法

目標QPSを設定すると、必要な容量が自動的にプロビジョニングされます。新しいスループットレベルはプロビジョニング完了後に適用されます。変更をトリガーするためにインデックスを同期する必要はありません。

注記

スケーリング操作の実行中にターゲットQPSを更新しようとすると、 RESOURCE_CONFLICTエラーが返されます。再試行する前に、現在の操作が完了するまでお待ちください。

制限事項

  • オートスケールなし : 予想されるトラフィックに基づいてターゲット QPS を手動で設定する必要があります。 トラフィックがプロビジョニング レベルを超えると、429 エラーが発生します。 クエリの急増については、計画を参照してください。
  • 標準エンドポイントのみ : ストレージ最適化エンドポイントはtarget_qpsをサポートしません。