メインコンテンツまでスキップ

AI検索エンドポイントとインデックスを作成

この記事では、AI検索を使用して、AI検索エンドポイントとインデックスを作成する方法について説明します。

UI、Python SDK 、またはREST API を使用して、AI検索エンドポイントやAI検索インデックスなどの AI検索 コンポーネントを作成および管理できます。

たとえば、AI Search エンドポイントを作成およびクエリする方法を説明するノートブックについては、「AI Search サンプルノートブック」を参照してください。リファレンス情報については、 Python SDK リファレンスを参照してください。

要件

AI検索エンドポイントを作成および管理するためのアクセス許可は、アクセス制御リストを使用して構成されます。AI 検索エンドポイント ACLを参照してください。

インストール

AI Search SDK を使用するには、ノートブックにインストールする必要があります。パッケージをインストールするには、次のコードを使用します。

%pip install databricks-vectorsearch
dbutils.library.restartPython()

次に、VectorSearchClientをインポートするには、次のコマンドを使用してください。

from databricks.vector_search.client import VectorSearchClient

認証に関する情報については、「データ保護と認証」を参照してください。

AI検索エンドポイントを作成

Databricks UI、Python SDK、またはAPIを使用して、AI Searchエンドポイントを作成できます。

UIを使用してAI検索エンドポイントを作成する

UI を使用して AI Search エンドポイントを作成するには、次のステップに従います。

  1. 左側のサイドバーで、 コンピュート をクリックします。

  2. 「**AI Search**」タブをクリックし、「**エンドポイントを作成**」をクリックします。

    AI検索コンピュートを作成します。

  3. エンドポイントの作成フォーム が開きます。このエンドポイントの名前を入力します。

    「AI検索エンドポイントの作成」ダイアログを作成します。

  4. タイプ フィールドで、 標準 または ストレージ最適化 を選択します。エンドポイントのオプションを参照してください。

  5. (オプション) 詳細設定 で、使用ポリシーを選択します。AI 検索使用ポリシーをご覧ください。

  6. 確認 をクリックします。

Python SDKを使用して、AI検索エンドポイントを作成する

次の例では、 create_endpoint() SDK 関数を使用して AI Search エンドポイントを作成します。

Python
# The following line automatically generates a PAT Token for authentication
client = VectorSearchClient()

# The following line uses the service principal token for authentication
# client = VectorSearchClient(service_principal_client_id=<CLIENT_ID>,service_principal_client_secret=<CLIENT_SECRET>)

client.create_endpoint(
name="vector_search_endpoint_name",
endpoint_type="STANDARD" # or "STORAGE_OPTIMIZED"
)

REST APIを使用してAI検索エンドポイントを作成する

REST API リファレンスドキュメント: POST /api/2.0/vector-search/endpointsを参照してください。

宣言型オートメーションバンドルを使用してベクトル検索エンドポイントを作成する

宣言型オートメーションバンドル内でベクトル検索エンドポイントをリソースとして定義し、ジョブ、パイプライン、その他のワークスペースアセットとともにコードとして管理できます。バンドルの概要については、宣言型オートメーションバンドルとはをご覧ください。

注記

バンドルでベクトル検索エンドポイントを定義できるのは、直接デプロイエンジンのみであり、Databricks CLIバージョン1.1.0が必要です。またはそれ以降。

次の例では、標準のベクトル検索エンドポイントを定義します。

YAML
resources:
vector_search_endpoints:
my_vector_search_endpoint:
name: my_vector_search_endpoint
endpoint_type: STANDARD

endpoint_typebudget_policy_idmin_qps、およびpermissionsを含むサポートされている全フィールドのリストについては、vector_search_endpointをご覧ください。

ハイスループットのワークロード向けに、ターゲットQPSを設定してエンドポイントを作成します。

備考

プレビュー

この機能は パブリック プレビュー段階です。

ハイスループットのワークロード向けに、ターゲットQPSのエンドポイントを作成できます。この機能は標準エンドポイントでのみ利用できます。

ターゲットQPSを設定するには、target_qpsパラメーターを使用します。「高 QPS でのエンドポイントスループットのスケーリング」を参照してください。

重要

target_qpsを設定すると、追加の容量がプロビジョニングされ、エンドポイントのコストが増加する可能性があります。この追加のキャパシティには、実際のクエリトラフィックに関わらず課金されます。スループットのスケーリングはベストエフォートであり、パブリックプレビュー期間中は保証されません。

Python
client.create_endpoint(
name="vector_search_endpoint_name",
endpoint_type="STANDARD",
target_qps=500, # target QPS for high-throughput workloads
)

既存のエンドポイントでターゲットQPSを変更するには、update_endpoint()を使用します。

Python
from databricks.vector_search.client import VectorSearchClient

client = VectorSearchClient()

# Set or update target QPS
response = client.update_endpoint(name="vector_search_endpoint_name", target_qps=500)

# Check scaling status
scaling_info = response.get("endpoint", {}).get("scaling_info", {})
print(f"State: {scaling_info.get('state')}") # SCALING_CHANGE_IN_PROGRESS or SCALING_CHANGE_APPLIED

ターゲットQPSを更新した後、新しい構成を適用するためにインデックスを同期してください。

(オプション) 埋め込みモデルを提供するためのエンドポイントを作成して構成する

Databricksで埋め込みをコンピュートすることを選択した場合は、事前構成済みの基盤モデルAPIsエンドポイントを使用するか、選択した埋め込みモデルを提供するためのモデルサービングエンドポイントを作成できます。手順については、トークン単位の従量課金 基盤モデル APIs または 基盤モデルをサービングするエンドポイントの作成を参照してください。たとえば、ノートブックについては、 AI Search サンプル ノートブックを参照してください。

エンべディングエンドポイントを構成する場合、Databricks では、デフォルトの選択である Scale to zero を削除することをお勧めします。 エンドポイントの提供にはウォームアップに数分かかる場合があり、スケールダウンされたエンドポイントを持つインデックスに対する最初のクエリがタイムアウトする可能性があります。

注記

エンベディングエンドポイントがデータセットに対して適切に構成されていない場合、AI Search インデックスの初期化がタイムアウトになる可能性があります。CPU エンドポイントは、小規模なデータセットとテストにのみ使用してください。大規模なデータセットの場合は、最適なパフォーマンスを得るために GPU エンドポイントを使用します。

AI検索インデックスを作成

UI、Python SDK、またはREST APIを使用して、AI Searchインデックスを作成できます。UI は最もシンプルなアプローチです。

インデックスには2種類あります:

  • Delta Sync Index は、ソースのDelta Tableと自動的に同期し、Delta Tableの基になるデータが変更されると、インデックスを自動的かつ段階的に更新します。
  • Direct Vector Access Indexは、ベクトルとメタデータの直接読み取りと書き込みをサポートします。 ユーザーはREST APIまたはPython SDKを使用してこのテーブルを更新する必要があります。このタイプのインデックスはUIを使用して作成できません。REST API または SDK を使用する必要があります。

Delta 同期インデックスは以下の検索モードに対応しています。

  • ベクトル検索 (ANN またはハイブリッド):埋め込み列が必要です。標準とストレージ最適化エンドポイントの両方をサポートしています。これらのインデックスに対するキーワード検索に query_type="FULL_TEXT" を使うこともできます。
  • 専用フルテキスト検索インデックス (ベータ版):キーワード検索のみを目的とし、埋め込み列なしで作成された Delta Sync インデックス。トリガー同期モードを使用するストレージ最適化エンドポイントでのみ利用可能です。全文検索インデックスの作成を参照してください。
注記

列名 _id は予約されています。ソーステーブルに_idという名前の列がある場合、AI検索インデックスを作成する前に名前を変更してください。

UIを使用したインデックスの作成

  1. 左のサイドバーで[ カタログ ] をクリックして、カタログエクスプローラーUIを開きます。

  2. 使用する Delta テーブルに移動します。

  3. 右上の 作成 ボタンをクリックし、ドロップダウンメニューから ベクトル検索インデックス を選択します。

    インデックスを作成するボタン

  4. ダイアログのセレクターを使用して、インデックスを設定してください。

    インデックス作成ダイアログ

    インデックス構造

    名前 : Unity Catalog のオンライン テーブルに使用する名前。 名前には3階層の名前空間、<catalog>.<schema>.<name>が必要です。英数字とアンダースコアのみ使用できます。

    インデックスタイプ :同じインデックスでセマンティック(ベクトル)検索とキーワード検索の両方をサポートするには、 ハイブリッド を選択します。埋め込みなしでキーワード検索のみを行うには、 全文 を選択してください。全文インデックスの要件については、全文検索インデックスの作成 (ベータ) を参照してください。

    主キー :主キーとして使用する列。

    エンベディング

    エンべディングソース :Databricks でDeltaテーブル内のテキスト列のエンべディングをコンピュートするか( エンベディングの計算)、またはDeltaテーブルに事前コンピュートされたエンべディングが含まれるかどうか( 既存のエンべディングを使用 )を示します。

    • コンピュート埋め込み を選択した場合は、埋め込みコンピュートの列を選択します。Databricks が管理する埋め込みモデルがデフォルトで選択されています。別のモデルを使用するには、**高度な設定**を展開し、**埋め込みモデル**ドロップダウンから選択します。テキスト列のみがサポートされています。

      • 標準エンドポイントを使用する本番運用アプリケーションの場合、Databricks は、プロビジョニング スループット サービング エンドポイントと共に基盤モデル databricks-qwen3-embedding-0-6b を使用することをお勧めします。

      • Databricksがホストするモデルでストレージ最適化エンドポイントを使用する本番運用アプリケーションの場合は、埋め込みモデルエンドポイントとしてモデル名を直接使用します (例: databricks-qwen3-embedding-0-6b)。ストレージ最適化エンドポイントは、取り込み時にai_queryをバッチ推論とともに使用し、埋め込みジョブに高いスループットを提供します。クエリにプロビジョン済みスループット エンドポイントを使用する場合、インデックス作成時にmodel_endpoint_name_for_queryフィールドで指定します。

    • 既存の埋め込みを使用 」を選択した場合は、事前計算された埋め込みと埋め込みディメンションを含む列を選択します。事前計算された埋め込み列の形式は array[float]である必要があります。ストレージ最適化エンドポイントの場合、埋め込みディメンションは 16 で均等に割り切れる必要があります。

    コンピュート エンベディングを保存 : この設定を切り替えて、生成されたエンベディングを Unity Catalog テーブルに保存します。詳細については、「生成されたエンベディングテーブルを保存する」を参照してください。

    コンピュートリソース

    ベクトル検索エンドポイント : インデックスを保存するためのベクトル検索エンドポイントを選択します。

    同期モード : 連続 は、インデックスを数秒の待機時間と同期させます。ただし、継続的な同期ストリーミングパイプラインを実行するためにコンピュートクラスターをプロビジョニングするため、コストが高くなります。

    • 標準エンドポイントの場合、 連続トリガー の両方が増分更新を実行するため、最後の同期以降に変更されたデータのみが処理されます。
    • ストレージ最適化エンドポイントの場合、同期ごとにインデックスが部分的に再構築されます。後続の同期で管理対象インデックスの場合、ソース行が変更されていない限り、生成された埋め込みは再利用され、再計算する必要はありません。ストレージ最適化エンドポイントの制限事項を参照してください。

    トリガー モードでは、Python SDK または REST API を使用して同期を開始します。Delta Sync インデックスの更新を参照してください。

    ストレージ最適化エンドポイントの場合、 トリガー 同期モードのみがサポートされています。

    高度な設定

    高度な設定

    高度な設定 」セクションはデフォルトで折りたたまれています。ほとんどのユーザーはデフォルトを受け入れることができます。以下のいずれかをファインチューニングできるように拡張します:

    埋め込みモデル : デフォルトの埋め込みモデルを上書きします。デフォルトの Databricks ホスト型モデルは、ほとんどのワークスペースで機能します。別のものが必要な場合、またはデフォルトにアクセスできない場合は、こちらで変更してください。

    インデックスを作成する列 :インデックスに含める列を選択してください。このフィールドを空白のままにすると、ソーステーブルのすべての列のインデックスが作成されます。プライマリキーおよび埋め込み列は常に含まれます。検索結果で返すかフィルターとして使用できるのは、インデックス化された列のみです。

    使用ポリシー :チームまたはプロジェクトで追跡できるように、インデックスのコストにタグを付けるために使用するポリシーです。AI 検索使用ポリシーをご覧ください。

    クエリ用の個別の埋め込みモデル:「埋め込みのコンピュート」を選択した場合、インデックスのクエリに個別のモデルサービングエンドポイントを指定できます。これは、取り込みには高スループットのエンドポイントが必要ですが、クエリには低レイテンシのエンドポイントが必要な場合に役立ちます。「 埋め込みモデル 」フィールドで指定されたモデルは、ここで別のモデルを指定しない限り、常に取り込みに使用され、クエリにも使用されます。

  5. インデックスの設定が完了したら、[ 作成 ]をクリックします。

Python SDKを使用して、インデックスを作成する

次の例では、Databricksによって計算されるエンべディングを用いたDelta Sync Indexを作成します。詳細については、 Python SDK リファレンスを参照してください。

この例では、オプションのパラメーターmodel_endpoint_name_for_queryも示しています。これは、インデックスのクエリに使用される別の埋め込みモデルサービング エンドポイントを指定します。

Python
client = VectorSearchClient()

index = client.create_delta_sync_index(
endpoint_name="vector_search_demo_endpoint",
source_table_name="vector_search_demo.vector_search.en_wiki",
index_name="vector_search_demo.vector_search.en_wiki_index",
pipeline_type="TRIGGERED",
primary_key="id",
embedding_source_column="text",
embedding_model_endpoint_name="e5-small-v2", # This model is used for ingestion, and is also used for querying unless model_endpoint_name_for_query is specified.
model_endpoint_name_for_query="e5-mini-v2" # Optional. If specified, used only for querying the index.
)

次の例では、自己管理型のエンベディングを使用して Delta Sync Index を作成します。

Python
client = VectorSearchClient()

index = client.create_delta_sync_index(
endpoint_name="vector_search_demo_endpoint",
source_table_name="vector_search_demo.vector_search.en_wiki",
index_name="vector_search_demo.vector_search.en_wiki_index",
pipeline_type="TRIGGERED",
primary_key="id",
embedding_dimension=1024,
embedding_vector_column="text_vector"
)

デフォルトでは、ソーステーブルのすべてのカラムがインデックスと同期されます。同期する列のサブセットを選択するには、columns_to_syncを使用します。プライマリ・キーとエンベディングカラムは、常にインデックスに含まれます。

プライマリキーとエンベディングカラム のみを 同期するには、次のように columns_to_sync で指定する必要があります。

Python
index = client.create_delta_sync_index(
...
columns_to_sync=["id", "text_vector"] # to sync only the primary key and the embedding column
)

追加の列を同期するには、次のように指定します。 プライマリ・キーとエンベディングカラムは、常に同期されるため、含める必要はありません。

Python
index = client.create_delta_sync_index(
...
columns_to_sync=["revisionId", "text"] # to sync the `revisionId` and `text` columns in addition to the primary key and embedding column.
)

全文検索インデックスを作成(ベータ)

備考

ベータ版

全文検索インデックスの作成は、ストレージ最適化エンドポイントでのみベータ機能として利用可能です。これを使用するには、vs_full_text ワークスペースのプレビューを有効にする必要があります。プレビューを有効にするには、アカウントチームにお問い合わせいただくか、Databricks プレビューの管理を参照してください。

全文検索インデックスは、ベクトル埋め込みを必要とせずに、テキスト列でのキーワードベースの検索を可能にします。これは、意味的な類似性よりも、正確な用語、識別子、またはキーワードを検索したい場合に便利です。

全文検索インデックスには次の要件があります。

  • ストレージ最適化エンドポイントを使用する必要があります。標準エンドポイントはサポートされていません。
  • トリガー モードを使用する必要があります。連続同期はサポートされていません。
  • パラメーター embedding_source_columnembedding_vector_column、および embedding_dimension はサポートされていません。

次の例では、Python SDK を使用してフルテキスト検索インデックスを作成します。

Python
client = VectorSearchClient()

index = client.create_delta_sync_index(
endpoint_name="storage_optimized_endpoint",
source_table_name="catalog.schema.source_table",
index_name="catalog.schema.full_text_index",
pipeline_type="TRIGGERED",
primary_key="id",
columns_to_sync=["id", "text", "metadata_column"],
index_subtype="FULL_TEXT"
)

インデックスを作成した後、同期をトリガーしてインデックスにデータを入力してください。

Python
index.sync()

全文インデックスをクエリーするには、query_type="FULL_TEXT"を使用します。詳細については、「AI Search Index をクエリする」を参照してください。

Python
results = index.similarity_search(
query_text="search terms",
columns=["id", "text"],
num_results=10,
query_type="FULL_TEXT"
)

以下の例では、Direct Vector Accessインデックスを作成します。

Python

client = VectorSearchClient()

index = client.create_direct_access_index(
endpoint_name="storage_endpoint",
index_name=f"{catalog_name}.{schema_name}.{index_name}",
primary_key="id",
embedding_dimension=1024,
embedding_vector_column="text_vector",
schema={
&quot;id&quot;: &quot;int&quot;,
&quot;field2&quot;: &quot;string&quot;,
&quot;field3&quot;: &quot;float&quot;,
&quot;text_vector&quot;: &quot;array&lt;float&gt;&quot;}
)

REST APIを使用してインデックスを作成する

REST API リファレンスドキュメント: POST /api/2.0/vector-search/indexesを参照してください。

生成されたエンベディングテーブルを保存

Databricks がエンべディングを生成する場合、生成されたエンべディングを Unity Catalog のテーブルに保存できます。 このテーブルは、ベクトル索引と同じスキーマで作成され、ベクトル索引ページからリンクされます。

テーブル名は、AI検索インデックス名に _writeback_table が付加されたものです。名前は編集できません。

Unity Catalog で、他のテーブルと同様に、テーブルにアクセスしてクエリを実行できます。ただし、手動で更新されることを想定していないため、テーブルを削除したり変更したりしないでください。インデックスが削除された場合、テーブルは自動的に削除されます。

AI検索インデックスを更新する

Delta Syncインデックスを更新する

Continuous 同期モードで作成されたインデックスは、ソースDeltaテーブルが変更されると自動的に更新されます。 トリガー 同期モードをご利用の場合、UI、Python SDK、またはREST APIを使用して同期を開始できます。

  1. Catalog Explorer で、「AI 検索インデックス」に移動します。

  2. 概要 タブの データ取り込み セクションで、 今すぐ同期 をクリックします。

    Catalog Explorer から AI Search インデックスを同期するための「今すぐ同期」ボタン。

ダイレクト ベクター アクセス インデックスの更新

Direct Vector Access Index にデータを挿入、更新、削除するには、Python SDK または REST API を使用できます。

詳細については、 Python SDK リファレンスを参照してください。

Python
index.upsert([
{
"id": 1,
"field2": "value2",
"field3": 3.0,
"text_vector": [1.0] * 1024
},
{
"id": 2,
"field2": "value2",
"field3": 3.0,
"text_vector": [1.1] * 1024
}
])

ダウンタイムなしでスキーマを変更する方法

ソーステーブルへのスキーマの変更は、インデックスを再構築しない限りサポートされていません。これには、既存の列の変更と新しい列の追加が含まれます。インデックススキーマは作成時に固定されているため、スキーマの変更を反映させるには新しいインデックスを作成する必要があります。

ダウンタイムなしでインデックスを再構築してデプロイするには、以下のステップに従ってください。

  1. ソーステーブルでスキーマ変更を実行してください。
  2. 更新されたスキーマを使用して新しいインデックスを作成する。
  3. 新しいインデックスの準備ができたら、トラフィックを新しいインデックスに切り替えてください。
  4. 元のインデックスを削除してください。