ベクトル検索インデックスを作成してクエリを実行する方法

この記事では、 Mosaic AI Vector Search を使用してベクトル検索インデックスを作成およびクエリする方法について説明します。

ベクトル検索UI、Python SDK 、またはREST API を使用して、ベクトル検索エンドポイントやベクトル検索インデックスなどのコンポーネントを作成および管理できます。

必要条件

Unity Catalog対応ワークスペースであること。
サーバレスコンピュートが有効化されていること。手順については、サーバレスコンピュートへの接続を参照してください。
標準エンドポイントの場合、ソーステーブルでチェンジデータフィードが有効になっている必要があります。DatabricksでのDelta Lake チェンジデータフィードの使用を参照してください。
ベクトル検索インデックスを作成するには、インデックスが作成されるカタログスキーマに対する CREATE TABLE 権限が必要です。
別のユーザーが所有するインデックスをクエリするには、追加の特権が必要です。ベクトル検索エンドポイントのクエリを参照してください。

ベクトル検索エンドポイントを作成および管理するためのアクセス許可は、アクセス制御リストを使用して構成されます。ベクトル検索エンドポイント ACLを参照してください。

インストール

ベクトル検索 SDK を使用するには、ノートブックにインストールする必要があります。次のコードを使用して、パッケージをインストールします。

%pip install databricks-vectorsearch
dbutils.library.restartPython()

次に、次のコマンドを使用して VectorSearchClientをインポートします。

from databricks.vector_search.client import VectorSearchClient

認証

データ保護と認証を参照してください。

ベクトル検索エンドポイントを作成する

ベクトル検索エンドポイントは、Databricks UI、Python SDK、または API を使用して作成できます。

UI を使用したベクトル検索エンドポイントの作成

UI を使用してベクトル検索エンドポイントを作成するには、次の手順に従います。

左のサイドバーで、[ コンピュート ]をクリックします。
「 ベクトル検索 」タブをクリックし、「作成」をクリックします。
エンドポイントの作成フォーム が開きます。このエンドポイントの名前を入力します。
タイプ フィールドで、標準または ストレージ最適化 を選択します。エンドポイントのオプションを参照してください。
(オプション) 詳細設定 で、予算ポリシーを選択します。Mosaic AI Vector Search: 予算ポリシーをご覧ください。
確認をクリックします。

Python SDK を使用してベクトル検索エンドポイントを作成する

次の例では、 create_endpoint() SDK 関数を使用してベクトル検索エンドポイントを作成します。

Python
# The following line automatically generates a PAT Token for authentication
client = VectorSearchClient()

# The following line uses the service principal token for authentication
# client = VectorSearchClient(service_principal_client_id=<CLIENT_ID>,service_principal_client_secret=<CLIENT_SECRET>)

client.create_endpoint(
    name="vector_search_endpoint_name",
    endpoint_type="STANDARD" # or "STORAGE_OPTIMIZED"
)

REST API を使用してベクトル検索エンドポイントを作成する

REST API リファレンスドキュメント: POST /api/2.0/vector-search/endpointsを参照してください。

(オプション)埋め込みモデルを提供するエンドポイントを作成して構成する

エンベディングをDatabricksに計算させることを選択した場合は、事前に構成された基盤モデル API エンドポイントを使用するか、モデルサービングエンドポイントを作成して、選択したエンベディングモデルを提供できます。手順については、トークン単位の従量課金基盤モデル API またはエンドポイント基盤モデルをサービングするエンドポイントの作成を参照してください。ノートブックの例については、エンベディングモデルを呼び出すためのノートブックの例を参照してください。

エンべディングエンドポイントを構成する場合、Databricks では、デフォルトの選択である Scale to zero を削除することをお勧めします。エンドポイントの提供にはウォームアップに数分かかる場合があり、スケールダウンされたエンドポイントを持つインデックスに対する最初のクエリがタイムアウトする可能性があります。

注記

埋め込みエンドポイントがデータセットに対して適切に構成されていない場合、ベクトル検索インデックスの初期化がタイムアウトする可能性があります。CPU エンドポイントは、小規模なデータセットとテストにのみ使用してください。大規模なデータセットの場合は、最適なパフォーマンスを得るために GPU エンドポイントを使用します。

ベクトル検索インデックスを作成する

ベクトル検索インデックスは、UI、Python SDK、または REST API を使用して作成できます。 UI は最も簡単なアプローチです。

インデックスには、次の 2 つのタイプがあります。

Delta Sync Index は、ソース Delta テーブルと自動的に同期し、Delta テーブル内の基になるデータが変更されると、インデックスを自動的かつ増分的に更新します。
Direct Vector Access Index は、ベクトルとメタデータの直接読み取りと書き込みをサポートします。ユーザーは、REST API または Python SDK を使用してこのテーブルを更新する必要があります。このタイプのインデックスは、UI を使用して作成することはできません。 REST API または SDK を使用する必要があります。

注記

列名 _id は予約されています。ソース・テーブルに _idという名前のカラムがある場合は、ベクトル検索インデックスを作成する前に名前を変更します。

UI を使用したインデックスの作成

左のサイドバーで[ カタログ ] をクリックして、カタログエクスプローラーUIを開きます。
使用する Delta テーブルに移動します。
右上の作成ボタンをクリックし、ドロップダウンメニューから ベクトル検索インデックス を選択します。
ダイアログのセレクタを使用して、インデックスを設定します。

名前 : Unity Catalog のオンラインテーブルに使用する名前。名前には3階層の名前空間、<catalog>.<schema>.<name>が必要です。英数字とアンダースコアのみ使用できます。

主キー : 主キーとして使用する列。

同期する列 : (標準エンドポイントでのみサポートされます。ベクトルインデックスと同期する列を選択します。このフィールドを空白のままにすると、ソーステーブルのすべての列がインデックスと同期されます。主キー列と埋め込みソース列または埋め込みベクトル列は常に同期されます。ストレージ最適化エンドポイントの場合、ソーステーブルのすべての列は常に同期されます。

エンべディングソース : Databricks でDeltaテーブル内のテキスト列のエンべディングをコンピュートするか ( エンベディングの計算 )、 Deltaテーブルに事前計算されたエンべディングが含まれるかどうか ( 既存のエンべディング列を使用 ) を示します。
- コンピュート埋め込み を選択した場合は、コンピュート埋め込みを行う列と、計算に使用する埋め込みモデルを選択します。テキスト列のみがサポートされます。本番運用アプリケーションの場合、 Databricks プロビジョニングスループットサービングエンドポイントで基盤モデル databricks-gte-large-en を使用することをお勧めします。
- 既存の埋め込み列を使用 を選択した場合は、事前計算された埋め込みと埋め込みディメンションを含む列を選択します。事前計算された埋め込み列の形式は array[float]である必要があります。ストレージ最適化エンドポイントの場合、埋め込みディメンションは 16 で均等に割り切れる必要があります。
計算されたエンベディングの同期 : この設定を切り替えて、生成されたエンベディングを Unity Catalog テーブルに保存します。詳細については、「生成されたエンベディングテーブルの保存」を参照してください。

ベクトル検索エンドポイント : インデックスを格納するベクトル検索エンドポイントを選択します。

同期モード : 連続は、インデックスを数秒の待機時間と同期させます。ただし、継続的な同期ストリーミングパイプラインを実行するためにコンピュートクラスターをプロビジョニングするため、コストが高くなります。
- 標準エンドポイントの場合、連続と トリガー の両方が増分更新を実行するため、最後の同期以降に変更されたデータのみが処理されます。
- ストレージ最適化エンドポイントの場合、同期ごとにインデックスが部分的に再構築されます。後続の同期の管理インデックスの場合、ソース行が変更されていない生成された埋め込みは再利用されるため、再計算する必要はありません。ストレージ最適化エンドポイントの制限事項を参照してください。
トリガー モードでは、Python SDK または REST API を使用して同期を開始します。Delta Sync インデックスの更新を参照してください。

ストレージ最適化エンドポイントの場合、 トリガー同期 モードのみがサポートされます。

詳細設定: (オプション) コンピュート埋め込み を選択した場合は、別の埋め込みモデルを指定してベクトル検索インデックスを照会できます。これは、取り込みには高スループットのエンドポイントが必要で、インデックスのクエリには低レイテンシーのエンドポイントが必要な場合に役立ちます。[ 埋め込みモデル ] フィールドで指定されたモデルは、ここで別のモデルを指定しない限り、常に取り込みに使用され、クエリにも使用されます。別のモデルを指定するには、[ インデックスを照会するための個別の埋め込みモデルを選択] をクリックし、ドロップダウンメニューからモデルを選択します。
インデックスの構成が完了したら、[ 作成 ] をクリックします。

Python SDK を使用してインデックスを作成する

次の例では、Databricksによって計算されるエンべディングを用いたDelta Sync Indexを作成します。詳細については、 Python SDK リファレンスを参照してください。

この例では、オプションのパラメーター model_endpoint_name_for_queryも示しており、インデックスのクエリに使用する別の埋め込みモデルサービングエンドポイントを指定します。

Python
client = VectorSearchClient()

index = client.create_delta_sync_index(
  endpoint_name="vector_search_demo_endpoint",
  source_table_name="vector_search_demo.vector_search.en_wiki",
  index_name="vector_search_demo.vector_search.en_wiki_index",
  pipeline_type="TRIGGERED",
  primary_key="id",
  embedding_source_column="text",
  embedding_model_endpoint_name="e5-small-v2", # This model is used for ingestion, and is also used for querying unless model_endpoint_name_for_query is specified.
  model_endpoint_name_for_query="e5-mini-v2"   # Optional. If specified, used only for querying the index.
)

次の例では、自己管理型のエンベディングを使用して Delta Sync Index を作成します。

Python
client = VectorSearchClient()

index = client.create_delta_sync_index(
  endpoint_name="vector_search_demo_endpoint",
  source_table_name="vector_search_demo.vector_search.en_wiki",
  index_name="vector_search_demo.vector_search.en_wiki_index",
  pipeline_type="TRIGGERED",
  primary_key="id",
  embedding_dimension=1024,
  embedding_vector_column="text_vector"
)

デフォルトでは、ソーステーブルのすべてのカラムがインデックスと同期されます。

標準エンドポイントでは、 columns_to_syncを使用して同期する列のサブセットを選択できます。プライマリ・キーと埋め込みカラムは、常にインデックスに含まれます。

プライマリキーとエンベディングカラム のみを 同期するには、次のように columns_to_sync で指定する必要があります。

Python
index = client.create_delta_sync_index(
  ...
  columns_to_sync=["id", "text_vector"] # to sync only the primary key and the embedding column
)

追加の列を同期するには、次のように指定します。プライマリ・キーとエンベディングカラムは、常に同期されるため、含める必要はありません。

Python
index = client.create_delta_sync_index(
  ...
  columns_to_sync=["revisionId", "text"] # to sync the `revisionId` and `text` columns in addition to the primary key and embedding column.
)

次の例では、Direct Vector Access Index を作成します。

Python

client = VectorSearchClient()

index = client.create_direct_access_index(
  endpoint_name="storage_endpoint",
  index_name=f"{catalog_name}.{schema_name}.{index_name}",
  primary_key="id",
  embedding_dimension=1024,
  embedding_vector_column="text_vector",
  schema={
    "id": "int",
    "field2": "string",
    "field3": "float",
    "text_vector": "array<float>"}
)

REST API を使用したインデックスの作成

REST API リファレンスドキュメント ( POST /api/2.0/vector-search/indexes) を参照してください。

生成されたエンベディングテーブルを保存

Databricks がエンべディングを生成する場合、生成されたエンべディングを Unity Catalog のテーブルに保存できます。このテーブルは、ベクトル索引と同じスキーマで作成され、ベクトル索引ページからリンクされます。

テーブルの名前は、ベクトル検索インデックスの名前に _writeback_tableを付加したものです。名前は編集できません。

このテーブルは、Unity Catalog の他のテーブルと同様にアクセスしてクエリを実行できます。ただし、テーブルは手動で更新することを意図していないため、削除または変更しないでください。インデックスが削除されると、テーブルは自動的に削除されます。

ベクトル検索インデックスの更新

Delta Sync インデックスの更新

連続同期モードで作成されたインデックスは、ソース Delta テーブルが変更されると自動的に更新されます。 トリガー 同期モードを使用している場合は、UI、Python SDK、または REST API を使用して同期を開始できます。

Databricks UI
Python SDK
REST API

カタログエクスプローラで、ベクトル検索インデックスに移動します。
概要タブの データ取り込み セクションで、 今すぐ同期 をクリックします。

.

詳細については、 Python SDK リファレンスを参照してください。

Python
client = VectorSearchClient()
index = client.get_index(index_name="vector_search_demo.vector_search.en_wiki_index")

index.sync()

Direct Vector Access インデックスの更新

Python SDK または REST API を使用して、Direct Vector Access Index のデータを挿入、更新、または削除できます。

Python SDK
REST API

詳細については、 Python SDK リファレンスを参照してください。

Python
index.upsert([
    {
        "id": 1,
        "field2": "value2",
        "field3": 3.0,
        "text_vector": [1.0] * 1024
    },
    {
        "id": 2,
        "field2": "value2",
        "field3": 3.0,
        "text_vector": [1.1] * 1024
    }
])

REST API リファレンスドキュメント ( POST /api/2.0/vector-search/indexes) を参照してください。

本番運用アプリケーションの場合、 Databricks はパーソナルアクセストークンの代わりに serviceプリンシパルを使用することをお勧めします。パフォーマンスは、クエリごとに最大 100 ミリ秒向上できます。

次のコード例は、サービスプリンシパルを使用してインデックスを更新する方法を示しています。

sh
export SP_CLIENT_ID=...
export SP_CLIENT_SECRET=...
export INDEX_NAME=...
export WORKSPACE_URL=https://...
export WORKSPACE_ID=...

# Set authorization details to generate OAuth token
export AUTHORIZATION_DETAILS='{"type":"unity_catalog_permission","securable_type":"table","securable_object_name":"'"$INDEX_NAME"'","operation": "WriteVectorIndex"}'

# Generate OAuth token
export TOKEN=$(curl -X POST --url $WORKSPACE_URL/oidc/v1/token -u "$SP_CLIENT_ID:$SP_CLIENT_SECRET" --data 'grant_type=client_credentials' --data 'scope=all-apis' --data-urlencode 'authorization_details=['"$AUTHORIZATION_DETAILS"']' | jq .access_token | tr -d '"')

# Get index URL
export INDEX_URL=$(curl -X GET -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" --url $WORKSPACE_URL/api/2.0/vector-search/indexes/$INDEX_NAME | jq -r '.status.index_url' | tr -d '"')

# Upsert data into vector search index.
curl -X POST -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" --url https://$INDEX_URL/upsert-data --data '{"inputs_json": "[...]"}'

# Delete data from vector search index
curl -X DELETE -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" --url https://$INDEX_URL/delete-data --data '{"primary_keys": [...]}'

次のコード例は、パーソナルアクセストークン (PAT) を使用してインデックスを更新する方法を示しています。

sh
export TOKEN=...
export INDEX_NAME=...
export WORKSPACE_URL=https://...

# Upsert data into vector search index.
curl -X POST -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" --url $WORKSPACE_URL/api/2.0/vector-search/indexes/$INDEX_NAME/upsert-data --data '{"inputs_json": "..."}'

# Delete data from vector search index
curl -X DELETE -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" --url $WORKSPACE_URL/api/2.0/vector-search/indexes/$INDEX_NAME/delete-data --data '{"primary_keys": [...]}'

ベクトル検索エンドポイントのクエリ

ベクトル検索エンドポイントのクエリは、Python SDK、REST API、または SQL vector_search() AI 関数を使用してのみ実行できます。

注記

エンドポイントをクエリするユーザーがベクトル検索インデックスの所有者でない場合、そのユーザーには次の UC 権限が必要です。

ベクトル検索インデックスを含むカタログ上のUSE CATALOG。
ベクトル検索インデックスを含むスキーマに対して USE SCHEMA。
ベクトル検索インデックスに対するSELECT権限。

デフォルトのクエリタイプは ann (近似最近隣内) です。ハイブリッドキーワード類似性検索を実行するには、パラメーター query_type を hybridに設定します。ハイブリッド検索では、すべてのテキストメタデータ列が含まれ、最大 200 件の結果が返されます。

クエリでリランカーを使用するには、「クエリでリランカーを使用する」を参照してください。

備考

ベータ版

全文検索はベータ機能として利用できます。全文検索を実行するには、パラメーターquery_typeをFULL_TEXTに設定します。全文検索では、ベクトルエンべディングを使用せずに、キーワードの一致に基づいて最大 200 件の結果を取得できます。

Python SDK standard endpoint
Python SDK storage-optimized endpoint
REST API
SQL

詳細については、 Python SDK リファレンスを参照してください。

Python
# Delta Sync Index with embeddings computed by Databricks
results = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "field2"],
    num_results=2
    )

# Delta Sync Index using hybrid search, with embeddings computed by Databricks
results3 = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "field2"],
    num_results=2,
    query_type="hybrid"
    )

# Delta Sync Index using full-text search (Beta)
results4 = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "field2"],
    num_results=2,
    query_type="FULL_TEXT"
    )

# Delta Sync Index with pre-calculated embeddings
results2 = index.similarity_search(
    query_vector=[0.9] * 1024,
    columns=["id", "text"],
    num_results=2
    )

詳細については、 Python SDK リファレンスを参照してください。

既存のフィルターインターフェイスは、ストレージに最適化されたベクトル検索インデックス用に再設計され、標準のベクトル検索エンドポイントで使用されるフィルターディクショナリではなく、より SQL に似たフィルター文字列が採用されました。

Python
client = VectorSearchClient()
index = client.get_index(index_name="vector_search_demo.vector_search.en_wiki_index")

# similarity search with query vector
results = index.similarity_search(
    query_vector=[0.2, 0.33, 0.19, 0.52],
    columns=["id", "text"],
    num_results=2
)

# similarity search with query vector and filter string
results = index.similarity_search(
    query_vector=[0.2, 0.33, 0.19, 0.52],
    columns=["id", "text"],
    # this is a single filter string similar to SQL WHERE clause syntax
    filters="language = 'en' AND country = 'us'",
    num_results=2
)

REST API リファレンスドキュメント: POST /api/2.0/vector-search/indexes/{index_name}/queryを参照してください。

本番運用アプリケーションの場合、 Databricks はパーソナルアクセストークンの代わりにサービスプリンシパルを使用することをお勧めします。サービスプリンシパルを使用すると、セキュリティとアクセス管理の向上に加えて、クエリごとに最大 100 ミリ秒のパフォーマンスを向上させることができます。

次のコード例は、サービスプリンシパルを使用してインデックスをクエリする方法を示しています。

sh
export SP_CLIENT_ID=...
export SP_CLIENT_SECRET=...
export INDEX_NAME=...
export WORKSPACE_URL=https://...
export WORKSPACE_ID=...

# Set authorization details to generate OAuth token
export AUTHORIZATION_DETAILS='{"type":"unity_catalog_permission","securable_type":"table","securable_object_name":"'"$INDEX_NAME"'","operation": "ReadVectorIndex"}'
# If you are using an route_optimized embedding model endpoint, then you need to have additional authorization details to invoke the serving endpoint
# export EMBEDDING_MODEL_SERVING_ENDPOINT_ID=...
# export AUTHORIZATION_DETAILS="$AUTHORIZATION_DETAILS"',{"type":"workspace_permission","object_type":"serving-endpoints","object_path":"/serving-endpoints/'"$EMBEDDING_MODEL_SERVING_ENDPOINT_ID"'","actions": ["query_inference_endpoint"]}'

# Generate OAuth token
export TOKEN=$(curl -X POST  --url $WORKSPACE_URL/oidc/v1/token -u "$SP_CLIENT_ID:$SP_CLIENT_SECRET" --data 'grant_type=client_credentials' --data 'scope=all-apis' --data-urlencode 'authorization_details=['"$AUTHORIZATION_DETAILS"']' | jq .access_token | tr -d '"')

# Get index URL
export INDEX_URL=$(curl -X GET -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" --url $WORKSPACE_URL/api/2.0/vector-search/indexes/$INDEX_NAME | jq -r '.status.index_url' | tr -d '"')

# Query vector search index.
curl -X GET -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" --url https://$INDEX_URL/query --data '{"num_results": 3, "query_vector": [...], "columns": [...], "debug_level": 1}'

# Query vector search index.
curl -X GET -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" --url https://$INDEX_URL/query --data '{"num_results": 3, "query_text": "...", "columns": [...], "debug_level": 1}'

次のコード例は、パーソナルアクセストークン (PAT) を使用してインデックスをクエリする方法を示しています。

sh
export TOKEN=...
export INDEX_NAME=...
export WORKSPACE_URL=https://...

# Query vector search index with `query_vector`
curl -X GET -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" --url $WORKSPACE_URL/api/2.0/vector-search/indexes/$INDEX_NAME/query --data '{"num_results": 3, "query_vector": [...], "columns": [...], "debug_level": 1}'

# Query vector search index with `query_text`
curl -X GET -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" --url $WORKSPACE_URL/api/2.0/vector-search/indexes/$INDEX_NAME/query --data '{"num_results": 3, "query_text": "...", "columns": [...], "debug_level": 1}'

important

vector_search() AI 関数はパブリックプレビュー段階です。

この AI 関数を使用するには、 vector_search 関数を参照してください。

クエリでフィルターを使用する

クエリでは、Delta テーブル内の任意の列に基づいてフィルターを定義できます。similarity_search は、指定したフィルターに一致する行のみを返します。

次の表に、サポートされているフィルターを示します。

フィルター演算子	挙動	例
`NOT`	標準 : フィルターを無効にします。キーの末尾は「NOT」である必要があります。たとえば、値が "red" の "color NOT" は、色が赤でないドキュメントと一致します。ストレージ最適化 : `!=` (bangeq sign) 演算子を参照してください。	スタンダード : `{"id NOT": 2}` `{“color NOT”: “red”}` ストレージ最適化 : `"id != 2" "color != 'red'"`
`<`	標準 : フィールド値がフィルター値より小さいかどうかを確認します。キーの末尾は「<」でなければなりません。たとえば、値が 200 の "price <" は、価格が 200 未満のドキュメントと一致します。ストレージ最適化 : `<` (lt 記号) 演算子を参照してください。	スタンダード : `{"id <": 200}` ストレージ最適化 : `"id < 200"`
`<=`	標準 : フィールド値がフィルター値以下であるかどうかを確認します。キーの末尾は「<=」である必要があります。たとえば、値が 200 の "price <=" は、価格が 200 以下のドキュメントと一致します。ストレージ最適化 : `<=` (lt eq sign) 演算子を参照してください。	スタンダード : `{"id <=": 200}` ストレージ最適化 : `"id <= 200"`
`>`	標準 : フィールド値がフィルター値より大きいかどうかを確認します。キーの末尾は「>」である必要があります。たとえば、値が 200 の "price >" は、価格が 200 より大きいドキュメントと一致します。ストレージ最適化 : `>` (gt 記号) 演算子を参照してください。	スタンダード : `{"id >": 200}` ストレージ最適化 : `"id > 200"`
`>=`	標準 : フィールド値がフィルター値以上かどうかを確認します。キーの末尾は「>=」である必要があります。たとえば、値が 200 の "price >=" は、価格が 200 以上のドキュメントと一致します。ストレージ最適化 : `>=` (gt eq sign) 演算子を参照してください。	スタンダード : `{"id >=": 200}` ストレージ最適化 : `"id >= 200"`
`OR`	標準 : フィールド値がフィルター値のいずれかと一致するかどうかを確認します。キーには、複数のサブキーを区切る `OR` が含まれている必要があります。たとえば、値が `["red", "blue"]` の `color1 OR color2` は、`color1` が `red` であるか、`color2` が `blue`のドキュメントと一致します。ストレージ最適化 : `or`演算子を参照してください。	スタンダード : `{"color1 OR color2": ["red", "blue"]}` ストレージ最適化 : `"color1 = 'red' OR color2 = 'blue'"`
`LIKE`	標準 : 文字列内の空白で区切られたトークンを照合します。以下のコード例を参照してください。ストレージ最適化 : `like`演算子を参照してください。	スタンダード : `{"column LIKE": "hello"}` ストレージ最適化 : `"column LIKE 'hello'"`
フィルタ演算子が指定されていません	標準 : フィルターは完全一致をチェックします。複数の値を指定すると、いずれかの値に一致します。ストレージ最適化 : `=` (eq 符号) 演算子と`in`述語を参照してください。	スタンダード : `{"id": 200}` `{"id": [200, 300]}` ストレージ最適化 : `"id = 200"` `"id IN (200, 300)"`
`to_timestamp` (ストレージ最適化エンドポイントのみ)	ストレージ最適化 : タイムスタンプでフィルタリングします。`to_timestamp`機能を見る	ストレージ最適化 : `"date > TO_TIMESTAMP('1995-01-01')"`

フィルター演算子

挙動

例

NOT

標準 : フィルターを無効にします。キーの末尾は「NOT」である必要があります。たとえば、値が "red" の "color NOT" は、色が赤でないドキュメントと一致します。

ストレージ最適化 : != (bangeq sign) 演算子を参照してください。

スタンダード : {"id NOT": 2} {“color NOT”: “red”}

ストレージ最適化 : "id != 2" "color != 'red'"

<

標準 : フィールド値がフィルター値より小さいかどうかを確認します。キーの末尾は「<」でなければなりません。たとえば、値が 200 の "price <" は、価格が 200 未満のドキュメントと一致します。

ストレージ最適化 : < (lt 記号) 演算子を参照してください。

スタンダード : {"id <": 200}

ストレージ最適化 : "id < 200"

<=

標準 : フィールド値がフィルター値以下であるかどうかを確認します。キーの末尾は「<=」である必要があります。たとえば、値が 200 の "price <=" は、価格が 200 以下のドキュメントと一致します。

ストレージ最適化 : <= (lt eq sign) 演算子を参照してください。

スタンダード : {"id <=": 200}

ストレージ最適化 : "id <= 200"

>

標準 : フィールド値がフィルター値より大きいかどうかを確認します。キーの末尾は「>」である必要があります。たとえば、値が 200 の "price >" は、価格が 200 より大きいドキュメントと一致します。

ストレージ最適化 : > (gt 記号) 演算子を参照してください。

スタンダード : {"id >": 200}

ストレージ最適化 : "id > 200"

>=

標準 : フィールド値がフィルター値以上かどうかを確認します。キーの末尾は「>=」である必要があります。たとえば、値が 200 の "price >=" は、価格が 200 以上のドキュメントと一致します。

ストレージ最適化 : >= (gt eq sign) 演算子を参照してください。

スタンダード : {"id >=": 200}

ストレージ最適化 : "id >= 200"

OR

標準 : フィールド値がフィルター値のいずれかと一致するかどうかを確認します。キーには、複数のサブキーを区切る OR が含まれている必要があります。たとえば、値が ["red", "blue"] の color1 OR color2 は、color1 が red であるか、color2 が blueのドキュメントと一致します。

ストレージ最適化 : or演算子を参照してください。

スタンダード : {"color1 OR color2": ["red", "blue"]}

ストレージ最適化 : "color1 = 'red' OR color2 = 'blue'"

LIKE

標準 : 文字列内の空白で区切られたトークンを照合します。以下のコード例を参照してください。

ストレージ最適化 : like演算子を参照してください。

スタンダード : {"column LIKE": "hello"}

ストレージ最適化 : "column LIKE 'hello'"

フィルタ演算子が指定されていません

標準 : フィルターは完全一致をチェックします。複数の値を指定すると、いずれかの値に一致します。

ストレージ最適化 : = (eq 符号) 演算子とin述語を参照してください。

スタンダード : {"id": 200} {"id": [200, 300]}

ストレージ最適化 : "id = 200" "id IN (200, 300)"

to_timestamp (ストレージ最適化エンドポイントのみ)

ストレージ最適化 : タイムスタンプでフィルタリングします。to_timestamp機能を見る

ストレージ最適化 : "date > TO_TIMESTAMP('1995-01-01')"

次のコード例を参照してください。

Python SDK standard endpoint
Python SDK storage-optimized endpoint
REST API
LIKE

Python
# Match rows where `title` exactly matches `Athena` or `Ares`
results = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "text"],
    filters={"title": ["Ares", "Athena"]},
    num_results=2
    )

# Match rows where `title` or `id` exactly matches `Athena` or `Ares`
results = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "text"],
    filters={"title OR id": ["Ares", "Athena"]},
    num_results=2
    )

# Match only rows where `title` is not `Hercules`
results = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "text"],
    filters={"title NOT": "Hercules"},
    num_results=2
    )

Python
# Match rows where `title` exactly matches `Athena` or `Ares`
results = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "text"],
    filters='title IN ("Ares", "Athena")',
    num_results=2
    )

# Match rows where `title` or `id` exactly matches `Athena` or `Ares`
results = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "text"],
    filters='title = "Ares" OR id = "Athena"',
    num_results=2
    )

# Match only rows where `title` is not `Hercules`
results = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "text"],
    filters='title != "Hercules"',
    num_results=2
    )

LIKE 例

{"column LIKE": "apple"}: 文字列 "apple" と "apple pear" は一致しますが、"pineapple" と "pear" は一致しません。部分文字列 "apple" が含まれていても "pineapple" には一致しないことに注意してください---、"apple pear" のように空白で区切られたトークンと完全に一致するものを探します。

{"column NOT LIKE": "apple"} その逆を行います。「pineapple」と「pear」は一致しますが、「apple」または「apple pear」は一致しません。

クエリでリランカーを使用する

備考

プレビュー

この機能はパブリックプレビュー段階です。

エージェントのパフォーマンスは、クエリに最も関連性の高い情報を取得するかどうかに依存します。再ランク付けは、取得したドキュメントを評価して、意味的に最も関連性の高いドキュメントを特定することで、検索品質を向上させる手法です。Databricks は、これらの文書を識別するための研究ベースの複合AI システムを開発しました。また、各ドキュメントの関連性を評価するときに、リランカーが追加のコンテキストに使用するメタデータを含む列を指定することもできます。

ランク付けを変更すると、遅延はわずかになりますが、検索品質とエージェントのパフォーマンスを大幅に向上させることができます。Databricks では、RAG エージェントのユースケースでランク付けを変更試すことをお勧めします。

このセクションの例は、ベクトル検索リランカーの使用方法を示しています。リランカーを使用する場合は、返す列 (columns) と、リランク付けに使用するメタデータ列 (columns_to_rerank) を個別に設定します。num_results は、返される最終的な結果の数です。これは、再ランキングに使用される結果の数には影響しません。

クエリデバッグメッセージには、ランク付け変更ステップにかかった時間に関する情報が含まれます。例えば：

Bash
'debug_info': {'response_time': 1647.0, 'ann_time': 29.0, 'reranker_time': 1573.0}

リランク呼び出しが失敗した場合、その情報はデバッグメッセージに含まれます。

Bash
'debug_info': {'response_time': 587.0, 'ann_time': 331.0, 'reranker_time': 246.0, 'warnings': [{'status_code': 'RERANKER_TEMPORARILY_UNAVAILABLE', 'message': 'The reranker is temporarily unavailable. Results returned have not been processed by the reranker. Please try again later for reranked results.'}]}

注記

列が columns_to_rerank にリストされる順序は重要です。ランク付けの再評価計算では、列がリストされている順序で取得され、検出された最初の 2000 文字のみが考慮されます。

Python SDK
REST API

Python
# Install the most recent version.
# Databricks SDK version 0.57 or above is required to use the reranker.
%pip install databricks-vectorsearch --force-reinstall
dbutils.library.restartPython()

Python
from databricks.vector_search.reranker import DatabricksReranker

results = index.similarity_search(
    query_text = "How to create a Vector Search index",
    columns = ["id", "text", "parent_doc_summary", "date"],
    num_results = 10,
    query_type = "hybrid",
    reranker=DatabricksReranker(columns_to_rerank=["text", "parent_doc_summary", "other_column"])
    )

レイテンシー情報を確実に取得するには、 debug_level を少なくとも 1 に設定します。

Bash
export TOKEN=...
export INDEX_NAME=...
export WORKSPACE_URL=https://...

curl -X GET -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" --url $WORKSPACE_URL/api/2.0/vector-search/indexes/$INDEX_NAME/query --data '{"num_results": 10, "query_text": "How to create a Vector Search index", "columns": ["id", "text", "parent_doc_summary", "date"], "reranker": {"model": "databricks_reranker",
             "parameters": {
               "columns_to_rerank":
                 ["text", "parent_doc_summary"]
              }
             },
"debug_level": 1}'

ノートブックの例

このセクションの例では、ベクトル検索 Python SDK の使用法を示します。リファレンス情報については、 Python SDK リファレンスを参照してください。

LangChain の例

LangChainパッケージとの統合と同様にMosaic AI Vector Searchを使用するには、LangChainでMosaic AI Vector Searchを使用する方法を参照してください。

次のノートブックは、類似性検索結果を LangChain ドキュメントに変換する方法を示しています。

Python SDK ノートブックを使用したベクトル検索

Open notebook in new tab

埋め込みモデルを呼び出すためのノートブックの例

次のノートブックは、埋め込み生成用に Mosaic AI Model Serving エンドポイントを構成する方法を示しています。

OAuthトークンでVector Searchを使う

次のノートブックでは、Vector Search SDKまたは新しいOAuthトークンを使用して HTTP を使用して、Vector Searchエンドポイントを呼び出す方法を示します。

OAuthトークンでVector Searchを使うノートブック

Open notebook in new tab

必要条件​

インストール​

認証​

ベクトル検索エンドポイントを作成する​

UI を使用したベクトル検索エンドポイントの作成​

Python SDK を使用してベクトル検索エンドポイントを作成する​

REST API を使用してベクトル検索エンドポイントを作成する​

(オプション)埋め込みモデルを提供するエンドポイントを作成して構成する​

ベクトル検索インデックスを作成する​

UI を使用したインデックスの作成​

Python SDK を使用してインデックスを作成する​

REST API を使用したインデックスの作成​

生成されたエンベディングテーブルを保存​

ベクトル検索インデックスの更新​

Delta Sync インデックスの更新​

Direct Vector Access インデックスの更新​

ベクトル検索エンドポイントのクエリ​

クエリでフィルターを使用する​

クエリでリランカーを使用する​

ノートブックの例​

LangChain の例​

Python SDK ノートブックを使用したベクトル検索

埋め込みモデルを呼び出すためのノートブックの例​

Mosaic AI Model Servingを使用して OpenAI 埋め込みモデルを呼び出す ノートブック

Mosaic AI Model Serving ノートブックを使用して GTE 埋め込みモデルを呼び出す

OSSエンベディングモデルの登録とサービングのノートブック

OAuthトークンでVector Searchを使う​

OAuthトークンでVector Searchを使うノートブック

必要条件

インストール

認証

ベクトル検索エンドポイントを作成する

UI を使用したベクトル検索エンドポイントの作成

Python SDK を使用してベクトル検索エンドポイントを作成する

REST API を使用してベクトル検索エンドポイントを作成する

(オプション)埋め込みモデルを提供するエンドポイントを作成して構成する

ベクトル検索インデックスを作成する

UI を使用したインデックスの作成

Python SDK を使用してインデックスを作成する

REST API を使用したインデックスの作成

生成されたエンベディングテーブルを保存

ベクトル検索インデックスの更新

Delta Sync インデックスの更新

Direct Vector Access インデックスの更新

ベクトル検索エンドポイントのクエリ

クエリでフィルターを使用する

クエリでリランカーを使用する

ノートブックの例

LangChain の例

埋め込みモデルを呼び出すためのノートブックの例

Mosaic AI Model Servingを使用して OpenAI 埋め込みモデルを呼び出すノートブック

OAuthトークンでVector Searchを使う