Databricksモデルサービングによる自動特徴量検索
モデルサービング は、公開されたオンラインストアまたはオンラインテーブルから特徴値を自動的に検索できます。 オンライン テーブルの作成と操作の詳細については、「リアルタイム テーブルFeature Servingにオンライン テーブルを使用する」を参照してください。
必要条件
- モデルは
FeatureEngineeringClient.log_model
( Unity Catalogでの特徴量エンジニアリングの場合) またはFeatureStoreClient.log_model
(従来のワークスペース Feature Store の場合、v0.3.5 以降が必要) でログに記録されている必要があります。 - サードパーティのオンラインストアの場合、オンラインストアは 読み取り専用の資格情報で公開する必要があります。
特徴量テーブルは、モデルデプロイ前(モデルトレーニング後を含む)いつでも公開できます。
自動特徴量検索
Databricksモデルサービングは、次のオンラインストアからの自動特徴量検索をサポートしています。
- Databricks Online テーブル
- Amazon DynamoDB (v0.3.8 以降)
自動特徴量検索は、次のデータ型でサポートされています。
IntegerType
FloatType
BooleanType
StringType
DoubleType
LongType
TimestampType
DateType
ShortType
DecimalType
ArrayType
MapType
オンライン モデル スコアリングで特徴値をオーバーライドする
モデルに必要なすべての機能 ( FeatureEngineeringClient.log_model
または FeatureStoreClient.log_model
で記録) は、モデルのスコアリングのためにオンラインストアから自動的に検索されます。 モデルサービングで REST API を使用してモデルをスコアリングするときに特徴値を上書きするには、API ペイロードの一部として特徴値を含めます。
新しい特徴量の値は、基になるモデルで想定される特徴量のデータ型に準拠している必要があります。
拡張された DataFrame を推論テーブルに保存します
2025 年 2 月以降に作成されたエンドポイントでは、モデルサービングエンドポイントを設定して、検索された機能値と関数の戻り値を含む拡張 DataFrame をログに記録できます。 DataFrame は、提供されたモデルの推論テーブルに保存されます。
この構成の設定手順については、「 推論テーブルへのフィーチャルックアップ DataFrames の記録」を参照してください。
推論テーブルに関する情報については、「 モデルのモニタリングとデバッグのための推論テーブル」を参照してください。
ノートブックの例: Unity Catalog
Databricks Runtime13.3LTS 以降では、主キーを持つDelta Unity Catalog内の任意の テーブルを特徴量テーブルとして使用できます。Unity Catalogに登録したテーブルを特徴量テーブルとして使用すると、自動的にその特徴量テーブルですべてのUnity Catalog機能が利用できるようになります。
次のノートブックは、リアルタイム サービスおよび自動特徴量検索のために、特徴量をオンライン テーブルに公開する方法を示しています。
オンライン テーブルのデモ ノートブック
このノートブックの例は、オンラインストアに特徴量を発行し、オンラインストアから特徴量を自動的に検索するトレーニング済みモデルを提供する方法を示しています。
サードパーティーのオンラインストアサンプルノートブック(Unity Catalog)
ノートブックの例: ワークスペース Feature Store (レガシ)
このノートブックの例は、オンラインストアに特徴量を発行し、オンラインストアから特徴量を自動的に検索するトレーニング済みモデルを提供する方法を示しています。