Databricks での MLflow モデルを使用した自動特徴検索
モデルサービング は、公開されているオンライン ストアまたはオンライン テーブルから特徴値を自動的に検索できます。 この記事では、オンライン ストアを使用する方法について説明します。 オンライン テーブルの操作の詳細については、「 オンライン テーブルを使用したリアルタイム特徴量サービング」をご参照ください。
要件
モデルは、
FeatureEngineeringClient.log_model
( Unity Catalogでの特徴量エンジニアリング) またはFeatureStoreClient.log_model
(ワークスペース Feature Storeの場合、v0.3.5 以降が必要です) でログに記録されている必要があります。オンラインストアは 、読み取り専用の資格情報で公開する必要があります。
注
特徴テーブルは、モデルのトレーニング後を含め、モデルのデプロイ前であればいつでも公開できます。
自動機能検索
Databricks Model Servingでは、 次のオンライン ストアからの自動機能検索がサポートされています。
Amazon DynamoDB (v0.3.8 以降)
自動フィーチャ検索は、次のデータ型でサポートされています。
IntegerType
FloatType
BooleanType
StringType
DoubleType
LongType
TimestampType
DateType
ShortType
DecimalType
ArrayType
MapType
オンライン モデル スコアリングで特徴値をオーバーライドする
モデルに必要なすべての特徴量 ( FeatureEngineeringClient.log_model
または FeatureStoreClient.log_model
で記録) は、モデルのスコアリングのためにオンライン ストアから自動的に検索されます。 モデルサービングで REST API を使用してモデルをスコアリングするときに特徴値をオーバーライドするには、特徴値を API ペイロードの一部として含めます。
注
新しいフィーチャ値は、基になるモデルで想定されるフィーチャのデータ型に準拠している必要があります。