Databricksモデルサービングによる特徴量の自動検索
モデルサービングでは、公開されたオンライン ストアまたはオンライン テーブルから特徴量の値を自動的に検索できます。 オンライン テーブルの作成と操作の詳細については、 「リアルタイム特徴量サービングにオンライン テーブルを使用する」を参照してください。
要件
モデルは
FeatureEngineeringClient.log_model
( Unity Catalogでの特徴量エンジニアリングの場合) またはFeatureStoreClient.log_model
(従来のワークスペース Feature Store の場合、v0.3.5 以降が必要) でログに記録されている必要があります。サードパーティのオンライン ストアの場合、オンライン ストアは読み取り専用の資格情報を使用して公開する必要があります。
注
特徴テーブルは、モデルのトレーニング後を含め、モデルのデプロイ前であればいつでも公開できます。
自動特徴量検索
Databricks モデルサービングでは、 次のオンライン ストアからの自動特徴量検索がサポートされています。
Amazon DynamoDB (v0.3.8 以降)
自動特徴量検索は、次のデータ型でサポートされています。
IntegerType
FloatType
BooleanType
StringType
DoubleType
LongType
TimestampType
DateType
ShortType
DecimalType
ArrayType
MapType
オンライン モデル スコアリングで特徴量の値をオーバーライドする
モデルに必要なすべての特徴量 ( FeatureEngineeringClient.log_model
または FeatureStoreClient.log_model
で記録) は、モデルのスコアリングのためにオンライン ストアから自動的に検索されます。 モデルサービングで REST API を使用してモデルをスコアリングするときに特徴量の値をオーバーライドするには、特徴量の値を API ペイロードの一部として含めます。
注
新しい特徴量の値は、基になるモデルで想定される特徴量のデータ型に準拠している必要があります。
ノートブックの例: Unity Catalog
Databricks Runtime13.3LTS 以降では、主キーを持つDelta Unity Catalog内の任意の テーブルを特徴量テーブルとして使用できます。Unity Catalogに登録されているテーブルを特徴量テーブルとして使用すると、すべてのUnity Catalog機能が特徴量テーブルで自動的に使用できるようになります。
次のノートブックは、リアルタイムの提供と自動フィーチャ検索のために、フィーチャをオンライン テーブルに公開する方法を示しています。
このサンプル ノートブックでは、機能を ONLINE に発行し、その GOOGLE から機能を自動的に検索するトレーニング済みモデルを提供する方法を示します。