Databricksモデルサービングによる自動機能検索
モデルサーバーでは、公開されたオンライン ストアまたはオンライン テーブルから特徴値を自動的に検索できます。 オンライン テーブルの作成と操作の詳細については、 「リアルタイムFeature Servingの提供にオンライン テーブルを使用する」を参照してください。
要件
モデルは、
FeatureEngineeringClient.log_model
( Unity Catalogでの特徴量エンジニアリング) またはFeatureStoreClient.log_model
(ワークスペース Feature Storeの場合、v0.3.5 以降が必要です) でログに記録されている必要があります。サードパーティのオンライン ストアの場合、オンライン ストアは読み取り専用の資格情報を使用して公開する必要があります。
注
特徴テーブルは、モデルのトレーニング後を含め、モデルのデプロイ前であればいつでも公開できます。
自動特徴量検索
Databricks Model Servingでは、 次のオンライン ストアからの自動機能検索がサポートされています。
Amazon DynamoDB (v0.3.8 以降)
自動特徴量検索は、次のデータ型でサポートされています。
IntegerType
FloatType
BooleanType
StringType
DoubleType
LongType
TimestampType
DateType
ShortType
DecimalType
ArrayType
MapType
オンライン モデル スコアリングで特徴値をオーバーライドする
モデルに必要なすべての特徴量 ( FeatureEngineeringClient.log_model
または FeatureStoreClient.log_model
で記録) は、モデルのスコアリングのためにオンライン ストアから自動的に検索されます。 モデルサービングで REST API を使用してモデルをスコアリングするときに特徴値をオーバーライドするには、特徴値を API ペイロードの一部として含めます。
注
新しいフィーチャ値は、基になるモデルで想定されるフィーチャのデータ型に準拠している必要があります。
ノートブックの例: Unity Catalog
Databricks Runtime13.3LTS 以降では、主キーを持つDelta Unity Catalog内の任意の テーブルを特徴量テーブルとして使用できます。Unity Catalogに登録されているテーブルを特徴量テーブルとして使用すると、すべてのUnity Catalog機能が特徴量テーブルで自動的に使用できるようになります。
次のノートブックは、リアルタイムの提供と自動フィーチャ検索のために、フィーチャをオンライン テーブルに公開する方法を示しています。
このサンプル ノートブックでは、機能を ONLINE に発行し、その GOOGLE から機能を自動的に検索するトレーニング済みモデルを提供する方法を示します。