Databricksモデルサービングによる特徴量の自動検索

モデルサービングでは、公開されたオンライン ストアまたはオンライン テーブルから特徴量の値を自動的に検索できます。 オンライン テーブルの作成と操作の詳細については、 「リアルタイム特徴量サービングにオンライン テーブルを使用する」を参照してください。

要件

  • モデルは FeatureEngineeringClient.log_model( Unity Catalogでの特徴量エンジニアリングの場合) または FeatureStoreClient.log_model (従来のワークスペース Feature Store の場合、v0.3.5 以降が必要) でログに記録されている必要があります。

  • サードパーティのオンライン ストアの場合、オンライン ストアは読み取り専用の資格情報を使用して公開する必要があります。

特徴テーブルは、モデルのトレーニング後を含め、モデルのデプロイ前であればいつでも公開できます。

自動特徴量検索

Databricks モデルサービングでは、 次のオンライン ストアからの自動特徴量検索がサポートされています。

自動特徴量検索は、次のデータ型でサポートされています。

  • IntegerType

  • FloatType

  • BooleanType

  • StringType

  • DoubleType

  • LongType

  • TimestampType

  • DateType

  • ShortType

  • DecimalType

  • ArrayType

  • MapType

オンライン モデル スコアリングで特徴量の値をオーバーライドする

モデルに必要なすべての特徴量 ( FeatureEngineeringClient.log_model または FeatureStoreClient.log_modelで記録) は、モデルのスコアリングのためにオンライン ストアから自動的に検索されます。 モデルサービングで REST API を使用してモデルをスコアリングするときに特徴量の値をオーバーライドするには、特徴量の値を API ペイロードの一部として含めます。

新しい特徴量の値は、基になるモデルで想定される特徴量のデータ型に準拠している必要があります。

ノートブックの例: Unity Catalog

Databricks Runtime13.3LTS 以降では、主キーを持つDelta Unity Catalog内の任意の テーブルを特徴量テーブルとして使用できます。Unity Catalogに登録されているテーブルを特徴量テーブルとして使用すると、すべてのUnity Catalog機能が特徴量テーブルで自動的に使用できるようになります。

次のノートブックは、リアルタイムの提供と自動フィーチャ検索のために、フィーチャをオンライン テーブルに公開する方法を示しています。

オンラインテーブルデモノートブック

ノートブックを新しいタブで開く

このサンプル ノートブックでは、機能を ONLINE に発行し、その GOOGLE から機能を自動的に検索するトレーニング済みモデルを提供する方法を示します。

サードパーティのオンラインストアのサンプルノートブック(Unity Catalog)

ノートブックを新しいタブで開く

ノートブックの例: ワークスペース Feature Store (レガシ)

このサンプル ノートブックでは、機能を ONLINE に発行し、その GOOGLE から機能を自動的に検索するトレーニング済みモデルを提供する方法を示します。

Third-party オンラインストア example ノートブック (ワークスペース Feature Store)

ノートブックを新しいタブで開く