オンラインワークフローで機能を使用する

Databricks Feature Store使用すると、モデル開発プロセスのあらゆる段階がDatabricksデータインテリジェンスプラットフォームに統合されます。これは、 Databricksインフラストラクチャを処理している間に、自動化されたデータパイプラインを構築してコンピュートし、機能値を提供できることを意味します。 Databricksプラットフォームは、フィーチャとモデルの両方に対してリアルタイム配信を提供し、フィーチャ値のオンデマンド計算も可能にします。

自動フィーチャ検索

Databricks Feature Storeを使用してモデルをトレーニングし、 Databricksモデルサービングで提供すると、モデルはDatabricks Online Feature Storeまたはサードパーティのオンラインストアから特徴値を自動的に検索します。これは自動的に行われ、設定は一切不要です。

スコアリング要求がモデルに届くと、モデルサービングはモデルに必要な公開された特徴値を自動的に取得します。このように、最新の特徴値が常に予測に使用されます。詳細とノートブックの例については、「モデルサービングと自動機能検索」を参照してください。

次の図は、リアルタイムサービングのプラットフォームコンポーネント間の関係を示しています。

オンライン検索を使用した Feature Store ワークフロー

オンデマンド機能

リアルタイムアプリケーション用の機械学習モデルは、多くの場合、最新の特徴量値を必要とします。図に示されている例では、レストランのレコメンデーションモデルの1つの特徴量は、ユーザーからレストランまでの現在の距離です。この特徴量は、「オンデマンド」、つまりスコアリング要求時に計算される必要があります。スコアリング要求を受信すると、モデルはレストランの場所を検索し、事前定義された関数を適用して、ユーザーの現在地とレストラン間の距離を計算します。その距離は、Feature Storeからの他の事前計算された特徴量とともに、モデルへの入力として渡されます。

詳細については、「オンデマンドの特徴量コンピュート」を参照してください。

コンピュート features on demand ワークフロー

自動フィーチャ検索​

オンデマンド機能​

自動フィーチャ検索

オンデマンド機能