オンラインワークフローの機能を使用する
Unity Catalog で特徴エンジニアリングを使用すると、モデル開発プロセスのすべてのステップが Databricks Data Intelligence Platform に統合されます。 つまり、 Databricksインフラストラクチャを処理している間に、コンピュートへの自動化されたデータパイプラインを構築して特徴値を提供することができます。 Databricks プラットフォームは、特徴値のオンデマンド計算を含む、特徴とモデルの両方に対してリアルタイム サービスを提供します。
自動特徴量検索
Databricks機能エンジニアリングを使用してモデルをトレーニングし、 Databricksモデルサービスを提供すると、モデルはDatabricksオンライン テーブルまたはサードパーティのオンライン ストアから機能値を自動的に検索します。 これは、セットアップを必要とせずに自動的に行われます。
モデルにスコアリング要求が届くと、モデルサービングはモデルに必要な公開された特徴値を自動的に取得します。 このように、最新の特徴値が常に予測に使用されます。 詳細と例については、 Databricksモデルサービングによる自動特徴検索」を参照してください。
次の図は、リアルタイム サービングのプラットフォーム コンポーネント間の関係を示しています。
オンデマンド機能
リアルタイム アプリケーション用の機械学習モデルでは、多くの場合、最新の特徴値が必要になります。 図に示されている例では、レストランのレコメンデーション モデルの 1 つの特徴は、ユーザーのレストランからの現在の距離です。 この機能は、"オンデマンド" で、つまりスコアリング要求時に計算する必要があります。 スコアリング要求を受信すると、モデルはレストランの場所を検索し、事前定義された関数を適用して、ユーザーの現在地とレストランの間の距離を計算します。 その距離は、 Feature Storeからの他の事前計算された特徴とともに、モデルへの入力として渡されます。 詳細については、コンピュートのオンデマンド機能をご覧ください。