AutoML Feature Store の統合

AutoML、 または 従来のワークスペース Feature Store のUnity Catalog 特徴量テーブル の特徴を使用して、元の入力データセットを拡張できます。

要件

  • エクスペリメントの分類と回帰には、 Databricks Runtime 11.3 LTS ML 以上が必要です。

  • エクスペリメントの予測には Databricks Runtime 12.2 LTS ML 以上が必要です。

AutoML UIを使用して特徴量テーブルを選択する

AutoMLエクスペリメントを設定したら、次の手順で特徴量テーブルを選択できます。

  1. [ フィーチャを結合 (オプション)] をクリックします。

    [フィーチャに参加] ボタン
  2. [追加特徴量テーブルの結合] ページで、[特徴量テーブル] フィールドで 特徴量テーブル を選択します。

  3. 特徴量テーブルの主キーごとに、対応する参照キーを選択します。参照キーは、AutoML エクスペリメントに指定したトレーニング データセットの列である必要があります。

  4. [time series 特徴量テーブル] で、対応するタイムスタンプ参照キーを選択します。同様に、タイムスタンプ ルックアップ キーは、 AutoML エクスペリメント用に提供したトレーニング データセットの列である必要があります。

    主キーとルックアップ テーブルの選択
  5. 特徴量テーブルをさらに追加するには、「 別の特徴量テーブルを追加 」をクリックし、上記の手順を繰り返します。

特徴量テーブルをAutoML API と一緒に使用する

既存の特徴量テーブルを使用するには、 AutoML 実行仕様feature_store_lookups パラメーターを設定します。

feature_store_lookups = [
  {
     "table_name": "example.trip_pickup_features",
     "lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
  },
  {
      "table_name": "example.trip_dropoff_features",
     "lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
  }
]

次のノートブックは、特徴量テーブルをトレーニング データセットに結合して AutoMLで使用する方法を示しています。

AutoML エクスペリメント using 特徴量テーブル ノートブック

ノートブックを新しいタブで開く