AutoML Feature Store の統合
AutoMLでは、レガシーのワークスペース Feature Store またはUnity Catalogの 特徴量テーブル の特徴量で元の入力データセットを拡張することができます。
必要条件
- エクスペリメントの分類と回帰には、 Databricks Runtime 11.3 LTS ML 以上が必要です。
- エクスペリメントの予測には Databricks Runtime 12.2 LTS ML 以上が必要です。
AutoML UIを使用して特徴量テーブルを選択する
AutoMLエクスペリメントを設定した後、次の手順で特徴量テーブルを選択できます。
-
特徴量を結合 (オプション) をクリックします。
-
追加の特徴量の結合 ページの 特徴量テーブル フィールドで特徴量を選択します。
-
特徴量テーブルの主キー ごとに、対応する参照キーを選択します。
-
時系列特徴量テーブルで、対応するタイムスタンプ参照キーを選択します。同様に、タイムスタンプ ルックアップ キーは、 AutoML エクスペリメント用に提供したトレーニング データセットの列である必要があります。
-
特徴量テーブルをさらに追加するには、 別の特徴量テーブルを追加 をクリックし、上記の手順を繰り返します。
特徴量テーブルをAutoML APIと一緒に使用する
既存の特徴量テーブルを使用するには、 AutoML 実行仕様で feature_store_lookups
パラメーターを設定します。
Python
feature_store_lookups = [
{
"table_name": "example.trip_pickup_features",
"lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
},
{
"table_name": "example.trip_dropoff_features",
"lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
}
]
次のノートブックは、特徴量テーブルをトレーニング データセットに結合して AutoMLで使用する方法を示しています。