メインコンテンツまでスキップ

AutoML Feature Store の統合

AutoMLでは、レガシーのワークスペース Feature Store またはUnity Catalogの 特徴量テーブル の特徴量で元の入力データセットを拡張することができます。

必要条件

  • エクスペリメントの分類と回帰には、 Databricks Runtime 11.3 LTS ML 以上が必要です。
  • エクスペリメントの予測には Databricks Runtime 12.2 LTS ML 以上が必要です。

AutoML UIを使用して特徴量テーブルを選択する

AutoMLエクスペリメントを設定した後、次の手順で特徴量テーブルを選択できます。

  1. 特徴量を結合 (オプション) をクリックします。

    [フィーチャに参加] ボタン

  2. 追加の特徴量の結合 ページの 特徴量テーブル フィールドで特徴量を選択します。

  3. 特徴量テーブルの主キー ごとに、対応する参照キーを選択します。

  4. 時系列特徴量テーブルで、対応するタイムスタンプ参照キーを選択します。同様に、タイムスタンプ ルックアップ キーは、 AutoML エクスペリメント用に提供したトレーニング データセットの列である必要があります。

    主キーとルックアップテーブルを選択してください

  5. 特徴量テーブルをさらに追加するには、 別の特徴量テーブルを追加 をクリックし、上記の手順を繰り返します。

特徴量テーブルをAutoML APIと一緒に使用する

既存の特徴量テーブルを使用するには、 AutoML 実行仕様feature_store_lookups パラメーターを設定します。

Python
feature_store_lookups = [
{
"table_name": "example.trip_pickup_features",
"lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
},
{
"table_name": "example.trip_dropoff_features",
"lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
}
]

次のノートブックは、特徴量テーブルをトレーニング データセットに結合して AutoMLで使用する方法を示しています。

特徴量テーブルを用いたAutoML エクスペリメントノートブック

Open notebook in new tab