トラブルシューティングと制限事項
トラブルシューティング
エラーメッセージ: Database recommender_system does not exist in the Hive metastore.
特徴量テーブルは Delta テーブルとして格納されます。 データベースはテーブル名のプレフィックスで指定されるため、特徴量テーブル recommender_system.customer_features は recommender_system データベースに格納されます。
データベースを作成するには、次のコマンドを実行します。
%sql CREATE DATABASE IF NOT EXISTS recommender_system;
エラー メッセージ: ModuleNotFoundError: No module named 'databricks.feature_engineering' または ModuleNotFoundError: No module named 'databricks.feature_store'
このエラーは、使用している Databricks Runtime に databricks-feature-engineeringがインストールされていない場合に発生します。
databricks-feature-engineering は PyPIで使用でき、次のものと共にインストールできます。
%pip install databricks-feature-engineering
エラーメッセージ: ModuleNotFoundError: No module named 'databricks.feature_store'
このエラーは、使用している Databricks Runtime に databricks-feature-store がインストールされていない場合に発生します。
Databricks Runtime 14.3 以降の場合は、代わりに databricks-feature-engineeringを %pip install databricks-feature-engineering
databricks-feature-store は PyPI で利用でき、以下を使用してインストールできます。
%pip install databricks-feature-store
エラーメッセージ: Invalid input. Data is not compatible with model signature. Cannot convert non-finite values...'
このエラーは、Feature Store でパッケージ化されたモデルを Mosaic AI Model Servingで使用している場合に発生する可能性があります。 エンドポイントへの入力にカスタム特徴量を指定する場合は、入力の各行に特徴量の値を指定するか、行を指定しない値を指定する必要があります。 一部の行のみにフィーチャのカスタム値を指定することはできません。
エラーメッセージ: No suitable online store found for feature tables
このエラーは、自動機能検索またはFeature Serving備えたモデルに対してMosaic AI Model Servingエンドポイントを設定するときに発生します。 エラー メッセージは、失敗したサービス エンドポイントのイベント ログに表示されます。これは、オフラインの特徴量テーブルとオンラインFeature Storeの間の切断を示します。
原因1: テーブルが公開されていない
オフライン特徴量テーブルを検索するには、オンライン ストアで利用できる必要があります。 エラーの最も一般的な原因は、必要な特徴量テーブル (エラー メッセージにリストされている) が Online Feature Storeにまだ公開されていないことです。
解決策 : Online Feature Store の指示に従って、エラーに記載されているテーブルを公開します。
原因2: ソーステーブルが再作成された(IDの不一致)
解決策 : テーブル ID が一致しているかどうかを確認し、問題を修正できます。
-
オフライン特徴量テーブル ID を取得します。
- カタログエクスプローラーに移動します。
- 特徴量テーブルを見つけます。
- 詳細 タブを開いて、
Table IDを見つけます。
-
オンライン テーブル ソース ID を取得します。
- カタログ エクスプローラーで対応するオンライン テーブルを見つけます。
- 詳細 タブを開きます。
- プロパティ の下で
source_table_idを見つけます。
-
比較して修正:
- ID が一致しない場合はリンクが壊れます。これは、オフライン ソース テーブルが再作成されたことを意味します。
- 元のオフライン テーブルを復元できるかどうかに基づいて、以下のいずれかのオプションを選択して問題を修正します。
オプション1: 以前のオフラインテーブルを復元する
- 現在のテーブルの名前を変更するには、 ALTER TABLE RENAME TOコマンドを使用します。
- UNDROP TABLE WITH IDコマンドを使用して、オンライン テーブル プロパティに記録された
source_table_idで以前のテーブルを復元します。 - 新しいオンライン テーブルに接続するには、サービス エンドポイントを更新または再作成します。
オプション2: 現在のオフラインテーブルを保持し、オンラインストアに公開する
- 指示に従って特徴量テーブルを公開します。
- 新しいオンライン テーブルに接続するには、サービス エンドポイントを更新または再作成します。
- オプション : 混乱を避けるために、古いオンライン テーブルをクリーンアップします。
制限
-
モデルでは、トレーニングに使用できるテーブルは最大 50 個と 100 個です。
-
Lakeflow Spark宣言型パイプラインを特徴量テーブルとして使用する場合、 Databricks Runtime MLクラスターはサポートされません。 代わりに、標準アクセス モードのコンピュート リソースを使用し、
pip install databricks-feature-engineeringを使用してクライアントを手動でインストールします。 その他の必要な ML ライブラリもインストールする必要があります。Python%pip install databricks-feature-engineering -
Databricks レガシー ワークスペース Feature Store は、特徴量テーブルからの個々のフィーチャの削除をサポートしていません。
-
モデルでは、最大 100 個の オンデマンド機能 を使用できます。