メインコンテンツまでスキップ

トラブルシューティングと制限事項

トラブルシューティング

エラーメッセージ: Database recommender_system does not exist in the Hive metastore.

特徴量テーブルは Delta テーブルとして格納されます。 データベースはテーブル名のプレフィックスで指定されるため、特徴量テーブル recommender_system.customer_featuresrecommender_system データベースに格納されます。

データベースを作成するには、次のコマンドを実行します。

%sql CREATE DATABASE IF NOT EXISTS recommender_system;

エラー メッセージ: ModuleNotFoundError: No module named 'databricks.feature_engineering' または ModuleNotFoundError: No module named 'databricks.feature_store'

このエラーは、使用している Databricks Runtime に databricks-feature-engineeringがインストールされていない場合に発生します。

databricks-feature-engineering は PyPIで使用でき、次のものと共にインストールできます。

%pip install databricks-feature-engineering

エラーメッセージ: ModuleNotFoundError: No module named 'databricks.feature_store'

このエラーは、使用している Databricks Runtime に databricks-feature-store がインストールされていない場合に発生します。

注記

Databricks Runtime 14.3 以降の場合は、代わりに databricks-feature-engineeringを %pip install databricks-feature-engineering

databricks-feature-store は PyPI で利用でき、以下を使用してインストールできます。

%pip install databricks-feature-store

エラーメッセージ: Invalid input. Data is not compatible with model signature. Cannot convert non-finite values...'

このエラーは、Feature Store でパッケージ化されたモデルを Mosaic AI Model Servingで使用している場合に発生する可能性があります。 エンドポイントへの入力にカスタム特徴量を指定する場合は、入力の各行に特徴量の値を指定するか、行を指定しない値を指定する必要があります。 一部の行のみにフィーチャのカスタム値を指定することはできません。

エラーメッセージ: No suitable online store found for feature tables

このエラーは、自動機能検索またはFeature Serving備えたモデルに対してMosaic AI Model Servingエンドポイントを設定するときに発生します。 エラー メッセージは、失敗したサービス エンドポイントのイベント ログに表示されます。これは、オフラインの特徴量テーブルとオンラインFeature Storeの間の切断を示します。

原因1: テーブルが公開されていない

オフライン特徴量テーブルを検索するには、オンライン ストアで利用できる必要があります。 エラーの最も一般的な原因は、必要な特徴量テーブル (エラー メッセージにリストされている) が Online Feature Storeにまだ公開されていないことです。

解決策 : Online Feature Store の指示に従って、エラーに記載されているテーブルを公開します。

原因2: ソーステーブルが再作成された(IDの不一致)

解決策 : テーブル ID が一致しているかどうかを確認し、問題を修正できます。

  1. オフライン特徴量テーブル ID を取得します。

  2. オンライン テーブル ソース ID を取得します。

    • カタログ エクスプローラーで対応するオンライン テーブルを見つけます。
    • 詳細 タブを開きます。
    • プロパティ の下でsource_table_idを見つけます。
  3. 比較して修正:

    • ID が一致しない場合はリンクが壊れます。これは、オフライン ソース テーブルが再作成されたことを意味します。
    • 元のオフライン テーブルを復元できるかどうかに基づいて、以下のいずれかのオプションを選択して問題を修正します。

オプション1: 以前のオフラインテーブルを復元する

  • 現在のテーブルの名前を変更するには、 ALTER TABLE RENAME TOコマンドを使用します。
  • UNDROP TABLE WITH IDコマンドを使用して、オンライン テーブル プロパティに記録されたsource_table_idで以前のテーブルを復元します。
  • 新しいオンライン テーブルに接続するには、サービス エンドポイントを更新または再作成します。

オプション2: 現在のオフラインテーブルを保持し、オンラインストアに公開する

  • 指示に従って特徴量テーブルを公開します
  • 新しいオンライン テーブルに接続するには、サービス エンドポイントを更新または再作成します。
  • オプション : 混乱を避けるために、古いオンライン テーブルをクリーンアップします。

制限

  • モデルでは、トレーニングに使用できるテーブルは最大 50 個と 100 個です。

  • Lakeflow Spark宣言型パイプラインを特徴量テーブルとして使用する場合、 Databricks Runtime MLクラスターはサポートされません。 代わりに、標準アクセス モードのコンピュート リソースを使用し、 pip install databricks-feature-engineeringを使用してクライアントを手動でインストールします。 その他の必要な ML ライブラリもインストールする必要があります。

    Python
    %pip install databricks-feature-engineering
  • Databricks レガシー ワークスペース Feature Store は、特徴量テーブルからの個々のフィーチャの削除をサポートしていません。

  • モデルでは、最大 100 個の オンデマンド機能 を使用できます。