Upgrade a ワークスペース 特徴量テーブル to Unity Catalog
このページでは、既存のワークスペース 特徴量テーブルを Unity Catalogにアップグレードする方法について説明します。
まず、基になるワークスペース Delta テーブルをアップグレードする必要があります。 「 テーブルとビューを Unity Catalog にアップグレードする」の手順に従います。
基になるテーブルとデータが Unity Catalogで使用できるようになったら、次のコードに示すように、upgrade_workspace_table
を使用してワークスペース 特徴量テーブルのメタデータを Unity Catalogにアップグレードします。 Databricks では、使用している Databricks Runtime のバージョンに関係なく、この操作には常に最新バージョンの databricks-feature-engineering
を使用することをお勧めします。
%pip install databricks-feature-engineering --upgrade
dbutils.library.restartPython()
from databricks.feature_engineering import UpgradeClient
upgrade_client = UpgradeClient()
upgrade_client.upgrade_workspace_table(
source_workspace_table='recommender_system.customer_features',
target_uc_table='ml.recommender_system.customer_features'
)
次のメタデータが Unity Catalog にアップグレードされます。
- 主キー
- 時系列列
- テーブルと列のコメント (説明)
- テーブルと列のタグ
- ノートブック and ジョブ リネージ
ターゲット・テーブルに、ソース・テーブルとは異なる既存のテーブル・コメントまたはカラム・コメントがある場合、アップグレード・メソッドはコメントのアップグレードをスキップし、警告をログに記録します。 バージョン0.1.2を使用している場合 または databricks-feature-engineering
以下の場合、エラーがスローされ、アップグレードは実行されません。 他のすべてのメタデータでは、ターゲットテーブルとソーステーブルが一致しないとエラーが発生し、アップグレードが妨げられます。 エラーを回避し、ターゲット Unity Catalog テーブル上の既存のメタデータを上書きするには、 overwrite = True
API に渡します。
upgrade_client.upgrade_workspace_table(
source_workspace_table='recommender_system.customer_features',
target_uc_table='ml.recommender_system.customer_features',
overwrite=True
)
- この API を呼び出す前に、まず基になるワークスペースの Delta テーブルを Unity Catalog にアップグレードする必要があります。
- タグと時系列列のアップグレードは、Databricks Runtime 13.2 ML以下ではサポートされていません。
- アップグレードされた特徴量テーブルのプロデューサーとコンシューマーに通知して、新しいテーブル名を Unity Catalogで使用を開始することを忘れないでください。 Unity Catalog のターゲット テーブルが、ソース テーブルを複製した
CREATE TABLE AS SELECT
または同様の方法を使用してアップグレードされた場合、ソース テーブルへの更新はターゲット テーブルで自動的に同期されません。