Delta Lake へのデータの移行
Databricks は、Parquet と Iceberg のデータを Delta Lake に簡単に移行するためのツールを提供します。
CONVERT TO DELTA
と CLONE
のどちらを使用するか
CONVERT TO DELTA
SQL コマンドは、Parquet テーブルと Iceberg テーブルを外部テーブルに 1 回だけインプレース変換します。「Delta Lake への変換」を参照してください。
CLONE
Parquet と Iceberg のサポートにより CONVERT TO DELTA
機能が拡張され、変換の増分サポートが含まれるようになりました。 DEEP CLONE
を使用して、マネージドテーブル Unity Catalog 作成できます。 「Parquet テーブルと Iceberg テーブルを Delta Lake に段階的に複製する」を参照してください。
Databricks マネージドテーブル Unity Catalog を使用してデータを格納することをお勧めしますが、インプレース変換では、すべてのデータを完全に書き換える必要なく、同じ利点の多くが提供されます。 Databricks では、移行中にソース システムが引き続き更新プログラムを受け取る場合は、 CLONE
を使用することをお勧めします。