Delta Lake へのデータの移行

Databricks は、Parquet と Iceberg のデータを Delta Lake に簡単に移行するためのツールを提供します。

CONVERT TO DELTACLONE のどちらを使用するか

CONVERT TO DELTA SQL コマンドは、Parquet テーブルと Iceberg テーブルを外部テーブルに 1 回だけインプレース変換します。「Delta Lake への変換」を参照してください。

CLONE Parquet と Iceberg のサポートにより CONVERT TO DELTA 機能が拡張され、変換の増分サポートが含まれるようになりました。 DEEP CLONEを使用して、マネージドテーブル Unity Catalog 作成できます。 「Parquet テーブルと Iceberg テーブルを Delta Lake に段階的に複製する」を参照してください。

Databricks マネージドテーブル Unity Catalog を使用してデータを格納することをお勧めしますが、インプレース変換では、すべてのデータを完全に書き換える必要なく、同じ利点の多くが提供されます。 Databricks では、移行中にソース システムが引き続き更新プログラムを受け取る場合は、 CLONE を使用することをお勧めします。