Databricks テーブル
Databricks は、さまざまなデータ マネジメントのニーズを満たすために、複数のテーブル タイプとストレージ形式を提供します。 このセクションでは、マネージドテーブル、外部テーブル、フォーリンテーブル、およびアトミック性、一貫性、分離性、耐久性などの高度な機能を強化する Delta Lake および Apache Iceberg ストレージ形式について説明します (ACIDトランザクションとタイムトラベル。
コアコンセプト
テーブルの種類、ストレージ形式、Unity Catalog 統合の基礎について説明します。
トピック | 説明 |
---|---|
テーブルの種類、ストレージ形式、Unity Catalog 統合に関するコア概念と基本情報。 |
テーブルタイプ
さまざまなテーブルタイプとその機能を調べて、さまざまなデータマネジメントのシナリオに対応します。
テーブルの種類 | 説明 |
---|---|
Databricks がメタデータとデータ ファイルの両方を管理するテーブル。パフォーマンスとストレージが最適化された新しいテーブルに推奨されます。 | |
Unity Catalog でメタデータを管理するときに、外部ストレージ システムに格納されているデータを参照するテーブル。 | |
レイクハウスフェデレーションを介して接続された外部システムのデータを表す読み取り専用テーブル。 |
ストレージ形式
高度なデータマネジメント機能を提供するオープンテーブル形式を使用します。
フォーマット | 説明 |
---|---|
管理されたテーブルと外部テーブルに ACIDトランザクション、タイムトラベル、スキーマ強制を提供するデフォルトストレージ形式。 | |
Icebergエコシステムと統合するためのオープンテーブル形式で、高度なメタデータ管理をサポートします。 |
テーブル管理
テーブルの動作、構造、およびパフォーマンスを構成および最適化します。
機能 | 説明 |
---|---|
データ品質ルールを定義し、null 制約ではなくチェック制約を使用して適用します。 | |
書き込み中に Databricks がスキーマの変更とデータ型の適用を処理する方法を制御します。 | |
パーティションキーでデータを整理して、クエリのパフォーマンスを向上させ、データマネジメントを向上させます。 | |
テーブル ストレージの使用状況と増加パターンを監視および分析します。 | |
外部テーブルをマネージドテーブルに移行して、パフォーマンスと管理を向上させます。 | |
自動的に検出して登録するパーティション in 外部テーブル クラウドストレージに格納されています。 |