Databricks テーブル
Databricks は、さまざまなデータ マネジメントのニーズを満たすために、複数のテーブル タイプとストレージ形式を提供します。 このセクションでは、マネージドテーブル、外部テーブル、フォーリンテーブル、およびアトミック性、一貫性、分離性、耐久性などの高度な機能を強化する Delta Lake および Apache Iceberg ストレージ形式について説明します (ACIDトランザクションとタイムトラベル。
コアコンセプト
テーブルの種類、ストレージ形式、Unity Catalog 統合の基礎について説明します。
トピック | 説明 |
|---|---|
テーブルの種類、ストレージ形式、Unity Catalog 統合に関するコア概念と基本情報。 |
テーブルタイプ
さまざまなテーブルタイプとその機能を調べて、さまざまなデータマネジメントのシナリオに対応します。
テーブルの種類 | 説明 |
|---|---|
DatabricksにおけるDelta LakeとApache IcebergのUnity Catalog マネージドテーブル | Databricks はメタデータとデータ ファイルを管理します。最適化されたパフォーマンスを必要とする新しいテーブルに使用されます。 |
中間データ用のセッションスコープのUnity Catalogマネージドテーブル。 SQLウェアハウスのみ。 | |
外部システムに保存されたデータ。Unity Catalog はメタデータのみを管理します。 | |
レイクハウスフェデレーションを通じて接続された外部システムのデータへの読み取り専用アクセス。 |
ストレージ形式
高度なデータマネジメント機能を提供するオープンテーブル形式を使用します。
フォーマット | 説明 |
|---|---|
管理されたテーブルと外部テーブルに ACIDトランザクション、タイムトラベル、スキーマ強制を提供するデフォルトストレージ形式。 | |
Icebergエコシステムと統合するためのオープンテーブル形式で、高度なメタデータ管理をサポートします。 |
テーブル管理
テーブルの動作、構造、およびパフォーマンスを構成および最適化します。
機能 | 説明 |
|---|---|
データ品質ルールを定義し、null 制約ではなくチェック制約を使用して適用します。 | |
書き込み中に Databricks がスキーマの変更とデータ型の適用を処理する方法を制御します。 | |
パーティションキーでデータを整理して、クエリのパフォーマンスを向上させ、データマネジメントを向上させます。 | |
テーブル ストレージの使用状況と増加パターンを監視および分析します。 | |
外部テーブルをマネージドテーブルに移行して、パフォーマンスと管理を向上させます。 | |
自動的に検出して登録するパーティション in 外部テーブル クラウドストレージに格納されています。 |