Databricks のスキーマとは何ですか?
Unity Catalog では、スキーマはカタログの子要素であり、テーブル、ビュー、ボリューム、モデル、関数を含めることができます。 スキーマは、カタログよりも詳細なカテゴリのデータ構成を提供します。
この記事では、Unity Catalog の Databricks データ オブジェクト階層におけるスキーマの役割について説明します。
従来のワークスペースローカルHive metastoreのスキーマの詳細については、 従来のHive metastoreのデータベース オブジェクトを参照してください。
スキーマとは
Unity Catalog では、スキーマは Unity Catalog の 3 レベルの名前空間 ( catalog.schema.table-etc
) の 2 番目のレベルです。
スキーマは、データと AI アセットをカタログよりも細かい論理カテゴリに整理します。 通常、スキーマは単一のユースケース、プロジェクト、またはチーム サンドボックスを表します。 カテゴリの種類に関係なく、スキーマは、データ アクセス制御を管理し、データの検出可能性を向上させるための便利なツールです。
注:
Databricks では、スキーマはデータベースと呼ばれることもあります。 たとえば、 CREATE DATABASE
は CREATE SCHEMA
のエイリアスです。 この用語は、データベースがスキーマの集合である一部のリレーショナル・データベース・システムの用語とは異なります。
Unity Catalogのデータ オブジェクト階層の詳細については、 Databricksのデータベース オブジェクトとはを参照してください。
スキーマのマネージドロケーション
Unity Catalog では、スキーマのマネージドストレージロケーションを指定することで、スキーマ内のすべてのマネージドテーブルとマネージドボリュームのデータをカタログ内の他のスキーマのデータと物理的に分離できます。これは完全にオプションです。 スキーマのマネージドストレージロケーションを指定しない場合、データはカタログのマネージドストレージロケーションに格納されます (カタログに何も定義されていない場合は、メタストアのマネージドストレージロケーションに格納されます)。 Unity Catalog でマネージドストレージロケーションを指定するを参照してください。
外部テーブルと外部ボリュームのデータ分離は、クラウド ストレージでのデータの管理方法によって異なります。 これは、スキーマのマネージドロケーションとは無関係です。