Databricks のスキーマとは
Unity Catalog では、スキーマは カタログ の子であり、テーブル、ビュー、ボリューム、モデル、関数を含めることができます。 スキーマは、カタログよりも詳細なデータ編成のカテゴリを提供します。
この記事では、Unity Catalog の Databricks データ オブジェクト階層におけるスキーマの役割について説明します。
従来のワークスペースローカル Hive metastoreのスキーマに関する情報については、従来のHive metastoreのデータベース オブジェクトを参照してください。
スキーマとは
Unity Catalog では 、スキーマは Unity Catalog の 3 レベルの名前空間 (catalog.schema.table-etc
) の 2 番目のレベルです。
スキーマは、データと AI アセットを、カタログよりも詳細な論理カテゴリに整理します。 通常、スキーマは 1 つのユースケース、プロジェクト、またはチームサンドボックスを表します。 カテゴリの種類に関係なく、スキーマは、データアクセス制御を管理し、データの検出可能性を向上させるための便利なツールです。
Databricks では、スキーマはデータベースと呼ばれることがあります。 たとえば、 CREATE DATABASE
は CREATE SCHEMA
のエイリアスです。 この用語は、データベースがスキーマの集合である一部のリレーショナル・データベース・システムの用語とは異なります。
Unity Catalogのデータ オブジェクト階層の詳細については、「Databricksのデータベース オブジェクトとは」を参照してください。
スキーマの管理された場所
Unity Catalog では、スキーマの管理 ストレージの場所 を指定することで、スキーマ内のすべてのマネージドテーブルと管理ボリュームのデータをカタログ内の他のスキーマのデータと物理的に分離できます。これは完全にオプションです。 スキーマの管理ストレージの場所を指定しない場合、データはカタログの管理ストレージの場所に存在します (カタログに何も定義されていない場合は、メタストアの管理ストレージの場所に存在します)。 「Unity Catalog で管理されたストレージの場所を指定する」を参照してください。
外部テーブルと外部ボリューム のデータ分離は、クラウド ストレージでのデータの管理方法によって異なります。 これは、スキーマのマネージドロケーションとは無関係です。