Databricks のスキーマとは何ですか?

Unity Catalog では、スキーマはカタログの子であり、テーブル、ビュー、ボリューム、モデル、関数を含めることができます。 スキーマは、カタログよりも詳細なカテゴリのデータ編成を提供します。

この記事では、Unity Catalog の Databricks データ オブジェクト階層におけるスキーマの役割について説明します。

従来のワークスペースローカルHive metastoreのスキーマの詳細については、 「従来のHive metastoreのデータベース オブジェクト」を参照してください。

スキーマとは

Unity Catalog では、スキーマは Unity Catalog の 3 レベルの名前空間 ( catalog.schema.table-etc ) の 2 番目のレベルです。

スキーマに重点を置いたUnity Catalogオブジェクト モデル図

スキーマは、データと AI アセットをカタログよりも細かい論理カテゴリに整理します。 通常、スキーマは単一のユースケース、プロジェクト、またはチーム サンドボックスを表します。 カテゴリの種類に関係なく、スキーマは、データ アクセス制御を管理し、データの検出可能性を向上させるための便利なツールです。

注:

Databricks では、スキーマはデータベースと呼ばれることもあります。 たとえば、 CREATE DATABASECREATE SCHEMAのエイリアスです。 この用語は、データベースがスキーマの集合である一部のリレーショナル・データベース・システムの用語とは異なります。

Unity Catalogのデータ オブジェクト階層の詳細については、 「 Databricksのデータベース オブジェクトとは」を参照してください。

スキーマの管理場所

Unity Catalog では、スキーマの管理ストレージの場所を指定することで、スキーマ内のすべてのマネージドテーブルと管理ボリュームのデータをカタログ内の他のスキーマのデータと物理的に分離できます。これは完全にオプションです。 スキーマの管理ストレージの場所を指定しない場合、データはカタログの管理ストレージの場所に存在します (カタログに何も定義されていない場合は、メタストアの管理ストレージの場所に存在します)。 「Unity Catalog で管理されたストレージの場所を指定する」を参照してください。

外部テーブルとボリュームのデータ分離は、クラウド ストレージでのデータの管理方法によって異なります。 これは、スキーマの管理対象の場所とは無関係です。