Databricks のスキーマとは何ですか?
Unity Catalog では、スキーマはカタログの子であり、テーブル、ビュー、ボリューム、モデル、関数を含めることができます。 スキーマは、カタログよりも詳細なカテゴリのデータ編成を提供します。
この記事では、Unity Catalog の Databricks データ オブジェクト階層におけるスキーマの役割について説明します。
従来のワークスペースローカルHive metastoreのスキーマの詳細については、 「従来のHive metastoreのデータベース オブジェクト」を参照してください。
スキーマとは
Unity Catalog では、スキーマは Unity Catalog の 3 レベルの名前空間 ( catalog.schema.table-etc
) の 2 番目のレベルです。
スキーマは、データと AI アセットをカタログよりも細かい論理カテゴリに整理します。 通常、スキーマは単一のユースケース、プロジェクト、またはチーム サンドボックスを表します。 カテゴリの種類に関係なく、スキーマは、データ アクセス制御を管理し、データの検出可能性を向上させるための便利なツールです。
注:
Databricks では、スキーマはデータベースと呼ばれることもあります。 たとえば、 CREATE DATABASE
は CREATE SCHEMA
のエイリアスです。 この用語は、データベースがスキーマの集合である一部のリレーショナル・データベース・システムの用語とは異なります。
Unity Catalogのデータ オブジェクト階層の詳細については、 「 Databricksのデータベース オブジェクトとは」を参照してください。
スキーマの管理場所
Unity Catalog では、スキーマの管理対象ストレージの場所を指定することにより、スキーマ内のすべての管理対象テーブルと管理対象ボリュームのデータを、カタログ内の他のスキーマのデータから物理的に分離できます。 これは完全にオプションです。 スキーマの管理ストレージの場所を指定しない場合、データはカタログの管理されたストレージの場所にあります (カタログに何も定義されていない場合は、メタストアの管理されたストレージの場所にあります)。 「Unity Catalog で管理対象ストレージの場所を指定する」を参照してください。
外部テーブルとボリュームのデータ分離は、クラウド ストレージでのデータの管理方法によって異なります。 これは、スキーマの管理対象の場所とは無関係です。