メインコンテンツまでスキップ

カタログの作成

この記事では、Unity Catalog でカタログを作成する方法について説明します。 カタログには スキーマ (データベース) が含まれ、スキーマにはテーブル、ビュー、ボリューム、モデル、および関数が含まれます。

カタログの詳細については、「 Databricks のカタログとは」を参照してください。

注記

フォーリンカタログ (外部データ・システム内のデータベースをミラーリングするUnity Catalogオブジェクト) の作成方法については、フォーリンカタログの作成を参照してください。フォーリンカタログの管理と操作も参照してください。

必要条件

カタログの種類に関係なくカタログを作成するには:

  • Databricks メタストア管理者であるか、メタストアに対する CREATE CATALOG 特権を持っている必要があります。
  • ノートブックを実行してカタログを作成するために使用するコンピュート リソースは、 Databricks Runtime 11.3 以降を使用し、Unity Catalog 準拠のアクセス モードを使用している必要があります。 「アクセスモード」を参照してください。SQLウェアハウスは常に Unity Catalogをサポートしています。

共有カタログ を作成するには:

標準カタログ を作成するには:

  • カタログのマネージドストレージ場所を指定する場合は、ターゲット外部場所に対するCREATE MANAGED STORAGE権限が必要です。
  • メタストア レベルのマネージドストレージが存在しない場合は、カタログのマネージドストレージの場所を指定する 必要があります

フォーリンカタログ を作成するには:

  • フォーリンカタログを作成するために使用する接続の所有者であるか、接続に対するCREATE FOREIGN CATALOG権限を持っている必要があります。
  • コンピュートは Databricks Runtime 13.1以上で使用する必要があります。 SQLウェアハウスは Pro または サーバレス である必要があります。

カタログを作成する

カタログを作成するには、Catalog Explorer、SQL コマンド、REST API、Databricks CLI、または Terraform を使用できます。 カタログを作成すると、 defaultinformation_schemaの 2 つのスキーマ (データベース) が自動的に作成されます。

  1. メタストアにリンクされているワークスペースにログインします。

  2. カタログアイコン [カタログ] をクリックします。

  3. [クイック アクセス ] の下の [カタログ ] をクリックします。

  4. [ カタログを作成 ] をクリックします。

  5. [ 新しいカタログの作成 ] ダイアログで、[ カタログ名 ] を入力し、作成するカタログの [ タイプ ] を選択します。

    • 標準 カタログ: Unity Catalog によって管理されるデータと AI アセットを整理するセキュリティ保護可能なオブジェクト。レイクハウスフェデレーションと Delta Sharing 共有から作成されたカタログを除くすべてのユースケース。
    • 外部 カタログ : レイクハウスフェデレーションを使用して外部データ システム内のデータベースをミラーリングするセキュリティ保護可能なオブジェクト。 「レイクハウスフェデレーションのセットアップの概要」を参照してください。
    • 共有 カタログ: Delta Sharing 共有 として共有されるデータやその他の資産を整理するセキュリティ保護可能なオブジェクト。共有からカタログを作成すると、ワークスペース内のユーザーがそれらのアセットを読み取ることができます。「共有とは」を参照してください。
  6. カタログ・タイプに応じて、以下のオプションを指定します。

    • 標準カタログの場合 : オプションですが、管理 ストレージの場所 を指定することを強くお勧めします。管理対象ストレージの場所として使用するターゲット外部ロケーションに対する CREATE MANAGED STORAGE 権限が必要です。 「Unity Catalog で管理されたストレージの場所を指定する」を参照してください。

      オプションで、定義された外部ロケーションのサブパスを指定できます。外部ロケーションが定義されていない場合は、[ 新しい外部ロケーションを作成 ] をクリックして作成できます。

important

ワークスペースにメタストア レベルのストレージの場所がない場合は、カタログを作成するときにマネージドストレージロケーションを指定する 必要があります

  • フォーリンカタログの場合: 外部データベース Unity Catalogシステムにアクセスするためのパスと資格情報を指定する 内のセキュリティ保護可能なオブジェクトである[接続] を選択する必要があります。「レイクハウスフェデレーションのセットアップの概要」を参照してください。

    接続を選択したら、ミラーリングする データベース またはその他の Databricks カタログ の名前を入力します。

    要件はデータソースによって異なります。

    • MySQLは2層の名前空間を使用するため、データベース名は必要ありません。
    • 別のDatabricksワークスペース内のカタログに接続する場合は、データベース名ではなくDatabricks カタログ 名を入力します。

    接続が定義されていない場合は、[ 新しい接続の作成 ] をクリックして接続を作成できます。

  • 共有カタログの場合 : [プロバイダー ] と [共有 ] を選択する必要があります。プロバイダーを選択したら、プロバイダーの株式の 1 つを選択できます。

    必要なプロバイダーと共有がわからない場合は、Catalog Explorer ブラウザーを使用してプロバイダーと共有を参照または検索する方が簡単な場合があります。「 プロバイダーの表示 」および 「プロバイダーが共有した共有の表示」を参照してください。

  1. 作成 をクリックします。

  2. カタログ作成! ダイアログで、「 カタログの表示 」をクリックしてカタログを自動的に構成したものとして受け入れるか、「 カタログの構成 (推奨)」をクリックしてカタログの権限、ワークスペース・バインディングおよびメタデータを構成します。

    [ カタログの表示 ] をクリックすると、メタストアに接続されているすべてのワークスペースからカタログにアクセスできるようになり、すべてのアカウント ユーザーに BROWSE 権限が付与されます。この手順の残りのステップをスキップして、カタログへのスキーマの追加に進むことができます。スキーマの作成を参照してください。

    カタログエクスプローラーのカタログ詳細ページには、いつでも戻って、所有者、タグ、コメント、ワークスペースバインディング、権限、スキーマを更新できます。

  3. [ カタログ>ワークスペースの構成 ] ページで、カタログがバインドされているワークスペースを指定します。

    By デフォルト、カタログは現在のメタストアに接続されているすべてのワークスペースと共有されます。 カタログに特定のワークスペースに制限する必要があるデータが含まれる場合は、[ すべてのワークスペースにアクセス権がある ] オプションをオフにし、[ ワークスペースに割り当て] ボタンを使用してそれらのワークスペースを追加します。 現在のワークスペースを含める必要があります。

    ワークスペースを割り当てた後、オプションでデフォルトの 読み取りおよび書き込み アクセスレベルを 読み取り専用 に変更することができます。リストからワークスペースを選択し、 アクセスレベルの管理 ボタンをクリックします。

    詳細については、「 カタログへのアクセスを特定のワークスペースに制限する」を参照してください。

  4. [次へ ] をクリックして、カタログの 権限 を割り当てます。

    すべてのアカウント ユーザーには、デフォルトで BROWSE 権限が付与されており、データへの読み取りアクセス権がなくてもカタログ メタデータを検出できます。

    ユーザー、グループ、またはサービスプリンシパルに権限を付与するには、[ 付与] をクリックし、「権限とセキュリティ保護可能なオブジェクトUnity Catalog」の指示に従います。

  5. 「次へ 」をクリックして、オプションのタグとコメント のメタデータ を追加します。

    タグ は、カタログを整理および分類してデータ資産の検索と検出を簡素化するために使用できるキーと値のペアです。値はオプションです。「 Unity Catalog のセキュリティ保護可能なオブジェクトにタグを適用する」を参照してください。

    コメント は、ユーザーがカタログ内のデータ資産を見つけるのに役立つ説明を提供するためによく使用される自由形式のフィールドです。「データ資産と AI 資産にコメントを追加する」を参照してください

  6. 保存 をクリックします。

  7. スキーマとデータオブジェクトをカタログに追加します。

    スキーマの作成を参照してください。

カタログエクスプローラを使用すると、カタログを作成した後でいつでも、所有者、タグ、コメント、ワークスペースバインディング、およびパーミッションを更新できます。

詳細情報