メインコンテンツまでスキップ

Unity Catalog とは何ですか?

Unity Catalogは、Databricksに組み込まれた統合ガバナンスレイヤーです。ワークスペースに対して有効にすると、 Unity Catalogワークスペース内のすべてのデータ インタラクションの下で自動的に動作します。テーブルにクエリを実行するときのアクセス制御の強制、データ移動時のリネージの追跡、監査のためのアクティビティのログ記録などが行われます。 Unity Catalog管理するオブジェクトは、Catalog Explorer 、 SQL 、 Databricks CLI 、およびREST APIsを通じて操作します。

Unity Catalog は、オープンソースの実装としても利用できます。 お知らせのブログと公開されている Unity Catalog GitHub リポジトリを参照してください。

Unity Catalogオブジェクトモデル

Unity Catalogで管理するすべてのアセットは、 セキュリティ保護可能なオブジェクト としてモデル化されます。このオブジェクトに対して、ユーザー、サービスプリンシパル、またはグループに権限を付与することができます。テーブル、ビュー、ボリューム、関数、モデルなどのデータ資産は、3 レベルのネームスペース ( catalog.schema.object ) に従います。テーブルとボリュームは、Unity Catalogがガバナンスと基盤となるファイルストレージのライフサイクルの両方を処理する内部管理、またはUnity Catalogがガバナンスのみを処理する 外部 管理のいずれかで 管理 できます。ストレージ認証情報、外部ロケーション、接続、共有などのその他のオブジェクトは、メタストアの直下に配置されます。

Unity Catalogオブジェクトモデル図

次のページではUnity Catalogコア概念とワークフローについて詳しく説明します。

    • 管理資産と外部資産
    • 管理対象テーブルと外部テーブルおよびボリュームの違い、そしてそれぞれをいつ使用すべきかを理解しましょう。
    • 要件と制限事項
    • コンピュートの要件、サポートされているファイル形式、名前付けの制約、既知の制限事項を確認します。

Unity Catalogの機能

Unity Catalogは、データとAI環境のあらゆる側面を管理するための組み込みツールを提供します。以下のトピックは、主要な能力領域を網羅しています。

    • アクセス制御
    • 権限、属性ベースのポリシー、行および列フィルター、ワークスペースバインディングを使用して、誰が何にアクセスできるかを管理します。
    • データディスカバリー
    • Unity Catalogに登録されているデータやAIアセットの発見と管理を行うためのDatabricks UIであるCatalog Explorerを使用して、セキュリティ保護可能なオブジェクトを操作します。
    • データリネージ
    • データの流れと変換が、ソースから最終的なビューやダッシュボードに至るまで自動的に追跡します。
    • 監査
    • 監査ログシステムテーブルを使用して、すべてのデータアクセスとシステムアクティビティの完全な記録を保持してください。
    • データの分類
    • カタログ内の機密データを自動的に分類し、タグ付けします。
    • データ品質モニタリング
    • 組み込みのプロファイリング機能とアラート機能により、データの状態を積極的に追跡し、異常が下流の消費者に届く前に検知します。
    • データ共有
    • オープンなDelta Sharingプロトコルを使用して、組織間およびクラウド間でライブデータとAIアセットを安全に共有します。
    • AI ガバナンス
    • Unity CatalogとAI Gatewayを使用して、AIアセットとAIトラフィックを管理します。

さあ始めましょう

以下のリソースは、Unity Catalog の利用開始に役立ちます。ワークスペースが 2024 年 3 月 6 日以降に作成された場合、 Unity Catalogが自動的に有効になります。

    • Unity Catalogの使用を開始する
    • Unity Catalogワークスペースに対してすでに有効になっているかどうかを確認し、最初のカタログ、スキーマ、およびデータ アクセス制御を構成します。

追加のリソース