Unity Catalog の使用を開始する
Unity Catalog は、Databricks におけるデータと AI のための統合ガバナンス層です。ワークスペース全体で、一元化されたアクセス制御、リネージ、監査、およびデータディスカバリーを提供します。「Unity Catalog とは」を参照してください。
Unity Catalogは、2023年11月8日以降に作成されたすべてのDatabricksワークスペースで自動的に有効化されます。ワークスペースでUnity Catalogがすでに有効になっている場合は、セットアップチュートリアルを参照してください。ワークスペースが Unity Catalog の導入前に作成された場合、または作成時に有効になっていなかった場合は、アップグレードガイドに従ってください。
-
- Unity Catalog の設定ガイド
- Unity Catalog が既に有効になっているワークスペースの場合。管理者ロール、ユーザー、コンピュート、権限、カタログを構成します。
-
- Unity Catalogにアップグレード
- まだUnity Catalogを導入していない既存のワークスペース向けです。Unity Catalog を有効にし、データを移行してください。
Unity Catalog のセットアップを拡張する
ワークスペースのセットアップ後、データとAIワークフローにさらに高度なガバナンス機能を適用できるようになります。
属性ベースのアクセス制御
属性ベースのアクセス制御 (ABAC)は、データおよびそれにアクセスするユーザーの属性に基づいて、動的できめ細かいアクセスポリシーを定義できます。テーブルごとにアクセス許可を管理する代わりに、行レベルのフィルタリングと列レベルのマスクを自動的に適用するポリシーを作成します。例えば、特定の地域外のユーザーから機密性の高い列を非表示にしたり、非特権ロールに対して PII をマスクすることができます。

データの分類
データ分類はAIエージェントを利用して、カタログを自動的にスキャンし、PII、財務情報、資格情報などの機密データにタグを付けます。分類後、タグはABACポリシーと直接統合でき、オブジェクトごとにアクセスを管理するのではなく、データが実際に含まれている内容に基づいてガバナンス制御を適用することができます。

データ品質モニタリング
データ品質モニタリングは、スキーマ内のすべてのテーブルにわたる異常検出とテーブルレベルでのデータプロファイリングを提供します。異常検出は、ヒストリカルデータパターンに基づいて鮮度と完全性を自動的に監視し、手動での設定なしに問題を検出します。データプロファイリングは、時間の経過とともに統計分布を把握してデータ完全性を追跡し、予期しない変更に対するアラートを設定できます。

データリネージ
データリネージは、データがテーブル、ノートブック、ジョブ、およびパイプライン全体でどのように流れるかを、列レベルまで自動的にキャプチャします。任意の列の発生元をたどり、それに依存するダウンストリームアセットを確認し、スキーマ変更を行う前にその変更による影響全体を把握できます。

Unity AI Gateway による AI ガバナンス
Unity AIゲートウェイは、Unity Catalog のガバナンスを AI にまで広げます。LLMエンドポイント、エージェント、およびMCPサーバーにエンタープライズガバナンスを提供します。これにより、統合されたUIですべてのAIインタラクションにわたるアクセス制御、監査ロギング、および可観測性を実装できます。
Unity Catalog の機能の全体像については、「Unity Catalog とは」を参照してください。ガバナンスのベストプラクティスについては、Unity Catalogのベストプラクティスを参照してください。