Unity Catalogのモデルサービス
ベータ版
この機能はベータ版です。アカウント管理者は、アカウント コンソールの [プレビュー] ページからこの機能へのアクセスを制御できます。 Databricksのプレビューを管理するを参照してください。
モデルサービスは、管理された LLM エンドポイントを表す Unity Catalog のセキュリティ保護可能なオブジェクトです。モデルサービスを使用すると、データと共にワークスペースの境界を越えて、Unity Catalog で LLM へのアクセスを一元的に定義、共有、管理できます。
ベータ期間中、モデルサービスは以下をサポートしています。
- Databricks でホストされているトークン単位の従量課金 基盤モデルは、
system.aiでシステム提供サービスとして、および作成するサービスとして提供されます。 - Unity AI Gateway UI、Catalog Explorer、および Unity Catalog REST API を使用したモデルサービスの**作成と管理**。
- Databricksの内外から、ワークスペース全体でモデルサービスを**クエリする**。
モデルサービスとは何ですか?
モデルサービスはUnity Catalogのスキーマに存在し、1つまたは複数のサーブモデルを宛先として参照し、それらの間でルーティングとフォールバックを行います。呼び出し元は、モデルサービスを完全修飾名で呼び出し、Unity AI Gatewayは各リクエストを宛先モデルにルーティングします。
モデルサービスは Unity Catalog のセキュリティ保護可能なオブジェクトであるため、以下が可能です:
- **カタログとスキーマに存在し**、ワークスペースのバインディングなどのスキーマ設定が継承されます。
- 名前、所有者、コメント、タグなど、標準的な Unity Catalog メタデータ を保持しています。
- Unity Catalogの権限によって管理される ため、テーブル、関数、およびモデルに使用するのと同じ
GRANTとREVOKEステートメントを使用してアクセスを付与します。 - Unity Catalog の他のアセットと同様に、Catalog Explorer で検出可能です。
同じモデルサービスは、Unity AI Gateway UI にエンドポイントとしても表示され、AI チームはレート制限、推論テーブル、ガードレールなどの機能を設定できます。これらの機能の詳細については、エージェントとモデルサービス向けの Unity AI Gateway(レガシー)を参照してください。
Unity Catalog で LLM を管理する理由
ワークスペースで作成された Unity AI Gateway エンドポイントは、そのワークスペースにスコープされます。ワークスペース間でエンドポイントを共有するには、各ワークスペースでエンドポイントを複製し、各コピーを個別に管理する必要があります。
モデルサービスはガバナンスをUnity Catalogに移行し、これにより、以下が可能になります。
- LLMエンドポイントを一度定義し 、同じメタストアにアタッチされている任意のワークスペースから使用できます。
- Unity Catalog の権限を使用してアクセスを一元的に管理します 。ワークスペースごとの権限は使用しません。
- 一箇所から、複数のワークスペース全体で利用できる モデルを検出 します。
- Unity Catalogシステムテーブルでモデルサービスの 利用状況とコストを追跡 します。
システム提供のモデルサービス
Databricksは、system.ai.databricks-claude-opus-4-6などのDatabricksでホストされている各基盤モデルに対して、system.aiスキーマですぐに使えるモデルサービスを提供しています。Databricksは、新しい基盤モデルが利用可能になるにつれて、新しいシステムモデルサービスを追加します。
システム提供モデルサービスには、次の特性があります。
- デフォルトでは、すべてのアカウントユーザーに
EXECUTE権限が付与されているため、追加の設定なしでクエリを実行できます。 - システムユーザーが所有しており、削除することはできません。
- デフォルトでは、メタストア管理者のみがそれらを変更できます。メタストア管理者は、
MANAGE権限を付与することで管理を委任できます。
システム提供のモデルサービスへのアクセスを制限するには、「モデルサービスを統制する」を参照してください。
権限
モデルサービスは、標準のUnity Catalog特権モデルを使用します。以下の特権が適用されます:
権限 | 説明 |
|---|---|
| モデルサービスを含むカタログとスキーマにアクセスします。すべてのオペレーションに必要です。 |
| スキーマでモデルサービスを作成します。カタログまたはスキーマに付与されます。 |
| モデルサービスにクエリを実行します。 |
| モデルサービスを変更または削除し、その権限を管理します。所有者は |
ユーザーがモデルサービスをクエリすると、Databricksは、参照されるモデルに対して*所有者*がEXECUTEを持っていることを確認します(定義者の権限)。呼び出し元は、基盤となるモデルに直接アクセスする必要はありません。
制限事項
次の機能は、ベータ期間中は利用できません:
- プロビジョニングされたスループットモデルと外部モデルプロバイダー。
- TerraformまたはSQLを使用したモデルサービスの作成と管理。
BROWSE権限のみでのモデルサービスの検出。- モデルサービスのリネージとグローバル検索。