Unity AI Gateway
ベータ版
このページでは、現在ベータ版である新しいAIゲートウェイ(UIの左側のナビゲーションに表示されます)について説明します。アカウント管理者は、アカウント コンソールの [プレビュー] ページでこの機能へのアクセスを有効にすることができます。 Databricksのプレビューを管理するを参照してください。
AIゲートウェイの以前のバージョン(Unity AIゲートウェイではない)の詳細については、「サービングエンドポイント用AIゲートウェイ(レガシー)」を参照してください。
Unity AI Gatewayは、エンタープライズAI向けのDatabricksガバナンスソリューションです。Unity Catalogを基盤として、データおよびAI資産を超えてガバナンスを拡張し、モデル、エージェント、MCPサーバー、およびツールの間のランタイムのインタラクションにまで及びます。用途:
- チームが使用できる AI サービスを制御する : Databricksがホストするモデルおよび外部モデル、MCPサービス、エージェントをUnity Catalogに登録し、標準のUnity Catalog権限でアクセスを付与します。Databricksは、基盤モデルサービスをすぐに利用できる形で提供し、さらにGoogle Drive、Jira、Slack、GitHubなどのアプリ向けにマネージドMCPサービスを提供しています。
- AI トラフィックを一元的にルーティングおよび管理 :リクエストをルーティングし、レート制限を設定し、フォールバックを構成し、モデルと MCP サービス全体で予算を管理します。厳格な支出上限は、予算に達した後にアラートを発するのではなく、予算到達時にリクエストを停止します。
- **ガードレールとアクセス ポリシーを設定する**:個々のリクエストとレスポンスを許可、拒否、承認要求、または変換するために、サービスポリシーをアタッチします。組み込みポリシーは、PII漏洩、プロンプトインジェクション、および安全でないコンテンツから保護します。
- 使用量、コスト、リスクを監視する :誰がどのサービスを使用しているか、どれくらいの費用がかかるか、および各リクエスト中に何が起こったかを、モデルとMCPアクティビティ全体での統合エージェントトレースにより追跡します。
Databricks での AI ガバナンスは初めてですか?エンドツーエンドのセットアップパスについては、AI ガバナンスの概要を参照してください。
チームが利用できる AI サービスを制御します
Unity Catalogは、AIアセットをセキュリティ保護可能なオブジェクトとして管理します。それらを一度登録するだけで、テーブルやボリュームに使用するのと同じ権限を使用してアクセスを付与および取り消すことができます。
- **モデル**:Foundation Model APIsを通じて利用可能なDatabricksホスト型基盤モデルであるホスト型基盤モデルを含む、Unity Catalogに登録されている機械学習モデル。モデルのライフサイクルを管理しますおよび基盤モデルのUnity Catalog権限をご覧ください。
- **MCPツール**: Unity Catalogのセキュリティ保護可能なオブジェクトとして登録されたMCPサーバーで、ツールフィルタリングとサービスポリシーを備えています。「MCPサービスでエージェントをサードパーティツールに接続する」を参照してください。
- エージェント : Unity Catalogセキュアブルオブジェクトとして登録され、テーブル、モデル、関数と共に管理されるAIエージェント。
- 接続 :外部 APIs と MCP サーバーにアクセスするために使用される Unity Catalog HTTP 接続。HTTP 接続を参照してください。
- 関数 :エージェントツールとして使用される、またはデータ変換に使用されるUnity Catalog 関数です。Unity Catalog 関数を使用したAIエージェントツールの作成を参照してください。
ワークスペース間で Unity Catalog の保護可能オブジェクトとしてモデル サービスを定義して共有するには、カスタム モデル サービスを作成するを参照してください。
AIトラフィックをルーティングして管理する
Unity AI Gatewayは、中央のコントロールプレーンからモデルサービスおよびMCPサービスへのリクエストをルーティングします。Databricksホスト型プロバイダーおよび外部プロバイダー全体で、キャパシティ、可用性、使用量を管理します。
機能 | 説明 |
|---|---|
容量とコストを管理するために、モデルサービスおよびMCPサービスに消費制限を適用します。 | |
複数のモデルバックエンドにリクエストを分散し、フェイルオーバーを追加して可用性を高めます。 | |
Databricks ホスト型プロバイダーおよび外部プロバイダー全体で、利用額を監視し、ユーザーごとのしきい値と上限を設定してください。 |
Unity AI Gatewayの機能は、ベータ版期間中は料金が発生しません。
ガードレールとアクセスポリシーを設定する
Unity Catalogの権限付与により、プリンシパルがAIサービスを呼び出せるかどうかが決定されます。サービスポリシーは、リクエストとレスポンスのコンテンツ、および誰が呼び出しを行っているかに基づいて、そのインタラクションがどのように進行するかを管理します。これは、エージェントがユーザーに代わって行動し、外部システムにアクセスする場合に最も重要になります。
サービスポリシーは、AIサービスにスコープ設定された属性ベースのアクセス制御 (ABAC) ポリシーの一種です。相互作用に対して、人間による承認を許可、拒否、または要求したり、リクエストとレスポンスのコンテンツを変換したりできます。たとえば、system.ai.mask_piiのような組み込みポリシーを使用して、個人を特定できる情報(PII)を編集(墨消し)できます。AIセキュリティ保護可能なサービスポリシーとサービスポリシーの作成とアタッチを参照してください。
使用状況、コスト、リスクを監視する
すべてのUnity AI Gatewayサービス全体で、アクティビティ、使用量、および結果を追跡します。
機能 | 説明 |
|---|---|
システムテーブルを使用して、モデルサービスのリクエスト、トークン使用量、レイテンシーを追跡します。 | |
Databricksのコストをサービス、ターゲットモデル、プリンシパル、タグに割り当てます。 | |
モニタリングとデバッグのために、リクエストとレスポンスをUnity Catalog Deltaテーブルにログ記録します。 |
連携の仕組み
Unity AI Gatewayは、Unity Catalogガバナンスを3つの層にわたって構築しています。
- **AIアセット**: Unity Catalogは、モデル、関数、接続、およびサービスを、標準のUnity Catalog権限で管理される保護可能なオブジェクトとして管理します。サービスには、モデルサービス、エージェントサービス、およびMCPサービスが含まれます。
- AI トラフィック :Unity AI Gateway は、基盤モデル、ツール、エージェントを含むすべての AI サービスを一元的に制御するコントロールプレーンです。
- AI サービスの動作 :サービスポリシーは、呼び出し元と送信される内容に基づいて、AI サービスに対するリクエストと応答のコンテンツを管理します。
Unity CatalogにおけるAIガバナンスの概念的な概要については、Unity CatalogにおけるAIガバナンスを参照してください。
モデルサービングエンドポイント (レガシー)
AI Gatewayの以前のバージョンは、外部モデルエンドポイント、基盤モデルAPIエンドポイント、カスタムモデルエンドポイントを含む、ワークスペースレベルのモデルサービングエンドポイントにガバナンス機能を提供します。
トピック | 説明 |
|---|---|
サポートされている機能や制限事項など、エンドポイントを提供するための AI Gateway 機能について説明します。 | |
モデルビング エンドポイントで使用状況追跡、ペイロード ログ、レート制限、ガードレールなどのAIゲートウェイ機能を構成します。 | |
AI Gateway 対応の推論テーブルを使用して、提供されたモデルを監視します。 | |
LLM ベースのガードレールを適用し、リクエストとレスポンスを検査して、ポリシーに違反するコンテンツをブロックまたはサニタイズします。 |