メインコンテンツまでスキップ

Unity AI Gateway for LLMエンドポイント

備考

ベータ版

このページでは、現在ベータ版である新しいAIゲートウェイ(UIの左側のナビゲーションに表示されます)について説明します。アカウント管理者は、アカウント コンソールの [プレビュー] ページでこの機能へのアクセスを有効にすることができます。 Databricksのプレビューを管理するを参照してください。

Unity AI Gateway の以前のバージョンに関する詳細は、 「エンドポイントを提供する Unity AI Gateway」を参照してください。

Unity AI Gatewayとは何ですか?

Unity AI Gatewayは、LLMエンドポイントとコーディングエージェントを管理するためのエンタープライズ制御プレーンです。これを使用して、使用状況の分析、権限の設定、およびプロバイダー間の容量管理を行うことができます。

Unity AI Gateway を使用すると、次のことが可能になります。

  • 組織内でLLMとコーディングエージェントがどのように使用されているか を分析する
  • Databricks でホストされているモデルと外部モデルへのアクセスを 管理する
  • すべてのエンドポイントの LLM トラフィックを Unity Catalog に 記録します
  • エンドポイントの健全性とプロバイダーの可用性 を監視する
  • 料金制限と安全対策 を徹底する
  • コストを特定のエンドポイント、ユーザー、チームに 割り当てる
  • 信頼性と負荷分散のために、プロバイダー間でトラフィックをインテリジェントに ルーティングします
  • 拡張性を高めるために、トラフィックを複数のモデルバックエンドに 分散させる
  • コードを変更せずにプロバイダーとモデル を切り替える

AIゲートウェイの概要

サポートされている機能

以下の表は、利用可能なUnity AI Gatewayの機能を示しています。

機能

説明

権限

エンドポイントにアクセスできるユーザーを制御します。

使用状況の追跡

システムテーブルを使用して使用状況とコストを監視します。

推論テーブル

Unity Catalog Delta テーブル内の要求と応答を監視および監査します。

運用メトリクス

使用状況をリアルタイムで監視します。

レート制限

エンドポイント、ユーザー、またはグループ レベルで消費制限を適用します。

ガードレール

コンテンツフィルタリング、機密データ保護、およびカスタムポリシーを適用します。

コスト帰属

エンドポイントタグとリクエストタグを使用して、エンドポイント、ユーザー、チームごとに詳細なレベルでコストを追跡します。

フォールバック

障害が発生した場合に複数のプロバイダーにルーティングすることで信頼性を高めます。

交通分離

スケーラビリティと負荷分散を向上させるため、トラフィックを複数のモデルバックエンドに分散させる。

カスタムAPIs

カスタムAPIおよび外部APIs 、 LLMエンドポイントと同じアクセス制御、レート制限、およびログ記録で管理します。

注記

Unity AI Gatewayの機能は、ベータ版期間中は料金が発生しません。

Unity AI Gatewayを使用する

Databricksは、人気のあるLLM(論理言語管理)向けにUnity AI Gatewayのエンドポイントを提供しています。コーディングエージェントやその他のアプリケーションを管理するための新しいエンドポイントを作成できます。

まずは、 「Unity AI Gatewayエンドポイントの設定」を参照してください。エンドポイントを照会するには、 「Unity AI Gateway エンドポイントの照会」を参照してください。Cursor、Gemini CLI、Codex CLI、Claude Codeなどのコーディングエージェントを統合するには、 「コーディングエージェントとの統合」を参照してください。

クエリのクイックスタート

以下の例は、PythonとOpenAIクライアントを使用してUnity AI Gatewayエンドポイントにクエリを実行する方法を示しています。

Python
from openai import OpenAI
import os

# To get a Databricks token, see https://docs.databricks.com/dev-tools/auth/pat
DATABRICKS_TOKEN = os.environ.get('DATABRICKS_TOKEN')

client = OpenAI(
api_key=DATABRICKS_TOKEN,
base_url="https://<ai-gateway-url>/mlflow/v1"
)

chat_completion = client.chat.completions.create(
messages=[
{"role": "user", "content": "Hello!"},
{"role": "assistant", "content": "Hello! How can I assist you today?"},
{"role": "user", "content": "What is Databricks?"},
],
model="databricks-gpt-5-2",
max_tokens=256
)

print(chat_completion.choices[0].message.content)

<ai-gateway-url> Unity AI Gateway のエンドポイント URL に置き換えてください。

次のステップ