Unity AI Gatewayエンドポイントの使用状況を監視します。

備考

ベータ版

この機能はベータ版です。アカウント管理者は、アカウントコンソールの [プレビュー] ページからこの機能へのアクセスを制御できます。「Databricks プレビューの管理」を参照してください。

このページでは、使用状況追跡システムテーブルを使用してUnity AI Gatewayエンドポイントの使用状況を監視する方法について説明します。

使用状況追跡テーブルは、エンドポイントのリクエストと応答の詳細を自動的にキャプチャし、使用状況や遅延などの重要なメトリクスを記録します。この表のデータを使用して、使用状況を監視し、コストを追跡し、エンドポイントのパフォーマンスと消費量を把握することができます。

使用状況の追跡では、Databricksが提供するエンドポイントへのai_queryリクエストも捕捉されます。

要件

お客様のアカウントでUnity AI Gatewayのプレビュー版が有効になりました。Databricksのプレビューを管理するを参照してください。
Unity AI Gateway がサポートされるリージョン内のDatabricksワークスペース。
ワークスペースで Unity Catalog が有効になりました。「Unity Catalog のワークスペースを有効にする」を参照してください。

使用状況テーブルを照会する

Unity AI Gateway は、使用状況データをsystem.ai_gateway.usageシステムテーブルに記録します。テーブルはUI上で表示することも、Databricks SQLまたはノートブックからクエリを実行することもできます。

注記

system.ai_gateway.usageテーブルを表示またはクエリする権限を持つのはアカウント管理者のみです。

UI でテーブルを表示するには、エンドポイントページの使用状況追跡テーブルリンクをクリックして、カタログエクスプローラーでテーブルを開きます。

Databricks SQL またはノートブックからテーブルをクエリするには:

SQL
SELECT * FROM system.ai_gateway.usage;

プロンプト

Genie Code（エージェントモード）が、この処理を実行できます。このプロンプトの例を試してください。

Query the system.ai_gateway.usage table to analyze AI Gateway usage showing request count and total tokens, grouped by endpoint name for the last 7 days.

使用状況ダッシュボードの組み込み

組み込みの使用状況ダッシュボードを作成する

アカウント管理者は、 AI Gateway ページで [ダッシュボードの作成] を クリックして組み込み Unity AI Gateway 使用状況ダッシュボードを作成し、使用状況を監視し、コストを追跡し、エンドポイントのパフォーマンスと使用量についての知識を得ることができます。アカウント管理者は、ダッシュボードクエリの実行に使用されるデータウェアハウスを更新することもできます。この更新は、以降のすべてのクエリに適用されます。

ダッシュボードボタンを作成

注記

ダッシュボードの作成は、 system.ai_gateway.usageテーブルに対するSELECT権限が必要なため、アカウント管理者のみに制限されています。ダッシュボードのデータは、 usageテーブルの保持ポリシーの対象となります。利用可能なシステムテーブルについては、「どのシステムテーブルが利用できますか？」を参照してください。

組み込みの使用状況ダッシュボードの新しいバージョンが利用可能になった場合、アカウント管理者はAI Gatewayページのダッシュボードアクションメニューから 「更新」 をクリックできます。

AIゲートウェイ更新ダッシュボードダイアログ

ダッシュボードを管理するには、以下のダッシュボード設定オプションを使用できます。

範囲：ダッシュボードをアカウントまたはワークスペースのどちらに表示するかを選択します。
権限：クエリをダッシュボード所有者の権限で実行するか、各閲覧者の権限で実行するかを選択します。「共有データ権限とは何か？」を参照してください。
自動更新 ：このオプションを有効にすると、新しいバージョンが利用可能になり、アカウント管理者がAI Gatewayページにアクセスするたびに、ダッシュボードが自動的に更新されます。

AIゲートウェイ更新ダッシュボードオプション

ダッシュボードがバージョン0.3以降に更新されると、6時間ごとにダッシュボードを更新するスケジュールが自動的に作成されます。必要に応じて、このスケジュールはLakeviewダッシュボードで無効にすることができます。「スケジュールの作成」を参照してください。

使用状況ダッシュボードを表示

ダッシュボードを表示するには、AIゲートウェイページから 「ダッシュボードを表示」 をクリックしてください。ダッシュボードでは、Unity AI Gatewayエンドポイントの使用状況、パフォーマンス、コストを包括的に把握できます。これには、リクエスト、社内消費、レイテンシメトリクス、エラー率、コスト内訳、外部 MCP サーバートラフィック、コーディングエージェントアクティビティを追跡する複数のページが含まれます。

ダッシュボードを表示ボタン

AIゲートウェイ利用状況ダッシュボード

ダッシュボードは、ワークスペース間のアナリティクスを実現します。すべてのダッシュボードページは、日付範囲とワークスペース ID でフィルターできます。

[概要] タブ : 毎日のリクエスト量、長期にわたる長期間の使用傾向、使用量別の上位ユーザー、合計ユニークユーザー数などの高レベルの使用状況メトリクスが表示されます。このタブを使用して、Unity AI Gateway アクティビティ全体の簡単なスナップショットを取得し、最もアクティブなユーザーとモデルを特定します。
「パフォーマンス」タブ : レイテンシのパーセンタイル (P50、P90、P95、P99)、最初のバイトまでの時間、エラー率、HTTP ステータスコードの分布などの主要なパフォーマンスメトリクスを追跡します。このタブを使用してエンドポイントの健全性を監視し、パフォーマンスのボトルネックや信頼性の問題を特定します。
使用状況タブ ：エンドポイント、ワークスペース、リクエスター別の詳細な使用状況の内訳を表示します。このタブには、トークンの使用パターン、リクエストの分布、キャッシュヒット率が表示されます。
コスト可視性タブ ：エンドポイント、ターゲットモデル、ユーザー、エンドポイントタグ、リクエストタグ別にコストの内訳を表示します。このタブには、外部モデルの概算費用も含まれています。Unity AI Gatewayのコスト監視を参照してください。
外部MCPサーバータブ ：外部MCPサーバーのトラフィックに関するリクエスト量、エラー率、ユーザー数と接続数、および日々の使用傾向を表示します。
コーディングエージェントタブ : Cursor、Claude Code、Gemini CLI、Codex CLI などの統合コーディングエージェントからのアクティビティを追跡します。このタブには、アクティブな日、コーディングセッション、コミット、開発者ツールの使用状況を監視するために追加または削除されたコード行などのメトリクスが表示されます。詳細については、コーディングエージェントダッシュボードを参照してください。

使用状況テーブルスキーマ

system.ai_gateway.usageテーブルのスキーマは次のとおりです:

列名	Type	説明	例
`account_id`	STRING	アカウントID。	`11d77e21-5e05-4196-af72-423257f74974`
`workspace_id`	STRING	ワークスペース ID。	`1653573648247579`
`request_id`	STRING	リクエストの一意の識別子。	`b4a47a30-0e18-4ae3-9a7f-29bcb07e0f00`
`schema_version`	Integer	使用状況レコードのスキーマバージョン。	`1`
`endpoint_id`	STRING	Unity AI Gatewayエンドポイントの一意のID。	`43addf89-d802-3ca2-bd54-fe4d2a60d58a`
`endpoint_name`	STRING	Unity AI Gatewayエンドポイントの名前。	`databricks-gpt-5-2`
`endpoint_tags`	マップ	タグは、作成時または更新時にエンドポイント上で設定されます。エンドポイントタグは、エンドポイントへのすべてのリクエストに適用され、チーム、コストセンター、またはプロジェクトごとにエンドポイントを分類するのに役立ちます。使用状況の追跡については、タグのリクエストとエンドポイントを参照してください。	`{"team": "engineering"}`
`endpoint_metadata`	構造体	エンドポイントメタデータには、 `creator` 、 `creation_time` 、 `last_updated_time` 、 `destinations` 、 `inference_table` 、 `fallbacks`が含まれます。	`{"creator": "user.name@email.com", "creation_time": "2026-01-06T12:00:00.000Z", ...}`
`event_time`	TIMESTAMP	リクエストを受信した時のタイムスタンプ。	`2026-01-20T19:48:08.000+00:00`
`latency_ms`	LONG	合計遅延時間（ミリ秒）。	`300`
`time_to_first_byte_ms`	LONG	最初のバイトまでの時間（ミリ秒）。	`300`
`destination_type`	STRING	宛先のタイプ (外部モデルや基盤モデルなど)。	`PAY_PER_TOKEN_FOUNDATION_MODEL`
`destination_name`	STRING	宛先モデルまたはプロバイダーの名前。	`databricks-gpt-5-2`
`destination_id`	STRING	宛先の一意の ID。	`507e7456151b3cc89e05ff48161efb87`
`destination_model`	STRING	リクエストに使用される特定のモデル。	`GPT-5.2`
`requester`	STRING	リクエストを行ったユーザーまたはサービスプリンシパルのID。	`user.name@email.com`
`requester_type`	STRING	リクエスタのタイプ (ユーザー、サービスプリンシパル、またはユーザーグループ)。	`USER`
`ip_address`	STRING	要求者の IP アドレス。	`1.2.3.4`
`url`	STRING	リクエストの URL。	`https://<workspace-url>/ai-gateway/mlflow/v1/chat/completions`
`user_agent`	STRING	要求者のユーザーエージェント。	`OpenAI/Python 2.13.0`
`api_type`	STRING	API 呼び出しのタイプ (例: チャット、補完、埋め込み)。	`mlflow/v1/chat/completions`
`request_tags`	マップ	ユーザーが指定したタグは、 `Databricks-Ai-Gateway-Request-Tags` HTTPヘッダーを使用して個々のリクエストとともに送信されます。リクエストタグを使用して、使用状況を特定のプロジェクト、チーム、環境、またはエンドユーザーに紐付けます。使用状況追跡のためのタグリクエストとエンドポイント、および使用状況追跡のためのタグリクエストを参照してください。	`{"project": "chatbot", "team": "ml-platform"}`
`input_tokens`	LONG	入力トークンの数。	`100`
`output_tokens`	LONG	出力トークンの数。	`100`
`total_tokens`	LONG	トークンの合計数（入力 + 出力）。	`200`
`token_details`	構造体	`cache_read_input_tokens` 、 `cache_creation_input_tokens` 、 `output_reasoning_tokens`を含む詳細なトークンの内訳。	`{"cache_read_input_tokens": 100, ...}`
`response_content_type`	STRING	応答のコンテンツタイプ。	`application/json`
`status_code`	INT	応答の HTTP ステータスコード。	`200`
`routing_information`	構造体	フォールバック試行のルーティングの詳細。リクエスト中に試行された各モデルの`priority` 、 `action` 、 `destination` 、 `destination_id` 、`status_code`、、 `error_code` 、 `latency_ms` `start_time`および`end_time`を含む`attempts`配列が含まれます。	`{"attempts": [{"priority": "1", ...}]}`

使用状況追跡のためのタグリクエストとエンドポイント

AI Gatewayは、使用状況の追跡と属性付けのために2種類のタグをサポートしています。

リクエストタグ ：呼び出し元が個々のリクエストに付加するカスタムのキーと値のペア。リクエストタグを使用して、プロジェクト、チーム、環境、エンドユーザー、または組織に関連するその他のあらゆる側面に基づいて使用状況を分類します。
エンドポイントタグ ：エンドポイント自体に設定されるキーと値のペア。エンドポイントタグは、そのエンドポイントを経由してルーティングされるすべてのリクエストに適用され、チーム、コストセンター、またはアプリケーションごとにエンドポイントを分類するのに役立ちます。

どちらのタグタイプもsystem.ai_gateway.usageテーブルに記録され、使用状況データのフィルタリング、集計、分析に使用できます。

リクエストタグ

個々のリクエストにタグを付けるには、文字列キーを文字列値にマッピングするJSONオブジェクトを含むDatabricks-Ai-Gateway-Request-Tags HTTPヘッダーを含めます。リクエストタグは、使用状況テーブルと推論テーブルのrequest_tags列に記録されます。

REST API 、 OpenAI SDK 、およびAnthropic SDKを使用してリクエストタグを設定する方法の例については、「使用状況追跡のためのタグリクエスト」を参照してください。

例えば、リクエストタグを使用してプロジェクトごとの使用状況を集計できます。

SQL
SELECT
  request_tags['project'] AS project,
  COUNT(*) AS request_count,
  SUM(total_tokens) AS total_tokens
FROM system.ai_gateway.usage
WHERE request_tags['project'] IS NOT NULL
GROUP BY request_tags['project']
ORDER BY total_tokens DESC;

エンドポイントタグ

エンドポイントタグは、AI Gatewayエンドポイントを作成または更新する際に設定されます。それらは、そのエンドポイントへのすべてのリクエストについて、使用状況テーブルのendpoint_tags列に表示されます。

例えば、エンドポイントタグを使用してチームごとの利用状況を集計できます。

SQL
SELECT
  endpoint_tags['team'] AS team,
  endpoint_name,
  COUNT(*) AS request_count,
  SUM(total_tokens) AS total_tokens
FROM system.ai_gateway.usage
WHERE endpoint_tags['team'] IS NOT NULL
GROUP BY endpoint_tags['team'], endpoint_name
ORDER BY total_tokens DESC;

要件​

使用状況テーブルを照会する​

使用状況ダッシュボードの組み込み​

組み込みの使用状況ダッシュボードを作成する​

使用状況ダッシュボードを表示​

使用状況テーブルスキーマ​

使用状況追跡のためのタグリクエストとエンドポイント​

リクエストタグ​

エンドポイントタグ​

その他のリソース​

要件