AI ゲートウェイエンドポイントの使用状況を監視する
ベータ版
この機能はベータ版です。アカウント管理者は、アカウント コンソールの [プレビュー] ページからこの機能へのアクセスを制御できます。 「Databricks プレビューの管理」を参照してください。
このページでは、使用状況追跡システム テーブルを使用してAI Gateway (ベータ)エンドポイントの使用状況を監視する方法について説明します。
使用状況追跡テーブルは、エンドポイントのリクエストと応答の詳細を自動的にキャプチャし、使用状況や遅延などの重要なメトリクスを記録します。 この表のデータを使用して、使用状況を監視し、コストを追跡し、エンドポイントのパフォーマンスと消費量を把握することができます。
要件
- お使いのアカウントで AI ゲートウェイ (ベータ版) プレビューが有効になっています。「Databricks プレビューの管理」を参照してください。
- AI Gateway (ベータ) がサポートされているリージョン内の Databricks ワークスペース。
- ワークスペースで Unity Catalog が有効になりました。「Unity Catalog のワークスペースを有効にする」を参照してください。
使用状況テーブルを照会する
AI Gateway は、使用状況データをsystem.ai_gateway.usageシステムテーブルに記録します。 UI でテーブルを表示したり、Databricks SQL またはノートブックからテーブルをクエリしたりできます。
system.ai_gateway.usageテーブルを表示またはクエリする権限を持つのはアカウント管理者のみです。
UI でテーブルを表示するには、エンドポイント ページの使用状況追跡テーブル リンクをクリックして、カタログ エクスプローラーでテーブルを開きます。
Databricks SQL またはノートブックからテーブルをクエリするには:
SELECT * FROM system.ai_gateway.usage;
組み込みの使用状況ダッシュボード
組み込みの使用状況ダッシュボードをインポートする
アカウント管理者は、 AI Gateway ページの [ダッシュボード の作成] をクリックして、組み込み AI Gateway の使用状況ダッシュボード AIインポートし、使用状況を監視し、コストを追跡し、エンドポイントのパフォーマンスと使用量についての知識を得ることができます。 ダッシュボードはアカウント管理者の権限で公開されるため、閲覧者は公開者の権限を使用してクエリを実行できます。詳細については、 「ダッシュボードの公開」を参照してください。アカウント管理者は、ダッシュボード クエリの実行に使用されるウェアハウスを更新することもできます。これは、後続のすべてのクエリに適用されます。

ダッシュボードのインポートは、 system.ai_gateway.usageテーブルに対するSELECT権限が必要なため、アカウント管理者に制限されています。ダッシュボードのデータは、 usageテーブルの保持ポリシーの対象となります。「どのシステムテーブルが利用可能ですか?」を参照してください。 。
最新のテンプレートからダッシュボードを再ロードするには、アカウント管理者は AI ゲートウェイ ページで [ダッシュボードの再インポート] をクリックします。これにより、ウェアハウスの構成を維持しながら、テンプレートからの新しい視覚化や改善でダッシュボードが更新されます。
使用状況ダッシュボードを表示
ダッシュボードを表示するには、AI ゲートウェイ ページから [ダッシュボードの表示] をクリックします。組み込みダッシュボードでは、AI ゲートウェイ エンドポイントの使用状況とパフォーマンスを包括的に把握できます。これには、複数のページの追跡リクエスト、社内消費、レイテンシ メトリクス、エラー率、およびコーディング エージェント アクティビティが含まれます。


ダッシュボードは、ワークスペース間のアナリティクスを実現します。 すべてのダッシュボード ページは、日付範囲とワークスペース ID でフィルターできます。
- [概要] タブ : 毎日のリクエスト量、長期にわたる 長期間の使用傾向、使用量別の上位ユーザー、合計ユニーク ユーザー数など、高レベルの使用状況メトリクスが表示されます。 このタブを使用して、AI ゲートウェイの全体的なアクティビティのスナップショットを簡単に取得し、最もアクティブなユーザーとモデルを特定します。
- 「パフォーマンス」タブ : レイテンシのパーセンタイル (P50、P90、P95、P99)、最初のバイトまでの時間、エラー率、HTTP ステータス コードの分布などの主要なパフォーマンス メトリクスを追跡します。 このタブを使用してエンドポイントの健全性を監視し、パフォーマンスのボトルネックや信頼性の問題を特定します。
- 使用状況タブ : エンドポイント、ワークスペース、リクエスター別の詳細な消費量の内訳を表示します。このタブには、トークンの使用パターン、リクエストの分布、キャッシュヒット率が表示され、コストの分析と最適化に役立ちます。
- コーディング エージェント タブ : Cursor、Claude Code、Gemini CLI、Codex CLI などの統合コーディング エージェントからのアクティビティを追跡します。このタブには、アクティブな日、コーディング セッション、コミット、開発者ツールの使用状況を監視するために追加または削除されたコード行などのメトリクスが表示されます。 詳細については、コーディング エージェント ダッシュボードを参照してください。
使用状況テーブルスキーマ
system.ai_gateway.usageテーブルのスキーマは次のとおりです:
列名 | Type | 説明 | 例 |
|---|---|---|---|
| STRING | アカウントID。 |
|
| STRING | ワークスペース ID。 |
|
| STRING | リクエストの一意の識別子。 |
|
| Integer | 使用状況レコードのスキーマ バージョン。 |
|
| STRING | AI ゲートウェイ エンドポイントの一意の ID。 |
|
| STRING | AI ゲートウェイ エンドポイントの名前。 |
|
| マップ | エンドポイントに関連付けられたタグ。 |
|
| 構造体 | エンドポイント メタデータには、 |
|
| TIMESTAMP | リクエストを受信した時のタイムスタンプ。 |
|
| LONG | 合計遅延時間(ミリ秒)。 |
|
| LONG | 最初のバイトまでの時間(ミリ秒)。 |
|
| STRING | 宛先のタイプ (外部モデルや基盤モデルなど)。 |
|
| STRING | 宛先モデルまたはプロバイダーの名前。 |
|
| STRING | 宛先の一意の ID。 |
|
| STRING | リクエストに使用される特定のモデル。 |
|
| STRING | リクエストを行ったユーザーまたはサービスプリンシパルのID。 |
|
| STRING | リクエスタのタイプ (ユーザー、サービスプリンシパル、またはユーザー グループ)。 |
|
| STRING | 要求者の IP アドレス。 |
|
| STRING | リクエストの URL。 |
|
| STRING | 要求者のユーザー エージェント。 |
|
| STRING | API 呼び出しのタイプ (例: チャット、補完、埋め込み)。 |
|
| マップ | リクエストに関連付けられたタグ。 |
|
| LONG | 入力トークンの数。 |
|
| LONG | 出力トークンの数。 |
|
| LONG | トークンの合計数(入力 + 出力)。 |
|
| 構造体 |
|
|
| STRING | 応答のコンテンツ タイプ。 |
|
| INT | 応答の HTTP ステータス コード。 |
|
| 構造体 | フォールバック試行のルーティングの詳細。リクエスト中に試行された各モデルの |
|