Unity AI Gatewayのコストを監視する
ベータ版
この機能はベータ版です。
Unity AI Gatewayのすべてのトラフィックについて、エンドポイント、ターゲットモデル、リクエスト元、およびタグごとにコストを監視および分析します。
コストの可視性は、Databricksの請求記録に基づいています。オフライン数、レイテンシ、リクエスタの詳細、リクエスト タグなどのリクエスト レベルの使用状況の分析については、 「Unity AI Gateway エンドポイントの使用状況を監視する」を参照してください。
要件
- お客様のアカウントでUnity AI Gatewayが有効になりました。
- Unity AI Gateway がサポートされるリージョン内のDatabricksワークスペース。
- アカウントに対して料金利用システムテーブルが有効になります。 システムテーブルの有効化を参照してください。
帰属
Unity AI Gateway は、料金利用テーブル システム ( system.billing.usage ) を通じてコストの帰属を提供します。
Unity AI Gateway は、 system.billing.usageのMODEL_SERVING請求レコードにエンドポイント固有のメタデータを追加することで、Databricks のコストを関連するエンドポイント、ターゲットモデル、プリンシパル、エンドポイントタグに紐付けることができるようにします。スキーマとフィールド定義の完全な説明については、「課金使用システムテーブルリファレンス」を参照してください。
料金利用システム テーブルには、 Databricksでホストされるモデルのコスト帰属が含まれています。 ダッシュボードでの外部モデルコスト分析については、 「外部モデルコスト」を参照してください。
Unity AI Gatewayエンドポイント経由で処理されるリクエストの場合、Databricksはsystem.billing.usageのMODEL_SERVINGレコードに以下のフィールドを入力します。
フィールド | 説明 |
|---|---|
| リクエストを受信したUnity AI Gatewayエンドポイントの名前。 |
| Unity AI GatewayエンドポイントのID。 |
| リクエストを処理した宛先モデル、例えば |
| リクエストを処理したターゲットのID。 |
| リクエストを発行したユーザーまたはDatabricksサービスプリンシパル。 |
| Unity AI Gatewayエンドポイントで設定されたエンドポイントタグ(例: |
これらのフィールドは、Unity AI Gatewayエンドポイントを経由してルーティングされるリアルタイム推論リクエストとバッチ推論リクエストの両方に対して入力されます。
可観測性
組み込まれた使用状況ダッシュボードには、コストを監視し、長期にわたるコストの内訳を分析するための コスト分析 ページが含まれています。 コストは、以下のような複数の側面から分析できます。
- エンドポイント
- 対象モデル
- 要求元のユーザーまたはサービスプリンシパル
- エンドポイントタグ
- リクエストタグ
ダッシュボードを開くには、AIゲートウェイページから 「ダッシュボードを表示」 をクリックしてください。ダッシュボードのインポートと更新の詳細については、 「組み込みの使用状況ダッシュボード」を参照してください。


コスト可視化機能は、ダッシュボードバージョン0.4以降で利用可能です。アカウント管理者は、最新のテンプレート変更を受け取るためにダッシュボードを更新する必要があります。組み込みの使用状況ダッシュボードを参照してください。
タグベースの分析
[コスト分析] ページにはタグベースのビューとフィルターが含まれているため、エンドポイント タグ と リクエスト タグを使用してコストを分析できます。
エンドポイントタグはUnity AI Gatewayエンドポイントに設定され、そのエンドポイントに送信されるすべてのリクエストに適用されます。リクエストタグは個々のリクエストに付加され、プロジェクト、機能、環境、エンドユーザーなど、同じエンドポイント内でのより詳細な属性付けを可能にします。
タグフィルタは、セミコロンで区切られたリストを<entry1>;<entry2>;<entry3>形式で受け入れます。各エントリは、次のいずれかの形式で指定されます。
<key>タグキーのすべての値に一致させる。例えば、teamteamタグを持つすべてのリクエストに一致します。<key>=<value>特定のタグのキーと値のペアに一致させる。例えば、team=ml-platform;env=prodteam=ml-platformとenv=prodタグが付いたリクエストに一致します。
リクエスト タグの構成とクエリについては、 「使用状況追跡のためのタグ リクエストとエンドポイント」を参照してください。
外部モデルコスト
使用状況ダッシュボードには 、価格テーブルの上書き 設定でモデル価格テーブルを指定することで、外部モデル のコスト見積もりを含めるように構成できます。価格表はユーザーが管理するものであり、ダッシュボードへの入力として提供する必要があります。

価格表には以下の項目を含める必要があります。
フィールド | Type | 説明 |
|---|---|---|
| STRING | ダッシュボードにおけるコスト配分に使用されるモデル名。 |
| DOUBLE | 入力トークンの価格。 |
| DOUBLE | 出力トークンの価格。 |
| DOUBLE | キャッシュ読み取り入力トークンがサポートされている場合の価格。 |
| DOUBLE | キャッシュ書き込み入力トークンの価格(サポートされている場合)。 |
外部モデルの費用見積もりは、情報提供のみを目的としています。これらの数値は定価または特別価格に基づいて算出されており、最終的なプロバイダーの請求書の内容とは異なる場合があります。Databricksは、第三者による請求における差異について責任を負いません。
コスト分析
以下のクエリは、 system.billing.usageの Databricks でホストされているモデルのコストを分析します。コストは、エンドポイント、ターゲットモデル、プリンシパル、およびエンドポイントタグごとに分類できます。
エンドポイント別
SELECT
usage_metadata.ai_gateway_endpoint_name AS endpoint_name,
SUM(usage_quantity) AS dbus
FROM system.billing.usage
WHERE billing_origin_product = 'MODEL_SERVING'
AND usage_metadata.ai_gateway_endpoint_name IS NOT NULL
AND usage_unit = 'DBU'
AND usage_date >= current_date() - INTERVAL 30 DAYS
GROUP BY endpoint_name
ORDER BY dbus DESC;
目的地モデル別
SELECT
usage_metadata.ai_gateway_destination_model AS destination_model,
SUM(usage_quantity) AS dbus
FROM system.billing.usage
WHERE billing_origin_product = 'MODEL_SERVING'
AND usage_metadata.ai_gateway_endpoint_name IS NOT NULL
AND usage_unit = 'DBU'
AND usage_date >= current_date() - INTERVAL 30 DAYS
GROUP BY destination_model
ORDER BY dbus DESC;
ユーザーまたはDatabricksプリンシパルによる
SELECT
identity_metadata.run_by AS run_by,
SUM(usage_quantity) AS dbus
FROM system.billing.usage
WHERE billing_origin_product = 'MODEL_SERVING'
AND usage_metadata.ai_gateway_endpoint_name IS NOT NULL
AND identity_metadata.run_by IS NOT NULL
AND usage_unit = 'DBU'
AND usage_date >= current_date() - INTERVAL 30 DAYS
GROUP BY run_by
ORDER BY dbus DESC;
エンドポイントタグによる
エンドポイントタグはcustom_tagsの請求レコードに伝播されるため、チーム、環境、プロジェクト、コストセンターなどのディメンションごとにコストを割り当てることが可能になります。
SELECT
custom_tags['team'] AS team,
SUM(usage_quantity) AS dbus
FROM system.billing.usage
WHERE billing_origin_product = 'MODEL_SERVING'
AND usage_metadata.ai_gateway_endpoint_name IS NOT NULL
AND custom_tags['team'] IS NOT NULL
AND usage_unit = 'DBU'
AND usage_date >= current_date() - INTERVAL 30 DAYS
GROUP BY team
ORDER BY dbus DESC;
Unity AI Gateway エンドポイントにteam 、 project 、 cost_centerなどのタグを追加するには、 「Unity AI Gateway エンドポイントの設定」を参照してください。
制限事項
- 支出の帰属は、
system.billing.usageのMODEL_SERVINGレコードに適用されます。外部プロバイダーによって直接請求される外部モデルにルーティングされたリクエストは、system.billing.usageには表示されません。 - トラフィック分割やフォールバックなど、複数の宛先を持つ Unity AI Gateway エンドポイントの場合、
ai_gateway_destination_modelとai_gateway_destination_id最終的にリクエストを処理した宛先を識別します。