メインコンテンツまでスキップ

Unity AI Gatewayのコストを監視する

備考

ベータ版

この機能はベータ版です。

Unity AI Gatewayのすべてのトラフィックについて、エンドポイント、ターゲットモデル、リクエスト元、およびタグごとにコストを監視および分析します。

注記

コストの可視性は、Databricksの請求記録に基づいています。オフライン数、レイテンシ、リクエスタの詳細、リクエスト タグなどのリクエスト レベルの使用状況の分析については、 「Unity AI Gateway エンドポイントの使用状況を監視する」を参照してください。

要件

帰属

Unity AI Gateway は、料金利用テーブル システム ( system.billing.usage ) を通じてコストの帰属を提供します。

Unity AI Gateway は、 system.billing.usageMODEL_SERVING請求レコードにエンドポイント固有のメタデータを追加することで、Databricks のコストを関連するエンドポイント、ターゲットモデル、プリンシパル、エンドポイントタグに紐付けることができるようにします。スキーマとフィールド定義の完全な説明については、「課金使用システムテーブルリファレンス」を参照してください。

料金利用システム テーブルには、 Databricksでホストされるモデルのコスト帰属が含まれています。 ダッシュボードでの外部モデルコスト分析については、 「外部モデルコスト」を参照してください。

Unity AI Gatewayエンドポイント経由で処理されるリクエストの場合、Databricksはsystem.billing.usageMODEL_SERVINGレコードに以下のフィールドを入力します。

フィールド

説明

usage_metadata.ai_gateway_endpoint_name

リクエストを受信したUnity AI Gatewayエンドポイントの名前。

usage_metadata.ai_gateway_endpoint_id

Unity AI GatewayエンドポイントのID。

usage_metadata.ai_gateway_destination_model

リクエストを処理した宛先モデル、例えばGPT-5.2

usage_metadata.ai_gateway_destination_id

リクエストを処理したターゲットのID。

identity_metadata.run_by

リクエストを発行したユーザーまたはDatabricksサービスプリンシパル。

custom_tags

Unity AI Gatewayエンドポイントで設定されたエンドポイントタグ(例: teamまたはcost_center )。Unity AI Gatewayエンドポイントの設定を参照してください。

これらのフィールドは、Unity AI Gatewayエンドポイントを経由してルーティングされるリアルタイム推論リクエストとバッチ推論リクエストの両方に対して入力されます。

可観測性

組み込まれた使用状況ダッシュボードには、コストを監視し、長期にわたるコストの内訳を分析するための コスト分析 ページが含まれています。 コストは、以下のような複数の側面から分析できます。

  • エンドポイント
  • 対象モデル
  • 要求元のユーザーまたはサービスプリンシパル
  • エンドポイントタグ
  • リクエストタグ

ダッシュボードを開くには、AIゲートウェイページから 「ダッシュボードを表示」 をクリックしてください。ダッシュボードのインポートと更新の詳細については、 「組み込みの使用状況ダッシュボード」を参照してください。

AIゲートウェイのコスト分析ダッシュボード

AIゲートウェイのコスト分析の詳細

注記

コスト可視化機能は、ダッシュボードバージョン0.4以降で利用可能です。アカウント管理者は、最新のテンプレート変更を受け取るためにダッシュボードを更新する必要があります。組み込みの使用状況ダッシュボードを参照してください。

タグベースの分析

[コスト分析] ページにはタグベースのビューとフィルターが含まれているため、エンドポイント タグ リクエスト タグを使用してコストを分析できます。

エンドポイントタグはUnity AI Gatewayエンドポイントに設定され、そのエンドポイントに送信されるすべてのリクエストに適用されます。リクエストタグは個々のリクエストに付加され、プロジェクト、機能、環境、エンドユーザーなど、同じエンドポイント内でのより詳細な属性付けを可能にします。

タグフィルタは、セミコロンで区切られたリストを<entry1>;<entry2>;<entry3>形式で受け入れます。各エントリは、次のいずれかの形式で指定されます。

  • <key> タグキーのすべての値に一致させる。例えば、 team teamタグを持つすべてのリクエストに一致します。
  • <key>=<value> 特定のタグのキーと値のペアに一致させる。例えば、 team=ml-platform;env=prod team=ml-platformenv=prodタグが付いたリクエストに一致します。

リクエスト タグの構成とクエリについては、 「使用状況追跡のためのタグ リクエストとエンドポイント」を参照してください。

外部モデルコスト

使用状況ダッシュボードには 、価格テーブルの上書き 設定でモデル価格テーブルを指定することで、外部モデル のコスト見積もりを含めるように構成できます。価格表はユーザーが管理するものであり、ダッシュボードへの入力として提供する必要があります。

AI ゲートウェイ外部モデル 価格テーブル オーバーライド

価格表には以下の項目を含める必要があります。

フィールド

Type

説明

model

STRING

ダッシュボードにおけるコスト配分に使用されるモデル名。

input_token_price

DOUBLE

入力トークンの価格。

output_token_price

DOUBLE

出力トークンの価格。

cache_read_input_token_price

DOUBLE

キャッシュ読み取り入力トークンがサポートされている場合の価格。

cache_write_input_token_price

DOUBLE

キャッシュ書き込み入力トークンの価格(サポートされている場合)。

注記

外部モデルの費用見積もりは、情報提供のみを目的としています。これらの数値は定価または特別価格に基づいて算出されており、最終的なプロバイダーの請求書の内容とは異なる場合があります。Databricksは、第三者による請求における差異について責任を負いません。

コスト分析

以下のクエリは、 system.billing.usageの Databricks でホストされているモデルのコストを分析します。コストは、エンドポイント、ターゲットモデル、プリンシパル、およびエンドポイントタグごとに分類できます。

エンドポイント別

SQL
SELECT
usage_metadata.ai_gateway_endpoint_name AS endpoint_name,
SUM(usage_quantity) AS dbus
FROM system.billing.usage
WHERE billing_origin_product = 'MODEL_SERVING'
AND usage_metadata.ai_gateway_endpoint_name IS NOT NULL
AND usage_unit = 'DBU'
AND usage_date >= current_date() - INTERVAL 30 DAYS
GROUP BY endpoint_name
ORDER BY dbus DESC;

目的地モデル別

SQL
SELECT
usage_metadata.ai_gateway_destination_model AS destination_model,
SUM(usage_quantity) AS dbus
FROM system.billing.usage
WHERE billing_origin_product = 'MODEL_SERVING'
AND usage_metadata.ai_gateway_endpoint_name IS NOT NULL
AND usage_unit = 'DBU'
AND usage_date >= current_date() - INTERVAL 30 DAYS
GROUP BY destination_model
ORDER BY dbus DESC;

ユーザーまたはDatabricksプリンシパルによる

SQL
SELECT
identity_metadata.run_by AS run_by,
SUM(usage_quantity) AS dbus
FROM system.billing.usage
WHERE billing_origin_product = 'MODEL_SERVING'
AND usage_metadata.ai_gateway_endpoint_name IS NOT NULL
AND identity_metadata.run_by IS NOT NULL
AND usage_unit = 'DBU'
AND usage_date >= current_date() - INTERVAL 30 DAYS
GROUP BY run_by
ORDER BY dbus DESC;

エンドポイントタグによる

エンドポイントタグはcustom_tagsの請求レコードに伝播されるため、チーム、環境、プロジェクト、コストセンターなどのディメンションごとにコストを割り当てることが可能になります。

SQL
SELECT
custom_tags['team'] AS team,
SUM(usage_quantity) AS dbus
FROM system.billing.usage
WHERE billing_origin_product = 'MODEL_SERVING'
AND usage_metadata.ai_gateway_endpoint_name IS NOT NULL
AND custom_tags['team'] IS NOT NULL
AND usage_unit = 'DBU'
AND usage_date >= current_date() - INTERVAL 30 DAYS
GROUP BY team
ORDER BY dbus DESC;

Unity AI Gateway エンドポイントにteamprojectcost_centerなどのタグを追加するには、 「Unity AI Gateway エンドポイントの設定」を参照してください。

制限事項

  • 支出の帰属は、 system.billing.usageMODEL_SERVINGレコードに適用されます。外部プロバイダーによって直接請求される外部モデルにルーティングされたリクエストは、 system.billing.usageには表示されません。
  • トラフィック分割やフォールバックなど、複数の宛先を持つ Unity AI Gateway エンドポイントの場合、 ai_gateway_destination_modelai_gateway_destination_id最終的にリクエストを処理した宛先を識別します。