メインコンテンツまでスキップ

Unity AIゲートウェイ費用のモニタリング

備考

ベータ版

この機能はベータ版です。

すべてのUnity AI Gatewayトラフィックのコストを、モデルサービス、ターゲットモデル、要求プリンシパル、およびタグ別に監視および分析します。

注記

コストの可観測性は、Databricksの請求レコードに基づいています。トークン数、レイテンシー、リクエスターの詳細、リクエストタグなどのリクエストレベルの使用量アナリティクスについては、Unity AI Gatewayサービスのモデル使用量を参照してください。

要件

帰属

Unity AI Gatewayは、課金利用システムテーブル(system.billing.usage)を介してコストの割り当てを提供します。

Unity AI Gateway は、MODEL_SERVINGの課金レコードをsystem.billing.usageのサービス固有のメタデータで拡充するため、Databricks のコストを関連するサービス、ターゲットモデル、プリンシパル、サービスタグに割り当てることができます。完全なスキーマとフィールド定義については、課金利用システムテーブルリファレンスを参照してください。

課金利用システムテーブルには、Databricksでホストされているモデルのコスト配分が含まれています。ダッシュボードでの外部モデルのコスト分析については、「外部モデルのコスト」をご覧ください。

Unity AI Gateway モデルサービスを介して提供されるリクエストに対して、Databricks は system.billing.usageMODEL_SERVING レコードに以下のフィールドを設定します。

フィールド

説明

usage_metadata.ai_gateway_endpoint_name

要求を受信した Unity AI Gateway モデルサービスの名前。これは、<catalog>.<schema>.<modelservice> の形式の Unity Catalog の完全修飾名です。

usage_metadata.ai_gateway_endpoint_id

Unity AI Gateway モデルサービスのID。

usage_metadata.ai_gateway_destination_model

リクエストを処理した宛先モデルです。たとえば GPT-5.2

usage_metadata.ai_gateway_destination_id

リクエストを処理したターゲットのID。

identity_metadata.run_by

リクエストを発行したユーザーまたはDatabricksサービスプリンシパル。

custom_tags

Unity AI Gatewayモデルサービスに構成されているサービス タグ(teamcost_centerなど)。Unity AI Gatewayエンドポイントの構成を参照してください。

Unity AI Gateway を介してルーティングされるリアルタイムおよびバッチ推論リクエストのこれらのフィールドにデータが入力されます。

可観測性

組み込みの使用状況ダッシュボードには、コストのモニタリングと経時的なコストの内訳分析を行うための コスト分析 ページが含まれています。コストは、以下を含む複数のディメンションで分析できます。

  • モデルサービス
  • ターゲットモデル
  • リクエスト元のユーザーまたはDatabricksサービスプリンシパル
  • サービス タグ
  • リクエストタグ

ダッシュボードを開くには、AI Gatewayページから ダッシュボードを表示 をクリックします。ダッシュボードのインポートと更新の詳細については、組み込みの使用状況ダッシュボードを参照してください。

AIゲートウェイ コスト分析ダッシュボード

AIゲートウェイ コスト分析ドリルダウン

注記

コスト監視は、ダッシュボードバージョン0.4以降で利用可能です。アカウント管理者は、最新のテンプレート変更を受け取るためにダッシュボードを更新する必要があります。組み込み使用状況ダッシュボードを参照してください。

タグに基づく分析

「**コスト分析**」ページには、サービス**タグ**とリクエスト**タグ**を使用してコストを分析できるように、タグベースのビューとフィルターが含まれています。

サービスタグは Unity AI Gateway モデルサービスで構成され、そのモデルサービスに送信されるすべてのリクエストに適用されます。リクエストタグは個々のリクエストにアタッチされ、プロジェクト、機能、環境、またはエンドユーザーごとなど、同じモデルサービス内でよりきめ細やかなアトリビューションを可能にします。

タグフィルターは、<entry1>;<entry2>;<entry3>の形式でセミコロン区切りリストを受け入れます。各エントリは次のように指定されます。

  • <key> タグキーのすべての値に一致させるため。たとえば、teamteam タグを持つすべてのリクエストに一致します。
  • <key>=<value> 特定のタグのキーと値のペアと一致させるため。たとえば、team=ml-platform;env=prodteam=ml-platformenv=prodでタグ付けされたリクエストに一致します。

リクエストタグの構成とクエリに関する情報については、「利用状況追跡のためのリクエストとモデルサービスのタグ付け」を参照してください。

外部モデルのコスト

使用状況ダッシュボードでは、「**価格テーブルのオーバーライド**」設定でモデル価格テーブルを指定することにより、外部モデル のコスト見積もりを含めるように構成できます。価格テーブルはユーザーが管理するものであり、ダッシュボードへの入力として提供する必要があります。

AI Gateway 外部モデル価格テーブルの上書き

価格表には次のフィールドを含める必要があります:

フィールド

Type

説明

model

STRING

ダッシュボードにおけるコスト配分に使用されるモデル名。

input_token_price

DOUBLE

入力トークンの料金。

output_token_price

DOUBLE

出力トークンの価格。

cache_read_input_token_price

DOUBLE

サポートされている場合のキャッシュ読み取り入力トークンの価格。

cache_write_input_token_price

DOUBLE

キャッシュ書き込み入力トークンの価格(サポートされている場合)。

注記

外部モデルのコスト見積もりは参考情報です。これらの数値は、定価または上書き価格に基づいて算出されており、最終的なプロバイダーの請求額に反映されない場合があります。Databricksは、第三者による請求の不一致については責任を負いません。

コスト分析

プロンプト

Genie Code (エージェントモード) がこれを実行できます。このプロンプト例をお試しください。

Query system.billing.usage to show AI Gateway DBU cost for the past 30 days, broken down by usage_metadata.ai_gateway.endpoint_name, destination model, and requesting user. Filter to MODEL_SERVING records. Show top 10 in each.

次のクエリは、system.billing.usage での Databricks ホスト型モデルのコストを分析します。コストは、モデルサービス、ターゲットモデル、プリンシパル、およびサービスタグで分類できます。

モデルサービス別

SQL
SELECT
usage_metadata.ai_gateway_endpoint_name AS endpoint_name,
SUM(usage_quantity) AS dbus
FROM system.billing.usage
WHERE billing_origin_product = 'MODEL_SERVING'
AND usage_metadata.ai_gateway_endpoint_name IS NOT NULL
AND usage_unit = 'DBU'
AND usage_date >= current_date() - INTERVAL 30 DAYS
GROUP BY endpoint_name
ORDER BY dbus DESC;

宛先モデル別

SQL
SELECT
usage_metadata.ai_gateway_destination_model AS destination_model,
SUM(usage_quantity) AS dbus
FROM system.billing.usage
WHERE billing_origin_product = 'MODEL_SERVING'
AND usage_metadata.ai_gateway_endpoint_name IS NOT NULL
AND usage_unit = 'DBU'
AND usage_date >= current_date() - INTERVAL 30 DAYS
GROUP BY destination_model
ORDER BY dbus DESC;

ユーザーまたはDatabricksサービスプリンシパルによる

SQL
SELECT
identity_metadata.run_by AS run_by,
SUM(usage_quantity) AS dbus
FROM system.billing.usage
WHERE billing_origin_product = 'MODEL_SERVING'
AND usage_metadata.ai_gateway_endpoint_name IS NOT NULL
AND identity_metadata.run_by IS NOT NULL
AND usage_unit = 'DBU'
AND usage_date >= current_date() - INTERVAL 30 DAYS
GROUP BY run_by
ORDER BY dbus DESC;

サービス タグ別

サービスタグはcustom_tagsの請求レコードに伝播されるため、チーム、環境、プロジェクト、またはコストセンターなどのディメンション別にコストを割り当てることができます。

SQL
SELECT
custom_tags['team'] AS team,
SUM(usage_quantity) AS dbus
FROM system.billing.usage
WHERE billing_origin_product = 'MODEL_SERVING'
AND usage_metadata.ai_gateway_endpoint_name IS NOT NULL
AND custom_tags['team'] IS NOT NULL
AND usage_unit = 'DBU'
AND usage_date >= current_date() - INTERVAL 30 DAYS
GROUP BY team
ORDER BY dbus DESC;

モデル サービスに teamproject、または cost_center などのタグを追加するには、Unity AI Gateway エンドポイントの構成を参照してください。

制限事項

  • system.billing.usageMODEL_SERVINGレコードに支出アトリビューションが適用されます。外部プロバイダーによって直接請求される外部モデルにルーティングされるリクエストは、system.billing.usageには表示されません。
  • トラフィックスプリットやフォールバックなど、複数の宛先を持つモデルサービスの場合、ai_gateway_destination_modelai_gateway_destination_idは最終的にリクエストを処理した宛先を特定します。