Monitore o uso do endpoint do Unity AI Gateway.

info

Beta

Este recurso está em versão Beta. Os administradores da conta podem controlar o acesso a este recurso na página de pré-visualizações do console account . Veja as prévias do Gerenciador Databricks.

Esta página descreve como monitorar o uso do endpoint do Unity AI Gateway usando a tabela de sistema de acompanhamento de uso.

A tabela de acompanhamento de uso captura automaticamente detalhes de solicitações e respostas para um endpoint, registrando métricas essenciais como uso de tokens e latência. Você pode usar os dados desta tabela para monitorar o uso, acompanhar os custos e obter insights sobre o desempenho e o consumo endpoint .

O acompanhamento de uso também captura ai_query solicitações para o endpoint fornecido Databricks .

Requisitos

A pré-visualização do Unity AI Gateway foi ativada para sua account. Veja as prévias do Gerenciador Databricks.
Um workspace Databricks em uma região compatível com o Unity AI Gateway.
Unity Catalog está habilitado para seu workspace. Consulte Ativar um workspace para Unity Catalog.

Consulte a tabela de utilização.

O Unity AI Gateway logs os dados de uso na tabela de sistema system.ai_gateway.usage . Você pode view a tabela na interface do usuário ou consultá-la a partir Databricks SQL ou de um Notebook.

nota

Somente os administradores account têm permissão para view ou consultar a tabela system.ai_gateway.usage .

Para view a tabela na interface do usuário, clique no link "tabela de acompanhamento de uso" na página endpoint para abrir a tabela no Explorador de Catálogo.

Para consultar a tabela a partir Databricks SQL ou de um Notebook:

SQL
SELECT * FROM system.ai_gateway.usage;

prompt

Genie Code (modo agente) pode fazer isso por você. Experimente este prompt de exemplo:

Query the system.ai_gateway.usage table to analyze AI Gateway usage showing request count and total tokens, grouped by endpoint name for the last 7 days.

painel de utilização integrado

Criar painel de utilização integrado

Os administradores de contas podem criar um painel de controle integrado para o uso do Unity AI Gateway clicando em "Criar painel" na página do AI Gateway para monitorar o uso, acompanhar os custos e obter informações sobre o desempenho e o consumo endpoint . Os administradores de contas também podem atualizar o data warehouse usado para executar consultas no painel de controle, o que se aplica a todas as consultas subsequentes.

Botão Criar painel de controle

nota

A criação do painel é restrita aos administradores account porque requer permissões SELECT na tabela system.ai_gateway.usage . Os dados do painel estão sujeitos às políticas de retenção da tabela usage . Consulte Quais tabelas de sistema estão disponíveis?

Quando uma versão mais recente do painel de controle de uso integrado estiver disponível, os administradores account poderão clicar em Atualizar no menu de ações do painel na página do AI Gateway.

Diálogo de painel de atualização do gateway de IA

Você pode usar as seguintes opções de configuração do painel para gerenciar o painel:

Escopo : Selecione se deseja restringir o painel à account ou workspace.
Permissões : Escolha se as consultas serão executadas usando as permissões do proprietário do painel ou as permissões de cada visualizador. Consulte O que são permissões de dados compartilhados?
Atualizações automáticas : Ao ativar esta opção, o painel de controle é atualizado automaticamente sempre que uma versão mais recente estiver disponível e um administrador account visitar a página AI Gateway.

opções do painel de atualização do gateway de IA

Quando o painel é atualizado para a versão 0.3 ou superior, um programador é criado automaticamente para refresh o painel a cada 6 horas. Caso necessário, este programador pode ser desativado no painel de controle Lakeview . Consulte Criar um programa.

visualizar painel de utilização

Para view o painel de controle, clique em " Visualizar painel de controle" na página do AI Gateway. O painel de controle integrado oferece visibilidade completa do uso, desempenho e custo endpoint do Unity AI Gateway. Inclui várias solicitações de acompanhamento de páginas, consumo de tokens, métricas de latência, taxas de erro, detalhamento de custos, tráfego externo do servidor MCP e atividade do agente de codificação.

botão visualizar painel de controle

Painel de utilização do gateway de IA

O painel de controle fornece análises entreworkspace por default. Todas as páginas do painel de controle podem ser filtradas por intervalo de datas e ID workspace .

tabVisão geral : Exibe métricas de uso de alto nível, incluindo volume diário de solicitações, tendências de uso de tokens ao longo do tempo, principais usuários por consumo de tokens e número total de usuários únicos. Use esta tab para obter uma visão geral rápida da atividade do Unity AI Gateway e identificar os usuários e modelos mais ativos.
tabDesempenho : Monitora as key métricas de desempenho, incluindo percentis de latência (P50, P90, P95, P99), tempo até o primeiro byte, taxas de erro e distribuição de códigos de status HTTP. Use esta tab para monitorar a integridade endpoint e identificar gargalos de desempenho ou problemas de confiabilidade.
tabUso : Exibe detalhamentos do consumo por endpoint, workspace e solicitante. Esta tab mostra os padrões de uso de tokens, a distribuição de requisições e as taxas de acerto de cache.
tabObservabilidade de Custos : Exibe a discriminação de custos por endpoint, modelo de destino, usuário, tags endpoint e tags de requisição. Esta tab também inclui o custo estimado para modelos externos. Veja o custo do Monitor Unity AI Gateway.
tabServidor MCP externo : Exibe o volume de solicitações, taxas de erro, usuários e conexões, além das tendências de uso diário do tráfego do servidor MCP externo.
tabAgentes de Codificação : Registra a atividade de agentes de codificação integrados, incluindo Cursor, Claude Code, Gemini CLI e Codex CLI. Esta tab mostra métricas como dias ativos, sessões de programação, commits e linhas de código adicionadas ou removidas para monitorar o uso das ferramentas de desenvolvimento. Consulte o painel do agente de codificação para obter mais detalhes.

Esquema da tabela de utilização

A tabela system.ai_gateway.usage tem o seguinte esquema:

Nome da coluna	Tipo	Descrição	Exemplo
`account_id`	String	O ID account .	`11d77e21-5e05-4196-af72-423257f74974`
`workspace_id`	String	O ID workspace .	`1653573648247579`
`request_id`	String	Um identificador único para a solicitação.	`b4a47a30-0e18-4ae3-9a7f-29bcb07e0f00`
`schema_version`	Integer	A versão esquemática do registro de uso.	`1`
`endpoint_id`	String	O ID exclusivo do endpoint do Unity AI Gateway.	`43addf89-d802-3ca2-bd54-fe4d2a60d58a`
`endpoint_name`	String	O nome do endpoint do Unity AI Gateway.	`databricks-gpt-5-2`
`endpoint_tags`	Mapa	Etiquetas configuradas no endpoint no momento da criação ou atualização. tags de endpoint se aplicam a todas as solicitações ao endpoint e são úteis para categorizar endpoints por equipe, centro de custo ou projeto. Consulte as solicitações de tags e o endpoint para acompanhamento de uso.	`{"team": "engineering"}`
`endpoint_metadata`	struct	Metadados do ponto de extremidade incluindo `creator`, `creation_time`, `last_updated_time`, `destinations`, `inference_table` e `fallbacks`.	`{"creator": "user.name@email.com", "creation_time": "2026-01-06T12:00:00.000Z", ...}`
`event_time`	Timestamp	O registro de data e hora em que a solicitação foi recebida.	`2026-01-20T19:48:08.000+00:00`
`latency_ms`	Long	A latência total em milissegundos.	`300`
`time_to_first_byte_ms`	Long	Tempo até o primeiro byte, em milissegundos.	`300`
`destination_type`	String	O tipo de destino (por exemplo, modelo externo ou modelo de fundação).	`PAY_PER_TOKEN_FOUNDATION_MODEL`
`destination_name`	String	O nome do modelo ou provedor de destino.	`databricks-gpt-5-2`
`destination_id`	String	O identificador único do destino.	`507e7456151b3cc89e05ff48161efb87`
`destination_model`	String	O modelo específico utilizado para a solicitação.	`GPT-5.2`
`requester`	String	O ID do usuário ou da entidade de serviço que fez a solicitação.	`user.name@email.com`
`requester_type`	String	O tipo de solicitante (usuário, entidade de serviço ou grupo de usuários).	`USER`
`ip_address`	String	O endereço IP do solicitante.	`1.2.3.4`
`url`	String	A URL da solicitação.	`https://<workspace-url>/ai-gateway/mlflow/v1/chat/completions`
`user_agent`	String	O agente do usuário do solicitante.	`OpenAI/Python 2.13.0`
`api_type`	String	O tipo de chamada de API (por exemplo, chat, autocompletar ou incorporar conteúdo).	`mlflow/v1/chat/completions`
`request_tags`	Mapa	tags fornecidas pelo usuário enviadas com solicitações individuais usando o cabeçalho HTTP `Databricks-Ai-Gateway-Request-Tags` . Use tags de solicitação para atribuir o uso a projetos, equipes, ambientes ou usuários finais específicos. Consulte as solicitações de tags e o endpoint para acompanhamento de uso e as solicitações de tags para acompanhamento de uso.	`{"project": "chatbot", "team": "ml-platform"}`
`input_tokens`	Long	O número de tokens de entrada.	`100`
`output_tokens`	Long	O número de tokens de saída.	`100`
`total_tokens`	Long	Número total de tokens (entrada + saída).	`200`
`token_details`	struct	Detalhamento dos tokens, incluindo `cache_read_input_tokens`, `cache_creation_input_tokens` e `output_reasoning_tokens`.	`{"cache_read_input_tokens": 100, ...}`
`response_content_type`	String	O tipo de conteúdo da resposta.	`application/json`
`status_code`	INT	O código de status HTTP da resposta.	`200`
`routing_information`	struct	Detalhes de roteamento para tentativas de fallback . Contém um array `attempts` com `priority`, `action`, `destination`, `destination_id`, `status_code`, `error_code`, `latency_ms`, `start_time` e `end_time` para cada modelo tentado durante a solicitação.	`{"attempts": [{"priority": "1", ...}]}`

solicitações de tags e endpoint para uso acompanhamento

AI Gateway suporta dois tipos de tags para acompanhamento e atribuição de uso:

tagsde solicitação : Par personalizado key-valor que o chamador associa a solicitações individuais. Utilize tags de solicitação para atribuir o uso por projeto, equipe, ambiente, usuário final ou qualquer outra dimensão relevante para sua organização.
tagsde endpoint : pares chave-valor configurados no próprio endpoint . tags de endpoint se aplicam a todas as solicitações roteadas por meio do endpoint e são úteis para categorizar endpoints por equipe, centro de custo ou aplicativo.

Ambos os tipos tag são registros na tabela system.ai_gateway.usage e podem ser usados para filtrar, agregar e analisar dados de uso.

tagsde solicitação

Para tag solicitações individuais, inclua o cabeçalho HTTP Databricks-Ai-Gateway-Request-Tags com um objeto JSON que mapeia chaves de string para valores de string. tags de solicitação são registros na coluna request_tags na tabela de uso e nas tabelas de inferência.

Para exemplos que mostram como definir tags de solicitação com API REST , SDK OpenAI e SDK Anthropic , consulte o acompanhamento de uso de solicitações de tags.

Por exemplo, você pode agregar o uso por projeto usando tags de solicitação:

SQL
SELECT
  request_tags['project'] AS project,
  COUNT(*) AS request_count,
  SUM(total_tokens) AS total_tokens
FROM system.ai_gateway.usage
WHERE request_tags['project'] IS NOT NULL
GROUP BY request_tags['project']
ORDER BY total_tokens DESC;

tagsde ponto final

tags de endpoint são configuradas ao criar ou atualizar um endpoint AI Gateway. Eles aparecem na coluna endpoint_tags da tabela de uso para todas as solicitações para esse endpoint.

Por exemplo, você pode agregar o uso por equipe usando tags de endpoint:

SQL
SELECT
  endpoint_tags['team'] AS team,
  endpoint_name,
  COUNT(*) AS request_count,
  SUM(total_tokens) AS total_tokens
FROM system.ai_gateway.usage
WHERE endpoint_tags['team'] IS NOT NULL
GROUP BY endpoint_tags['team'], endpoint_name
ORDER BY total_tokens DESC;

Requisitos​

Consulte a tabela de utilização.​

painel de utilização integrado​

Criar painel de utilização integrado​

visualizar painel de utilização​

Esquema da tabela de utilização​

solicitações de tags e endpoint para uso acompanhamento​

tagsde solicitação​

tagsde ponto final​

Recursos adicionais​