Tabelas de inferência do agente: Logs de solicitação e avaliação (descontinuado)

info

Para novos casos de uso, a Databricks recomenda implantar agentes no Databricks Apps para controle total sobre o código do agente, a configuração do servidor e o fluxo de trabalho de implantação. Consulte Crie um agente de AI e o tenha implantado no Databricks Apps. Para migrar um agente existente, consulte Migre um agente do Model Serving para o Databricks Apps.

importante

**Aviso de descontinuação**: A partir de 4 de dezembro de 2025, o Databricks não preenche mais automaticamente as payload_request_logs payload_assessment_logs tabelas e. Estas tabelas foram descontinuadas.

Agentes recém-implantados por meio de agents.deploy() não gerará mais tabelas request_logs ou assessment_logs.
As tabelas legadas de logs de solicitação e logs de avaliação não são mais preenchidas. Você pode criar sua própria tabela de substituição usando view materializada. Consulte as soluções alternativas para o MLflow 2.
A API experimental legada para registro de feedback não será mais compatível com agentes implantados com a versão mais recente do databricks-agents. Use a MLflow 3 API de Avaliações em vez disso.

Ação necessária :

Recomendado : Atualize para o MLflow 3 para usar o rastreamento em tempo real, o que fornece registro unificado com melhor desempenho.
Alternativa : Se for preciso continuar usando o MLflow 2, consulte soluções alternativas para manter o acesso aos seus dados.

Ao implantado um agente de AI, o Databricks cria três tabelas de inferência que capturam automaticamente as solicitações e respostas de e para seu agente. Essas tabelas ajudam a monitorar o desempenho, depurar problemas e analisar o feedback do usuário.

Tabela de inferência	Exemplo de nome de tabela do Databricks	Conteúdo da tabela
Payload	`{catalog_name}.{schema_name}.{model_name}_payload`	Payloads de solicitação e resposta JSON brutos
Logs de solicitação de payload	`{catalog_name}.{schema_name}.{model_name}_payload_request_logs`	Solicitação e respostas formatadas. Rastreamentos do MLflow. Derivado da tabela de payload bruta.
Logs de avaliação de payload	`{catalog_name}.{schema_name}.{model_name}_payload_assessment_logs`	Feedback formatado, conforme apresentado no aplicativo de avaliação, para cada solicitação Derivado da tabela de payload bruta.

Tabela de inferência

Exemplo de nome de tabela do Databricks

Conteúdo da tabela

Payload

{catalog_name}.{schema_name}.{model_name}_payload

Payloads de solicitação e resposta JSON brutos

Logs de solicitação de payload

{catalog_name}.{schema_name}.{model_name}_payload_request_logs

Solicitação e respostas formatadas. Rastreamentos do MLflow.

Derivado da tabela de payload bruta.

Logs de avaliação de payload

{catalog_name}.{schema_name}.{model_name}_payload_assessment_logs

Feedback formatado, conforme apresentado no aplicativo de avaliação, para cada solicitação

Derivado da tabela de payload bruta.

Tabela de inferência	Exemplo de nome de tabela do Databricks	Conteúdo da tabela
Payload	`{catalog_name}.{schema_name}.{model_name}_payload`	Payloads de solicitação e resposta JSON brutos
Logs de solicitação de payload	`{catalog_name}.{schema_name}.{model_name}_payload_request_logs`	Solicitação e respostas formatadas. Rastreamentos do MLflow. Derivado da tabela de payload bruta.
Logs de avaliação de payload	`{catalog_name}.{schema_name}.{model_name}_payload_assessment_logs`	Feedback formatado, conforme apresentado no aplicativo de avaliação, para cada solicitação Derivado da tabela de payload bruta.

Tabela de inferência

Exemplo de nome de tabela do Databricks

Conteúdo da tabela

Payload

{catalog_name}.{schema_name}.{model_name}_payload

Payloads de solicitação e resposta JSON brutos

Logs de solicitação de payload

{catalog_name}.{schema_name}.{model_name}_payload_request_logs

Solicitação e respostas formatadas. Rastreamentos do MLflow.

Derivado da tabela de payload bruta.

Logs de avaliação de payload

{catalog_name}.{schema_name}.{model_name}_payload_assessment_logs

Feedback formatado, conforme apresentado no aplicativo de avaliação, para cada solicitação

Derivado da tabela de payload bruta.

Dados JSON brutos entram na tabela de payload em até uma hora após seu agente receber uma solicitação.
As tabelas de logs de solicitação e logs de avaliação processam e formatam dados da tabela de payload. Isso leva tempo adicional.
É possível extrair e processar dados da tabela de payload manualmente, se necessário.
As alterações na tabela de payload (exclusões ou atualizações) não são sincronizadas automaticamente com as tabelas derivadas.

O que está mudando?

Databricks não preenche mais automaticamente as tabelas payload_request_logs e payload_assessment_logs.

O que ainda funciona : A tabela payload bruta continua a receber dados de novas solicitações.

Migre para o MLflow 3 e use o rastreamento em tempo real para unificar os logs do agente.

A Databricks recomenda fortemente migrar os endpoint de agente para usar o MLflow 3. O rastreamento em tempo real do MLflow 3 elimina a necessidade de tabelas separadas de request_logs e assessment_logs unificando todos os seus logs de agente em um único local de rastreamento.

	Observabilidade legada	Observabilidade do MLflow 3
Latência de coleta de dados	1+ horas	<10s
Organização de Dados	Os rastreamentos e o feedback do usuário (avaliações) são extraídos para tabelas separadas do Unity Catalog (`request_logs` e `assessment_logs`).	Todos os seus dados relacionados à observabilidade, como rastreamentos, feedback e avaliações, podem ser facilmente acessados no mesmo experimento.
Coleta de Feedback	Não bem suportado. Usa a API experimental de feedback, que insere dados na tabela de inferência de payload.	O MLflow 3 fornece APIs simplificadas para executar avaliação, rótulo humano e gerenciar datasets de avaliação.
Monitoramento	Não bem suportado. O suporte é limitado ao monitoramento herdado agora preterido, que se restringia a juízes integrados herdados e juízes de diretrizes, e não possui suporte para métricas personalizadas. O monitoramento herdado executa sobre logs de solicitação de payload, o que significa que as respostas do seu agente levarão mais de 1 hora para serem avaliadas.	O monitoramento é nativamente integrado ao MLflow 3, compatível com qualquer Avaliador: Avaliadores integrados Avaliador de código personalizado Juízes personalizados Inclui recursos de preenchimento de métricas para aplicar retroativamente novas métricas a rastreamentos históricos. Os rastreamentos são lidos do MLflow para avaliação, diminuindo a latência do monitoramento para 15–30 minutos.

	Observabilidade legada	Observabilidade do MLflow 3
Latência de coleta de dados	1+ horas	<10s
Organização de Dados	Os rastreamentos e o feedback do usuário (avaliações) são extraídos para tabelas separadas do Unity Catalog (`request_logs` e `assessment_logs`).	Todos os seus dados relacionados à observabilidade, como rastreamentos, feedback e avaliações, podem ser facilmente acessados no mesmo experimento.
Coleta de Feedback	Não bem suportado. Usa a API experimental de feedback, que insere dados na tabela de inferência de payload.	O MLflow 3 fornece APIs simplificadas para executar avaliação, rótulo humano e gerenciar datasets de avaliação.
Monitoramento	Não bem suportado. O suporte é limitado ao monitoramento herdado agora preterido, que se restringia a juízes integrados herdados e juízes de diretrizes, e não possui suporte para métricas personalizadas. O monitoramento herdado executa sobre logs de solicitação de payload, o que significa que as respostas do seu agente levarão mais de 1 hora para serem avaliadas.	O monitoramento é nativamente integrado ao MLflow 3, compatível com qualquer Avaliador: Avaliadores integrados Avaliador de código personalizado Juízes personalizados Inclui recursos de preenchimento de métricas para aplicar retroativamente novas métricas a rastreamentos históricos. Os rastreamentos são lidos do MLflow para avaliação, diminuindo a latência do monitoramento para 15–30 minutos.

O MLflow 3 anexa avaliações a rastreamentos, então registra os rastreamentos no servidor de rastreamento do MLflow juntamente com todos os logs de payload, resposta e etapa intermediária. Consulte Rótulo durante o desenvolvimento e Conceitos e modelo de dados.

Os passos da migração

Atualize para o MLflow 3 : Certifique-se de que seu agente use o MLflow 3.1.3. ou acima. O rastreamento será habilitado automaticamente quando você implantar agentes com o MLflow 3.

Python
# Install prerequisites
%pip install mlflow>=3.1.3

# Restart Python to make sure the new packages are picked up
dbutils.library.restartPython()

**log seu agente**: log o agente como você faria normalmente, certificando-se de que ele requer MLflow 3.1.3 ou acima. Em seguida, faça o registro do modelo no Unity Catalog.

Python
# Log your agent
with mlflow.start_run():
    logged_agent_info = mlflow.pyfunc.log_model(
        name="my_agent",
        pip_requirements=[
            "mlflow>=3.1.3",
        ],
        ...
    )

# Register your model to UC
uc_registered_model_info = mlflow.register_model(
    model_uri=logged_agent_info.model_uri, name=UC_MODEL_NAME
)

Implante seu agente: Implante o agente como você faria normalmente. Opcionalmente, configure seu experimento MLflow antes da implantação para controlar onde os rastreamentos são log. Se você não fizer isso, os rastreamentos serão registrados no experimento MLflow atualmente ativo.

Python
import mlflow
from databricks import agents

# Set experiment for trace logging
mlflow.set_experiment("/path/to/your/experiment")

# Deploy with automatic tracing
deployment = agents.deploy(uc_model_name, uc_model_info.version)

# Retrieve the query endpoint URL for making API requests
deployment.query_endpoint

nota

O MLflow 3 atualmente suporta até 100.000 rastreamentos por endpoint de serviço. Se você antecipar a necessidade de limites maiores, contate sua equipe de conta da Databricks.

Consulte agentes de rastreamento implantados no Databricks para obter mais informações.

Opções alternativas para continuar usando MLflow 2.

importante

Métodos alternativos do MLflow 2 não oferecem suporte a endpoint com monitoramento de agente habilitado. Se você usar o monitoramento, você deve migrar para o MLflow 3 e recriar seus monitores como avaliadores do MLflow 3.

Se não for possível atualizar para o MLflow 3, o Databricks continuará a preencher a tabela bruta payload. No entanto, o Databricks não processa mais esses dados nas tabelas payload_requests_logs e payload_assessment_logs.

Em vez disso, o Databricks gera views sobre suas tabelas de payload que fornecem os mesmos dados formatados. Você tem duas opções para acessar esses dados. Use as view fornecidas ou crie view materializadas.

Opção 1: Use as views fornecidas

O método mais simples é usar as view geradas payload_request_logs_view e payload_assessment_logs_view no lugar das tabelas obsoletas.

Essas views consultam a tabela de payload para fornecer os mesmos dados formatados, e funcionam imediatamente sem a necessidade de configuração.

Opcionalmente, renomeie as view para que correspondam aos nomes originais de suas tabelas a fim de minimizar as alterações no código.

Opção 2: Criar view materializada

As view fornecidas (payload_request_logs_view e payload_assessment_logs_view) compute dados em tempo real consultando a tabela de carga. Para cenários que exigem tabelas Delta físicas, como o monitoramento em tempo real, crie exibições materializadas em vez disso.

Execute o seguinte Notebook para converter suas views em views materializadas:

Criar views materializadas para logs de inferência do agente

Abrir notebook em uma nova aba Open in Databricks

Perguntas Frequentes

O que acontece com os dados em meus logs de solicitação e logs de avaliação existentes?

Os dados existentes nas suas tabelas de inferência continuarão acessíveis. No entanto, após 4 de dezembro de 2025, nenhum dado novo será preenchido nas tabelas request_logs e assessment_logs.

A implantação do meu agente está falhando?

Não, suas implantações de agente antigas continuam funcionando e suas tabelas de inferência de payload continuam sendo preenchidas. No entanto, após as datas de descontinuação, você não receberá dados nas tabelas request_logs e assessment_logs. Use as view fornecidas ou migre para o MLflow 3 para manter a funcionalidade equivalente.

Se precisar de assistência com a migração, entre em contato com a equipe de suporte da Databricks.

O que está mudando?​

Migre para o MLflow 3 e use o rastreamento em tempo real para unificar os logs do agente.​

Os passos da migração​

Opções alternativas para continuar usando MLflow 2.​

Opção 1: Use as views fornecidas​

Opção 2: Criar view materializada​

Criar views materializadas para logs de inferência do agente

Perguntas Frequentes​

O que acontece com os dados em meus logs de solicitação e logs de avaliação existentes?​

A implantação do meu agente está falhando?​

Recursos adicionais​

O que está mudando?

Migre para o MLflow 3 e use o rastreamento em tempo real para unificar os logs do agente.

Os passos da migração

Opções alternativas para continuar usando MLflow 2.

Opção 1: Use as views fornecidas

Opção 2: Criar view materializada

Perguntas Frequentes

O que acontece com os dados em meus logs de solicitação e logs de avaliação existentes?

A implantação do meu agente está falhando?

Recursos adicionais