Tabelas de inferência do agente: Logs de solicitação e avaliação (descontinuado)
Para novos casos de uso, a Databricks recomenda implantar agentes no Databricks Apps para controle total sobre o código do agente, a configuração do servidor e o fluxo de trabalho de implantação. Consulte Crie um agente de AI e o tenha implantado no Databricks Apps. Para migrar um agente existente, consulte Migre um agente do Model Serving para o Databricks Apps.
**Aviso de descontinuação**: A partir de 4 de dezembro de 2025, o Databricks não preenche mais automaticamente as payload_request_logs payload_assessment_logs tabelas e. Estas tabelas foram descontinuadas.
- Agentes recém-implantados por meio de agents.deploy() não gerará mais tabelas request_logs ou assessment_logs.
- As tabelas legadas de logs de solicitação e logs de avaliação não são mais preenchidas. Você pode criar sua própria tabela de substituição usando view materializada. Consulte as soluções alternativas para o MLflow 2.
- A API experimental legada para registro de feedback não será mais compatível com agentes implantados com a versão mais recente do databricks-agents. Use a MLflow 3 API de Avaliações em vez disso.
Ação necessária :
- Recomendado : Atualize para o MLflow 3 para usar o rastreamento em tempo real, o que fornece registro unificado com melhor desempenho.
- Alternativa : Se for preciso continuar usando o MLflow 2, consulte soluções alternativas para manter o acesso aos seus dados.
Ao implantado um agente de AI, o Databricks cria três tabelas de inferência que capturam automaticamente as solicitações e respostas de e para seu agente. Essas tabelas ajudam a monitorar o desempenho, depurar problemas e analisar o feedback do usuário.
Tabela de inferência | Exemplo de nome de tabela do Databricks | Conteúdo da tabela |
|---|---|---|
Payload |
| Payloads de solicitação e resposta JSON brutos |
Logs de solicitação de payload |
| Solicitação e respostas formatadas. Rastreamentos do MLflow. Derivado da tabela de payload bruta. |
Logs de avaliação de payload |
| Feedback formatado, conforme apresentado no aplicativo de avaliação, para cada solicitação Derivado da tabela de payload bruta. |
- Dados JSON brutos entram na tabela de payload em até uma hora após seu agente receber uma solicitação.
- As tabelas de logs de solicitação e logs de avaliação processam e formatam dados da tabela de payload. Isso leva tempo adicional.
- É possível extrair e processar dados da tabela de payload manualmente, se necessário.
- As alterações na tabela de payload (exclusões ou atualizações) não são sincronizadas automaticamente com as tabelas derivadas.
O que está mudando?
Databricks não preenche mais automaticamente as tabelas payload_request_logs e payload_assessment_logs.
O que ainda funciona : A tabela payload bruta continua a receber dados de novas solicitações.
Migre para o MLflow 3 e use o rastreamento em tempo real para unificar os logs do agente.
A Databricks recomenda fortemente migrar os endpoint de agente para usar o MLflow 3. O rastreamento em tempo real do MLflow 3 elimina a necessidade de tabelas separadas de request_logs e assessment_logs unificando todos os seus logs de agente em um único local de rastreamento.
Observabilidade legada | Observabilidade do MLflow 3 | |
|---|---|---|
Latência de coleta de dados | 1+ horas | <10s |
Organização de Dados | Os rastreamentos e o feedback do usuário (avaliações) são extraídos para tabelas separadas do Unity Catalog ( | Todos os seus dados relacionados à observabilidade, como rastreamentos, feedback e avaliações, podem ser facilmente acessados no mesmo experimento. |
Coleta de Feedback | Não bem suportado. Usa a API experimental de feedback, que insere dados na tabela de inferência de payload. | O MLflow 3 fornece APIs simplificadas para executar avaliação, rótulo humano e gerenciar datasets de avaliação. |
Monitoramento | Não bem suportado. O suporte é limitado ao monitoramento herdado agora preterido, que se restringia a juízes integrados herdados e juízes de diretrizes, e não possui suporte para métricas personalizadas. O monitoramento herdado executa sobre logs de solicitação de payload, o que significa que as respostas do seu agente levarão mais de 1 hora para serem avaliadas. | O monitoramento é nativamente integrado ao MLflow 3, compatível com qualquer Avaliador:
Inclui recursos de preenchimento de métricas para aplicar retroativamente novas métricas a rastreamentos históricos. Os rastreamentos são lidos do MLflow para avaliação, diminuindo a latência do monitoramento para 15–30 minutos. |
O MLflow 3 anexa avaliações a rastreamentos, então registra os rastreamentos no servidor de rastreamento do MLflow juntamente com todos os logs de payload, resposta e etapa intermediária. Consulte Rótulo durante o desenvolvimento e Conceitos e modelo de dados.
Os passos da migração
- Atualize para o MLflow 3 : Certifique-se de que seu agente use o MLflow 3.1.3. ou acima. O rastreamento será habilitado automaticamente quando você implantar agentes com o MLflow 3.
# Install prerequisites
%pip install mlflow>=3.1.3
# Restart Python to make sure the new packages are picked up
dbutils.library.restartPython()
- **log seu agente**: log o agente como você faria normalmente, certificando-se de que ele requer MLflow 3.1.3 ou acima. Em seguida, faça o registro do modelo no Unity Catalog.
# Log your agent
with mlflow.start_run():
logged_agent_info = mlflow.pyfunc.log_model(
name="my_agent",
pip_requirements=[
"mlflow>=3.1.3",
],
...
)
# Register your model to UC
uc_registered_model_info = mlflow.register_model(
model_uri=logged_agent_info.model_uri, name=UC_MODEL_NAME
)
- Implante seu agente: Implante o agente como você faria normalmente. Opcionalmente, configure seu experimento MLflow antes da implantação para controlar onde os rastreamentos são log. Se você não fizer isso, os rastreamentos serão registrados no experimento MLflow atualmente ativo.
import mlflow
from databricks import agents
# Set experiment for trace logging
mlflow.set_experiment("/path/to/your/experiment")
# Deploy with automatic tracing
deployment = agents.deploy(uc_model_name, uc_model_info.version)
# Retrieve the query endpoint URL for making API requests
deployment.query_endpoint
O MLflow 3 atualmente suporta até 100.000 rastreamentos por endpoint de serviço. Se você antecipar a necessidade de limites maiores, contate sua equipe de conta da Databricks.
Consulte agentes de rastreamento implantados no Databricks para obter mais informações.
Opções alternativas para continuar usando MLflow 2.
Métodos alternativos do MLflow 2 não oferecem suporte a endpoint com monitoramento de agente habilitado. Se você usar o monitoramento, você deve migrar para o MLflow 3 e recriar seus monitores como avaliadores do MLflow 3.
Se não for possível atualizar para o MLflow 3, o Databricks continuará a preencher a tabela bruta payload. No entanto, o Databricks não processa mais esses dados nas tabelas payload_requests_logs e payload_assessment_logs.
Em vez disso, o Databricks gera views sobre suas tabelas de payload que fornecem os mesmos dados formatados. Você tem duas opções para acessar esses dados. Use as view fornecidas ou crie view materializadas.
Opção 1: Use as views fornecidas
O método mais simples é usar as view geradas payload_request_logs_view e payload_assessment_logs_view no lugar das tabelas obsoletas.
Essas views consultam a tabela de payload para fornecer os mesmos dados formatados, e funcionam imediatamente sem a necessidade de configuração.
Opcionalmente, renomeie as view para que correspondam aos nomes originais de suas tabelas a fim de minimizar as alterações no código.
Opção 2: Criar view materializada
As view fornecidas (payload_request_logs_view e payload_assessment_logs_view) compute dados em tempo real consultando a tabela de carga. Para cenários que exigem tabelas Delta físicas, como o monitoramento em tempo real, crie exibições materializadas em vez disso.
Execute o seguinte Notebook para converter suas views em views materializadas:
Criar views materializadas para logs de inferência do agente
Perguntas Frequentes
O que acontece com os dados em meus logs de solicitação e logs de avaliação existentes?
Os dados existentes nas suas tabelas de inferência continuarão acessíveis. No entanto, após 4 de dezembro de 2025, nenhum dado novo será preenchido nas tabelas request_logs e assessment_logs.
A implantação do meu agente está falhando?
Não, suas implantações de agente antigas continuam funcionando e suas tabelas de inferência de payload continuam sendo preenchidas. No entanto, após as datas de descontinuação, você não receberá dados nas tabelas request_logs e assessment_logs. Use as view fornecidas ou migre para o MLflow 3 para manter a funcionalidade equivalente.
Se precisar de assistência com a migração, entre em contato com a equipe de suporte da Databricks.