Rastreando a implantação
MLflow Tracing fornece observabilidade abrangente para aplicativos GenAI de produção, capturando detalhes de execução que o senhor pode view na UI MLflow ou analisar como tabelas. Esta página fornece um detalhamento de referência de recurso:
- Opções de implantação: O senhor pode implantar um agente AI em Databricks ou fora de Databricks. Essa escolha determina suas opções para o registro de rastreamento.
- Opções de registro de rastreamento: Os rastreamentos podem ser registrados em um experimento MLflow ou em tabelas Delta.
Para obter um guia e um tutorial, consulte agentes implantados com rastreamento.
Esta página é para o MLflow 3. Para o MLflow 2 Tracing, consulte a documentação de código aberto da sua versão do MLflow.
Opções de implantação para rastreamento
O Databricks oferece suporte à implementação dentro e fora do Databricks. Essa escolha afeta suas opções de registro de rastreamento: Registro de experimentos do MLflow, tabelas de monitoramento de produção e tabelas de inferência.
Local de implantação | Método de implantação | |||
---|---|---|---|---|
Databricks | Agent Framework (recomendado) ou implantação de serviço personalizado | Suportado | Suportado | Suportado |
Databricks externos | Suportado | Suportado | Não suportado |
Opções de registro de rastreamento
Os rastros podem ser registrados no site Databricks MLflow acompanhamento serviço ou nas tabelas Delta. As arquiteturas de exemplo abaixo ilustram o fluxo de dados para todas as opções de registro.
- Deploy on Databricks
- Deploy outside of Databricks
Opção de registro de rastreamento | Acesso e governança | Benefícios | Limitações |
---|---|---|---|
Os traços podem ser visualizados na interface do usuário do experimento MLflow ou consultados de forma programática. O acesso é controlado por ACLs de experimentos MLflow. | Registro em tempo real. Suporta traços muito grandes. | 100 mil traços por experimento. Máximo de 60 consultas por segundo (QPS). Peça ajuda à sua equipe do Databricks account para aumentar esses limites. | |
Delta são administradas usando os privilégios do siteUnity Catalog. | Suporta traços muito grandes. | O mesmo que o registro de experimentos do MLflow. Atraso de aproximadamente 15 minutos. | |
Delta são administradas usando os privilégios do siteUnity Catalog. | Sem limite de traços por experimento. | Atraso de 30 a 90 minutos. Limites no tamanho do traço. |
Na tabela acima, se o experimento MLflow for criado com um local de armazenamento personalizado para artefatos, os dados de rastreamento do experimento serão armazenados no local especificado pelo senhor. Especificamente, se o senhor criar um experimento workspace, poderá definir um local de armazenamento nãodefault para artefatos e dados de rastreamento especificando um artifact_location
, como um volume Unity Catalog. Nesse caso, o acesso aos dados de rastreamento é regido pelas permissões do local, como os privilégios de volume do Unity Catalog.
guia e tutorial
referências de recursos
Para obter detalhes sobre os conceitos e recursos deste guia, consulte:
- Conceitos de monitoramento da produção - Entenda como o MLflow permite o monitoramento contínuo da qualidade
- Modelo de dados de rastreamento - Saiba mais sobre traços, extensões e atributos
- Avaliações de registro - Entenda como o feedback é armazenado e usado