MLflow para o agente gen e o ciclo de vida do modelo AI ML
Este artigo descreve como MLflow o site on Databricks é usado para desenvolver agentes generativos de alta qualidade AI e modelos de aprendizado de máquina.
Se o senhor estiver começando a usar o Databricks, considere experimentar o MLflow on Databricks Community Edition.
O que é o MLflow?
MLflow é uma plataforma de código aberto para o desenvolvimento de modelos e aplicativos generativos AI. Ele tem os seguintes componentes principais:
- acompanhamento: Permite que o senhor acompanhe experimentos para registrar e comparar parâmetros e resultados.
- Modelos: Permite que o senhor gerencie e implante modelos de várias ML bibliotecas para várias plataformas de modelo de serviço e inferência.
- Model Registry: Permite que o senhor gerencie o processo de implementação de modelos, desde a preparação até a produção, com recursos de versão e anotação de modelos.
- AI Avaliação e rastreamento de agentes: Permite que o senhor desenvolva agentes de alta qualidade no site AI, ajudando-o a comparar, avaliar e solucionar problemas de agentes.
O MLflow é compatível com APIs Java, Python, R e REST.
Databricks-gerenciar MLflow
Databricks oferece uma versão totalmente gerenciada e hospedada do MLflow, com base na experiência do código aberto para torná-lo mais robusto e dimensionável para uso corporativo.
O diagrama a seguir mostra como o Databricks se integra ao MLflow para treinar e implantar o modelo de aprendizado de máquina.
Databricks-gerenciar MLflow foi desenvolvido com base em Unity Catalog e no lago de dados da nuvem para unificar todos os seus dados e AI ativos no ciclo de vida ML:
- recurso store: Databricks pesquisas automatizadas de recurso simplificam a integração e reduzem os erros.
- Treine modelos: Use o Mosaic AI para treinar modelos ou ajustar modelos básicos.
- acompanhamento : MLflow acompanha o treinamento registrando parâmetros, métricas e artefatos para avaliar e comparar o desempenho do modelo.
- Model Registry: MLflow Model Registry, integrado ao Unity Catalog, centraliza os modelos e artefatos do AI.
- servindo modelo: Mosaic AI Model Serving implantado modelos para a REST API endpoint.
- monitoramento: o site Mosaic AI Model Serving captura automaticamente solicitações e respostas para monitorar e depurar modelos. O MLflow aumenta esses dados com dados de rastreamento para cada solicitação.
Modelo treinamento
MLflow Os modelos estão no centro do desenvolvimento de AI e ML em Databricks. MLflow AI Os modelos são um formato padronizado para empacotar modelos de aprendizado de máquina e agentes generativos. O formato padronizado garante que os modelos e agentes possam ser usados por ferramentas downstream e fluxo de trabalho em Databricks.
- Documentação do MLflow - Modelos.
Databricks fornece recurso para ajudá-lo a treinar diferentes tipos de modelos ML.
Experimentar acompanhamento
A Databricks usa experimentos MLflow como unidades organizacionais para acompanhar seu trabalho durante o desenvolvimento de modelos.
O acompanhamento de experimentos permite que o senhor log e gerencie parâmetros, métricas, artefatos e versões de código durante o treinamento de aprendizado de máquina e o desenvolvimento de agentes. A organização do logs em experimentos e execução permite comparar modelos, analisar o desempenho e iterar com mais facilidade.
- Acompanhamento de experimentos usando Databricks o site.
- Consulte a documentação do site MLflow para obter informações gerais sobre execução e acompanhamento de experimentos.
Model Registry com Unity Catalog
O MLflow Model Registry é um repositório de modelos centralizado, uma interface de usuário e um conjunto de APIs para gerenciar o processo de implantação de modelos.
A Databricks integra o Model Registry ao Unity Catalog para fornecer governança centralizada para modelos. Unity Catalog permite que o senhor acesse modelos em todo o espaço de trabalho, acompanhe a linhagem do modelo e descubra modelos para reutilização.
- gerenciar modelos usando Databricks Unity Catalog .
- Consulte a documentação do site MLflow para obter informações gerais sobre o Model Registry.
servindo modelo
Databricks O servindo modelo é totalmente integrado ao MLflow Model Registry e oferece uma interface unificada e escalonável para implantar, governar e consultar modelos AI. Cada modelo que o senhor atende está disponível como uma API REST que pode ser integrada a aplicativos da Web ou de clientes.
Embora sejam componentes distintos, o servindo modelo depende muito do MLflow Model Registry para lidar com o controle de versão do modelo, o gerenciamento de dependências, a validação e a governança.
código aberto vs. Databricks-gerenciar MLflow recurso
Para conhecer os conceitos gerais do MLflow, APIs e os recursos compartilhados entre as versões do código aberto e do Databricks-gerenciar, consulte a documentação doMLflow. Para o recurso exclusivo do Databricks-gerenciar MLflow, consulte a documentação da Databricks.
A tabela a seguir destaca as diferenças key entre o código aberto MLflow e Databricks-gerenciar MLflow e fornece links de documentação para ajudá-lo a saber mais:
Recurso | Disponibilidade no MLflow de código aberto | Disponibilidade em Databricks-gerenciar MLflow |
---|---|---|
Segurança | O usuário deve fornecer sua própria camada de governança de segurança | |
Recuperação de desastres | Indisponível | |
Acompanhamento de experimentos | MLflow acompanhamento API integrado com Databricks acompanhamento avançado de experimentos | |
Registro de modelos | MLflow Model Registry integrado com Databricks Unity Catalog | |
Integração com o Unity Catalog | Integração de código aberto com o Unity Catalog | |
Implantação de modelos | Integrações configuradas pelo usuário com soluções de serviço externas (SageMaker, Kubernetes, qualquer serviço de contêiner, etc.) | Databricks servindo modelo e soluções de serviço externo |
AI agentes | ||
Criptografia | Indisponível | Criptografia usando a chave gerenciadora do cliente |