código aberto MLflow vs. gerenciar MLflow on Databricks
O código aberto MLflow fornece o modelo de dados principal e SDKs, enquanto o gerenciar MLflow em Databricks adiciona:
- Escalável para produção — Ingestão de rastreamento de alto volume para cargas de trabalho de produção
- Avaliação/monitoramento avançado - por meio da integração da Avaliação de agentes
- Integrado com o Lakehouse - Todos os dados estão disponíveis como Delta Tables para uso em casos de uso downstream BI e analítico via Notebook, Databricks SQL e Databricks AI/BI dashboards
- Governança pronta para a empresa - por meio da integração com o Unity Catalog
- hosting totalmente gerenciado - gerenciamento de infraestrutura zero
Seus dados são sempre seus - O modelo de dados principal e os recursos de rastreamento são totalmente de código aberto. O senhor pode exportar e usar seus dados do MLflow em qualquer lugar.
Principais diferenças em um relance
Comparação da visão geral
Recurso | MLflow de código aberto | MLflow gerenciado na Databricks |
---|---|---|
Rastreando a observabilidade do & | ||
Rastreamento do modelo de dados & APIs | ✅ | ✅ |
Ingestão de traços em escala de produção | ❌ | ✅ |
Monitoramento da produção | ❌ | ✅ |
Avaliação do GenAI & monitoramento | ||
Modelo de dados de avaliação & APIs | ✅ | ✅ |
UI e APIs com feedback humano | ❌ | ✅ |
Juízes de LLM de alta qualidade e com base em pesquisa | ❌ | ✅ |
Conjunto de dados de avaliação com versão | ❌ | ✅ |
Prontidão empresarial | ||
hospedagem | Autogerenciadas | Totalmente gerenciado |
Governança corporativa (Unity Catalog) | ❌ | ✅ |
Dados integrados com a lakehouse para AI/BI & SQL | ❌ | ✅ |
CI/CD implantação Trabalho | ❌ | ✅ |
LLM / MLOps | ||
Gerenciamento imediato | ✅ | ✅ |
Acompanhamento de experiments | ✅ | ✅ |
Gerenciamento de versões de modelos/aplicativos | ✅ | ✅ |
Por que escolher a gerenciar MLflow?
gerenciar MLflow em Databricks amplia o código aberto MLflow com recursos projetados para aplicativos GenAI de produção:
Escalável para produção
- Ingestão de rastreamento de alto volume projetada para cargas de trabalho de produção com milhares de solicitações por segundo
- Dimensionamento automático sem gerenciamento de infraestrutura
- Monitoramento da produção com painéis de controle e alertas integrados
Avaliação e monitoramento avançados
- A integração da avaliação de agentes fornece juízes de alta qualidade em LLM, UIs de rótulos humanos e conjunto de dados de avaliação com versão
- O monitoramento contínuo avalia automaticamente os traços de produção
- Painéis de qualidade visualizam tendências e identificam problemas
Integrado com a casa do lago & Unity Catalog
- A integração da Lakehouse torna todos os dados de rastreamento, avaliação e monitoramento disponíveis para o fluxo de trabalho downstream usando os recursos do Databricks AI/BI para criar painéis personalizados, análises e relatórios sobre os dados do GenAI
- A governança do Unity Catalog oferece segurança de nível empresarial e controles de acesso
hospedagem totalmente gerenciada
- Gerenciamento de infraestrutura zero - a Databricks cuida de toda a hospedagem, dimensionamento e atualizações
- SLAs corporativos com alta disponibilidade e backups automatizados
- Atualizações contínuas para o mais recente recurso MLflow
Próximas etapas
- Criar um teste grátis Databricks account
- O MLflow é pré-instalado e configurado
- Siga os guias de início rápido para começar