Pular para o conteúdo principal

código aberto MLflow vs. gerenciar MLflow on Databricks

O código aberto MLflow fornece o modelo de dados principal e SDKs, enquanto o gerenciar MLflow em Databricks adiciona:

  • Escalável para produção — Ingestão de rastreamento de alto volume para cargas de trabalho de produção
  • Avaliação/monitoramento avançado - por meio da integração da Avaliação de agentes
  • Integrado com o Lakehouse - Todos os dados estão disponíveis como Delta Tables para uso em casos de uso downstream BI e analítico via Notebook, Databricks SQL e Databricks AI/BI dashboards
  • Governança pronta para a empresa - por meio da integração com o Unity Catalog
  • hosting totalmente gerenciado - gerenciamento de infraestrutura zero
dica

Seus dados são sempre seus - O modelo de dados principal e os recursos de rastreamento são totalmente de código aberto. O senhor pode exportar e usar seus dados do MLflow em qualquer lugar.

Principais diferenças em um relance

Comparação da visão geral

Recurso

MLflow de código aberto

MLflow gerenciado na Databricks

Rastreando a observabilidade do &

Rastreamento do modelo de dados & APIs

Ingestão de traços em escala de produção

Monitoramento da produção

Avaliação do GenAI & monitoramento

Modelo de dados de avaliação & APIs

UI e APIs com feedback humano

Juízes de LLM de alta qualidade e com base em pesquisa

Conjunto de dados de avaliação com versão

Prontidão empresarial

hospedagem

Autogerenciadas

Totalmente gerenciado

Governança corporativa (Unity Catalog)

Dados integrados com a lakehouse para AI/BI & SQL

CI/CD implantação Trabalho

LLM / MLOps

Gerenciamento imediato

Acompanhamento de experiments

Gerenciamento de versões de modelos/aplicativos

Por que escolher a gerenciar MLflow?

gerenciar MLflow em Databricks amplia o código aberto MLflow com recursos projetados para aplicativos GenAI de produção:

Escalável para produção

  • Ingestão de rastreamento de alto volume projetada para cargas de trabalho de produção com milhares de solicitações por segundo
  • Dimensionamento automático sem gerenciamento de infraestrutura
  • Monitoramento da produção com painéis de controle e alertas integrados

Avaliação e monitoramento avançados

  • A integração da avaliação de agentes fornece juízes de alta qualidade em LLM, UIs de rótulos humanos e conjunto de dados de avaliação com versão
  • O monitoramento contínuo avalia automaticamente os traços de produção
  • Painéis de qualidade visualizam tendências e identificam problemas

Integrado com a casa do lago & Unity Catalog

  • A integração da Lakehouse torna todos os dados de rastreamento, avaliação e monitoramento disponíveis para o fluxo de trabalho downstream usando os recursos do Databricks AI/BI para criar painéis personalizados, análises e relatórios sobre os dados do GenAI
  • A governança do Unity Catalog oferece segurança de nível empresarial e controles de acesso

hospedagem totalmente gerenciada

  • Gerenciamento de infraestrutura zero - a Databricks cuida de toda a hospedagem, dimensionamento e atualizações
  • SLAs corporativos com alta disponibilidade e backups automatizados
  • Atualizações contínuas para o mais recente recurso MLflow

Próximas etapas

  1. Criar um teste grátis Databricks account
  2. O MLflow é pré-instalado e configurado
  3. Siga os guias de início rápido para começar