Pular para o conteúdo principal

código aberto vs. gerenciar MLflow no Databricks

Esta página tem como objetivo ajudar os usuários do MLflow de código aberto a se familiarizarem com o uso do MLflow no Databricks. Databricks-gerenciar MLflow usa as mesmas APIs , mas oferece recursos adicionais por meio de integrações com a plataforma Databricks em geral.

Benefícios de gerenciar MLflow no Databricks

O MLflow de código aberto fornece o modelo de dados principal, a API e o SDK. Isso significa que seus dados e cargas de trabalho são sempre portáteis.

Gerenciar MLflow no Databricks adiciona:

  • Governança e segurança de nível empresarial por meio da integração com a plataforma Databricks , Lakehouse e Unity Catalog. Seus dados, ferramentas, agentes, modelos e outros ativos AI e ML podem ser gerenciados e usados na mesma plataforma que o restante de seus dados e cargas de trabalho.
  • hospedagem totalmente gerenciada em servidores escaláveis e prontos para produção
  • Integrações para desenvolvimento e produção com a plataforma Mosaic AI em geral.

Consulte a página do produto MLflow para obter mais detalhes sobre os benefícios e veja o restante desta página para saber mais sobre os detalhes técnicos.

dica

Seus dados são sempre seus - O modelo de dados principal e as APIs são totalmente de código aberto. Você pode exportar e usar seus dados do MLflow em qualquer lugar.

Funcionalidades adicionais no Databricks

Esta seção lista importantes funcionalidades habilitadas no MLflow por meio de integrações com a plataforma Databricks em geral. Para obter uma visão geral de todos os recursos do MLflow para GenAI, consulte MLflow 3 para GenAI e a documentação de código aberto do GenAI.

Governança e segurança de nível empresarial

  • Governança corporativa com Unity Catalog : Modelos, tabelas de recursos, índices vetoriais, ferramentas e muito mais são gerenciados centralmente pelo Unity Catalog. Ao implantar agentes, a autenticação para acesso a agentes, dados e ferramentas pode ser controlada com precisão, utilizando tanto a autenticação direta quanto a autenticação em nome do usuário.

  • Integração de dados do Lakehouse : Aproveite os espaços e painéis AI/BI Genie spaces e Databricks SQL para analisar logs e rastreamentos de experimentos MLflow .

  • Segurança e gerenciamento : as permissões do MLflow seguem os mesmos padrões de governança da plataforma Databricks em geral:

  • Auditoria : As tabelas do sistema fornecem logs de uso e auditoria para o gerenciamento MLflow.

alojamento totalmente gerido em servidores prontos para produção

  • Totalmente gerenciado : Databricks fornece servidores MLflow com atualizações automáticas, projetados para escalabilidade e produção. Para mais detalhes, consulte os limites de recursos.
  • Plataforma confiável : gerenciar MLflow é utilizado por milhares de clientes em todo o mundo.

Integrações para desenvolvimento e produção

O desenvolvimento de AI e ML é otimizado por integrações como:

AI e ML de produção são facilitados por integrações como:

nota

A coleta de telemetria de código aberto foi introduzida no MLflow 3.2.0. e está desativado por default no Databricks . Para obter mais detalhes, consulte a documentação de acompanhamento de usoMLflow.

Próximas etapas

Comece a usar MLflow no Databricks:

Material de referência relacionado: