Tutorial: modelos de ML de ponta a ponta no Databricks

Machine learning no mundo real é confuso. As fontes de dados contêm valores ausentes, incluem linhas redundantes ou podem não caber na memória. A criação de recursos frequentemente exige conhecimento especializado no domínio e pode ser trabalhosa. Com muita frequência, a modelagem mistura ciência de dados e engenharia de sistemas, exigindo não apenas conhecimento de algoritmos, mas também de arquitetura de máquinas e sistemas distribuídos.

Databricks simplifica esse processo. O notebook de tutorial de 10 minutos a seguir mostra um exemplo completo de treinamento de modelos de aprendizado de máquina em dados tabulares.

Você pode importar este notebook e executá-lo sozinho ou copiar trechos de código e ideias para seu próprio uso.

Notebook

Se o seu workspace estiver habilitado para Unity Catalog, use esta versão do Notebook:

Use Scikit-Learn com a integração de MLflow em Databricks (Unity Catalog)

Abra o bloco de anotações em outra guia

Se o seu workspace não estiver habilitado para Unity Catalog, use esta versão do Notebook:

Use o site Scikit-Learn com a integração MLflow no Databricks

Abra o bloco de anotações em outra guia