Use Scikit-Learn em Databricks

Esta página fornece exemplos de como você pode usar o pacote scikit-learn para ensinar modelo de machine learning no Databricks. Scikit-Learn é uma das bibliotecas Python mais populares para machine learning de nó único e está incluída no Databricks Runtime e no Databricks Runtime ML. Consulte as notas sobre a versão do Databricks Runtime para obter a versão da biblioteca Scikit-Learn incluída no tempo de execução dos seus clusters .

Você pode importar esses Notebook e executá-los em seu espaço de trabalho do Databricks.

Para obter um exemplo adicional do Notebook para começar rapidamente em Databricks, consulte o tutorial: Get começar with IA and machine learning.

Exemplo básico usando Scikit-Learn

Este Notebook fornece uma visão geral rápida do modelo do machine learning treinamento em Databricks. Ele usa o pacote scikit-learn para ensinar um modelo de classificação simples. Ele também ilustra o uso do MLflow para rastrear o processo de desenvolvimento do modelo e do Optuna para automatizar o ajuste do hiperparâmetro.

Se o seu workspace estiver habilitado para Unity Catalog, use esta versão do Notebook:

Scikit-Learn Classificação Notebook (Unity Catalog)

Abra o bloco de anotações em outra guia

Se o seu workspace não estiver habilitado para Unity Catalog, use esta versão do Notebook:

Notebook de classificação Scikit-Learn

Abra o bloco de anotações em outra guia

Exemplo completo usando Scikit-Learn no Databricks

Este Notebook usa Scikit-Learn para ilustrar um exemplo completo de carregamento de dados, treinamento de modelo, ajuste de hiperparâmetros distribuídos e inferência de modelo. Ele também ilustra o gerenciamento do ciclo de vida do modelo usando MLflow Model Registry para logs e registrar seu modelo.

Se o seu workspace estiver habilitado para Unity Catalog, use esta versão do Notebook:

Use Scikit-Learn com a integração de MLflow em Databricks (Unity Catalog)

Abra o bloco de anotações em outra guia

Se o seu workspace não estiver habilitado para Unity Catalog, use esta versão do Notebook:

Use o site Scikit-Learn com a integração MLflow no Databricks

Abra o bloco de anotações em outra guia