Use Scikit-Learn em Databricks

Esta página fornece exemplos de como você pode usar o pacote scikit-learn para ensinar modelo de machine learning no Databricks. Scikit-Learn é uma das bibliotecas Python mais populares para machine learning de nó único e está incluída no Databricks Runtime e no Databricks Runtime ML. Consulte as notas sobre a versão do Databricks Runtime para obter a versão da biblioteca Scikit-Learn incluída no tempo de execução dos seus clusters .

Você pode importar esses Notebook e executá-los em seu espaço de trabalho do Databricks.

Para obter exemplos adicionais Notebook para começar rapidamente no Databricks, consulte Tutoriais: Introdução ao ML.

Exemplo básico usando Scikit-Learn

Este Notebook fornece uma visão geral rápida do modelo de treinamento machine learning no Databricks. Ele usa o pacote scikit-learn para ensinar um modelo de classificação simples. Ele também ilustra o uso do MLflow para rastrear o processo de desenvolvimento do modelo e do Hyperopt para automatizar o ajuste de hiperparâmetros.

Notebook de classificação Scikit-Learn

Abra o bloco de anotações em outra guia

Exemplo completo usando Scikit-Learn no Databricks

Este Notebook usa Scikit-Learn para ilustrar um exemplo completo de carregamento de dados, treinamento de modelo, ajuste de hiperparâmetros distribuídos e inferência de modelo. Ele também ilustra o gerenciamento do ciclo de vida do modelo usando MLflow Model Registry para logs e registrar seu modelo.

Use Scikit-Learn com Notebook de integração do MLflow

Abra o bloco de anotações em outra guia