Use Scikit-Learn em Databricks
Esta página fornece exemplos de como você pode usar o pacote scikit-learn
para ensinar modelo de machine learning no Databricks. Scikit-Learn é uma das bibliotecas Python mais populares para machine learning de nó único e está incluída no Databricks Runtime e no Databricks Runtime ML. Consulte as notas sobre a versão do Databricks Runtime para obter a versão da biblioteca Scikit-Learn incluída no tempo de execução dos seus clusters .
Você pode importar esses Notebook e executá-los em seu espaço de trabalho do Databricks.
Para obter exemplos adicionais Notebook para começar rapidamente no Databricks, consulte Tutoriais: Introdução ao ML.
Exemplo básico usando Scikit-Learn
Este Notebook fornece uma visão geral rápida do modelo de treinamento machine learning no Databricks. Ele usa o pacote scikit-learn
para ensinar um modelo de classificação simples. Ele também ilustra o uso do MLflow para rastrear o processo de desenvolvimento do modelo e do Hyperopt para automatizar o ajuste de hiperparâmetros.
Exemplo completo usando Scikit-Learn no Databricks
Este Notebook usa Scikit-Learn para ilustrar um exemplo completo de carregamento de dados, treinamento de modelo, ajuste de hiperparâmetros distribuídos e inferência de modelo. Ele também ilustra o gerenciamento do ciclo de vida do modelo usando MLflow Model Registry para logs e registrar seu modelo.