Exemplos de treinamento de modelos

Esta seção inclui exemplos que mostram como ensinar modelo de aprendizado de máquina em Databricks usando muitas bibliotecas populares de código aberto.

Você também pode usar o AutoML, que prepara automaticamente um conjunto de dados para treinamento de modelo, realiza um conjunto de tentativas utilizando bibliotecas de código aberto como scikit-learn e XGBoost, e cria um notebook Python com o código-fonte para cada tentativa, para que você possa revisar, reproduzir e modificar o código.

Para obter um notebook de exemplo que mostra como treinar um modelo de machine learning que usa dados no Unity Catalog e gravar previsões de volta no Unity Catalog, consulte Treinar e registrar modelos de machine learning com o Unity Catalog.

Exemplos de machine learning

Pacote

Notebook(s)

Recursos

scikit-learn

Tutorial de machine learning

Modelo de classificação, MLflow, ajuste automatizado de hiperparâmetro com Hyperopt e MLflow

scikit-learn

Exemplo de ponta a ponta

Modelo de classificação, MLflow, ajuste automatizado de hiperparâmetros com Hyperopt e MLflow, XGBoost, Model Registry, Model Serving

MLlib

Exemplos de MLlib

Classificação binária, árvores de decisão, regressão GBT, Structured Streaming, transformador personalizado

xgboost

Exemplos do XGBoost

Python, PySpark e Scala, workloads de nó único e treinamento distribuído

Exemplos de ajuste de hiperparâmetros

Para obter informações gerais sobre o ajuste de hiperparâmetros no Databricks, consulte Ajuste de hiperparâmetros.

Pacote

Notebook

Recursos

Hyperopt

Hyperopt distribuído

Hyperopt distribuído, scikit-learn, MLflow

Hyperopt

Comparar modelos

Utilize o hyperopt distribuído para buscar o espaço de hiperparâmetros para diferentes tipos de modelos simultaneamente.

Hyperopt

Algoritmos de treinamento distribuído e hyperopt

Hyperopt, MLlib

Hyperopt

Melhores práticas da Hyperopt

Práticas recomendadas para conjuntos de dados de tamanhos diferentes