Exemplos de treinamento de modelos
Esta seção inclui exemplos que mostram como ensinar modelo de aprendizado de máquina em Databricks usando muitas bibliotecas populares de código aberto.
Você também pode usar o AutoML, que prepara automaticamente um conjunto de dados para treinamento de modelo, realiza um conjunto de tentativas utilizando bibliotecas de código aberto como scikit-learn e XGBoost, e cria um notebook Python com o código-fonte para cada tentativa, para que você possa revisar, reproduzir e modificar o código.
Para obter um notebook de exemplo que mostra como treinar um modelo de machine learning que usa dados no Unity Catalog e gravar previsões de volta no Unity Catalog, consulte Treinar e registrar modelos de machine learning com o Unity Catalog.
Exemplos de machine learning
Pacote |
Notebook(s) |
Recursos |
---|---|---|
scikit-learn |
Modelo de classificação, MLflow, ajuste automatizado de hiperparâmetro com Hyperopt e MLflow |
|
scikit-learn |
Modelo de classificação, MLflow, ajuste automatizado de hiperparâmetros com Hyperopt e MLflow, XGBoost, Model Registry, Model Serving |
|
MLlib |
Classificação binária, árvores de decisão, regressão GBT, Structured Streaming, transformador personalizado |
|
xgboost |
Python, PySpark e Scala, workloads de nó único e treinamento distribuído |
Exemplos de ajuste de hiperparâmetros
Para obter informações gerais sobre o ajuste de hiperparâmetros no Databricks, consulte Ajuste de hiperparâmetros.
Pacote |
Notebook |
Recursos |
---|---|---|
Hyperopt |
Hyperopt distribuído, scikit-learn, MLflow |
|
Hyperopt |
Utilize o hyperopt distribuído para buscar o espaço de hiperparâmetros para diferentes tipos de modelos simultaneamente. |
|
Hyperopt |
Hyperopt, MLlib |
|
Hyperopt |
Práticas recomendadas para conjuntos de dados de tamanhos diferentes |