Usar o scikit-learn no Databricks
Esta página fornece exemplos de como o senhor pode usar o pacote scikit-learn
para treinar modelos de aprendizado de máquina em Databricks. scikit-learn é uma das mais populares Python biblioteca para aprendizado de máquina de nó único e está incluída em Databricks Runtime e Databricks Runtime ML. Consulte Databricks Runtime notas sobre a versão para obter a versão da biblioteca scikit-learn incluída no tempo de execução do seu clustering.
O senhor pode importar esse Notebook e executá-lo em seu site Databricks workspace.
Para obter um exemplo adicional do Notebook para começar rapidamente em Databricks, consulte o tutorial: Obter começar com AI e aprendizado de máquina.
Exemplo básico usando o scikit-learn
Este Notebook fornece uma visão geral rápida do treinamento do modelo do aprendizado de máquina em Databricks. Ele usa o pacote scikit-learn
para treinar um modelo de classificação simples. Ele também ilustra o uso do MLflow para rastrear o processo de desenvolvimento do modelo e do Optuna para automatizar o ajuste do hiperparâmetro.
Se o seu workspace estiver habilitado para Unity Catalog, use essa versão do Notebook:
scikit-learn Caderno de classificação (Unity Catalog)
Se o seu workspace não estiver habilitado para Unity Catalog, use esta versão do Notebook:
scikit-learn Caderno de classificação
Exemplo de ponta a ponta usando o scikit-learn no Databricks
Este Notebook usa o site scikit-learn para ilustrar um exemplo completo de ponta a ponta de carregamento de dados, treinamento de modelos, ajuste de hiperparâmetros distribuídos e inferência de modelos. Ele também ilustra o gerenciamento do ciclo de vida do modelo usando o site MLflow Model Registry para log e registrar o modelo.
Se o seu workspace estiver habilitado para Unity Catalog, use essa versão do Notebook:
Use o scikit-learn com a integração do MLflow no Databricks (Unity Catalog)
Se o seu workspace não estiver habilitado para Unity Catalog, use esta versão do Notebook: