Pular para o conteúdo principal

Usar o scikit-learn no Databricks

Esta página fornece exemplos de como o senhor pode usar o pacote scikit-learn para treinar modelos de aprendizado de máquina em Databricks. scikit-learn é uma das mais populares Python biblioteca para aprendizado de máquina de nó único e está incluída em Databricks Runtime e Databricks Runtime ML. Consulte Databricks Runtime notas sobre a versão para obter a versão da biblioteca scikit-learn incluída no tempo de execução do seu clustering.

O senhor pode importar esse Notebook e executá-lo em seu site Databricks workspace.

Para obter um exemplo adicional do Notebook para começar rapidamente em Databricks, consulte o tutorial: Obter começar com AI e aprendizado de máquina.

Exemplo básico usando o scikit-learn

Este Notebook fornece uma visão geral rápida do treinamento do modelo do aprendizado de máquina em Databricks. Ele usa o pacote scikit-learn para treinar um modelo de classificação simples. Ele também ilustra o uso do MLflow para rastrear o processo de desenvolvimento do modelo e do Optuna para automatizar o ajuste do hiperparâmetro.

Se o seu workspace estiver habilitado para Unity Catalog, use essa versão do Notebook:

scikit-learn Caderno de classificação (Unity Catalog)

Open notebook in new tab

Se o seu workspace não estiver habilitado para Unity Catalog, use esta versão do Notebook:

scikit-learn Caderno de classificação

Open notebook in new tab

Exemplo de ponta a ponta usando o scikit-learn no Databricks

Este Notebook usa o site scikit-learn para ilustrar um exemplo completo de ponta a ponta de carregamento de dados, treinamento de modelos, ajuste de hiperparâmetros distribuídos e inferência de modelos. Ele também ilustra o gerenciamento do ciclo de vida do modelo usando o site MLflow Model Registry para log e registrar o modelo.

Se o seu workspace estiver habilitado para Unity Catalog, use essa versão do Notebook:

Use o scikit-learn com a integração do MLflow no Databricks (Unity Catalog)

Open notebook in new tab

Se o seu workspace não estiver habilitado para Unity Catalog, use esta versão do Notebook:

Use o scikit-learn com a integração do MLflow no Databricks

Open notebook in new tab