Usar o Apache Spark MLlib no Databricks

Esta página fornece um exemplo de Notebook que mostra como usar o MLlib em Databricks.

Apache Spark MLlib é a Apache Spark biblioteca do aprendizado de máquina que consiste em algoritmos e utilidades comuns de aprendizado, incluindo classificação, regressão, clustering, filtragem colaborativa, redução de dimensionalidade e primitivos de otimização subjacentes. Para obter informações de referência sobre MLlib recurso, Databricks recomenda as seguintes referências Apache Spark API :

O pacote pyspark.ml do Apache Spark MLlib é suportado em compute serverless, padrão e dedicada.

Para obter informações sobre o uso do site Apache Spark MLlib do R, consulte a documentação de aprendizado de máquina do R.

Exemplo de classificação binária Notebook

Este Notebook mostra como criar um aplicativo de classificação binária usando o pipeline Apache Spark MLlib API.

Notebook de classificação binária

Abrir notebook em uma nova aba Open in Databricks

Exemplo de árvores de decisão Notebook

Esses exemplos demonstram várias aplicações de árvores de decisão usando o pipeline Apache Spark MLlib API.

Árvores de decisão

Este Notebook mostra ao senhor como realizar classificações com árvores de decisão.

Árvores de decisão para reconhecimento de dígitos Notebook

Abrir notebook em uma nova aba Open in Databricks

Árvores de decisão para a pesquisa da SFO Notebook

Abrir notebook em uma nova aba Open in Databricks

Regressão GBT usando o pipeline MLlib

Este Notebook mostra como usar o pipeline MLlib para realizar uma regressão usando árvores com gradiente impulsionado para prever a contagem de aluguel de bicicletas (por hora) a partir de informações como dia da semana, clima, estação do ano e assim por diante.

Regressão de compartilhamento de bicicletas Notebook

Abrir notebook em uma nova aba Open in Databricks

Avançado Apache Spark MLlib Exemplo de notebook

Este Notebook ilustra como criar um transformador personalizado.

Notebook de transformador personalizado

Abrir notebook em uma nova aba Open in Databricks

Exemplo de classificação binária Notebook​

Notebook de classificação binária

Exemplo de árvores de decisão Notebook​

Árvores de decisão​

Árvores de decisão para reconhecimento de dígitos Notebook

Árvores de decisão para a pesquisa da SFO Notebook

Regressão GBT usando o pipeline MLlib​

Regressão de compartilhamento de bicicletas Notebook

Avançado Apache Spark MLlib Exemplo de notebook​

Notebook de transformador personalizado

Exemplo de classificação binária Notebook

Exemplo de árvores de decisão Notebook

Árvores de decisão

Regressão GBT usando o pipeline MLlib

Avançado Apache Spark MLlib Exemplo de notebook