Pular para o conteúdo principal

Usar o Apache Spark MLlib no Databricks

Esta página fornece um exemplo de Notebook que mostra como usar o MLlib em Databricks.

Apache Spark MLlib é a Apache Spark biblioteca do aprendizado de máquina que consiste em algoritmos e utilidades comuns de aprendizado, incluindo classificação, regressão, clustering, filtragem colaborativa, redução de dimensionalidade e primitivos de otimização subjacentes. Para obter informações de referência sobre MLlib recurso, Databricks recomenda as seguintes referências Apache Spark API :

Para obter informações sobre o uso do site Apache Spark MLlib do R, consulte a documentação de aprendizado de máquina do R.

Exemplo de classificação binária Notebook

Este Notebook mostra como criar um aplicativo de classificação binária usando o pipeline Apache Spark MLlib API.

Notebook de classificação binária

Open notebook in new tab

Exemplo de árvores de decisão Notebook

Esses exemplos demonstram várias aplicações de árvores de decisão usando o pipeline Apache Spark MLlib API.

Árvores de decisão

Este Notebook mostra ao senhor como realizar classificações com árvores de decisão.

Árvores de decisão para reconhecimento de dígitos Notebook

Open notebook in new tab

Árvores de decisão para a pesquisa da SFO Notebook

Open notebook in new tab

Regressão GBT usando o pipeline MLlib

Este Notebook mostra como usar o pipeline MLlib para realizar uma regressão usando árvores com gradiente impulsionado para prever a contagem de aluguel de bicicletas (por hora) a partir de informações como dia da semana, clima, estação do ano e assim por diante.

Regressão de compartilhamento de bicicletas Notebook

Open notebook in new tab

Avançado Apache Spark MLlib Exemplo de notebook

Este Notebook ilustra como criar um transformador personalizado.

Notebook de transformador personalizado

Open notebook in new tab