Usar o Apache Spark MLlib no Databricks
Esta página fornece um exemplo de Notebook que mostra como usar o MLlib em Databricks.
Apache Spark MLlib é a Apache Spark biblioteca do aprendizado de máquina que consiste em algoritmos e utilidades comuns de aprendizado, incluindo classificação, regressão, clustering, filtragem colaborativa, redução de dimensionalidade e primitivos de otimização subjacentes. Para obter informações de referência sobre MLlib recurso, Databricks recomenda as seguintes referências Apache Spark API :
Para obter informações sobre o uso do site Apache Spark MLlib do R, consulte a documentação de aprendizado de máquina do R.
Exemplo de classificação binária Notebook
Este Notebook mostra como criar um aplicativo de classificação binária usando o pipeline Apache Spark MLlib API.
Notebook de classificação binária
Exemplo de árvores de decisão Notebook
Esses exemplos demonstram várias aplicações de árvores de decisão usando o pipeline Apache Spark MLlib API.
Árvores de decisão
Este Notebook mostra ao senhor como realizar classificações com árvores de decisão.
Árvores de decisão para reconhecimento de dígitos Notebook
Árvores de decisão para a pesquisa da SFO Notebook
Regressão GBT usando o pipeline MLlib
Este Notebook mostra como usar o pipeline MLlib para realizar uma regressão usando árvores com gradiente impulsionado para prever a contagem de aluguel de bicicletas (por hora) a partir de informações como dia da semana, clima, estação do ano e assim por diante.
Regressão de compartilhamento de bicicletas Notebook
Avançado Apache Spark MLlib Exemplo de notebook
Este Notebook ilustra como criar um transformador personalizado.