Use Apache Spark MLlib em Databricks
Esta página fornece um exemplo Notebook mostrando como usar o MLlib no Databricks.
Apache Spark MLlib é a biblioteca machine learning do Apache Spark que consiste em algoritmos de aprendizagem comuns e utilidades, incluindo classificação, regressão, clusters, filtragem colaborativa, redução de dimensionalidade e primitivas de otimização subjacentes. Para obter informações de referência sobre os recursos do MLlib, a Databricks recomenda as seguintes referências Spark API :
Para obter informações sobre como usar o Apache Spark MLlib do R, consulte a documentação machine learningdo R.
Exemplo de classificação binária Notebook
Este Notebook mostra como construir um aplicativo de classificação binária usando a API pipeline Apache Spark MLlib.
Exemplo de árvores de decisão Notebook
Estes exemplos demonstram várias aplicações de árvores de decisão usando a API pipeline Apache Spark MLlib.