Databricksで Apache Spark MLlib を使用する
このページでは、Databricks で MLlib を使用する方法を示すノートブックの例を示します。
Apache Spark MLlib は、分類、回帰、クラスター、協調フィルター処理、次元削減、基になる最適化プリミティブなど、一般的な学習アルゴリズムとユーティリティで構成される Apache Spark 機械学習ライブラリです。 MLlib の機能に関するリファレンス情報については、次の Apache Spark API リファレンス Databricks お勧めします。
R から Apache Spark MLlib を使用する方法については、 R 機械学習 のドキュメントを参照してください。
二項分類の例 ノートブック
このノートブックでは、Apache Spark MLlib パイプライン API を使用して二項分類アプリケーションを構築する方法を示します。
決定木のサンプルノートブック
これらの例では、Apache Spark MLlib パイプライン API を使用した決定木のさまざまなアプリケーションを示します。
決定木
これらのノートブックでは、決定木を使用して分類を実行する方法を示します。
MLlib パイプラインを使用した GBT 回帰
このノートブックでは、MLlib パイプラインを使用して、勾配ブースト ツリーを使用して回帰を実行し、曜日、天気、季節などの情報から自転車のレンタル数 (時間あたり) を予測する方法を示します。
高度な Apache Spark MLlib ノートブックの例
このノートブックでは、カスタム トランスフォーマーを作成する方法を示します。