メインコンテンツまでスキップ

Databricks で Apache Spark MLlib を使用する

このページでは、Databricks で MLlib を使用する方法を示すノートブックの例を示します。

Apache Spark MLlib は、分類、回帰、クラスタリング、協調フィルタリング、次元削減、基になる最適化プリミティブなど、一般的な学習アルゴリズムとユーティリティで構成される Apache Spark 機械学習ライブラリです。 MLlib 機能に関する参照情報については、Databricks では次の Apache Spark API リファレンスをお勧めします。

R からの Apache Spark MLlib の使用に関する情報については、 R 機械学習 のドキュメントを参照してください。

二項分類の例ノートブック

このノートブックでは、 Apache Spark MLlib パイプライン APIを使用して二項分類アプリケーションを構築する方法を示します。

二項分類ノートブック

Open notebook in new tab

決定木 example ノートブック

これらの例では、Apache Spark MLlib パイプライン API を使用した決定木のさまざまなアプリケーションを示します。

決定木

これらのノートブックでは、決定木を使用して分類を実行する方法を示します。

決定木 for digit recognition ノートブック

Open notebook in new tab

決定木 for SFO survey ノートブック

Open notebook in new tab

MLlib パイプラインを使用した GBT 回帰

このノートブックでは、MLlib パイプラインを使用して、勾配ブースト ツリーを使用して回帰を実行し、曜日、天気、季節などの情報から自転車のレンタル数 (時間あたり) を予測する方法を示します。

自転車シェアリングリグレッションノートブック

Open notebook in new tab

高度な Apache Spark MLlib ノートブックの例

このノートブックでは、カスタム トランスフォーマーを作成する方法について説明します。

カスタムトランスフォーマーノートブック

Open notebook in new tab