Databricksで Apache Spark MLlib を使用する

このページでは、Databricks で MLlib を使用する方法を示すノートブックの例を示します。

Apache Spark MLlib は、分類、回帰、クラスター、協調フィルター処理、次元削減、基になる最適化プリミティブなど、一般的な学習アルゴリズムとユーティリティで構成される Apache Spark 機械学習ライブラリです。 MLlib の機能に関するリファレンス情報については、次の Apache Spark API リファレンス Databricks お勧めします。

R から Apache Spark MLlib を使用する方法については、 R 機械学習 のドキュメントを参照してください。

二項分類の例 ノートブック

このノートブックでは、Apache Spark MLlib パイプライン API を使用して二項分類アプリケーションを構築する方法を示します。

二項分類ノートブック

ノートブックを新しいタブで開く

決定木のサンプルノートブック

これらの例では、Apache Spark MLlib パイプライン API を使用した決定木のさまざまなアプリケーションを示します。

決定木

これらのノートブックでは、決定木を使用して分類を実行する方法を示します。

数字認識のための決定木 ノートブック

ノートブックを新しいタブで開く

SFO 調査の決定木ノートブック

ノートブックを新しいタブで開く

MLlib パイプラインを使用した GBT 回帰

このノートブックでは、MLlib パイプラインを使用して、勾配ブースト ツリーを使用して回帰を実行し、曜日、天気、季節などの情報から自転車のレンタル数 (時間あたり) を予測する方法を示します。

自転車シェアリング回帰ノートブック

ノートブックを新しいタブで開く

高度な Apache Spark MLlib ノートブックの例

このノートブックでは、カスタム トランスフォーマーを作成する方法を示します。

カスタムTransformerノートブック

ノートブックを新しいタブで開く