Databricks で Apache Spark MLlib を使用する

このページでは、Databricks で MLlib を使用する方法を示すノートブックの例を示します。

Apache Spark MLlib は、分類、回帰、クラスタリング、協調フィルタリング、次元削減、基になる最適化プリミティブなど、一般的な学習アルゴリズムとユーティリティで構成される Apache Spark 機械学習ライブラリです。 MLlib 機能に関する参照情報については、Databricks では次の Apache Spark API リファレンスをお勧めします。

Apache Spark MLlibのpyspark.mlパッケージは、サーバレス、標準、専用コンピュートでサポートされています。

R からの Apache Spark MLlib の使用に関する情報については、 R 機械学習のドキュメントを参照してください。

二項分類の例ノートブック

このノートブックでは、 Apache Spark MLlib パイプライン APIを使用して二項分類アプリケーションを構築する方法を示します。

二項分類ノートブック

ノートブックを新しいタブで開く

決定木サンプルノートブック

これらの例では、Apache Spark MLlib パイプライン API を使用した決定木のさまざまなアプリケーションを示します。

決定木

これらのノートブックでは、決定木を使用して分類を実行する方法を示します。

数字認識のための決定木ノートブック

ノートブックを新しいタブで開く

SFO サーベイのための決定技ノートブック

ノートブックを新しいタブで開く

MLlib パイプラインを使用した GBT 回帰

このノートブックでは、MLlib パイプラインを使用して、勾配ブーストツリーを使用して回帰を実行し、曜日、天気、季節などの情報から自転車のレンタル数 (時間あたり) を予測する方法を示します。

自転車シェアリング回帰ノートブック

ノートブックを新しいタブで開く

高度な Apache Spark MLlib ノートブックの例

このノートブックでは、カスタムトランスフォーマーを作成する方法について説明します。

カスタムトランスフォーマーノートブック

ノートブックを新しいタブで開く

二項分類の例ノートブック​

二項分類ノートブック

決定木 サンプル ノートブック​

決定木​

数字認識のための決定木ノートブック

SFO サーベイのための決定技 ノートブック

MLlib パイプラインを使用した GBT 回帰​

自転車シェアリング回帰ノートブック

高度な Apache Spark MLlib ノートブックの例​

カスタムトランスフォーマーノートブック

二項分類の例ノートブック

決定木サンプルノートブック

決定木

SFO サーベイのための決定技ノートブック

MLlib パイプラインを使用した GBT 回帰

高度な Apache Spark MLlib ノートブックの例