Databricks で Scikit-Learn を使用す

このページでは、 scikit-learn パッケージを使用して Databricks で機械学習モデルをトレーニングする方法の例を示します。 Scikit-Learn は、単一ノード 機械学習で最も人気のある Python ライブラリの 1 つであり、Databricks ランタイムと Databricks Runtime 機械学習に含まれています。クラスターのランタイムに含まれる Scikit-Learn ライブラリのバージョンについては 、 Databricks Runtimeリリースノート を参照してください。

これらのノートブックをインポートして、Databricks ワークスペースで実行できます。

Databricks ですぐに開始するための追加のサンプル ノートブックについては、「 チュートリアル: 機械学習の概要」を参照してください。

Scikit-Learn を使用した基本的な例

このノートブックでは、Databricks での機械学習モデルのトレーニングの概要を簡単に説明します。 scikit-learn パッケージを使用して、単純な分類モデルをトレーニングします。また、 MLflow を使用してモデル開発プロセスを追跡し、 Hyperopt を使用してハイパーパラメーターの調整を自動化する方法についても説明します。

scikit-learn classification ノートブック

ノートブックを新しいタブで開く

Databricks で Scikit-Learn を使用したエンドツーエンドの

このノートブックでは、 Scikit-Learn を使用して、データの読み込み、モデルのトレーニング、分散ハイパーパラメーターの調整、モデル推論の完全なエンドツーエンドの例を示します。 また、 MLflow Model Registry を使用してモデルをログに記録および登録するモデル ライフサイクル管理についても説明します。

MLflow 統合ノートブック で Scikit-Learn を使用する

ノートブックを新しいタブで開く