Databricks で Scikit-Learn を使用する
このページでは、 scikit-learn
パッケージを使用して Databricks で機械学習モデルをトレーニングする方法の例を示します。 Scikit-Learn は、単一ノード 機械学習で最も人気のある Python ライブラリの 1 つであり、Databricks ランタイムと Databricks Runtime 機械学習に含まれています。クラスターのランタイムに含まれる Scikit-Learn ライブラリのバージョンについては 、 Databricks Runtimeリリースノート を参照してください。
これらのノートブックをインポートして、Databricks ワークスペースで実行できます。
Databricks ですぐに開始するための追加のサンプル ノートブックについては、「 チュートリアル: 機械学習の概要」を参照してください。
Scikit-Learn を使用した基本的な例
このノートブックでは、Databricks での機械学習モデルのトレーニングの概要を簡単に説明します。 scikit-learn
パッケージを使用して、単純な分類モデルをトレーニングします。また、 MLflow を使用してモデル開発プロセスを追跡し、 Hyperopt を使用してハイパーパラメーターの調整を自動化する方法についても説明します。