モデルトレーニングの例

このセクションでは、多くの一般的なオープンソースライブラリを使用して Databricks で機械学習モデルをトレーニングする方法を示す例を紹介します。

また、 AutoML を使用すると、モデルトレーニング用のデータセットが自動的に準備され、scikit-learn や XGBoost などのオープンソースライブラリを使用して一連の試用版が実行され、各試用版の実行のソースコードを含む Python ノートブックが作成されるため、コードを確認、再現、変更できます。

機械学習の例

パッケージ	ノートブック	機能
Scikit-Learn	機械学習のチュートリアル	Unity Catalog、分類モデル、MLflow、HyperoptとMLflowによる自動ハイパーパラメーターチューニング
Scikit-Learn	エンドツーエンドの例	Unity Catalog、分類モデル、 MLflow、 Hyperopt and MLflowによる自動ハイパーパラメーターチューニング、 XGBoost
MLlib	MLLibの例	二項分類、決定木、GBT回帰、構造化ストリーミング、カスタムトランスフォーマー
XGBoost	XGBoostの例	Python、PySpark、Scala、シングルノードワークロード、分散トレーニング

パッケージ	ノートブック	機能
Scikit-Learn	機械学習のチュートリアル	Unity Catalog、分類モデル、MLflow、HyperoptとMLflowによる自動ハイパーパラメーターチューニング
Scikit-Learn	エンドツーエンドの例	Unity Catalog、分類モデル、 MLflow、 Hyperopt and MLflowによる自動ハイパーパラメーターチューニング、 XGBoost
MLlib	MLLibの例	二項分類、決定木、GBT回帰、構造化ストリーミング、カスタムトランスフォーマー
XGBoost	XGBoostの例	Python、PySpark、Scala、シングルノードワークロード、分散トレーニング

ハイパーパラメーターチューニングの例

Databricksでのハイパーパラメーターチューニングに関する一般的な情報については、ハイパーパラメーターチューニングを参照してください。

注記

Hyperoptのオープンソース版は現在メンテナンスされていません。

Hyperoptは、Databricks Runtime for Machine Learning 16.4 LTS ML以降には含まれていません。Databricks 、単一ノードの最適化にはOptuna を使用するか、非推奨のHyperopt分散ハイパーチューニング機能と同様のエクスペリエンスにはRayTune を使用することをお勧めします。 DatabricksでRayTuneを使用する方法について詳しくはこちらをご覧ください。

パッケージ	ノートブック	機能
オプツナ	Optunaを始めよう	Optuna、分散Optuna、scikit-learn、MLflow
Hyperopt	分散hyperopt	分散hyperopt、Scikit-Learn、MLflow
Hyperopt	モデルの比較	分散hyperoptを使用して、ハイパーパラメータ空間でさまざまなモデルタイプを同時に検索する
Hyperopt	分散トレーニングのアルゴリズムとhyperopt	Hyperopt、MLlib
Hyperopt	Hyperoptのベストプラクティス	さまざまなサイズのデータセットのベストプラクティス

パッケージ	ノートブック	機能
オプツナ	Optunaを始めよう	Optuna、分散Optuna、scikit-learn、MLflow
Hyperopt	分散hyperopt	分散hyperopt、Scikit-Learn、MLflow
Hyperopt	モデルの比較	分散hyperoptを使用して、ハイパーパラメータ空間でさまざまなモデルタイプを同時に検索する
Hyperopt	分散トレーニングのアルゴリズムとhyperopt	Hyperopt、MLlib
Hyperopt	Hyperoptのベストプラクティス	さまざまなサイズのデータセットのベストプラクティス

機械学習の例​

ハイパーパラメーターチューニングの例​

機械学習の例

ハイパーパラメーターチューニングの例