Hyperopt で分散トレーニングアルゴリズムを使用する

注記

Hyperopt のオープンソースバージョンは保守されなくなりました。

Hyperopt は、次のメジャー DBR ML バージョンで削除されます。 Databricks、単一ノードの最適化にはOptunaを使用するか、非推奨の分散ハイパーパラメーターチューニング機能と同様のエクスペリエンスのためにRayTuneHyperoptを使用することをお勧めします。Databricks での RayTune の使用の詳細については、こちらをご覧ください。

scikit-learn のような単一マシンのトレーニングアルゴリズムに加えて、Hyperopt を分散トレーニングアルゴリズムと共に使用できます。このシナリオでは、Hyperopt はドライバーノードで異なるハイパーパラメーター設定の試用版を生成します。各試用版はドライバーノードから実行され、完全なクラスターリソースにアクセスできます。この設定は、Apache Spark MLlib や HorovodRunner など、任意の分散機械学習アルゴリズムまたはライブラリで動作します。

分散トレーニングアルゴリズムで Hyperopt を使用する場合は、fmin()に trials 引数を渡さないでください。具体的には、SparkTrials クラスを使用しないでください。SparkTrials は、それ自体が分散されていないアルゴリズムの試行を分散するように設計されています。分散トレーニングアルゴリズムでは、クラスタードライバーで実行される Default Trials クラスを使用します。 Hyperopt は、ML アルゴリズム自体が分散トレーニングを開始できるように、ドライバーノードで各試行を評価します。

注記

Databricks では、 Trials クラスを使用した MLflow への自動ログ記録はサポートされていません。分散トレーニングアルゴリズムを使用する場合は、MLflow を手動で呼び出して、Hyperopt の試用版をログに記録する必要があります。

ノートブックの例: Hyperopt と MLlib アルゴリズムを使用する

サンプルノートブックでは、Hyperopt を使用して MLlib の分散トレーニングアルゴリズムを調整する方法を示します。

Hyperopt と MLlib の分散トレーニングノートブック

Open notebook in new tab

ノートブックの例: HorovodRunner で Hyperopt を使用する

HorovodRunner は、Databricks で分散ディープラーニングワークロードを実行するために使用される一般的な API です。HorovodRunner は、Horovod を Sparkのバリアモードと統合して、Sparkで長時間実行されるディープラーニングトレーニングジョブの安定性を高めます。

このノートブックの例は、 Hyperopt を使用して、 HorovodRunnerに基づいてディープラーニングの分散トレーニングを調整する方法を示しています。

Hyperopt と HorovodRunner の分散トレーニングノートブック

Open notebook in new tab

ノートブックの例: Hyperopt と MLlib アルゴリズムを使用する​

Hyperopt と MLlib の分散トレーニング ノートブック

ノートブックの例: HorovodRunner で Hyperopt を使用する​

Hyperopt と HorovodRunner の分散トレーニング ノートブック

ノートブックの例: Hyperopt と MLlib アルゴリズムを使用する

Hyperopt と MLlib の分散トレーニングノートブック

ノートブックの例: HorovodRunner で Hyperopt を使用する

Hyperopt と HorovodRunner の分散トレーニングノートブック