MLflow エクスペリメント の使用を開始する

このノートブックのコレクションは、MLflow エクスペリメントの実行を開始する方法を示しています。

MLflow コンポーネント

MLflow は、エンドツーエンドの機械学習ライフサイクルを管理するための オープンソース プラットフォームです。 MLflow には、次の 3 つの主要なコンポーネントがあります。

  • トラッキング

  • モデル

  • プロジェクト

MLflow 追跡コンポーネントを使用すると、次の APIs を使用して、マシン モデルのトレーニング セッション ( 実行 ) をログに記録してクエリーできます。

MLflow の実行 は、機械学習モデルのトレーニング プロセスに関連付けられているパラメーター、メトリクス、タグ、成果物のコレクションです。

MLflow のエクスペリメントとは何ですか?

エクスペリメント は、MLflow の組織の主要な単位です。すべての MLflow 実行はエクスペリメントに属します。 各エクスペリメントを使用すると、実行を視覚化、検索、比較したり、他のツールで分析するために実行成果物やメタデータをダウンロードしたりできます。 エクスペリメントは、Databricks でホストされる MLflow 追跡サーバーで管理されます。

エクスペリメントは、 ワークスペース のファイルツリーにあります。 エクスペリメントは、フォルダー、ノートブック、ライブラリなどの他のワークスペース オブジェクトの管理に使用するのと同じツールを使用して管理します。

MLflow サンプル ノートブック

次のノートブックでは、MLflow 追跡 APIsを使用して MLflow 実行を作成してログに記録する方法と、エクスペリメント UI を使用して実行を表示する方法を示します。 これらのノートブックは、Python、Scala、R で使用できます。

Python ノートブックと R ノートブックは、 ノートブック エクスペリメントを使用します。 Scala ノートブックは、 Shared フォルダーにエクスペリメントを作成します。

Databricks Runtime 10.4 LTS 機械学習以降では、Python ノートブックの Databricks Autologging がデフォルトによって有効になります。