メインコンテンツまでスキップ

システムテーブルで MLflow メタデータを使用してダッシュボードを構築する

備考

プレビュー

この機能は パブリック プレビュー段階です。

システムテーブルのMLflowメタデータを使用して、ダッシュボードを構築して、ワークスペース全体におけるMLflowエクスペリメントやランを分析できます。これらのタスクに既存の MLflow UI と REST API を使用するには、広範囲にわたる時間のかかる反復が必要になります。

単一ラン詳細のダッシュボード

MLflow データの視覚化を開始するには、 このダッシュボード例 を JSON ファイルとしてダウンロードし、 ワークスペースにインポートします。このダッシュボードには、MLflow UI のラン詳細ページに表示される内容を複製するためのデータのスケルトンが含まれています。

特定のエクスペリメント ID、ラン ID、およびメトリクス名に対して、ランの詳細とタグ、パラメーター、およびメトリクス グラフが表示されます。 エクスペリメント ID と ラン ID は、ランの詳細ページから、UI と URL https://<workspace>.databricks.com/ml/experiments/<experiment_id>/runs/<run_id>自体の両方から取得できます。

ランとエクスペリメントのID

左側のナビゲーション・メニューからダッシュボード・パネルに移動すると、 ここで JSON ファイル定義からダッシュボードをインポートできます。そこからプロットするために、上部の入力ボックスを使用して、ワークスペースで関連する ランとエクスペリメントをフィルター処理できます。 クエリを自由に探索し、ニーズに合わせてプロットを変更してください。

ランの詳細ダッシュボード

ダッシュボードのクエリ

エクスペリメント全体の平均GPU使用率を監視するダッシュボード

上のダッシュボードの4番目のタブで、 メトリクス 名前を入力すると、特定の時間枠内のそのメトリクスを含むすべてのエクスペリメントの概要統計を取得できます。 この情報は、 監視 システム メトリクス MLflow によって記録された ワークスペース 非効率的なCPU、メモリ、またはGPUの使用率を監視します。

平均 GPU 使用率ダッシュボード

この例では、いくつかの エクスペリメント 平均GPU使用率が10%未満で、調査することをお勧めします。