MLflow 3.0 生成AI ワークフロー (Beta)

備考

ベータ版

この機能はベータ版です。

ノートブックの例

このサンプルノートブックでは、エージェントを作成し、MLflow にログを記録し、そのパフォーマンスを評価します。ノートブックは、 databricks-langchain、 databricks-agents、 uv、および langgraph==0.3.4 ライブラリをインストールします。このノートブックは、 LangGraph ツール呼び出しエージェントノートブックを適応させたものです。その他のノートブックの例とエージェントの作成方法の詳細については、「コードで AI エージェントを作成する」を参照してください。

MLflow 3.0 生成AIエージェントの構築、評価ノートブック

Open notebook in new tab

MLflow UI を使用してエージェントのパフォーマンスを調べる

ノートブックコードは初期テストを実行し、チェーンに対してクエリを実行して、チェーンがさらにテストするのに十分なパフォーマンスを発揮することを確認します。このテストのトレースは、MLflow UI のモデル詳細ページの トレース タブで使用できます。

複数のトレースの詳細を示すモデルページの [トレース] タブ。

ノートブックの例の評価実行では、対話型クエリと評価から 2 つの MLflow ラン、1 つの MLflow LoggedModel、およびトレースが生成されます。エージェントの評価メトリクスは、 MLflow エクスペリメントの機種詳細ページにすべて表示されています。

チェーンのMLflow UI モデルページで、メトリクスとパラメーターが表示されます。

モデル ID とモデルパラメーターとメトリクスは、 Unity Catalog モデルバージョンページにも表示されます。

複数の実行からのメトリクスを示す Unity Catalog のモデルバージョンページ。

Mosaic AI Model Serving を使用して、このモデルを任意のアプリケーションに埋め込むことができるライブエンドポイントに提供できるようになりました。サービスエンドポイントのオンライン呼び出しからのトレースは、開発フェーズからのオフライントレースと共に、Unity Catalog モデルバージョンの トレース タブにも記録されます。生成AIアプリケーションのためのエージェントのデプロイを参照してください。

Unity Catalog のモデルバージョンページの [トレース] タブには、複数のトレースの詳細が表示されます。

MLflow のトレースとフィードバックとツール呼び出しエージェントによるフィードバック

この短いチュートリアルでは、MLflow が数学的な問題を解決するときに、LangChain ツール呼び出しエージェントの詳細なトレースをキャプチャする方法を示します。これは、エージェントの実行を追跡し、エージェントの応答に関するフィードバックを格納する MLflow の機能を示しています。フィードバックは、 log_feedback API を使用してログに記録され、エージェントの品質を測定し、改善するのに非常に役立ちます。

MLflow 3.0 のトレースとフィードバックとツール呼び出しエージェントノートブック

Open notebook in new tab

詳細情報

詳細については、次のページを参照してください。

エクスペリメントページのモデルタブとMLflow カタログエクスプローラのモデルバージョンページの違いは何ですか?

エクスペリメントページの モデル タブとカタログエクスプローラーのモデルバージョンページには、モデルに関する同様の情報が表示されます。この 2 つのビューは、モデルの開発とデプロイのライフサイクルで異なる役割を果たします。

エクスペリメントページの モデル タブには、エクスペリメントの記録済みモデルの結果を1つのページに掲載しています。このページのチャートタブでは、モデルを比較し、デプロイのために Unity Catalog に登録するモデルのバージョンを選択するのに役立つ視覚化を提供します。
カタログエクスプローラーのモデルバージョンページには、すべてのモデルのパフォーマンスと評価結果の概要が表示されます。このページには、さまざまなワークスペース、エンドポイント、エクスペリメントなど、リンクされたすべての環境にわたるモデルパラメーター、メトリクス、トレースが表示されます。これは、モニタリングとデプロイに役立ち、デプロイジョブで特にうまく機能します。デプロイメント・ジョブの評価タスクは、このページに表示される追加のメトリクスを作成します。ジョブの承認者は、このページを確認して、デプロイのモデルバージョンを承認するかどうかを評価できます。

次のステップ

MLflow 3.0 で導入された LoggedModel 追跡の詳細については、次の記事を参照してください。

MLflow 記録済みモデル (Beta) を使用してモデルを追跡および比較します。

MLflow 3.0 を他のワークフローと共に使用する方法の詳細については、次の記事を参照してください。

ノートブックの例​

MLflow 3.0 生成AIエージェントの構築、評価 ノートブック

MLflow UI を使用してエージェントのパフォーマンスを調べる​

MLflow のトレースとフィードバックとツール呼び出しエージェントによるフィードバック​

MLflow 3.0 のトレースとフィードバックとツール呼び出しエージェント ノートブック

詳細情報​

エクスペリメント ページのモデルタブとMLflow カタログエクスプローラ のモデル バージョン ページの違いは何ですか?​

次のステップ​