デプロイメントのトレース
MLflow Tracing は、 MLflow UI で表示したり、テーブルとして分析したりできる実行の詳細をキャプチャすることで、本番運用 GenAI アプリに包括的なオブザーバビリティを提供します。 このページでは、以下の詳細を示す機能リファレンスを提供します。
- デプロイ オプション: AI エージェントは、Databricks 上または Databricks の外部にデプロイできます。この選択によって、トレース・ロギングのオプションが決まります。
- トレース・ロギング・オプション: トレースは、エクスペリメント MLflow または Delta 表に記録できます。
ガイドとチュートリアルについては、「 トレースを使用したエージェントのデプロイ」を参照してください。
このページは MLflow 3 用です。MLflow 2 トレースについては、 MLflow バージョンのオープンソース ドキュメントを参照してください。
トレースのデプロイメント・オプション
Databricks では、Databricks の内部と外部でのデプロイがサポートされています。この選択は、トレース・ロギングのオプション (エクスペリメント・ロギング、本番運用 モニタリング・テーブル、および推論テーブル MLflow に影響します。
展開場所 | 展開方法 | |||
---|---|---|---|---|
Databricks | サポート | サポート | サポート | |
Databricks の外部 | サポート | サポート | サポートされていない |
トレース・ロギング・オプション
トレースは、Databricks MLflow 追跡サービスまたは Delta テーブルに記録できます。以下のアーキテクチャ例は、すべてのロギングオプションのデータフローを示しています。
- Deploy on Databricks
- Deploy outside of Databricks
トレース ログ オプション | アクセスとガバナンス | 利点 | 制限事項 |
---|---|---|---|
トレースは、 MLflow エクスペリメントUIで表示することも、 プログラムでクエリを実行することもできます。 アクセスは、 MLflow エクスペリメント ACL によって管理されます。 | リアルタイムロギング。非常に大きなトレースをサポートします。 | エクスペリメントあたり100Kトレース。 最大 60 クエリ/秒 (QPS)。これらの制限を引き上げるには、Databricks アカウント チームに支援を求めてください。 | |
Delta テーブルは、 Unity Catalog 権限を使用して管理されます。 | 非常に大きなトレースをサポートします。 | エクスペリメントロギング MLflow と同じです。 ~15分の遅延。 | |
Delta テーブルは、 Unity Catalog 権限を使用して管理されます。 | エクスペリメントごとのトレースに制限はありません。 | 30〜90分の遅延。トレースサイズの制限。 |
上の表では、 MLflow エクスペリメントがアーティファクトのカスタム保存場所で作成されている場合、エクスペリメントのトレースデータは指定した場所に格納されます。 具体的には、ワークスペースエクスペリメントを作成すると、Unity Catalogボリュームなどのartifact_location
を指定することで、アーティファクトやトレースデータに非デフォルト保存場所を設定することができます。この場合、トレース データ アクセスは、 Unity Catalog ボリューム特権などの場所のアクセス許可によって管理されます。
ガイドとチュートリアル
機能参照
このガイドの概念と機能の詳細については、以下を参照してください。
- 本番運用 モニタリングの概念 - MLflow が継続的品質モニタリングを実現する方法を理解する
- トレース データ モデル - トレース、スパン、属性について学習します
- 評価のログ記録 - フィードバックの保存方法と使用方法を理解する