メインコンテンツまでスキップ

デプロイメントのトレース

MLflow Tracing は、 MLflow UI で表示したり、テーブルとして分析したりできる実行の詳細をキャプチャすることで、本番運用 GenAI アプリに包括的なオブザーバビリティを提供します。 このページでは、以下の詳細を示す機能リファレンスを提供します。

ガイドとチュートリアルについては、「 トレースを使用したエージェントのデプロイ」を参照してください。

このページは MLflow 3 用です。MLflow 2 トレースについては、 MLflow バージョンのオープンソース ドキュメントを参照してください。

トレースのデプロイメント・オプション

Databricks では、Databricks の内部と外部でのデプロイがサポートされています。この選択は、トレース・ロギングのオプション (エクスペリメント・ロギング、本番運用 モニタリング・テーブル、および推論テーブル MLflow に影響します。

展開場所

展開方法

エクスペリメントのロギングMLflow?

本番運用 モニタリング?

推論テーブル?

Databricks

エージェントフレームワーク(推奨) または カスタムサービス展開

サポート

サポート

サポート

Databricks の外部

カスタム展開

サポート

サポート

サポートされていない

トレース・ロギング・オプション

トレースは、Databricks MLflow 追跡サービスまたは Delta テーブルに記録できます。以下のアーキテクチャ例は、すべてのロギングオプションのデータフローを示しています。

MLflow 本番運用 tracing の概要

トレース ログ オプション

アクセスとガバナンス

利点

制限事項

MLflowエクスペリメント

トレースは、 MLflow エクスペリメントUIで表示することも、 プログラムでクエリを実行することもできます。 アクセスは、 MLflow エクスペリメント ACL によって管理されます。

リアルタイムロギング。非常に大きなトレースをサポートします。

エクスペリメントあたり100Kトレース。 最大 60 クエリ/秒 (QPS)。これらの制限を引き上げるには、Databricks アカウント チームに支援を求めてください。

本番運用のモニタリング

Delta テーブルは、 Unity Catalog 権限を使用して管理されます。

非常に大きなトレースをサポートします。

エクスペリメントロギング MLflow と同じです。 ~15分の遅延。

AI Gateway 対応推論テーブル

Delta テーブルは、 Unity Catalog 権限を使用して管理されます。

エクスペリメントごとのトレースに制限はありません。

30〜90分の遅延。トレースサイズの制限

上の表では、 MLflow エクスペリメントがアーティファクトのカスタム保存場所で作成されている場合、エクスペリメントのトレースデータは指定した場所に格納されます。 具体的には、ワークスペースエクスペリメントを作成すると、Unity Catalogボリュームなどのartifact_locationを指定することで、アーティファクトやトレースデータに非デフォルト保存場所を設定することができます。この場合、トレース データ アクセスは、 Unity Catalog ボリューム特権などの場所のアクセス許可によって管理されます。

ガイドとチュートリアル

機能参照

このガイドの概念と機能の詳細については、以下を参照してください。