メインコンテンツまでスキップ

デプロイメントのトレース

MLflow Tracing は、 MLflow UI で表示したり、テーブルとして分析したりできる実行の詳細をキャプチャすることで、本番運用 GenAI アプリに包括的なオブザーバビリティを提供します。 このページでは、トレース ログ オプションやガバナンスの詳細など、 MLflow Tracingを使用するエージェントまたはアプリのデプロイ オプションの詳細を説明する機能リファレンスを提供します。 ガイドとチュートリアルについては、「 トレースを使用したエージェントのデプロイ」を参照してください。

トレース・ロギング・オプション

トレースは、Databricks MLflow 追跡サービスまたは Delta テーブルに記録できます。次の図は、データフローを説明するために、すべてのログオプションを使用したアーキテクチャの例を示しています。

MLflow 本番運用 tracing の概要

トレース ログ オプション

アクセスとガバナンス

利点

制限事項

MLflowエクスペリメント

トレースは、 MLflow エクスペリメントUIで表示することも、 プログラムでクエリを実行することもできます。 アクセスは、 MLflow エクスペリメント ACL によって管理されます。

リアルタイムロギング。非常に大きなトレースをサポートします。

エクスペリメントあたり100Kトレース。 最大 60 クエリ/秒 (QPS)。これらの制限を引き上げるには、Databricks アカウント チームに支援を求めてください。

本番運用のモニタリング

Delta テーブルは、 Unity Catalog 権限を使用して管理されます。

非常に大きなトレースをサポートします。

エクスペリメントロギング MLflow と同じです。 ~15分の遅延。

AI Gateway 対応推論テーブル

Delta テーブルは、 Unity Catalog 権限を使用して管理されます。

エクスペリメントごとのトレースに制限はありません。

30〜90分の遅延。トレースサイズの制限

上の表では、 MLflow エクスペリメントがアーティファクトのカスタム保存場所で作成されている場合、エクスペリメントのトレースデータは指定した場所に格納されます。 具体的には、ワークスペースエクスペリメントを作成すると、Unity Catalogボリュームなどのartifact_locationを指定することで、アーティファクトやトレースデータに非デフォルト保存場所を設定することができます。この場合、トレース データ アクセスは、 Unity Catalog ボリューム特権などの場所のアクセス許可によって管理されます。

トレースのデプロイメント・オプション

Databricks では、MLflow 3 と MLflow 2 を使用して、Databricks の内部と外部でのデプロイがサポートされています。展開方法の選択は、使用可能なログ オプションに影響します。

展開場所 d - デプロイ方法

エクスペリメントのロギングMLflow?

本番運用 モニタリング?

推論テーブル?

Databricks

エージェントフレームワーク(推奨) または カスタムサービス展開

サポート

サポート

サポート

Databricks の外部

カスタム展開

サポート

サポート

サポートされていない

ガイドとチュートリアル

機能参照

このガイドの概念と機能の詳細については、以下を参照してください。