デプロイメントのトレース
MLflow Tracing は、 MLflow UI で表示したり、テーブルとして分析したりできる実行の詳細をキャプチャすることで、本番運用 GenAI アプリに包括的なオブザーバビリティを提供します。 このページでは、トレース ログ オプションやガバナンスの詳細など、 MLflow Tracingを使用するエージェントまたはアプリのデプロイ オプションの詳細を説明する機能リファレンスを提供します。 ガイドとチュートリアルについては、「 トレースを使用したエージェントのデプロイ」を参照してください。
トレース・ロギング・オプション
トレースは、Databricks MLflow 追跡サービスまたは Delta テーブルに記録できます。次の図は、データフローを説明するために、すべてのログオプションを使用したアーキテクチャの例を示しています。
トレース ログ オプション | アクセスとガバナンス | 利点 | 制限事項 |
---|---|---|---|
トレースは、 MLflow エクスペリメントUIで表示することも、 プログラムでクエリを実行することもできます。 アクセスは、 MLflow エクスペリメント ACL によって管理されます。 | リアルタイムロギング。非常に大きなトレースをサポートします。 | エクスペリメントあたり100Kトレース。 最大 60 クエリ/秒 (QPS)。これらの制限を引き上げるには、Databricks アカウント チームに支援を求めてください。 | |
Delta テーブルは、 Unity Catalog 権限を使用して管理されます。 | 非常に大きなトレースをサポートします。 | エクスペリメントロギング MLflow と同じです。 ~15分の遅延。 | |
Delta テーブルは、 Unity Catalog 権限を使用して管理されます。 | エクスペリメントごとのトレースに制限はありません。 | 30〜90分の遅延。トレースサイズの制限。 |
上の表では、 MLflow エクスペリメントがアーティファクトのカスタム保存場所で作成されている場合、エクスペリメントのトレースデータは指定した場所に格納されます。 具体的には、ワークスペースエクスペリメントを作成すると、Unity Catalogボリュームなどのartifact_location
を指定することで、アーティファクトやトレースデータに非デフォルト保存場所を設定することができます。この場合、トレース データ アクセスは、 Unity Catalog ボリューム特権などの場所のアクセス許可によって管理されます。
トレースのデプロイメント・オプション
Databricks では、MLflow 3 と MLflow 2 を使用して、Databricks の内部と外部でのデプロイがサポートされています。展開方法の選択は、使用可能なログ オプションに影響します。
展開場所 d - デプロイ方法 | ||||
---|---|---|---|---|
Databricks | サポート | サポート | サポート | |
Databricks の外部 | サポート | サポート | サポートされていない |
ガイドとチュートリアル
機能参照
このガイドの概念と機能の詳細については、以下を参照してください。
- 本番運用 モニタリングの概念 - MLflow が継続的品質モニタリングを実現する方法を理解する
- トレース データ モデル - トレース、スパン、属性について学習します
- 評価のログ記録 - フィードバックの保存方法と使用方法を理解する