メインコンテンツまでスキップ

トレースされたアプリをデプロイする

MLflowトレースは、実行の詳細をキャプチャすることで、本番運用で GenAI アプリケーションを監視するのに役立ちます。 トレースされたアプリケーションは、次の 2 つの方法でデプロイできます。

  • Databricks : モニタリングおよび推論テーブルの完全統合を備えたエージェント フレームワークまたはカスタム モデルサービングを使用してデプロイします。
  • Databricks外部 : モニタリングのためにトレースをDatabricksに記録しながら、外部環境にデプロイします。

展開オプションを比較する

以下の表は、各展開場所で利用可能な機能を比較したものです。

展開場所

MLflowエクスペリメントのトレース ロギング

本番運用のモニタリング

推論テーブル

Databricksにデプロイ

サポートされている

サポートされている

サポートされている

Databricks の外部にデプロイする

サポートされている

サポートされている

サポートされていない

  • MLflowエクスペリメント トレース ログ : MLflowエクスペリメント UI アクセスによるトレース ログ。 UI でトレースを表示するか、プログラムでクエリを実行します。エクスペリメントごとに最大 100K のトレースをサポートします。
  • 本番運用モニタリング : 長期的な分析とモニタリングのためにDeltaテーブルに自動アーカイブします。 エクスペリメントのロギングと比較して、最大 15 分の遅延が追加されます。
  • 推論テーブル : Databricks デプロイメントでのみ使用できます。エクスペリメント制限なしでトレースをDeltaテーブルに保存します。 30 ~ 90 分の遅延が追加され、トレースのサイズ制限があります。

次のステップ

展開方法を選択してください: