トレースされたアプリをデプロイする
MLflowトレースは、実行の詳細をキャプチャすることで、本番運用で GenAI アプリケーションを監視するのに役立ちます。 トレースされたアプリケーションは、次の 2 つの方法でデプロイできます。
- Databricks : モニタリングおよび推論テーブルの完全統合を備えたエージェント フレームワークまたはカスタム モデルサービングを使用してデプロイします。
- Databricks外部 : モニタリングのためにトレースをDatabricksに記録しながら、外部環境にデプロイします。
展開オプションを比較する
以下の表は、各展開場所で利用可能な機能を比較したものです。
展開場所 | MLflowエクスペリメントのトレース ロギング | ||
|---|---|---|---|
サポートされている | サポートされている | サポートされている | |
サポートされている | サポートされている | サポートされていない |
- MLflowエクスペリメント トレース ログ : MLflowエクスペリメント UI アクセスによるトレース ログ。 UI でトレースを表示するか、プログラムでクエリを実行します。エクスペリメントごとに最大 100K のトレースをサポートします。
- 本番運用モニタリング : 長期的な分析とモニタリングのためにDeltaテーブルに自動アーカイブします。 エクスペリメントのロギングと比較して、最大 15 分の遅延が追加されます。
- 推論テーブル : Databricks デプロイメントでのみ使用できます。エクスペリメント制限なしでトレースをDeltaテーブルに保存します。 30 ~ 90 分の遅延が追加され、トレースのサイズ制限があります。
次のステップ
展開方法を選択してください: