トレースされたアプリをデプロイする
MLflowトレースは、実行の詳細をキャプチャすることで、本番運用で GenAI アプリケーションを監視するのに役立ちます。 トレースされたアプリケーションは、次の 2 つの方法でデプロイできます。
- Databricks : モニタリングおよび推論テーブルの完全統合を備えたエージェント フレームワークまたはカスタム モデルサービングを使用してデプロイします。
- Databricks外部 : モニタリングのためにトレースをDatabricksに記録しながら、外部環境にデプロイします。
展開オプションを比較する
次の表は、各展開場所で使用できるトレース ログ オプションを比較したものです。
展開場所 | |||
|---|---|---|---|
サポートされている | サポートされている | サポートされている | |
サポートされている | サポートされている | サポートされていない |
トレースログオプションの比較
上記の展開オプションの表には、トレース ログの複数のオプションがリストされています。次の表は、これらのトレース ログ オプションを比較したものです。
トレースログオプション | アクセスとガバナンス | レイテンシー* | スループット* | サイズ制限* |
|---|---|---|---|---|
トレースは、 MLflowエクスペリメント UI で表示したり、プログラムでクエリしたりできます。 アクセスはMLflowエクスペリメント ACLによって管理されます。† | リアルタイム | 最大 60 クエリ/秒 (QPS) | 非常に大きなトレースをサポートします。エクスペリメントごとに最大 100K トレース。 | |
Deltaテーブルに記録されたトレースは、 Unity Catalog権限を使用して管理されます。 | 約15分の遅延 | 最大 50 クエリ/秒 (QPS) | 非常に大きなトレースをサポートします。エクスペリメントごとに最大 100K トレース。 | |
Deltaテーブルに記録されたトレースは、 Unity Catalog権限を使用して管理されます。 | 30~90分の遅延 | QPS 制限はモデルビング エンドポイント制限と一致します | トレース サイズの制限。エクスペリメントごとのトレースに制限はありません。 |
* その他のプラットフォームの制限については、 「リソースの制限」を参照してください。また、Databricks アカウント チームと連携して引き上げることができる制限に関する情報も確認してください。
† MLflowエクスペリメントのログの場合、トレースはアーティファクトとして保存され、カスタムの保存場所を指定できます。 たとえば、 artifact_location Unity Catalogボリュームに設定してワークスペース エクスペリメントを作成した場合、トレース データ アクセスはUnity Catalogボリューム権限によって管理されます。
次のステップ
展開方法を選択してください: