メインコンテンツまでスキップ

トレースされたアプリをデプロイする

MLflowトレースは、実行の詳細をキャプチャすることで、本番運用で GenAI アプリケーションを監視するのに役立ちます。 トレースされたアプリケーションは、次の 2 つの方法でデプロイできます。

  • Databricks : モニタリングおよび推論テーブルの完全統合を備えたエージェント フレームワークまたはカスタム モデルサービングを使用してデプロイします。
  • Databricks外部 : モニタリングのためにトレースをDatabricksに記録しながら、外部環境にデプロイします。

展開オプションを比較する

次の表は、各展開場所で使用できるトレース ログ オプションを比較したものです。

展開場所

MLflowエクスペリメントのトレース ロギング

本番運用のモニタリング

推論テーブル

Databricksにデプロイ

サポートされている

サポートされている

サポートされている

Databricks の外部にデプロイする

サポートされている

サポートされている

サポートされていない

トレースログオプションの比較

上記の展開オプションの表には、トレース ログの複数のオプションがリストされています。次の表は、これらのトレース ログ オプションを比較したものです。

トレースログオプション

アクセスとガバナンス

レイテンシー*

スループット*

サイズ制限*

MLflowエクスペリメントのトレース ロギング

トレースは、 MLflowエクスペリメント UI で表示したり、プログラムでクエリしたりできます。 アクセスはMLflowエクスペリメント ACLによって管理されます。†

リアルタイム

最大 60 クエリ/秒 (QPS)

非常に大きなトレースをサポートします。エクスペリメントごとに最大 100K トレース。

本番運用のモニタリング

Deltaテーブルに記録されたトレースは、 Unity Catalog権限を使用して管理されます。

約15分の遅延

最大 50 クエリ/秒 (QPS)

非常に大きなトレースをサポートします。エクスペリメントごとに最大 100K トレース。

AIゲートウェイ対応推論テーブル

Deltaテーブルに記録されたトレースは、 Unity Catalog権限を使用して管理されます。

30~90分の遅延

QPS 制限はモデルビング エンドポイント制限と一致します

トレース サイズの制限。エクスペリメントごとのトレースに制限はありません。

* その他のプラットフォームの制限については、 「リソースの制限」を参照してください。また、Databricks アカウント チームと連携して引き上げることができる制限に関する情報も確認してください。

† MLflowエクスペリメントのログの場合、トレースはアーティファクトとして保存され、カスタムの保存場所を指定できます。 たとえば、 artifact_location Unity Catalogボリュームに設定してワークスペース エクスペリメントを作成した場合、トレース データ アクセスはUnity Catalogボリューム権限によって管理されます。

次のステップ

展開方法を選択してください: