ステップ 5 (取得)。 取得品質をデバッグする方法
このページでは、取得の問題の根本原因を特定する方法について説明します。 このページは、 根本原因分析 で根本原因 Improve Retrieval
が示された場合に使用します。
取得品質は、間違いなくRAGアプリケーションの最も重要なコンポーネントです。 特定のクエリに対して最も関連性の高いチャンクが返されない場合、LLM は高品質の応答を生成するために必要な情報にアクセスできません。 検索が不十分な場合、出力が無関係、不完全、または幻覚につながる可能性があります。 このステップでは、基になるデータを分析するために手動の作業が必要です。 Mosaic AI Agent Frameworkは、データプラットフォーム( Unity Catalog やベクトル検索を含む)とエクスペリメント追跡と MLflow ( LLM 評価や MLflow トレーシングを含む)が緊密に統合されているため、トラブルシューティングがはるかに簡単になります。
指示
以下の手順に従って、取り出し品質の問題に対処してください。
B_quality_iteration/01_root_cause_quality_issues ノートブックを開きます。
クエリを使用して、取得品質の問題があったレコードの MLflow トレースを読み込みます。
レコードごとに、取得したチャンクを手動で調べます。 可能な場合は、それらをグラウンドトゥルース検索ドキュメントと比較します。
検索品質が低いクエリ間でパターンまたは一般的な問題を探します。 例えば:
関連情報がベクターデータベースから完全に欠落しています。
取得クエリに対して返されるチャンクまたはドキュメントの数が不足しています。
チャンクが小さすぎて、十分なコンテキストが不足しています。
チャンクが大きすぎて、無関係なトピックが複数含まれています。
埋め込みモデルは、ドメイン固有の用語の意味的類似性をキャプチャできません。
特定された問題に基づいて、潜在的な根本原因と対応する修正を仮定します。 ガイダンスについては、 取得品質が低下する一般的な理由を参照してください。
「変更の実装と評価」の手順に従って、潜在的な修正プログラムを実装および評価します。これには、データパイプラインの変更 (チャンク サイズの調整や別の埋め込みモデルの試行など) や RAG チェーンの変更 (ハイブリッド検索の実装やより多くのチャンクの取得など) が含まれる場合があります。
それでも検索品質が十分でない場合は、目的のパフォーマンスが得られるまで、次に有望な修正についてステップ 4 と 5 を繰り返します。
根本原因分析を再実行して、チェーン全体に対処すべき追加の根本原因があるかどうかを判断します。
検索品質が悪い一般的な理由
次の表に、デバッグ ステップと、一般的な取得の問題に対する潜在的な修正を示します。 修正プログラムはコンポーネントごとに分類されます。
データパイプライン
チェーン設定
チェーンコード
このコンポーネントは、 変更の実装と評価 のステップで従うべきステップを定義します。
取得の問題 |
デバッグ ステップ |
潜在的な修正 |
---|---|---|
チャンクが小さすぎる |
|
|
チャンクが大きすぎる |
|
|
チャンクには、取得元のテキストに関する十分な情報がありません |
|
|
埋め込みモデルがユーザークエリのドメインまたはキーフレーズを正確に理解しない |
|
|
ベクターデータベースに関連情報がありません |
|
|
取得クエリの定式化が不十分である |
|
|
次のステップ
生成品質の問題も特定した場合は、 ステップ 5 (生成) に進みます。生成品質をデバッグする方法。
特定された問題をすべて解決したと思われる場合は、 ステップ 6 に進みます。AIエージェントで品質修正を行い、評価します。