Retrieval-augmented generation (RAG) の基礎

このセクションでは、非構造化データに対するRAGアプリケーションの開発の背後にある主要なコンポーネントと原則を紹介します。

RAGアプリケーションコンポーネントの図。

特に、以下の点に注意してください。

  • データパイプライン: PDFのコレクションなどの非構造化ドキュメントを、RAGアプリケーションのデータパイプラインを使用して取得に適した形式に変換します。

  • Retrieval, Augmentation, and Generation (RAG chain): 一連のステップ(またはチェーン)は、以下の目的で呼び出されます。

    • ユーザーの質問を理解します。

    • サポート データを取得します。

    • LLM を呼び出して、ユーザーの質問とサポート データに基づいて応答を生成します。

  • 評価:RAGアプリケーションを評価して、その品質、コスト、および遅延を判断し、ビジネス要件を満たしていることを確認します。

  • ガバナンスとLLMOps:データリネージやガバナンス(アクセス制御)など、各コンポーネントのライフサイクルを追跡および管理します。