DatabricksのRAG(Retrieval Augmented Generation)

Retrieval-augmented generation (RAG) は、大規模言語モデル (LLM) とリアルタイムデータ retrieval を組み合わせて、より正確で最新かつ文脈的に関連性のある応答を生成する強力な手法です。

このアプローチは、専有情報、頻繁に変更される情報、またはドメイン固有の情報に関する質問に答える場合に特に役立ちます。

検索拡張生成とは?

最も単純な形式では、RAGエージェントは次の処理を行います。

取得 : ユーザーの要求は、ベクトルストア、キーワード検索、SQL データベースなどの外部ナレッジベースに対してクエリを実行するために使用されます。目標は、LLM の応答の裏付けとなるデータを取得することです。
拡張 : サポートデータは、多くの場合、LLM への追加の書式設定と指示を含むテンプレートを使用して、ユーザーの要求と組み合わされてプロンプトが作成されます。
生成 : プロンプトは LLM に渡され、ユーザーの要求に対する応答が生成されます。

ユーザー要求からデータの取得と応答までのRAGアプリケーションの流れ。

RAG は、次の方法で LLM を改善します。

一般的なRAGアプリケーションには、いくつかの段階があります。

データパイプライン :ドキュメント、テーブル、またはその他のデータを前処理してインデックスを作成し、迅速かつ正確に取得します。
RAGチェーン(Retrieval、Augmentation、Generation): 一連のステップ(またはチェーン)を呼び出して、次のことを行います。
- ユーザーの質問を理解します。
- サポートデータを取得します。
- プロンプトをサポートデータで補強します。
- 拡張プロンプトを使用して LLM から応答を生成します。
評価とモニタリング :RAGアプリケーションを評価して、その品質、コスト、レイテンシを判断し、ビジネス要件を満たしていることを確認します。
ガバナンスとLLMOps :データリネージやアクセス制御など、各コンポーネントのライフサイクルを追跡および管理します。

RAGアプリケーションコンポーネントの図。

RAG アーキテクチャでは、非構造化サポートデータと構造化サポートデータのいずれかを使用できます。RAG で使用するデータはユースケースによって異なります。

非構造化データ： 特定の構造や組織を持たないデータ。

構造化データ： データベースのテーブルなど、特定のスキーマに従って行と列に配置された表形式のデータ。

評価とモニタリングは、RAG アプリケーションが品質、コスト、レイテンシーの要件を満たしているかどうかを判断するのに役立ちます。評価は開発中に行われ、モニタリングはアプリケーションが本番環境にデプロイされた後に行われます。

非構造化データに対するRAGには、品質に影響を与える多くの要素があります。たとえば、データフォーマットの変更は、取得されたチャンクや、関連する応答を生成するLLMの能力に影響を与える可能性があります。そのため、アプリケーション全体に加えて、個々のコンポーネントを評価することが重要です。

詳細については、「 Mosaic AI エージェントの評価 (MLflow 2)」を参照してください。

Databricksは、RAG開発のための以下のようなエンドツーエンドのプラットフォームを提供しています。

RAGアプリケーションの主要コンポーネントであるデータパイプラインについてご紹介します。「RAGの非構造化データパイプラインの構築」を参照してください
AI Playgroundを使用して、独自のRAGエージェントのプロトタイプを作成します。「AI Playground でのプロトタイプツール呼び出しエージェント」を参照してください。
Agent Bricksの使用:Knowledge Assistantは、RAGエージェントをドキュメント上のチャットボットとして、またダウンストリームアプリケーションで使用できるエンドポイントとして作成します。「Agent Bricks: Knowledge Assistantを使用して、ドキュメント上に高品質のチャットボットを作成する」を参照してください。