はじめに
データの読み込みと管理
データの取り扱い
管理
参照とリソース
更新しました 2024/07/03
フィードバックの送信
「測定できないものは管理できない」という古い格言は、RAG を含むあらゆる生成AIアプリケーションのコンテキストにおいて非常に当てはまります (しゃれではありません)。 生成AIアプリケーションが高品質で正確な応答を提供するには、ユースケースにおける「品質」の意味を定義し、測定できる必要があります。
このセクションでは、評価の 3 つの重要な要素について詳しく説明します。
「品質」の定義:評価セット
パフォーマンスを評価する: 重要な指標
測定の有効化:サポートインフラストラクチャ