o passo 5 (geração). Como depurar a qualidade da geração
Esta página descreve como identificar a causa raiz dos problemas de geração. Use esta página quando a análise da causa raiz indicar uma causa raiz Improve Generation
.
Mesmo com a recuperação ideal, se o componente LLM de uma cadeia RAG não puder utilizar efetivamente o contexto recuperado para gerar respostas precisas, coerentes e relevantes, a qualidade do resultado final será prejudicada. Algumas das maneiras pelas quais os problemas com a qualidade da geração podem aparecer são alucinações, inconsistências ou falha em abordar de forma concisa a consulta do usuário.
Instruções
Siga estes passos para resolver os problemas de qualidade da geração:
Abra o Notebook B_quality_iteration/01_root_cause_quality_issues.
Use as consultas para carregar os rastreamentos do MLflow dos registros que tiveram problemas de qualidade de geração.
Para cada registro, examine manualmente a resposta gerada e compare-a com o contexto recuperado e a resposta verdadeira.
Procure padrões ou problemas comuns entre as consultas com qualidade de baixa geração. Por exemplo:
Geração de informações não presentes no contexto recuperado.
Geração de informações que não são consistentes com o contexto recuperado (alucinação).
Falha em abordar diretamente a consulta do usuário, considerando o contexto recuperado fornecido.
Gerar respostas excessivamente detalhadas, difíceis de entender ou sem coerência lógica.
Com base no problema identificado, crie uma hipótese sobre as possíveis causas e as correções correspondentes. Para obter orientação, consulte Motivos comuns para a baixa qualidade da geração.
Siga os passos em implementar e avaliar mudanças para implementar e avaliar uma possível correção. Isso pode envolver a modificação da cadeia RAG (por exemplo, ajustar o padrão do prompt ou tentar um LLM diferente) ou o pipeline de dados (por exemplo, ajustar a estratégia de chunking para fornecer mais contexto).
Se a qualidade da geração ainda não for satisfatória, repita os passos 4 e 5 para a próxima correção mais promissora até que o desempenho desejado seja alcançado.
Reexecutar a análise da causa raiz para determinar se a cadeia geral tem alguma causa raiz adicional que deva ser abordada.
Razões comuns para a baixa qualidade da geração
A tabela a seguir lista a depuração dos passos e as possíveis correções para problemas comuns de geração. As correções são categorizadas por componente:
Configuração da cadeia
Código da cadeia
O componente define quais passos o senhor deve seguir na implementação e avaliação das mudanças.
Importante
A Databricks recomenda que o senhor use a engenharia imediata para iterar na qualidade dos resultados do seu aplicativo. A maioria dos passos a seguir usa o prompt engenharia.
Problema de geração |
depuração os passos |
Possível correção |
---|---|---|
As informações geradas não estão presentes no contexto recuperado (como alucinações). |
|
|
Falha em abordar diretamente a consulta do usuário ou fornecer respostas excessivamente genéricas |
|
|
As respostas geradas são difíceis de entender ou carecem de fluxo lógico |
|
|
As respostas geradas não estão no formato ou estilo desejado |
|
|
Próximo passo
Se o senhor também identificou problemas com a qualidade da recuperação, continue com o passo 5 (recuperação). Como depurar a qualidade da recuperação.
Se o senhor achar que resolveu todos os problemas identificados, continue com o passo 6. Faça e avalie as correções de qualidade no agente AI .
< Anterior: o passo 5.1. Qualidade de recuperação de depuração
Próximo: o passo 6. corrigir iterativamente os problemas de qualidade >