Fundamentos da geração aumentada por recuperação (RAG)

Esta seção apresenta os componentes e princípios do key por trás do desenvolvimento de aplicativos RAG em dados não estruturados.

Diagrama dos componentes do aplicativo RAG.

Em particular:

  • pipeline de dados: Transformação de documentos não estruturados, como coleções de PDFs, em um formato adequado para recuperação usando o aplicativo RAG pipeline de dados.

  • Recuperação, aumento e geração (cadeia RAG): Uma série (ou cadeia) de os passos é chamada para:

    • Entenda a pergunta do usuário.

    • Recuperar os dados de suporte.

    • Chame um LLM para gerar uma resposta com base na pergunta do usuário e nos dados de suporte.

  • Avaliação: Avaliar o aplicativo RAG para determinar sua qualidade, custo e latência, a fim de garantir que ele atenda aos requisitos comerciais do senhor.

  • Governança e LLMOps: acompanhamento e gerenciamento do ciclo de vida de cada componente, incluindo linhagem de dados e governança (controles de acesso).