O RAG (Retrieval-Augmented Generation) é um framework que aborda os principais desafios enfrentados pelos grandes modelos de linguagem (LLM´s).
Os dois principais problemas das Large Language Models (LLMs) são:
1- a falta de fontes verificáveis para suportar respostas e a
2- desatualização das informações ao longo do tempo.
Esses desafios impactam a confiabilidade e a qualidade das respostas geradas pelos modelos.
A Questão das Fontes Verificáveis
O RAG aborda a questão da falta de fontes verificáveis ao instruir o modelo a buscar informações relevantes em uma determinada base de dados, melhorando a fundamentação das respostas.
Isso reduz a probabilidade de o modelo gerar respostas sem fontes confiáveis, melhorando a credibilidade das informações fornecidas.
A Questão da Atualização das Informações
Para lidar com a desatualização da fonte, o RAG oferece uma solução eficiente.
Em vez de retreinar o modelo, basta atualizar a base de dados com as novas informações.(informações atualizadas)
Dessa forma, o modelo pode acessar as informações mais recentes ao responder a consultas dos usuários, mantendo-se atualizado sem a necessidade de retreinar o modelo.