大模型RAG的召回模式
大模型的召回模式,通常指的是在检索增强生成(RAG, Retrieval-Augmented Generation)或多阶段信息检索系统中,大模型在“召回”(recall)阶段所参与的方式或策略。这个概念可以从两个维度理解:
一、狭义理解:RAG 框架中的召回模式
在RAG系统中,“召回”是指从大规模知识库中检索出与用户query相关的候选文档/片段,后续再由大模型(如GPT)生成最终回答。召回模式主要有以下几种:
1. 稠密召回(Dense Retrieval)
- 使用双塔结构(如DPR, ColBERT, Faiss+Embedding)进行Embedding相似度检索。
- 常见流程:
- 将query通过Query Encoder编码为向量;
- 检索与之向量相似的文档向量。
- 优点:语义层次的召回能力强,泛化性好。
- 适配:适合结合大模型Embedding(如OpenAI, BGE, DeepSeek等)做语义向量检索。