RAG 的完整流程是怎么样的?
RAG(Retrieval-Augmented Generation,检索增强生成)的完整流程包括以下三个核心阶段:检索(Retrieval)、增强(Augmentation)和生成(Generation)。以下是详细流程:
1. 检索(Retrieval)
- 目标:从外部知识库或数据源中获取与用户查询相关的信息。
- 方法:
- 语义检索:使用向量数据库(如FAISS、Weaviate、Milvus等)存储预处理后的文本数据(通常以向量形式表示)。
- 查询处理:将用户输入的自然语言查询转换为向量(通过嵌入模型,如BERT、Sentence-BERT等),并与向量数据库中的文档向量进行相似度计算(如余弦相似度)。
- 结果筛选:返回与查询最相关的文档或文本片段。
2. 增强(Augmentation)
- 目标:将检索到的相关信息与用户查询结合,形成更丰富的上下文。
- 方法</