当前位置：首页 > backend >正文

大模型RAG的召回模式

backend 2025/7/5 11:35:16

大模型的召回模式，通常指的是在检索增强生成（RAG, Retrieval-Augmented Generation）或多阶段信息检索系统中，大模型在“召回”（recall）阶段所参与的方式或策略。这个概念可以从两个维度理解：

一、狭义理解：RAG 框架中的召回模式

在RAG系统中，“召回”是指从大规模知识库中检索出与用户query相关的候选文档/片段，后续再由大模型（如GPT）生成最终回答。召回模式主要有以下几种：

1. 稠密召回（Dense Retrieval）

使用双塔结构（如DPR, ColBERT, Faiss+Embedding）进行Embedding相似度检索。
常见流程：
- 将query通过Query Encoder编码为向量；
- 检索与之向量相似的文档向量。
优点：语义层次的召回能力强，泛化性好。
适配：适合结合大模型Embedding（如OpenAI, BGE, DeepSeek等）做语义向量检索。

2. 稀疏召回（Sp

http://www.xdnf.cn/news/1442.html

相关文章：

Vite vs Webpack 优势对比

抱佛脚之学SSM六

AI与智能金融服务：如何利用AI分析大数据预测金融市场波动？

获取发起DNS请求的真实进程及请求域名，不是取服务进程svchost.exe，做网络过滤或网络加速用得上。

实验二多线程编程实验

云原生--CNCF-2-五层生态结构（成熟度3层分类，云原生生态5层结构）

前端加密介绍与实战

3dmax模型怎么导入酷家乐插件，材质贴图在，可优化不卡，可批量处理，无需打开一个个max，可批量转FBX/GLB/GLTF/OBJ/SU

Git简介与入门

使用分布式ID作为MybatisID生成器

【NVIDIA】Isaac Sim 4.5.0 Franka 机械臂参数解析

QT软件安装（12）

Sentinel源码—9.限流算法的实现对比一

黑马点评redis改 part 5

面向 C# 初学者的完整教程

千问2.5-VL-7B的推理、微调、部署_笔记2

MyBatis中的@Param注解-如何传入多个不同类型的参数

.NET 6 + Dapper + User-Defined Table Type

缓存与数据库一致性方案

数据分析：用Excel做周报

Android开发常用外部组件及使用指南（上）

maple实现移位算法

智驭未来：NVIDIA自动驾驶安全白皮书与实验室创新实践深度解析

Dart Flutter数据类型详解 int double String bool list Map

亚远景-基于ASPICE标准的汽车软件过程优化路径

电路中的DGND、GROUND、GROUND_REF的区别，VREF、VCC、VDD、VEE和VSS的区别？

Django 实现电影推荐系统：从搭建到功能完善（附源码）

AutoGPT超详细教程