当前位置: 首页 > backend >正文

大模型RAG的召回模式

大模型的召回模式,通常指的是在检索增强生成(RAG, Retrieval-Augmented Generation)或多阶段信息检索系统中,大模型在“召回”(recall)阶段所参与的方式或策略。这个概念可以从两个维度理解:

一、狭义理解:RAG 框架中的召回模式

在RAG系统中,“召回”是指从大规模知识库中检索出与用户query相关的候选文档/片段,后续再由大模型(如GPT)生成最终回答。召回模式主要有以下几种:

1. 稠密召回(Dense Retrieval)

  • 使用双塔结构(如DPR, ColBERT, Faiss+Embedding)进行Embedding相似度检索。
  • 常见流程:
    • 将query通过Query Encoder编码为向量;
    • 检索与之向量相似的文档向量。
  • 优点:语义层次的召回能力强,泛化性好。
  • 适配:适合结合大模型Embedding(如OpenAI, BGE, DeepSeek等)做语义向量检索。

2. 稀疏召回(Sp

http://www.xdnf.cn/news/1442.html

相关文章:

  • Vite vs Webpack 优势对比
  • 抱佛脚之学SSM六
  • 4.多表查询
  • AI与智能金融服务:如何利用AI分析大数据预测金融市场波动?
  • 获取发起DNS请求的真实进程及请求域名,不是取服务进程svchost.exe,做网络过滤或网络加速用得上。
  • Android 回显
  • 实验二 多线程编程实验
  • 云原生--CNCF-2-五层生态结构(成熟度3层分类,云原生生态5层结构)
  • 前端加密介绍与实战
  • 3dmax模型怎么导入酷家乐插件,材质贴图在,可优化不卡,可批量处理,无需打开一个个max,可批量转FBX/GLB/GLTF/OBJ/SU
  • Git简介与入门
  • 使用分布式ID作为MybatisID生成器
  • 【NVIDIA】Isaac Sim 4.5.0 Franka 机械臂参数解析
  • QT软件安装(12)
  • Sentinel源码—9.限流算法的实现对比一
  • 黑马点评redis改 part 5
  • 面向 C# 初学者的完整教程
  • 千问2.5-VL-7B的推理、微调、部署_笔记2
  • MyBatis中的@Param注解-如何传入多个不同类型的参数
  • .NET 6 + Dapper + User-Defined Table Type
  • 缓存与数据库一致性方案
  • 数据分析:用Excel做周报
  • Android开发常用外部组件及使用指南(上)
  • maple实现移位算法
  • 智驭未来:NVIDIA自动驾驶安全白皮书与实验室创新实践深度解析
  • Dart Flutter数据类型详解 int double String bool list Map
  • 亚远景-基于ASPICE标准的汽车软件过程优化路径
  • 电路中的DGND、GROUND、GROUND_REF的区别,VREF、VCC、VDD、VEE和VSS的区别?
  • Django 实现电影推荐系统:从搭建到功能完善(附源码)
  • AutoGPT超详细教程