当前位置: 首页 > ai >正文

什么是检索增强生成(RAG)?

什么是检索增强生成(RAG)?

检索增强生成(Retrieval-Augmented Generation,简称RAG),从名字就能看出,这是一种专为信息检索设计的技术。它的思路非常直接:假设你有大量文档,想要从中搜索并提取信息——就像向一个“知道答案的人”提问,或者是,向一个“已经研读了你提供的所有材料的人”提问。当被询问时,这个人不仅能指出信息在材料中的位置,还能组织出恰当的文字回答。

在RAG技术中,这个“人”就是大语言模型(LLM),那些“研读材料”被称为上下文(context),而最终的文字回答则是基于从“增强知识”(即那些研读材料或上下文)中检索(R) 到的信息生成(G)的输出。当然,回答的质量取决于材料的质量和数量:上下文需要包含相关信息,但不能掺杂过多无关内容。和人类一样,模型往往会更关注开头和结尾的信息;随着上下文长度增加,模型准确定位所需信息的难度也会越来越大。

因此,RAG流程中一个非常重要的步骤是:筛选出最可能包含答案的文档并整合成上下文,而不是把所有材料都给模型。

RAG是一种灵活性很强的技术,它的效果依赖于通用大语言模型的能力。再用刚才的类比:LLM就像一个受过良好教育的人,只要你让它研读某个主题的材料,它就能回答相关问题。任何时候,你都可以给它换一批不同主题的内容,或者更新版本的材料,再让它回答新的问题。这里的关键是:这个人受教育程度越高,无论面对什么主题,给出的答案质量就越好。对应到语言模型上,这意味着在预算允许的情况下,选择尽可能大的通用模型通常效果更好——对于RAG来说,我们需要的是一个“多面手”。

如果说RAG是“通才的技术”,那么微调就是“专才

http://www.xdnf.cn/news/15979.html

相关文章:

  • 深入浅出控制反转与依赖注入:从理论到实践
  • 社交电商推客系统全栈开发指南:SpringCloud+分润算法+Flutter跨端
  • 深度学习篇---车道线循迹
  • CMake实践:CMake3.30版本之前和之后链接boost的方式差异
  • Pulsar存储计算分离架构设计之Broker无状态
  • linux: tar解压之后属主和属组不是当前用户问题
  • [c++11]constexpr
  • MCP消息协议和传输协议(Java角度)
  • 【数学建模|Matlab】Matlab「基础知识」和「基础操作」
  • es搜索实现既能模糊查询又能分词查询
  • Linux部署.net Core 环境
  • 8.4 Java 原生 TCP Socket 实现 HTTP 请求解析和请求分发
  • Dify接入MCP案例1:基于Chatflow旅行、吃饭、新闻、学习的AI智能体
  • 公司内部网址怎么在外网打开?如何让外网访问内网的网站呢?
  • 2025 年非关系型数据库全面指南:类型、优势
  • cddlib(用于凸多面体计算和线性不等式系统求解)的开源库
  • JAVA API (三):从基础爬虫构建到带条件数据提取 —— 详解 URL、正则与爬取策略
  • Java 大视界 -- Java 大数据在智能交通自动驾驶车辆与周边环境信息融合与决策中的应用(357)
  • JMeter 实现 Protobuf 加密解密
  • UE5 UI 水平框
  • ansible 批量 scp 和 load 镜像
  • MybatisPlus-16.扩展功能-枚举处理器
  • Windows PE文件内未用空间学习
  • DNS应用层协议
  • Linux驱动-中断-共享队列
  • 两个android,一个客户端一个服务器端
  • 2025.7.22 测试 总结
  • Web服务器(Tomcat、项目部署)
  • C# 中的装箱与拆箱
  • 今日行情明日机会——20250722