当前位置: 首页 > news >正文

RAG vs 微调

一、知识

RAG:问题  ——>   LLM + 外部知识 (拼接)——> 回复

目的:不修改模型参数,为了 增强检索、更准确的回答问题

微调:基础 LLM  + 知识 (融合) ——>  LLM(更完善的大模型)

目的:训练调整模型参数,提升模型能力

二、特性对比

  • RAG: 处理事实类查询

  • 模型微调: 处理 复杂分析/评估/预测/推理类任务

特性RAG模型微调
知识更新实时(分钟级)需重新训练(天/周级)
可解释性高(提供来源)低(黑盒决策)
领域适应性更换知识库即可需重新训练
处理复杂推理中等优秀
银行适用场景制度问答、操作指南风险评估、财务预测

三、选择RAG还是微调的九个判断依据?

  1. 实时或动态变化的数据:RAG
  2. 遵循事实、更低的幻觉:RAG
  3. 可解释性、可追溯来源:RAG (微调是黑盒)
  4. 更高数据隐私性:RAG
  5. 依赖通用能力:RAG
  6. 低成本、低门槛:RAG
  7. 模型能力定制:微调
  8. 智能设备:微调
  9. 更低延迟:微调

http://www.xdnf.cn/news/1196605.html

相关文章:

  • 使用uni-app开发一个点餐收银台系统前端静态项目练习
  • C 语言第 10 天学习笔记:字符串基础操作与相关函数
  • 机器学习特征选择 explanation and illustration of ANOVA
  • java开闭原则 open-closed principle
  • 影刀RPA_初级课程_玩转影刀自动化_网页操作自动化
  • 【机器学习深度学习】NLP评价指标 BLEU 和 ROUGE
  • python优秀案例:基于python flask实现的小说文本数据分析与挖掘系统,包括K-means聚类算法和LDA主题分析
  • 用KNN实现手写数字识别:基于 OpenCV 和 scikit-learn 的实战教学 (超级超级超级简单)
  • Kafka——消费者组消费进度监控都怎么实现?
  • 牛客周赛101 D题 题解
  • 五、搭建springCloudAlibaba2021.1版本分布式微服务-gateway网关
  • 力扣热题100----------53最大子数组和
  • 零基础学习性能测试第五章:Tomcat的性能分析与调优-Tomcat原理,核心配置项,性能瓶颈分析,调优
  • RAG(检索增强生成)
  • 探秘CommonJS:Node.js模块化核心解析
  • redis主从复制、哨兵机制底层原理
  • XML Schema 指示器:全面解析与深度应用
  • 齐护Ebook科技与艺术Steam教育套件 可图形化micropython Arduino编程ESP32纸电路手工
  • xgboost 机器学习在生物信息学中的应用
  • 【橘子分布式】gRPC(番外篇-客户端重试机制)
  • PostGIS面试题及详细答案120道之 (021-030 )
  • Java面试精进:测试、监控与序列化技术全解析
  • Netty中 ? extends Future<? super V>这种的写法的理解
  • 51c自动驾驶~合集9
  • Java面试宝典:MySQL执行原理二
  • Spring AI 项目实战(二十一):Spring Boot + AI +DeepSeek驱动的智能题库系统(附完整源码)
  • bash的特性-常用的通配符
  • AWS免费套餐全面升级:企业降本增效与技术创新解决方案
  • HCIP---MGRE实验
  • 电子电气架构 --- 软件bug的管理模式