当前位置: 首页 > news >正文

AI大模型-微调和RAG方案选项

在搭建知识库的方向上,有两个落地方案:微调、RAG。两个方案的比对:

方案选型

微调

让大模型(LLM)去学习现有知识(调整大模型的参数,让它学习新的知识),最终生成一个新的模型,用户提出问题后,基于经过学习后的新的模型来生成答案。

RAG

当用户提出一个问题,依靠现有知识,加上大模型(LLM)的语言生成能力,两者进行结合,最终给到用户答案。

 

总结:RAG回答问题是基于知识库中的知识进行回答,而微调是基于新的模型来进行回答。这是两者最本质的区别。

场景举例:

适合用微调

1.模型能力定制:希望模型能以固定或者特殊口吻来回答问题。

2.智能设备:模型应用到智能设备上面,大多数智能设备的空间都是比较小的,智能部署一些小模型,小模型的能力相对比较弱,所以更适合用微调。

3.对相应速度有要求:接收到用户的问题后,以最快的速度回复问题,这种情况也适合用微调,因为微调的方式是基于模型直接回复。

适合用RAG

1. 动态数据:数据每周或者每日要更新一次,适合用RAG,因为微调的成本比较高。

2.幻觉问题:对幻觉问题比较敏感,或者说本意就是为了解决幻觉问题,适合用RAG。微调后可能在其他方面有提升,但是幻觉问题可能会加重。

3.可解释性:如果场景对回答要求有可解释性,比对生成的问题需要明确知道其依据是什么,来自哪个文档或者内容,这种情况用RAG更加合适。

4.成本:如果想有更小的成本,那相对来说RAG的成本更小,微调设计到GPU算力和数据成本,最大的成本是数据成本,需要有足够量的数据来对模型进行训练,对数据的数量和质量都有较高的要求。

5.依赖生成能力:如果对模型的生成能力有要求,适合RAG。微调能加强某些领域的水平,但是可能会造成其他领域内容的遗忘。

http://www.xdnf.cn/news/258715.html

相关文章:

  • 友元函数和友元类
  • 【学习笔记】深入理解Java虚拟机学习笔记——第1章 走进Java
  • 4.1 模块概述
  • JavaScript基础-逻辑运算符
  • 【质量管理】现代TRIZ问题识别中的功能分析——组件分析
  • 网站怎样备份网站,备份网站数据的方法
  • 正弦波、方波、三角波和锯齿波信号发生器——Multisim电路仿真
  • re题(52)BUUCTF-[FlareOn5]Minesweeper Championship Registration
  • 深度理解linux系统—— 进程优先级
  • 深入理解C++构造函数:从入门到实践
  • AXI中的burst有几种?都用在什么场景中
  • 复刻低成本机械臂 SO-ARM100 舵机配置篇(WSL)
  • HTML5+JavaScript实现连连看游戏之二
  • [预备知识]6. 优化理论(二)
  • Codeforces Round 1022 (Div. 2) A ~ C
  • 【AI面试准备】数据治理与GDPR脱敏机制构建
  • 一键暂停Windows更新工具
  • 数字智慧方案6186丨智慧应急指挥解决方案(43页PPT)(文末有下载方式)
  • VGG网络模型
  • 自监督学习的学习笔记
  • Python 数据智能实战 (7):智能流失预警 - 融合文本反馈
  • git问题记录-如何切换历史提交分支,且保留本地修改
  • 安卓程序打包与发布
  • 不小心误删了文件,找Windows数据恢复工具来帮忙
  • redis持久化-RDB
  • 数字智慧方案5868丨智慧建造总体策划方案(68页PPT)(文末有下载方式)
  • 泰迪杯特等奖案例学习资料:基于多模态特征融合的图像文本检索系统设计
  • 清洗数据集
  • 数字智慧方案5870丨智慧交通顶层设计方案(89页PPT)(文末有下载方式)
  • 树莓派连接教学