RAG vs 微调
一、知识
RAG:问题 ——> LLM + 外部知识 (拼接)——> 回复
目的:不修改模型参数,为了 增强检索、更准确的回答问题
微调:基础 LLM + 知识 (融合) ——> LLM(更完善的大模型)
目的:训练调整模型参数,提升模型能力
二、特性对比
RAG: 处理事实类查询
模型微调: 处理 复杂分析/评估/预测/推理类任务
特性 | RAG | 模型微调 |
---|---|---|
知识更新 | 实时(分钟级) | 需重新训练(天/周级) |
可解释性 | 高(提供来源) | 低(黑盒决策) |
领域适应性 | 更换知识库即可 | 需重新训练 |
处理复杂推理 | 中等 | 优秀 |
银行适用场景 | 制度问答、操作指南 | 风险评估、财务预测 |
三、选择RAG还是微调的九个判断依据?
- 实时或动态变化的数据:RAG
- 遵循事实、更低的幻觉:RAG
- 可解释性、可追溯来源:RAG (微调是黑盒)
- 更高数据隐私性:RAG
- 依赖通用能力:RAG
- 低成本、低门槛:RAG
- 模型能力定制:微调
- 智能设备:微调
- 更低延迟:微调