当前位置: 首页 > backend >正文

大模型笔记4:RAG检索增强生成

大模型的缺陷

大模型的知识不是实时的,不具知识更新。

大模型可能不知道你的私有领域内/业务知识。

大模型幻觉。也就是看似合理但其实是错误的内容。

RAG的概念

建立索引

将文本数据转换为向量存储,为后续检索提供基础。

1.数据清洗与提取:将PDF、Docx等文件中的内容转换为纯文本,去除无关信息。

2.切分文本:将文本切分为chunk,以便后续的向量化和检索。

3.向量化:使用嵌入模型将chunk向量化,并将chunk与向量以键值对的形式存储到向量数据库中,以便于后续的搜索。

检索生成

用户输入问题后,系统将问题转换为向量,与向量数据库中的文档块向量计算相似度。

检索相似度最高的k个文档块,作为回答当前问题的上下文。

提示词模板:请阅读{知识文档块},请问{问题指令}。

http://www.xdnf.cn/news/14527.html

相关文章:

  • LangGraph--框架核心思想
  • 数字系统设计与verilog hdl第8版王金明
  • HPC软件架构---Vector solution方案简介
  • 订单状态定时处理-01.需求分析
  • 免费插件集-illustrator插件-Ai插件-移除非纯黑叠印
  • NodeJS怎么开启多核执行任务,加快执行速度
  • 基于51单片机的流量检测及时间显示系统
  • PaddleOCR项目实战(2):SpringBoot服务开发之接口设计
  • 基于CL_PSO与BP神经网络分类模型的特征选择方法研究(Python实现)
  • 基于CATIA轴系的最小边界曲面自动化生成技术深度解析
  • linux多线程之POSIX信号量
  • PHP Swoft2 框架精华系列:Config 配置解析,使用说明
  • 如何在 Elementary OS 上安装 Google Chrome 浏览器
  • 智慧流水线在ESOP数字工厂中的作用
  • 迈向通用具身智能:具身智能的综述与发展路线
  • 前端如何调用外部api获取省市区数据
  • leetcode138-随机链表的复制
  • 技术突破与落地应用:端到端 2.0 时代辅助驾驶TOP10 论文深度拆解系列【第四篇(排名不分先后)】
  • 【C++】模板入门
  • LeetCode HOT 100
  • C语言空指针异常在Java中的解决方案
  • 智慧流水线在esop数字工厂中的作用?
  • GO语言---短变量声明
  • 手写简版React-router
  • DeepSeek提示词指南:从基础到高阶的全面解析
  • 160. 相交链表
  • MGR集群场景恢复处理
  • LoRA 与传统矩阵分解的比较
  • Ubuntu24.04一键安装ROS2
  • PoE供电异常如何排查?