大模型笔记4:RAG检索增强生成
大模型的缺陷
大模型的知识不是实时的,不具知识更新。
大模型可能不知道你的私有领域内/业务知识。
大模型幻觉。也就是看似合理但其实是错误的内容。
RAG的概念
建立索引
将文本数据转换为向量存储,为后续检索提供基础。
1.数据清洗与提取:将PDF、Docx等文件中的内容转换为纯文本,去除无关信息。
2.切分文本:将文本切分为chunk,以便后续的向量化和检索。
3.向量化:使用嵌入模型将chunk向量化,并将chunk与向量以键值对的形式存储到向量数据库中,以便于后续的搜索。
检索生成
用户输入问题后,系统将问题转换为向量,与向量数据库中的文档块向量计算相似度。
检索相似度最高的k个文档块,作为回答当前问题的上下文。
提示词模板:请阅读{知识文档块},请问{问题指令}。