当前位置: 首页 > ai >正文

RAG-概述

RAG 概述

        RAG(Retrieval Augmented Generation, 检索增强生成)是一种技术框架,其核心在于当 LLM 面对解答问题或创作文本任务时,首先会在大规模文档库中搜索并筛选出与任务紧密相关的素材,继而依据这些素材精准指导后续的回答生成或文本构造过程,旨在通过此种方式提升模型输出的准确性和可靠性。

       

RAG 技术架构图

RAG 主要包含哪些

1. 核心组件

  1. 检索器(Retriever)

    • 功能:从外部知识库中检索与输入问题相关的信息。

    • 技术:通常使用密集检索(如基于BERT的向量嵌入)或稀疏检索(如BM25),计算查询与文档的相似度。

    • 输出:返回最相关的文档片段或段落。

  2. 生成器(Generator)

    • 功能:基于检索结果和用户输入,生成自然语言回答。

    • 技术:常用预训练语言模型(如GPT、T5),可能针对特定任务微调。

    • 输入:用户问题 + 检索到的上下文。

  3. 知识库(Knowledge Base)

    • 存储内容:结构化或非结构化数据(如文档、网页、数据库)。

    • 形式:常以向量数据库(如FAISS、Pinecone)存储,支持高效相似性搜索。


2. 关键流程

  1. 预处理与索引构建

    对知识库数据进行分块、清洗、嵌入(Embedding),并构建索引以便快速检索。
  2. 检索阶段

    将用户查询编码为向量,从知识库中检索Top-K相关文档。
  3. 生成阶段

    将检索结果与原始问题拼接,输入生成模型产生最终回答。

RAG分块策略

        RAG-分块策略-CSDN博客

http://www.xdnf.cn/news/273.html

相关文章:

  • 贪心、动态规划、其它算法基本原理和步骤
  • Kaamel隐私与安全分析报告:Microsoft Recall功能评估与风险控制
  • VMWARE安装ubuntu
  • 代码随想录算法训练营第三十八天| 322. 零钱兑换 279.完全平方数 139.单词拆分
  • javaSE.类型擦除机制
  • k8s教程3:Kubernetes应用的部署和管理
  • Foundation Agent:深度赋能AI4DATA
  • 宿舍DIY迷你空调实施方案
  • 敏捷开发管理流程
  • Qt 创建QWidget的界面库(DLL)
  • 论坛测试报告
  • redis不要以root权限启动(linux)
  • c加加重点学习之day03
  • 仿腾讯会议项目开发——网络嵌入
  • 软件测试之接口测试详解
  • 开源AI守护每一杯------奶茶咖啡店视频安全系统的未来之力
  • SQL-子查询
  • iPaaS应用集成平台在交通运输行业有哪些应用场景
  • (51单片机)LCD显示数据存储(DS1302时钟模块教学)(LCD1602教程)(独立按键教程)(延时函数教程)(I2C总线认识)(AT24C02认识)
  • 643SJBHflash个人网站
  • 【Python爬虫基础篇】--2.模块解析
  • AI时代的泛安全新范式:Kaamel安全智能体解决方案
  • 数据库被渗透怎么办?WAF能解决数据库安全问题吗?
  • 织梦DedeCMS首页列表页调用会员信息的SQL标签
  • 2025年人工智能指数报告(斯坦福)重点整理
  • 静态时序分析STA——8.2 时序检查(保持时间检查)
  • 第十四节:实战场景-何实现全局状态管理?
  • 【python】编码、输入、数据类型
  • CCF CSP 第36次(2024.12)(2_梦境巡查_C++)
  • 本地部署ai图片转生成视频,一键运行包的制作教程。