当前位置: 首页 > news >正文

rag搭建,是如何进行向量匹配检索的?

RAG 里为什么要“向量检索”?

在 Retrieval-Augmented Generation (RAG) 中,我们的目标是让 LLM 能够“回答它本身不知道的内容”。做法是:

  1. 将知识(文本)进行向量化,存入向量数据库;
  2. 用户提问后,也将问题向量化;
  3. 去数据库里 找出与这个问题最相似的一批知识,返回喂给 LLM。

向量匹配检索:原理解析

第一步:构建向量数据库(也叫“知识库”)

比如你有一大段文档,做法是:

  1. 切分成 chunk(段落),如每 300 字为一个段;
  2. 每个 chunk 用 Embedding 模型(如 OpenAI 的 text-embedding-ada-002 或 BGE) 转成一个向量:
    "向量" = 文本的语义表示,一个高维空间中的点。
    
  3. 把每个向量连带元信息&#x
http://www.xdnf.cn/news/49015.html

相关文章:

  • jsch(shell终端Java版)
  • LeRobot 项目部署运行逻辑(二)—— Mobile Aloha 真机部署
  • Vue3 打印网页内容
  • 通过Dify快速搭建本地AI智能体开发平台
  • 高边开关和低边开关的区别
  • 前端工程化之自动化部署
  • MVCC介绍
  • 《AI大模型应知应会100篇》第28篇:大模型在文本创作中的应用技巧
  • Matlab FCM模糊聚类
  • AI 编程工具——使用cursor创建一个mcp服务,并在cursor中调用
  • 使用LSTM动态调整SIMPLE算法松弛因子的CFD仿真训练程序
  • 使用tshark命令解析tcpdump抓取的数据包
  • 2025年4月19日
  • 【第四十一周】文献阅读:HippoRAG:受神经生物学启发的大型语言模型长期记忆机制
  • STM32 CubeMx下载及安装(一)
  • 【leetcode100】一和零
  • HarmonyOS-ArkUI-动画分类简介
  • javaSE.链表
  • 前端知识深度学习
  • [论文阅读]Making Retrieval-Augmented Language Models Robust to Irrelevant Context
  • ClickHouse简介
  • TCP常见知识点整理
  • 【C语言】char unsigned char signed char
  • Centos7 ftp、sftp无法使用ftp连接虚拟机
  • vue3 excel文件导入
  • MAC-从es中抽取数据存入表中怎么实现
  • C语言状态字与库函数详解:概念辨析与应用实践
  • 2025-2030:视频联网平台的六大技术演进趋势
  • Java开发软件
  • 每日算法-250420