当前位置: 首页 > java >正文

【大模型】RAG

大纲

  1. 用垂域数据,补充LLM的能力
  2. 构建垂域(向量)知识库
  3. 搭建RAG系统需要的模块
  4. 搭建RAG系统的技巧

一、什么是RAG(检索增强的生成模型)

LLM大模型(预训练模型)

目前的局限性:

  1. LLM的知识不是实时的
  2. 不知道私域知识

RAG - retrieval augmented generation

用检索的方法来增强生成模型的能力。

RAG系统的基本搭建流程

    二、向量检索

    2.1 文档的加载和切割

    openai_api_key

    2.2 LLM接口封装

    2.3 prompt模版

    三、向量检索

    向量:从一个点到另一个点到有向线段。

    向量的维度:用一组坐标,表示n维空间中的向量,N是向量的维度。

    文本向量:text embeddings 将文本转成一组N维浮点数。

    语义相似度:向量之间的距离,距离的远近。

    3.1 文本向量是怎么得到的

    3.2 计算向量间的相似度

    numpy 是数据科学中,pyprch的三剑客,

    http://www.xdnf.cn/news/18131.html

    相关文章:

  • 8.19 note
  • 云原生俱乐部-mysql知识点归纳(1)
  • cesium中实时获取鼠标精确坐标和高度
  • Vue深入组件:组件事件详解1
  • Laravel中如何使用php-casbin
  • OSCP - Proving Grounds - Vanity
  • 云计算核心技术之容器技术
  • SAP 数据脱敏工具:SNP TDO如何满足新颁敏感信息政策要求
  • 【C语言篇】操作符详解
  • 电子电气架构 --- 软件开发数字化转型
  • Python函数:装饰器
  • 三高架构杂谈
  • 软件定义汽车---创新与差异化之路
  • Jenkins全链路教程——Jenkins调用Maven构建项目
  • Kafka文件存储机制
  • 深入浅出决策树
  • (二十)深入了解 AVFoundation-编辑:使用 AVMutableVideoComposition 实现视频加水印与图层合成(下)——实战篇
  • Google 的 Opal:重新定义自动化的 AI 平台
  • Git版本控制与协作
  • 4.9 配置 开发服务器 和 请求代理
  • 汽车之家联合HarmonyOS SDK,深度构建鸿蒙生态体系
  • 使用Idea安装JDK
  • 从零开始,系统学习AI与机器学习:一份真诚的学习路线图
  • 容器化 Android 开发效率:cpolar 内网穿透服务优化远程协作流程
  • Baumer高防护相机如何通过YoloV8深度学习模型实现网球运动员和网球速度的检测分析(C#代码UI界面版)
  • WPF中BindingList<T>和List<T>
  • Conda技巧:修改Conda环境目录,节省系统盘空间
  • 学习:各种不同类型的for循环遍历,forEach/map/filter/every/some/includes/reduce的详细用法(1)
  • 【项目】分布式Json-RPC框架 - 项目介绍与前置知识准备
  • [Linux]学习笔记系列 --[mm][list_lru]