当前位置: 首页 > ai >正文

spring-ai RAG(Retrieval-Augmented Generation)

目录

    • RAG概念
    • Embedding Model & Vector Store
    • spring-ai 文本检索例子
      • 引入依赖
      • 定义向量存储: 存储两个文本说明书
      • 使用向量存储
      • 测试输出和说明
    • Spring AI 高级RAG功能实现

RAG概念

Retrieval-augmented Generation,简称RAG,检索增强生成,克服大型语言模型在处理长篇内容、事实准确性和上下文感知方面的局限性。

https://docs.spring.io/spring-ai/reference/api/retrieval-augmented-generation.html

Spring AI 通过使用增强器 API(Advisor API)为常见的检索增强生成(RAG)流程提供了现成的支持。

即RAG技术给AI装上了「实时百科大脑」,通过先查资料后回答的机制,让AI摆脱传统模型的”知识遗忘”困境。

四大核心步骤:

  1. 文档切割(语义分割,大文档分割并保证语义完整) → 建立智能档案库
  2. 向量编码(Embedding) → 构建语义地图
  3. 相似检索(VectorStore) → 智能资料猎人
  4. 生成增强(将检索增强作为上下文辅助大模型回答) → 专业报告撰写

参考:https://java2ai.com/docs/1.0.0-M6.1/tutorials/rag/?spm=5176.29160081.0.0.2856aa5cWGxNNo

Embedding Model & Vector Store

Embedding是文本、图像或视频的数值表示,能够捕捉输入之间的关系,Embedding 通过将文本、图像和视频转换为称为向量(Vector)的浮点数数组来工作。这些向量旨在捕捉文本、图像和视频的含义,Embedding 数组的长度称为向量的维度。

VectorStore是一种用于存储和检索高维向量数据的数据库或存储解决方案,它适用于处理那些经过Embedding模型转化后的数据。在 VectorStore 中,查询与传统关系数据库不同。它们执行相似性搜索,而不是精确匹配。当给定一个向量作为查询时,VectorStore 返回与查询向量“相似”的向量。

在这里插入图片描述

spring-ai 文本检索例子

引入依赖

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-advisors-vector-store</artifactId><version>1.0.0</version>
</dependency>

定义向量存储: 存储两个文本说明书

package com.example.demo.advisor;import org.springframework.ai.document.Document;
import org.springframework.ai.embedding.EmbeddingModel;
import org.springframework.ai.vectorstore.SimpleVectorStore;
import org.springframework.ai.vectorstore.VectorStore;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;import java.util.List;@Configuration
public class RagConfig {@BeanVectorStore vectorStore(EmbeddingModel embeddingModel) {SimpleVectorStore simpleVectorStore = SimpleVectorStore.builder(embeddingModel).build();// 生成一个机器人产品说明书的文档List<Document> documents = List.of(new Document("产品说明书:产品名称:科学计算器\n" +"产品描述:科学计算器具备多种数学运算和工程计算功能,主要包含以下核心能力:\n" +"功能:\n" +"1. 数学运算:支持四则运算、三角函数(正弦、余弦、正切)、反三角函数(反正切、反余弦)、对数、指数运算等基础数学功能。部分型号如Panecal支持二进制至十六进制的数制转换。\n" +"2. 存储与编辑:配备存储器(Memory)功能,可保存计算结果并随时调用,支持公式编辑与历史记录追溯。例如Panecal允许多行公式输入和实时编辑,并可通过振动反馈减少误操作。\n" +"3. 单位换算:提供公制/英制等7类单位换算,包括长度、面积、体积、温度等类别,部分型号支持货币汇率转换。\n" +"4. 工程师专用工具:支持开发者模式,提供二进制/十六进制转换、位运算等编程相关功能。\n"),new Document("产品说明书:产品名称:智能机器人\n" +"产品描述:智能机器人是一个智能设备,能够自动完成各种任务。\n" +"功能:\n" +"1. 自动导航:机器人能够自动导航到指定位置。\n" +"2. 自动抓取:机器人能够自动抓取物品。\n" +"3. 自动放置:机器人能够自动放置物品。\n"));simpleVectorStore.add(documents);return simpleVectorStore;}
}

使用向量存储

package com.example.demo.advisor;import org.springframework.ai.chat.client.ChatClient;
import org.springframework.ai.chat.client.advisor.RetrievalAugmentationAdvisor;
import org.springframework.ai.chat.client.advisor.api.Advisor;
import org.springframework.ai.rag.generation.augmentation.ContextualQueryAugmenter;
import org.springframework.ai.rag.retrieval.search.DocumentRetriever;
import org.springframework.ai.rag.retrieval.search.VectorStoreDocumentRetriever;
import org.springframework.ai.vectorstore.VectorStore;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RestController;@RestController
public class AdvisorController {private final ChatClient chatClient;public AdvisorController(ChatClient.Builder chatClientBuilder) {this.chatClient = chatClientBuilder.build();}@Autowiredprivate VectorStore vectorStore;/*** http://localhost:8080/ask?userInput=科学计算器有哪些功能?* http://localhost:8080/ask?userInput=智能机器人有哪些功能?*/@GetMapping("/ask")public String chat(String userInput) {// 4. 配置文档检索器DocumentRetriever retriever = VectorStoreDocumentRetriever.builder().vectorStore(vectorStore).similarityThreshold(0.5)    // 设置相似度阈值.topK(3)                     // 返回前3个最相关的文档.build();Advisor advisor = RetrievalAugmentationAdvisor.builder().queryAugmenter(ContextualQueryAugmenter.builder().allowEmptyContext(true).build()).documentRetriever(retriever).build();return chatClient.prompt().user(userInput).advisors(advisor).call().content();}}

测试输出和说明

可以看到针对用户不同的回答,回答出了不同的产品的功能
在这里插入图片描述

在这里插入图片描述

由此可以看到基于文档数据向量,我们对用户的问题进行了增强回答

Spring AI 高级RAG功能实现

参考文档:https://java2ai.com/docs/1.0.0-M6.1/tutorials/rag/?spm=5176.29160081.0.0.2856aa5cWGxNNo#%E4%B8%89spring-ai-%E9%AB%98%E7%BA%A7rag%E5%8A%9F%E8%83%BD%E5%AE%9E%E7%8E%B0

http://www.xdnf.cn/news/15076.html

相关文章:

  • 上位机知识篇---网络通信端口
  • 线程邮箱(线程间通信的异步缓存机制)
  • OBB旋转框检测配置与训练全流程(基于 DOTA8 数据集)
  • 云原生周刊:镜像兼容性
  • 十、MyBatis的逆向工程
  • 美颜SDK贴纸引擎设计指南:动画、识别与适配的实现逻辑
  • 华为数据通信网络基础
  • 香港站群服务器8C/4C/2C/1C有什么区别
  • 使用you-get命令下载视频/音频/图像
  • 北京-4年功能测试2年空窗-报培训班学测开-第四十八天
  • 【世纪龙科技】几何G6新能源汽车结构原理教学软件
  • 60 美元玩转 Li-Fi —— 开源 OpenVLC 平台入门(附 BeagleBone Black 驱动简单解析)
  • 飞算Java AI:专为 Java 开发者打造的智能开发引擎
  • uniapp制作一个个人页面
  • C++11堆操作深度解析:std::is_heap与std::is_heap_until原理解析与实践
  • [Reverse1] Tales of the Arrow
  • intellij idea的重命名shift+f6不生效(快捷键被微软输入法占用)
  • 【数据库基础 1】MySQL环境部署及基本操作
  • TypeScript---泛型
  • (7)机器学习小白入门 YOLOv:机器学习模型训练详解
  • map数据结构在Golang中是无序的,并且键值对的查找效率较高的原因
  • Linux 命令:tail
  • 如何查看自己本地的公网IP地址?内网环境网络如何开通服务器公网ip提供互联网访问?
  • Lecture #20:Database Logging
  • 深度解析 DApp 开发:从技术架构到商业落地的全链路解决
  • Jenkins 分布式和并发构建
  • RK3566/RK3568 Android11 修改selinux模式
  • 用 React Three Fiber 实现 3D 城市模型的扩散光圈特效
  • 策略模式实现
  • BP神经网络对时序数据进行分类