当前位置：首页 > news >正文

【RAG】使用llamaindex进行RAG开发

news 2025/8/28 6:32:59

RAG基本步骤

parse：将pdf，doc，ppt等file解析成文本，如markdown。有基本的metadata。
chunk：将markdown文本进行分块，比如按大小分，语义分等。可以为每个块添加更丰富的metadata。
index：将每个分块使用embedding model转换为向量，存储到vector db中，方便后续检索。
retrieve：将user query也用embedding model转换为向量，连接vector db进行相似度搜索，rerank等找到和query最相关的top k个块。
generate：根据上一步返回的最相关块和user query结合，调用llm进行生成。一般会有些后处理。

123步会在user上传知识库文件后执行，45步会在user对知识库进行问答时执行。

我们使用llamaindex完成rag整个过程，此外还需要：

minio: object store，存储文件
pgvector: vector db，存储embedding向量
docker env（非必须）

llamaindex提供了high level的RAG实现，但是我们需要更好的灵活性，所以会用更低层的API来做

需要设计五个base类，覆盖5个步骤的基础功能
每个base类有具体实现，能够实现对应功能
实现类按顺序串联，即可形成pipeline执行QA。其中index和retrieve通过db config保持一致
每个步骤可作为一个service

代码等忙完再整理

http://www.xdnf.cn/news/1374031.html

相关文章：

6 种无需 iTunes 将照片从 iPhone 传输到电脑

TDengine IPv6 支持用户手册

“java简单吗？”Java的“简单”与PHP的挑战：编程语言哲学-优雅草卓伊凡

KDMS V4 重磅升级，智能迁移赋能国产化替代！

android证书相关

像WPS Office 一样处理pdf页面尺寸

AI 解决生活小事 2——用 AI 做一回新闻播客

使用人工智能写一个websocket聊天页面

PDF补丁丁：开源多年，完全免费的多功能 PDF 工具箱

如何借助文档控件 TX Text Control 轻松优化 PDF 文件大小？

计算机视觉（三）：opencv环境搭建和图片显示

主键索引和普通索引的区别

基于 Qt 实现的动态流程图画板框架设计与实现

在Windows系统上升级Node.js和npm

FastAPI + SQLModel 从 0 搭到完整 CRUD

STL库——vector（类模拟实现）

skywalking 原理

当AI有了温度，三星正在重新定义生活的边界

技术分析 | Parasoft C/C++test如何突破单元测试的隔离难题

SyntaxError: Failed to execute ‘open‘ on ‘XMLHttpRequest‘: Invalid URL

【C++】set 容器的使用

Android/Java中枚举的详解

基于Spring Boot+Vue的生活用品购物平台/在线购物系统/生活用户在线销售系统/基于javaweb的在线商城系统

JMeter —— 压力测试

基于 Docker Compose 的若依多服务一键部署java项目实践

C# OpenCVSharp 实现物体尺寸测量方案

【Java】异常处理：从入门到精通

npm run start 的整个过程

文字样式设置