当前位置: 首页 > news >正文

【JeecgBoot AIGC】AI知识库实战应用与搭建

JeecgBoot 平台的 AIGC 功能模块,是一套类似 Dify 的 AIGC应用开发平台 + 知识库问答 子系统,是一款基于 LLM 大语言模型 AI 应用平台和 RAG 的知识库问答系统。 其直观的界面结合了 AI 流程编排、RAG 管道、知识库管理、模型管理、对接向量库、实时运行可观察等,让您可以快速从原型到生产,拥有 AI 服务能力。

体验地址:https://boot3.jeecg.com

源码下载:https://github.com/jeecgboot/JeecgBoot

1. 介绍

本节将介绍如何在系统中添加和管理AI知识库。

AI知识库是一个结合了自然语言处理(NLP)、向量搜索和大语言模型(LLM)的智能信息管理系统,旨在高效存储、检索和管理知识,使AI能够更精准地理解并回答用户的问题。

在本系统中,AI知识库是AI应用、AI流程等模块的核心组成部分,为知识存储与智能检索提供支持。

2. 前置条件

为了使AI能够更精准地理解并回答用户的问题,我们会对文档进行向量化处理,并存储所向量库中;
所以,如果要正常使用知识库,需要准备向量库,并在配置文件中配置向量库的配置。

3. 知识库管理

知识库是多个相关文档的集合。在使用过程中,可以将相关文档组织到同一知识库,并支持从目录、站点等渠道同步文档。

新建知识库

点击 创建知识库,填写以下信息:

  • 知识库名称:用于区分不同知识库。
  • 知识库描述:简要介绍知识库的内容。
  • 向量模型:指定当前知识库使用的向量模型(必须为向量模型)。

向量模型:向量模型是一种 将文本、图片、音频等数据转换为数学向量(Vector) 的技术,使其能够在高维空间中进行计算、比较和检索。

4. 知识库文档

点击已创建的知识库,进入 知识库详情页面

左侧菜单功能:

  • 文档:显示当前知识库的所有文档。
  • 命中测试:输入关键词测试文档的匹配情况。
4.1 创建文档

系统支持两种方式录入文档:

  • 手动录入
  • 文件上传
手动录入

点击 手动录入 按钮,打开手动录入页面:

  • 输入文档标题。
  • 填写文档内容。

文件上传

点击 文件上传 按钮,打开文件上传页面:

  • 输入文档标题。
  • 上传文件,支持格式:txt、markdown、pdf、docx、xlsx、pptx。

点击 确定 后,文档将自动进行向量化。

向量化:向量化是指将文本、图片、音频等数据转换为固定维度的数值向量(Embedding),使其在数学空间中可计算和比较。向量化广泛用于语义搜索、推荐系统和AI知识库。例如,“数据库优化”和“SQL性能提升”的向量相近,因此可视为相关内容。

文档库上传

系统支持批量上传markdown格式的文档库——只需将你的文件压缩为zip包,上传后,所有的markdown文件将被智能地添加到你的文档库中。

这不仅节省了时间,还让你能专注于内容创作,而不必担心繁琐的上传过程。

更棒的是,如果你的文档中涉及到相关的图片文件,例如:

![](/static/aigc/11111.png)

只需确保你的zip包结构正确,像这样:

---|- static|-- aigc|--- 11111.png

系统会自动识别并将图片与你的markdown文件关联起来,确保你的内容始终生动且富有吸引力。

4.2 文档操作

点击文档数据右下角的 ... 按钮,弹出编辑选单,可进行以下操作:

  • 向量化:重新计算并更新文档向量。
  • 编辑:修改文档内容。
  • 删除:移除该文档。

4.3 命中测试

命中测试 页面,可输入测试内容,点击发送后,系统会显示匹配的文档片段。

参数说明:

  • 条数:返回的匹配结果数量。
  • Score阈值:仅当匹配评分(Score)高于设定阈值(Threshold)时,才会返回结果。

匹配结果包含:

  • 命中段落内容
  • 所属文档
  • 分段序号
  • 匹配分数

点击条目可查看详细信息。

http://www.xdnf.cn/news/886231.html

相关文章:

  • 01 Deep learning神经网络的编程基础 二分类--吴恩达
  • Windows应用-GUID工具
  • LFWG2024.08
  • BeeWorks 协同办公能力:局域网内企业级协作的全场景重构
  • 电脑提示dll文件缺失怎么办 dll修复方法
  • 【Elasticsearch】 查询优化方式
  • openvino如何在c++中调用pytorch训练的模型
  • 【Oracle】分区表
  • Maxscript快速入门(四)
  • C#、VB.net——如何设置窗体应用程序的外边框不可拉伸
  • Mermaid画UML类图
  • 深度学习N2周:构建词典
  • 【笔记】解决MSYS2安装后cargo-install-update.exe-System Error
  • Mybatis动态SQL语句
  • aitrader兼容talib,布林带的简单策略,创业板十年年年化15.5%,附代码
  • 成都芯谷金融中心·文化科技产业园:构建产业新城的实践与探索
  • Python打卡训练营day45——2025.06.05
  • 11 - ArcGIS For JavaScript -- 高程分析
  • Redis 缓存策略:借助缓存优化数据库性能并保障数据一致性
  • Liunx进程替换
  • 【Linux篇】0基础之学习操作系统进程
  • 2021 RoboCom 世界机器人开发者大赛-高职组(初赛)解题报告 | 珂学家
  • Spring中@Primary注解的作用与使用
  • Dockerfile实践java项目
  • 哈希算法实战全景:安全加密到分布式系统的“核心引擎”
  • 25_06_05Ubuntu系统root密码破解
  • Vite模块联邦(vite-plugin-federation)实现去中心化微前端后台管理系统架构
  • ROS:pcd点云转为路径规划的pgm文件和yaml文件
  • PHP的namespace
  • 第十三节:第五部分:集合框架:集合嵌套