当前位置: 首页 > news >正文

【Ragflow】22.RagflowPlus(v0.3.0):用户会话管理/文件类型拓展/诸多优化更新

概述

在历经三周的阶段性开发后,RagflowPlus顺利完成既定计划,正式发布v0.3.0版本。

开源地址:https://github.com/zstar1003/ragflow-plus

新功能

1. 用户会话管理

在后台管理系统中,新增用户会话管理菜单。在此菜单中,可以查看每个用户的聊天历史信息。

用户会话管理菜单功能演示

2. 知识库图像预览显示

在前台知识库管理界面中,增加了一块关联图片显示区域

如果chunk块具有关联图片,会在此区域显示。

关联图像显示示例

3. 解析文件类型拓展

v0.2.1版本中,解析仅支持三种简单类型:pdf、word、ppt。

v0.3.0版本对文件类型进行进一步拓展,目前支持各种主流文件类型,包括:pdf、word、ppt、excel、txt、md、html、jpg、png、bmp。

其中,对于excel类型,做了单独的处理优化。

每个表格会单独将每行作为一个独立的chunk块,同时会自动添加表格表头。

学生花名单-excel表格解析结果示例

上图展现了一个学生花名单的解析效果,通过自动添加表头,可以保证每列信息的准确含义,从而能够准确问答检索。

比如,我问某学生的学号,它能够找到正确的分块,从而进行回答。

信息查询问答实例:查询某学生的学号

此外,对于图像类型的文件,也能正常解析。

图像文件解析示例

4. 聊天对话字体动态调节

在前台聊天界面中,额外添加了一个设置按钮,可以动态调节聊天窗口显示的字体大小。

经测试,使用docker部署时,该功能可能不生效,仍需进行排查修复。

改进优化

1. 信息自定义排序

在后台管理系统中,大部分表格都配置了排序功能。

这样可以根据条件(如创建时间)进行排序,从而快速筛选出记录。

在向知识库添加文件时,也可以通过该方式,快速添加最新上传的文件内容。

点击表头,可升序/降序排列信息

2. 知识库创建优化

在知识库创建界面中,新增创建人选项,可以在已有用户中添加。

通过该选项,可为不同用户单独添加知识库。

新建知识库时,指定创建人

同时,对于每个知识库,新增修改选项,从而可以让知识库权限在个人和团队中自由设定。

知识库权限修改

3. 嵌入模型适配硅基流动API

v0.2.1版本中,后台解析并不支持配置的在线嵌入模型。

v0.3.0版本中,增加了对硅基流动平台的模型适配。

硅基流动平台的bge-m3可免费使用

如果不想在本地下载embedding模型,可以直接在硅基流动平台上,注册密钥,配置使用。

硅基流动地址:https://cloud.siliconflow.cn/i/J8xf97VO

具体修改方式是先用初始用户(第一个创建的用户)登录前台系统,配置好模型信息。

前台配置模型信息

配置完成后,后台测试嵌入模型配置时,信息自动更新。

后台配置模型连接测试

需要注意的是,对于同一个知识库,不能混用不同的解析模型,否则会出现异常。

为防止误操作,该版本强制统一嵌入模型为bge-m3,使用其它嵌入模型将可能无法正常工作。

4. 修复用户人数>10人时,团队添加成员显示不全问题

当前版本,团队中可自由添加所有成员,且默认采用倒序排序,可以快速选择新用户。

5. 修复用户创建时间异常问题

设置时区为东八区(UTC+8时区),解决用户创建时间显示异常问题。

6. 移除vllm的docker默认配置

docker配置文件中,移除vllm的默认容器配置,因为 vllm 默认拉取使用的模型是 float16 精度,导致众多用户因显存不足无法正常使用。

对于个人用户,推荐使用ollama,默认拉取的模型为 int4 精度,比较友好。

7. MinerU版本更新

采用当前最新版本的MinerU(v1.3.11),性能较先前版本会略有提升。

8. minio地址可编辑

docker/.env文件中,新增MINIO_VISIT_HOST用于动态控制minio上传文件时的ip地址。

如需将解析图片配置公网访问,可修改此地址为公网地址。

9. 其它优化

其它细碎更新点,不逐一罗列,具体可见仓库Commits记录。

下版本开发计划

下版本的工作重点将围绕临时文件上传和文档撰写两个功能项进行优化。

文件上传优化方向

在原版的 ragflow 中,用户在问答界面中,上传文件后,文件会自动将文件添加进知识库,并自动进行解析。

v0.3.0中,临时移除上传文件功能

ragflow-plus的改进思路是:将用户上传的文件进行临时解析,插入缓存数据库,而不是直接塞入存储库中。

根据解析得到的文件文本信息,作为问答参考的一部分。

文档撰写优化方向

文档撰写主要有以下优化方向:

  • 1.文档模板支持自定义

  • 2.文档内容支持暂存

  • 3.文档撰写时,调用单独的模型问答接口

  • 4.支持问答结果的流式输出

  • 5.导出word时,支持图文内容

该方向部分功能原本计划在此版本完成,但鉴于鸽🕊得过久,移到下版本在做。

问题反馈

在使用过程中,如遇到问题,可以在开源仓库中提交issue。

提交同时,推荐附上容器日志信息,比如在后台管理系统中,遇到解析失败的问题,可以查看后台容器日志信息:

docker logs ragflowplus-management-backend
http://www.xdnf.cn/news/500275.html

相关文章:

  • 51单片机课设基于GM65模块的二维码加条形码识别
  • python第二十八天
  • Oracle APEX IR报表下载CSV文件的方法
  • [Java] 方法和数组
  • FauxGen:一款由 CodeBuddy 主动构建的假数据生成器
  • 语音转文字
  • 使用Spring Boot与Spring Security构建安全的RESTful API
  • 基于大疆Mini 3无人机和指定软件工具链的完整3D建模工作
  • JavaScript防抖与节流全解析
  • C# lock
  • 端到端自动驾驶系统实战指南:从Comma.ai架构到PyTorch部署
  • 通义千问-langchain使用构建(三)
  • 2025年渗透测试面试题总结-百度面经(题目+回答)
  • YOLO (You Only Look Once)版本历程学习
  • Java泛型详解
  • Vue百日学习计划Day21-23天详细计划-Gemini版
  • Elasticsearch 官网阅读之 Term-level Queries
  • 关于软件测试开发的一些有趣的知识
  • ElasticSearch 8.x新特性面试题
  • 【论文阅读】针对BEV感知的攻击
  • python:gimp 与 blender 两个软件如何协作?
  • 5.27本日总结
  • JSP链接MySQL8.0(Eclipse+Tomcat9.0+MySQL8.0)
  • markdown 文档编辑软件 MarkText 使用教程
  • QT软件安装
  • 项目复习(1)
  • 刷leetcodehot100返航版--二叉树
  • JavaScript【7】BOM模型
  • MODBUS RTU通信协议详解与调试指南
  • 利用人工智能优化求职流程:开发一个智能求职助手