当前位置: 首页 > news >正文

解决RAGFlow(v0.19.0)有部分PDF无法解析成功的问题。

ragflow版本为:v0.19.0


1.解析的时候报错:Internal server error while chunking: Coordinate lower is less than upper。
看报错怀疑是分片的问题,于是把文档的切片方法中的“建议文本块大小”数值(默认512)调小,比如300,发现有些原来不能解析的PDF文档能成功解析了。


2.但是还是有些PDF解析的时候报错如下图:


看报错怀疑是内存不足,实际查看了下CPU的使用情况,发现解析文档的时候CPU已经使用到了99%。但是我使用的启动容器命令是:docker compose -p ragflow -f docker-compose-gpu.yml up -d 。按理说应该使用GPU的,无解。于是想着怎么精简内存,考虑到我们的嵌入模型是自己部署的,于是决定不在使用v0.19.0版本, 遂将docker/.env 文件内的 RAGFLOW_IMAGE 变量改成使用v0.19.0-slim,这样可以减少使用的内存。

重启,发现能成功解析文档。

如果您有其他更好的解决方法,欢迎一起留言讨论。

http://www.xdnf.cn/news/726193.html

相关文章:

  • JNI开发流程
  • Ubuntu 桌面版忘记账户密码的重置方法
  • BaseTypeHandler用法-笔记
  • 【Linux 学习计划】-- 进程状态 | 进程运行、阻塞和挂起的本质 | 并行、并发与进程切换 | 进程优先级
  • Flink2.0及Flink-operater在K8S上部署
  • 基于51单片机的音乐盒键盘演奏proteus仿真
  • git查看commit属于那个tag
  • LangChain完全指南:从入门到精通,打造AI应用开发新范式
  • lua的笔记记录
  • MSTNet:用于糖尿病视网膜病变分类的多尺度空间感知 Transformer 与多实例学习方法|文献速递-深度学习医疗AI最新文献
  • LLM 使用 MCP 协议及其原理详解
  • SQL进阶之旅 Day 8:窗口函数实用技巧
  • 极简以太彩光网络解决方案4.0正式发布,“彩光”重构园区网络极简之道
  • PostgreSQL ALTER TABLE 命令详解
  • Visual Studio 2022 发布独立的 exe 文件
  • 1,QT的编译教程
  • (18)混合云架构部署
  • 论文阅读笔记——FLOW MATCHING FOR GENERATIVE MODELING
  • 二、OpenCV图像处理-图像处理
  • QT-Creator安装教程(windows)
  • 【技能篇】RabbitMQ消息中间件面试专题
  • Fusion引擎赋能:流利说如何用阿里云Serverless Spark实现数仓计算加速
  • 世冠科技亮相中汽中心科技周MBDE会议,共探汽车研发数字化转型新路径
  • 农村土地承包经营权二轮延包—生成地块的KJZB字段
  • React---day5
  • Flutter 4.x 版本 webview_flutter 嵌套H5
  • 自证式推理训练:大模型告别第三方打分的新纪元
  • GitHub 趋势日报 (2025年05月29日)
  • FPGA管脚类型,及选择
  • Vue3处理number输入框避免NaN