当前位置: 首页 > news >正文

PDFMathTranslate:科学 PDF 文件翻译及双语对照工具

PDFMathTranslate:科学 PDF 文件翻译及双语对照工具

在科研和学习过程中,我们经常会遇到大量的英文 PDF 文献,翻译这些文献成为了一项繁琐且耗时的工作。PDFMathTranslate 是一款强大的科学 PDF 文件翻译及双语对照工具,它能够保留公式、图表、目录和注释,支持多种语言和诸多翻译服务,还提供了命令行工具、图形用户界面以及容器化部署等多种使用方式。本文将详细介绍 PDFMathTranslate 的功能、安装方法和使用教程。

一、功能特点

  1. 保留关键元素:能够保留 PDF 文件中的公式、图表、目录和注释,确保翻译后的文档格式完整。
  2. 多语言支持:支持多种语言的翻译,满足不同用户的需求。
  3. 多种翻译服务:集成了多种翻译服务,如 Google、Bing、DeepL 等,用户可以根据自己的需求选择合适的翻译服务。
  4. 多种使用方式:提供命令行工具、图形用户界面和容器化部署等多种使用方式,方便不同场景下的使用。

二、安装方法

PDFMathTranslate 提供了多种安装方法,用户可以根据自己的需求选择合适的安装方式。

1. UV 安装

# 安装 Python (3.10 <= 版本 <= 3.12)
# 安装 uv 工具
pip install uv
# 使用 uv 工具安装 pdf2zh
uv tool install --python 3.12 pdf2zh

2. Windows exe 安装

从 发布页面 下载 pdf2zh-version-win64.zip,解压缩并双击 pdf2zh.exe 运行。

3. 图形用户界面 (GUI) 安装

# 安装 Python (3.10 <= 版本 <= 3.12)
# 安装 pdf2zh 包
pip install pdf2zh
# 在浏览器中开始使用
pdf2zh -i

如果浏览器没有自动启动,请访问 http://localhost:7860/

4. Docker 安装

# 拉取 Docker 镜像
docker pull byaidu/pdf2zh
# 运行 Docker 容器
docker run -d -p 7860:7860 byaidu/pdf2zh

在浏览器中打开 http://localhost:7860/

对于云服务上的 Docker 部署,还提供了多种一键部署的链接:

  • Heroku
  • Render
  • Zeabur
  • Sealos
  • Koyeb

三、使用教程

1. 命令行工具使用

# 执行翻译,文件生成在当前工作目录
pdf2zh document.pdf

2. 图形用户界面使用

打开浏览器,访问 http://localhost:7860/,在界面中上传需要翻译的 PDF 文件,选择翻译服务和目标语言,点击翻译按钮即可开始翻译。

3. 高级使用选项

选项功能示例
-f, -c异常pdf2zh example.pdf -f "(MS.*)"
-cp兼容模式pdf2zh example.pdf --compatible
--share公开链接pdf2zh -i --share
--authorized授权pdf2zh -i --authorized users.txt [auth.html]
--prompt自定义提示pdf2zh --prompt [prompt.txt]
--onnx[使用自定义 DocLayout-YOLO ONNX 模型]pdf2zh --onnx [onnx/model/path]
--serverport[使用自定义 WebUI 端口]pdf2zh --serverport 7860
--dir[批量翻译]pdf2zh --dir /path/to/translate/
--config配置文件pdf2zh --config /path/to/config/config.json

4. 无法安装时的解决方案

  • Python API:可以在其他 Python 程序中使用该程序,详细信息请参考 Python API 文档。
  • HTTP API:可以与已安装该程序的服务器进行通信,详细信息请参考 HTTP API 文档。

四、待办事项

项目还有一些待办事项,如使用基于 DocLayNet 的模型解析布局、修复页面旋转和目录格式、支持非 PDF/A 文件等,感兴趣的开发者可以参与项目的开发。

五、致谢

Immersive Translation 为此项目的活跃贡献者提供每月的专业会员兑换码,详细信息请查看 CONTRIBUTOR_REWARD.md。

六、总结

PDFMathTranslate 是一款功能强大、使用方便的科学 PDF 文件翻译及双语对照工具,它提供了多种安装和使用方式,能够满足不同用户的需求。无论是科研人员、学生还是其他需要翻译 PDF 文献的用户,都可以尝试使用 PDFMathTranslate 来提高翻译效率。

http://www.xdnf.cn/news/406027.html

相关文章:

  • Web4X:站在Web4.0时代的起点,定义AI商业新生态
  • 专业知识的检索过程 stepbystep - 样例
  • ARM-CortexM固件升级相关问题研究
  • 采用AI神经网络降噪算法的通信语音降噪(ENC)模组性能测试和应用
  • 学习笔记:Conda 环境共享
  • 2025年SDK游戏盾技术深度解析:AI赋能下的DDoS/CC攻击防御革命
  • Html5新特性_js 给元素自定义属性_json 详解_浅克隆与深克隆
  • 模型上下文协议(MCP):AI的“万能插座”
  • Halcon案例(一):C#联合Halcon识别路由器上的散热孔
  • 【Vue3】使用vite创建Vue3工程、Vue3基本语法讲解
  • Windows 添加 hosts 映射
  • 零碳园区能源系统-多能互补体系
  • 星海智算云平台部署GPT-SoVITS模型教程
  • 傲云源墅:以五傲价值重构北京主城别墅格局
  • Spring MVC 和 Spring Boot 是如何访问静态资源的?
  • MySQL数据库表的约束
  • 反弹shell再入门
  • MySQL查询优化100条军规
  • 深度解析RagFlow:本地大模型驱动的高效知识库应用搭建指南
  • Java MVC
  • nRF5_SDK_17.1.0_ddde560之ble_app_uart_c 出错
  • [Java实战]Spring Boot 整合 Session 共享(十七)
  • LintCode第42题-最大子数组 II
  • 《Vuejs设计与实现》第 5 章(非原始值响应式方案) 中
  • OpenCV 的 CUDA 模块中用于将一个多通道 GpuMat 图像拆分成多个单通道图像的函数split()
  • 【AI News | 20250512】每日AI进展
  • 一键生成达梦、Oracle、MySQL 数据库 ER 图!解锁高效数据库设计!
  • 【LeetCode】49.字母异位词分组
  • 典籍知识问答重新生成和消息修改Bug修改
  • 从零搭建AI工作站:Gemma3大模型本地部署+WebUI配置全套方案