当前位置: 首页 > web >正文

pdf2zh 简明本地部署和api调用,以及离线部署总结

pdf2zh是一个开源的能够保留pdf文档格式的翻译项目,地址为:https://github.com/Byaidu/PDFMathTranslate

这里主要介绍如何在python环境下使用。

在创建好新的环境后,安装非常简单

pip install pdf2zh

支持网上大模型和本地大模型,这里以本地大模型为例,使用方法有两种,一种是cmd运行,一种是python调用:

1.cmd 运行:

pdf2zh example.pdf -s "ollama:qwen2:7b"

2.python调用

from pdf2zh import translate, translate_streamfrom pdf2zh.doclayout import OnnxModel
model=OnnxModel.load_available()params = {"model": model,"output":"data/",'lang_in': 'en','lang_out': 'zh','service': 'ollama:gemma3:1b','thread': 4,}(file_mono, file_dual) = translate(files=['data/example2.pdf'], **params)[0]

当前版本在安装后可能无法正常运行,尝试以下解决方法

1.安装vc_redist.x64.exe ;

2.更新pdf2zh;

如果想在离线电脑运行上述项目,除了保证大模型正常运行外,还需要拷贝C:\Users\{Name}\.cache下babeldoc和pdf2zh两个文件夹,放在本地相应文件夹下面,保证程序能够正常调用。

http://www.xdnf.cn/news/12422.html

相关文章:

  • 行业案例 | ASOS 借助 Azure AI Foundry(国际版)为年轻时尚爱好者打造惊喜体验
  • 在Windows下利用LoongArch-toolchain交叉编译Qt
  • QuaggaJS用法详解
  • 分布式协同自动化办公系统-工作流引擎-流程设计
  • aardio 简单网页自动化
  • 命令行以TLS/SSL显式加密方式访问FTP服务器
  • 应用分享 | 精准生成和时序控制!AWG在确定性三量子比特纠缠光子源中的应用
  • http头部注入攻击
  • MySQL基础(二)SQL语言、客户端工具
  • 中国首套1公里高分辨率大气湿度指数数据集(2003~2020)
  • 服务器健康摩尔斯电码:深度解读S0-S5状态指示灯
  • ADI的BF609双核DSP怎么做开发,我来说一说(五)LAN口测试
  • 在.NET Core控制器中获取AJAX传递的Body参数
  • 【行驶证识别成表格】批量OCR行驶证识别与Excel自动化处理系统,行驶证扫描件和照片图片识别后保存为Excel表格,基于QT和华为ocr识别的实现教程
  • AI大模型学习三十三、HeyGem.ai 服务端(ubuntu)docker 安装 /客户端(win)分离部署
  • 【Linux】虚拟机代理,自动化脚本修改~/.bashrc
  • GAN生成模型评价体系:从主观感知到客观度量的技术演进
  • LeetCode 2434.使用机器人打印字典序最小的字符串:贪心(栈)——清晰题解
  • 推荐算法八股总结
  • 区块链可投会议CCF A--SP 2026 截止11.13 附录用率
  • mitmproxy 爬虫,下载自己的博客图片
  • 【数据分析】R版IntelliGenes用于生物标志物发现的可解释机器学习
  • 5.2 HarmonyOS NEXT应用性能诊断与优化:工具链、启动速度与功耗管理实战
  • transformer和 RNN以及他的几个变体区别 改进
  • 【Redis】分布式锁的介绍与演进之路
  • Windows系统中如何使用符号链接将.vscode等配置文件夹迁移到D盘(附 CMD PowerShell 双版本命令)
  • 人机融合智能 | “人智交互”跨学科新领域
  • MAX3490
  • 如何在没有 iTunes 的情况下备份 iPhone
  • 如何让AI自己检查全文?使用OCR和LLM实现自动“全文校订”(可DIY校订规则)