当前位置: 首页 > ai >正文

使用python 将多个docx文件合并为一个word

先安装python环境 

接着安装依赖 ,采用docxcompose 依赖包 进行合并word,执行如下命令进行安装

pip install docxcompose
from docxcompose.composer import Composer
from docx import Document
import osdef merge_with_docxcompose(doc_list, output_path):master = Document(doc_list[0])composer = Composer(master)for doc_path in doc_list[1:]:doc = Document(doc_path)composer.append(doc)composer.save(output_path)# 定义包含所有需要合并的Word文档路径的列表
documents_to_merge = []
document_dir = './file3'
# 检查目录是否存在
if not os.path.exists(document_dir):raise FileNotFoundError(f"目录 {document_dir} 不存在")# 获取所有.docx文件
for file in sorted(os.listdir(document_dir)):if file.endswith('.docx'):full_path = os.path.join(document_dir, file)documents_to_merge.append(full_path)if not documents_to_merge:raise ValueError("没有找到任何.docx文件进行合并")output_file = 'merged_document5.docx'
# merge_documents(documents_to_merge, output_file)
merge_with_docxcompose(documents_to_merge, output_file)
print(f"文档已成功合并到 {output_file}")

代码说明:  document_dir 是 要合并的文件目录  ;output_file 是合成后的文件  。

依赖包对比: 使用 python-docx 进行合并时, 图片无法合并到新文档中, 使用docxcompose 图片可合并到新文档中。

如果还无法解决实际需求 可考虑

  1. 先将每个文档转为 PDF(使用 python-docx2pdf

  2. 合并 PDF(使用 PyPDF2

  3. 再将合并后的 PDF 转回 Word(如果需要)

http://www.xdnf.cn/news/14906.html

相关文章:

  • 电网的智能觉醒——人工智能重构能源生态的技术革命与公平悖论
  • vue3面试题(个人笔记)
  • 并发编程第一节
  • 首批 | 云轴科技ZStack加入施耐德电气技术本地化创新生态
  • Caffeine的tokenCache与Spring的CaffeineCacheManager缓存区别
  • 一文读懂动态规划:多种经典问题和思路
  • VScode SSH远程连接Ubuntu(通过SSH密钥对的方式)
  • 深度学习遇到的问题
  • C++如何进行性能优化?
  • qt绘制饼状图并实现点击即放大点击部分
  • 前端接收流式数据demo,并用markdown解析数据,包括EventSource和fetch两种方式
  • 前端交互自定义封装类:“双回调自定义信息弹窗”
  • 香港维尔利健康科技集团AI健康云平台通过国际信息安全认证,打造全球健康数据合规新标杆
  • Transformer-BiGRU、Transformer、CNN-BiGRU、BiGRU、CNN五模型回归预测对比,Matlab代码实现
  • Ollama+OpenWebUI 0.42+0.3.35 最新版一键安装教程,解决手动更新失败问题
  • 传输层协议TCP、UDP
  • [NOIP][C++]洛谷P1376 [USACO05MAR] Yogurt factory 机器工厂
  • 实战Linux进程状态观察:R、S、D、T、Z状态详解与实验模拟
  • 智能推荐社交分享小程序(websocket即时通讯、协同过滤算法、时间衰减因子模型、热度得分算法)
  • 自动驾驶感知系统
  • 爬虫-request处理POST
  • 当DMA想“越狱”:IOMMU怎么硬核拦截?
  • c语言学习_函数递归
  • 深度学习-多分类
  • Linux网络:UDP socket创建流程与简单通信
  • AWS OpenSearch Dev Tools使用
  • FastAPI Docker环境管理脚本使用指南
  • 人体坐姿检测系统开发实战(YOLOv8+PyTorch+可视化)
  • 微服务集成snail-job分布式定时任务系统实践
  • 向量与向量组的线性相关性 线性代数