当前位置：首页 > backend >正文

python实现pdfs合并

backend 2025/8/25 16:26:08

灵感来源于博主正在学408，在搞到视频课对应的ppt.pdf后发现pdf是按小节的，以至于每章有5-10甚至更多，这可太繁琐了，我想要一章一个pdf就可以了，于是浅浅查了几个CSDN发现使用python的要么收费要么要vip，不用py的就是用在线的网站集成的功能，你知道的要充值才能用。算了还是自己搞吧。

由于博主的目标资源是ppt结成图片形成的pdf，也就是要合并的那些pdf文件的内容啊都是图片形式的，不包含字符，大家区分借鉴。

代码如下：

from PyPDF2 import PdfMerger
import osdef merge_pdfs_with_pypdf2(input_folder, output_file):merger = PdfMerger()# 获取文件夹中所有PDF文件pdf_files = [f for f in os.listdir(input_folder) if f.endswith('.pdf')]pdf_files.sort()  # 按文件名排序for pdf in pdf_files:file_path = os.path.join(input_folder, pdf)merger.append(file_path)# 输出合并后的PDFmerger.write(output_file)merger.close()print(f"PDFs合并完成，输出文件: {output_file}")# 使用示例
merge_pdfs_with_pypdf2(r'存放pdfs的文件夹路径', "最终输出合并后结果的pdf文件路径/merged.pdf")

注意默认按照文件名的排序进行合并，如有其它想法的可以提前手动编号。

http://www.xdnf.cn/news/18113.html

相关文章：

Ansible 部署LNMP

Read View 在 MVCC 里如何工作的？

下载大模型经常遇到的报错Still waiting to acquire lock on Wan2.1-VACE-14B/.cache与解决办法

Linux系统WireShark抓取本地网卡报文

发布npmjs组件库

套接字超时控制与服务器调度策略

多台服务器批量发布arcgisserver服务并缓存切片

开发指南133-设定列表分页的初始默认每页行数

vue从入门到精通：搭建第一个vue项目

【React Hooks】封装的艺术：如何编写高质量的 React 自-定义 Hooks

Rust学习笔记（六）｜Rust 中的常用集合（Vector、String、HashMap）

Rust 异步中的 Waker

Linux权限的学习

概率论基础教程第4章随机变量(三)

【opencv-Python学习笔记（7）：图像平滑处理】

IntelliJ IDEA 开发配置教程

独立看门狗（IWDG）

决策树简单实战

「数据获取」《防城港市统计年鉴》（2014-2020）（获取方式看绑定的资源）

图像分类精度评价的方法——误差矩阵、总体精度、用户精度、生产者精度、Kappa 系数

详细探讨AI在金融、医疗、教育和制造业四大领域的具体落地案例，并通过代码、流程图、Prompt示例和图表等方式展示这些应用的实际效果。

一套GoldenGate → Kafka → Flink → MySQL 的端到端增量同步方案

IDE开发系列（1）基于QT的简易IDE框架设计

3D检测笔记：基础坐标系与标注框介绍

深层语义知识图谱：提升NLP文本预处理效果的关键技术

【P18 3-10】OpenCV Python—— 鼠标控制，鼠标回调函数（鼠标移动、按下、。。。），鼠标绘制基本图形（直线、圆、矩形）

在 PyCharm Notebook 中安装 YOLO

Jupyter 中实现交互式图表：ipywidgets 从入门到部署

短剧小程序系统开发：推动短剧行业规范化与标准化发展

01数据结构-交换排序