当前位置: 首页 > backend >正文

python实现pdfs合并

灵感来源于博主正在学408,在搞到视频课对应的ppt.pdf后发现pdf是按小节的,以至于每章有5-10甚至更多,这可太繁琐了,我想要一章一个pdf就可以了,于是浅浅查了几个CSDN发现使用python的要么收费要么要vip,不用py的就是用在线的网站集成的功能,你知道的要充值才能用。算了还是自己搞吧。

由于博主的目标资源是ppt结成图片形成的pdf,也就是要合并的那些pdf文件的内容啊都是图片形式的,不包含字符,大家区分借鉴。

代码如下:

from PyPDF2 import PdfMerger
import osdef merge_pdfs_with_pypdf2(input_folder, output_file):merger = PdfMerger()# 获取文件夹中所有PDF文件pdf_files = [f for f in os.listdir(input_folder) if f.endswith('.pdf')]pdf_files.sort()  # 按文件名排序for pdf in pdf_files:file_path = os.path.join(input_folder, pdf)merger.append(file_path)# 输出合并后的PDFmerger.write(output_file)merger.close()print(f"PDFs合并完成,输出文件: {output_file}")# 使用示例
merge_pdfs_with_pypdf2(r'存放pdfs的文件夹路径', "最终输出合并后结果的pdf文件路径/merged.pdf")

注意默认按照文件名的排序进行合并,如有其它想法的可以提前手动编号。

http://www.xdnf.cn/news/18113.html

相关文章:

  • Ansible 部署LNMP
  • Read View 在 MVCC 里如何工作的?
  • 下载大模型经常遇到的报错Still waiting to acquire lock on Wan2.1-VACE-14B/.cache与解决办法
  • Linux系统WireShark抓取本地网卡报文
  • 发布npmjs组件库
  • 套接字超时控制与服务器调度策略
  • 多台服务器批量发布arcgisserver服务并缓存切片
  • 开发指南133-设定列表分页的初始默认每页行数
  • vue从入门到精通:搭建第一个vue项目
  • 【React Hooks】封装的艺术:如何编写高质量的 React 自-定义 Hooks
  • Rust学习笔记(六)|Rust 中的常用集合(Vector、String、HashMap)
  • Rust 异步中的 Waker
  • Linux权限的学习
  • 概率论基础教程第4章 随机变量(三)
  • 【opencv-Python学习笔记(7):图像平滑处理】
  • IntelliJ IDEA 开发配置教程
  • 独立看门狗(IWDG)
  • 决策树简单实战
  • 「数据获取」《防城港市统计年鉴》(2014-2020)(获取方式看绑定的资源)
  • 图像分类精度评价的方法——误差矩阵、总体精度、用户精度、生产者精度、Kappa 系数
  • 详细探讨AI在金融、医疗、教育和制造业四大领域的具体落地案例,并通过代码、流程图、Prompt示例和图表等方式展示这些应用的实际效果。
  • 一套GoldenGate → Kafka → Flink → MySQL 的端到端增量同步方案
  • IDE开发系列(1)基于QT的简易IDE框架设计
  • 3D检测笔记:基础坐标系与标注框介绍
  • 深层语义知识图谱:提升NLP文本预处理效果的关键技术
  • 【P18 3-10】OpenCV Python—— 鼠标控制,鼠标回调函数(鼠标移动、按下、。。。),鼠标绘制基本图形(直线、圆、矩形)
  • 在 PyCharm Notebook 中安装 YOLO
  • Jupyter 中实现交互式图表:ipywidgets 从入门到部署
  • 短剧小程序系统开发:推动短剧行业规范化与标准化发展
  • 01数据结构-交换排序