python的​PyPDF2实现pdf文件切割和合并

作者:qq_29235677 时间:2023-02-07 19:57:39 

今天想使用pdf的切分软件实现pdf文件的切分,但是软件需要会员???好吧,,,,又要会员,这么简单的功能能难倒咱们程序员吗。俗话说自给自足丰衣足食,决定使用python自己切分文件。

在百度了一番后,发现大多都是使用 Adobe Acrobat 软件进行剪裁,这完全不 Pythonic,因此又找了用 Python 处理 PDF 文件的方法,最后发现了 PyPDF2 这个库,本文将利用这个库,实现对 PDF 的分割。

首先,你需要通过 pip 安装这个库:

pip install PyPDF2

要使用python的

# 导入读写pdf模块
from PyPDF2 import PdfFileReader, PdfFileWriter
'''
注意:
页数从0开始索引
range()是左闭右开区间
'''

def split_pdf(file_name, start_page, end_page, output_pdf):
   '''
   :param file_name:待分割的pdf文件名
   :param start_page: 执行分割的开始页数
   :param end_page: 执行分割的结束位页数
   :param output_pdf: 保存切割后的文件名
   '''
   # 读取待分割的pdf文件
   input_file = PdfFileReader(open(file_name, 'rb'))
   # 实例一个 PDF文件编写器
   output_file = PdfFileWriter()
   # 把分割的文件添加在一起
   for i in range(start_page, end_page):
       output_file.addPage(input_file.getPage(i))
   # 将分割的文件输出保存
   with open(output_pdf, 'wb') as f:
       output_file.write(f)

def merge_pdf(merge_list, output_pdf):
   """
   merge_list: 需要合并的pdf列表
   output_pdf:合并之后的pdf名
   """
   # 实例一个 PDF文件编写器
   output = PdfFileWriter()
   for ml in merge_list:
       pdf_input = PdfFileReader(open(ml, 'rb'))
       page_count = pdf_input.getNumPages()
       for i in range(page_count):
           output.addPage(pdf_input.getPage(i))

output.write(open(output_pdf, 'wb'))

if __name__ == '__main__':
   # 分割pdf
   split_pdf("test.pdf", 0, 3, "0-2.pdf")
   split_pdf("test.pdf", 7, 12, "7-11.pdf")
   split_pdf("test.pdf", 18, 23, "18-22.pdf")
   split_pdf("test.pdf", 27, 33, "26-32.pdf")
   split_pdf("test.pdf", 40, 44, "40-43.pdf")
   split_pdf("test.pdf", 46, 51, "46-50.pdf")
   split_pdf("test.pdf", 58, 66, "58-65.pdf")
   split_pdf("test.pdf", 77, 84, "77-83.pdf")
   split_pdf("test.pdf", 93, 97, "93-96.pdf")
   split_pdf("test.pdf", 102, 106, "102-105.pdf")
   # 合并pdf
   # 合并的pdf列表
   pdf_list = ["0-2.pdf", "7-11.pdf", "18-22.pdf", "26-32.pdf", "40-43.pdf", "46-50.pdf", "58-65.pdf", "77-83.pdf", "93-96.pdf", "102-105.pdf"]
   merge_pdf(pdf_list, "all.pdf")

下面是切分好的文件效果,完美 

python的​PyPDF2实现pdf文件切割和合并

来源:https://blog.csdn.net/qq_29235677/article/details/122895023

标签:python,PyPDF2,pdf
0
投稿

猜你喜欢

  • python字符串的多行输出的实例详解

    2021-06-25 20:59:45
  • python实现控制台打印的方法

    2021-12-18 12:21:04
  • Python判断文件和文件夹是否存在的方法(最新推荐)

    2022-06-08 02:53:32
  • python3+requests接口自动化session操作方法

    2022-09-22 19:30:40
  • 在linux下实现 python 监控usb设备信号

    2022-04-18 15:29:24
  • springMVC + easyui + $.ajaxFileUpload实现文件上传注意事项

    2023-09-04 09:17:26
  • PHP实现数组根据某个字段进行水平合并,横向合并案例分析

    2023-10-04 04:55:53
  • 关注各网站的布局调整

    2008-09-23 18:14:00
  • python解析.pyd文件的详细代码

    2022-08-04 22:16:45
  • python机器学习实现决策树

    2021-04-21 07:44:34
  • Python连接phoenix的方法示例

    2023-05-24 06:25:19
  • WxPython建立批量录入框窗口

    2023-11-18 15:47:00
  • Access2000迁移到Oracle9i要点

    2010-07-27 13:10:00
  • Python3.6 + TensorFlow 安装配置图文教程(Windows 64 bit)

    2021-07-28 21:15:04
  • Python类如何定义私有变量

    2023-04-18 11:23:23
  • JS IOS/iPhone的Safari浏览器不兼容Javascript中的Date()问题如何解决

    2023-09-23 19:39:47
  • Numpy 数据处理 ndarray使用详解

    2021-01-30 18:05:11
  • Python代码列表求并集,交集,差集

    2021-12-03 03:33:38
  • 关于Python如何安装requests库

    2021-10-18 04:12:38
  • python矩阵运算,转置,逆运算,共轭矩阵实例

    2021-09-16 17:45:22
  • asp之家 网络编程 m.aspxhome.com