Python3压缩和解压缩实现代码

作者:Python探索牛 时间:2022-05-04 09:42:19 

一、说明

压缩和解压缩是日常常用的操作,不管是windows上图形界面的操作,还是linux上用命令来进行压缩解压缩,总的而言都还是比较方便的。

但用代码来实现就没做过,近期也得实现代码压缩与解压缩操作,所以就抽时间来研究一下。

二、zip文件压缩和解压缩实现


import os
import zipfile

# 函数功能是zip_file_list所有文件,和zip_dir_list所有目录下的所有文件,被压缩到一个zip_file_name的压缩文件中
def my_zip_function(zip_file_name, zip_file_list=[], zip_dir_list=[]):
 # 压缩文件最后需要close,为了方便我们直接用with
 with zipfile.ZipFile(zip_file_name, "w") as zip_obj:
   # 压缩文件
   for tmp_file in zip_file_list:
     zip_obj.write(tmp_file)
   # 压缩目录
   for tmp_dir in zip_dir_list:
     # zipfile没有直接压缩目录的功能,要压缩目录只能遍历目录一个一个文件压。
     for root, dirs, files in os.walk(tmp_dir):
       # 如果想要目录为空时仍将该目录压缩进去,该目录也要压缩一遍;反之请将以下行注释掉
       zip_obj.write(root)
       for tmp_file in files:
         # 拼接文件完整目录,不然只用文件名代码找不到文件
         tmp_file_path = os.path.join(root, tmp_file)
         zip_obj.write(tmp_file_path)

# 函数功能是遍历压缩文件中的所有文件
def my_traversal_zip_function(zip_file_name):
 with zipfile.ZipFile(zip_file_name, "r") as zip_obj:
   # 返回结果是一个ZipInfo列表
   # 如果在压缩时显示压缩目录,则目录也作为一个单独的ZipInfo呈现在列表中;反之则没有目录的ZipInfo
   all_file_list = zip_obj.infolist()
   for tmp_file in all_file_list:
     print(tmp_file.filename)
     # 还可以在不解压的情况下直接读取文件的内容
     # 可以通过ZipInfo.is_dir()来区分是文件还是目录
     # if not tmp_file.is_dir():
     #   with zip_obj.open(tmp_file) as zip_fd:
     #     print(zip_fd.read())

# 函数的功能是将压缩文件直接解压
def my_unzip_function(zip_file_name, path="."):
 with zipfile.ZipFile(zip_file_name, "r") as zip_obj:
   zip_obj.extractall(path=path)

if __name__ == "__main__":
 zip_file_name = "test_zip.zip"
 # 自己在测试时要先自行创建好要压缩的文件和目录
 zip_file_list = ["test_tar_file1.txt", "test_tar_file2.txt"]
 zip_dir_list = ["test_tar_dir"]
 my_zip_function(zip_file_name, zip_file_list, zip_dir_list)
 my_traversal_zip_function(zip_file_name)
 # my_unzip_function(zip_file_name, path=".")

三、tar文件的压缩与解压缩实现

除了直接的.tar文件,还包括.tar.gz/.tar.bz2/.tar.xz等格式文件的压缩与解压缩实现。


import os
import tarfile

# Python学习交流群:778463939
# 函数功能是tar_file_list所有文件,和tar_dir_list所有目录下的所有文件,被压缩到一个tar_file_name的压缩文件中
def my_tar_function(tar_file_name, tar_file_list=[], tar_dir_list=[], model="w"):
 # 本来也应该是tarfile.TarFile(tar_file_name, model)来创建的,但TarFile不支持"r:gz"等扩展形式
 # 压缩文件最后需要close,为了方便我们直接用with
 with tarfile.open(tar_file_name, model) as tar_obj:
   # 压缩文件
   for tmp_file in tar_file_list:
     tar_obj.add(tmp_file)
   # 压缩目录。和zipfile相比tarfile允许直接压缩目录,而不需要去遍历目录一个个文件压
   for tmp_dir in tar_dir_list:
     tar_obj.add(tmp_dir)

# 函数功能是遍历压缩文件中的所有文件
def my_traversal_tar_function(tar_file_name, model="r"):
 with tarfile.open(tar_file_name, model) as tar_obj:
   # 返回结果是一个TarInfo列表
   all_file_list = tar_obj.getmembers()
   for tmp_file in all_file_list:
     print(tmp_file.name)
     # 还可以在不解压的情况下直接读取文件的内容
     # 可以通过TarInfo.isdir()来区分是文件还是目录
     # if not tmp_file.isdir():
     #   # 相当于zip的open,并不会把文件给解压出来
     #   tar_fd = tar_obj.extractfile(tmp_file)
     #   print(tar_fd.read())

# 函数的功能是将压缩文件直接解压
def my_untar_function(tar_file_name, path=".", model="r"):
 with tarfile.open(tar_file_name, model) as tar_obj:
   tar_obj.extractall(path=path)

if __name__ == "__main__":
 # 自己在测试时要先自行创建好要压缩的文件和目录
 tar_file_list = ["test_tar_file1.txt", "test_tar_file2.txt"]
 tar_dir_list = ["test_tar_dir"]
 tar_file_name = "test_tar.tar"
 # 在.tar基础上,tarfile还支持gz/bz2/xz的压缩,只要在原来打开模式的基础上使用:或|接上压缩方法即可,如"r:gz"
 # 特别的,如果是读取文件,可以使用"r:*"来指示尝试以任意格式读取
 open_model = "w"
 # open_model = "w:gz"
 my_tar_function(tar_file_name, tar_file_list, tar_dir_list, model=open_model)
 open_model = "r"
 # open_model = "r:*"
 my_traversal_tar_function(tar_file_name, model=open_model)
 # open_model = "r:*"
 # my_untar_function(tar_file_name, path=".", model=open_model)

来源:https://www.cnblogs.com/djdjdj123/archive/2021/02/28/14459634.html

标签:Python3,压缩,解压缩
0
投稿

猜你喜欢

  • Python教程按照字典的键或值进行排序方法解析

    2023-01-12 09:10:26
  • Python爬虫中urllib库的进阶学习

    2023-12-13 19:31:53
  • 详解Python相关文件常见的后缀名

    2021-05-21 23:47:53
  • pyecharts如何实现显示数据为百分比的柱状图

    2021-06-27 17:11:52
  • 浅谈python numpy中nonzero()的用法

    2021-09-23 00:06:01
  • 浅谈javascript:两种注释,声明变量,定义函数

    2024-04-16 09:06:06
  • python中pyqtgraph知识点总结

    2022-02-23 10:24:30
  • 解决MySQL主从数据库没有同步的两种方法

    2024-01-15 03:34:44
  • VSCode 云同步扩展设置Settings Sync插件

    2022-08-30 03:20:54
  • Vue传参一箩筐(页面、组件)

    2024-05-29 22:44:13
  • 对python numpy.array插入一行或一列的方法详解

    2022-12-08 15:44:07
  • Python高级特性之切片迭代列表生成式及生成器详解

    2021-06-25 23:10:13
  • python备份文件的脚本

    2023-12-14 10:52:02
  • Python运行报错UnicodeDecodeError的解决方法

    2022-03-21 17:21:40
  • 如何修复使用 Python ORM 工具 SQLAlchemy 时的常见陷阱

    2022-07-03 20:51:47
  • 详解python pandas 分组统计的方法

    2021-01-30 05:33:48
  • 屏蔽浏览器缓存另类方法

    2023-11-21 08:09:23
  • 在Pandas中DataFrame数据合并,连接(concat,merge,join)的实例

    2022-01-10 00:11:57
  • Flask-Sqlalchemy的基本使用详解

    2023-06-16 19:40:02
  • Django框架下在URLconf中指定视图缓存的方法

    2023-10-03 01:54:28
  • asp之家 网络编程 m.aspxhome.com