用来将对象持久化的python pickle模块

作者:把苹果咬哭 时间:2023-11-01 02:28:45 

前言

pickle 模块可以对一个 Python 对象的二进制进行序列化和反序列化。说白了,就是它能够实现任意对象与二进制直接的相互转化,也可以实现对象与文本之间的相互转化。

比如,我程序里有一个 python 对象,我想把它存到磁盘里,于是我用 pickle 把他转到一个文本里。当后面我想使用的时候,读取出来时候依然是一个 python 对象。

一、pickle 模块下的方法

pickle 模块提供了以下 4 种方法:

  • dump():将 Python 中的对象序列化成二进制对象,并写入文件

  • load():读取指定的序列化数据文件,并返回对象

  • dumps():将 Python 中的对象序列化成二进制对象,并直接返回,而不是将其写入到文件

  • loads():读取给定的二进制对象数据,并将其转换为 Python 对象

1. dumps()

将 Python 中的对象序列化成二进制对象,并直接返回。

示例

import pickle
test_list = ["pingguo", {1, 2, 3}, None]
# 使用 dumps() 函数将 test_list 转成 p1
p1 = pickle.dumps(test_list)
print(p1)
print("返回类型:", type(p1))

输出结果:

b'\x80\x03]q\x00(X\x07\x00\x00\x00pingguoq\x01cbuiltins\nset\nq\x02]q\x03(K\x01K\x02K\x03e\x85q\x04Rq\x05Ne.'
返回类型: <class 'bytes'>

2. loads()

读取给定的二进制对象数据,并将其转换为 Python 对象。

示例在上面的基础上继续:

import pickle
test_list = ["pingguo", {1, 2, 3}, None]
# 使用 dumps() 函数将 test_list 转成 p1
p1 = pickle.dumps(test_list)
print(p1)
print("返回类型:", type(p1))
# 使用 loads() 函数将 p1 转成 Python 对象 p2
p2 = pickle.loads(p1)
print(p2)
print("返回类型:", type(p2))

输出结果:

b'\x80\x03]q\x00(X\x07\x00\x00\x00pingguoq\x01cbuiltins\nset\nq\x02]q\x03(K\x01K\x02K\x03e\x85q\x04Rq\x05Ne.'
返回类型: <class 'bytes'>
['pingguo', {1, 2, 3}, None]
返回类型: <class 'list'>

pickle 反序列化后的对象与原对象是等值的副本对象,类似deepcopy。

3. dump()

将 Python 中的对象序列化成二进制对象,并写入文件。

示例

import pickle
test_list = ["pingguo", {1, 2, 3}, None]
with open("test_pickle.txt", "wb") as f:
   # 使用 dump() 函数将 test_list 转成 p1,写到txt文本里
   pickle.dump(test_list, f)

注意这里的写文件是 "wb",以二进制格式打开一个文件只用于写入,否则会报错。

执行成功后,同级目录下生成一个test_pickle.txt文件,因为是二进制内容,直接打开看到的是乱码。

用来将对象持久化的python pickle模块

4. load()

读取指定的序列化数据文件,并返回对象。

示例

import pickle
test_list = ["pingguo", {1, 2, 3}, None]
with open("test_pickle.txt", "wb") as f:
   # 使用 dump() 函数将 test_list 转成 p1,写到txt文本里
   pickle.dump(test_list, f)
with open("test_pickle.txt", "rb") as f:
   # 将二进制文件对象转换成 Python 对象 p3
   p3 = pickle.load(f)
   print(p3)
   print("类型:", type(p3))

注意,这里读取文件用rb,也就是以二进制格式打开一个文件用于只读。

执行成功。

['pingguo', {1, 2, 3}, None]
类型: <class 'list'>

二、可以被 pickle 封存/解封的对象

下列类型可以被封存:

  • None、True 和 False

  • 整数、浮点数、复数

  • str、byte、bytearray

  • 只包含可封存对象的集合,包括 tuple、list、set 和 dict

  • 定义在模块最外层的函数(使用 def 定义,lambda 函数则不可以)

  • 定义在模块最外层的内置函数

  • 定义在模块最外层的类

  • 某些类实例,这些类的 dict 属性值或 getstate() 函数的返回值可以被封存。

三、pickle 与 json 的区别

python 提供的 json 标准库相信大家都熟悉,提供的方法也与 pickle 相似,那么两者有什么区别呢?

  • JSON 是一个文本序列化格式,pickle 是一个二进制序列化格式。

  • JSON 是我们可以直观阅读的,而 pickle 不行。

  • JSON是可互操作的,在Python之外也可以使用,而pickle则是Python专用的。

  • 默认情况下,JSON 只能表示 Python 内置类型的子集,不能表示自定义的类;但 pickle 可以表示大量的 Python 数据类型。

  • JSON不像 pickle,对一个不信任的JSON进行反序列化的操作本身不会造成任意代码执行漏洞。

关于最后一点,说的是 pickle 模块并不安全。很有可能你去解封的是恶意构建的 pickle 数据,造成解封时执行了恶意代码,所以要慎用。

来源:https://www.cnblogs.com/pingguo-softwaretesting/p/15063288.html

标签:python,对象,持久化,pickle
0
投稿

猜你喜欢

  • 使用 Python 在京东上抢口罩的思路详解

    2023-06-01 01:10:30
  • Spring数据库多数据源路由配置过程图解

    2024-01-26 11:23:55
  • python中使用百度音乐搜索的api下载指定歌曲的lrc歌词

    2023-06-14 06:23:07
  • python 使用OpenCV进行曝光融合

    2022-03-13 05:23:37
  • 用户体验之内容篇

    2010-11-05 18:21:00
  • Python学习笔记_数据排序方法

    2022-03-07 01:28:33
  • selenium+headless chrome爬虫的实现示例

    2022-01-31 19:29:50
  • python实现unicode转中文及转换默认编码的方法

    2021-05-02 22:19:59
  • golang gorm开发架构及写插件示例

    2024-04-25 13:19:00
  • python+pytest接口自动化参数关联

    2021-07-06 09:43:55
  • 在Python中移动目录结构的方法

    2022-08-04 20:48:47
  • Python函数装饰器的使用详解

    2023-04-30 14:47:24
  • js文本框输入内容智能提示效果

    2024-04-22 13:01:32
  • 了解WEB页面工具语言XML(一)产生背景

    2008-09-05 17:18:00
  • golang-redis之sorted set类型操作详解

    2024-02-02 05:19:20
  • Vue之插件详解

    2024-04-30 10:44:57
  • SQL Server如何实现快速删除重复记录?

    2011-05-03 11:18:00
  • django的聚合函数和aggregate、annotate方法使用详解

    2023-06-27 16:07:46
  • asp下几种常用排序算法

    2011-04-18 10:33:00
  • Python数据库反向生成Model最优方案示例

    2023-11-02 18:37:36
  • asp之家 网络编程 m.aspxhome.com