Python数据存储之 h5py详解
作者:鼹鼠的胡须 时间:2023-09-18 00:04:48
1、Python数据存储(压缩)
(1)numpy.save , numpy.savez , scipy.io.savemat
numpy和scipy内建的数据存储方式。
(2)cPickle + gzip
cPickle是pickle内建的数据存储方式,gzip是常用的文件压缩模块。
(3)h5py
h5py是对HDF5文件格式进行读写的python包,关于h5py更多介绍与安装,参考官方网站
关于HDF5,参考官方网站。:
一个HDF5文件就是一个由两种基本数据对象(groups and datasets)存放多种科学数据的容器:
HDF5 dataset: 数据元素的一个多维数组以及支持元数据(metadata); HDF5 group: 包含0个或多个HDF5对象以及支持元数据(metadata)的一个群组结构;
总之,dataset是类似于数组的数据集,而group是类似文件夹一样的容器,存放dataset和其他group;group和dataset在h5py中的使用有点类似于词典和Numpy中数组的用法。
h5py的优势:速度快、压缩效率高,总之,numpy.savez和cPickle存储work或不work的都可以试一试h5py!
2、h5py读取和存储数据示例
import h5py
X= np.random.rand(100, 1000, 1000).astype('float32')
y = np.random.rand(1, 1000, 1000).astype('float32')
# Create a new file
f = h5py.File('data.h5', 'w')
f.create_dataset('X_train', data=X)
f.create_dataset('y_train', data=y)
f.close()
# Load hdf5 dataset
f = h5py.File('data.h5', 'r')
X = f['X_train']
Y = f['y_train']
f.close()
详细使用方法,参考官网。
来源:https://blog.csdn.net/qq_23968185/article/details/77671726
标签:Python,数据存储,h5py
0
投稿
猜你喜欢
完美解决Pycharm中matplotlib画图中文乱码问题
2021-11-01 00:25:35
C#操作本地文件及保存文件到数据库的基本方法总结
2024-01-17 10:27:55
python模块中pip命令的基本使用
2023-09-28 22:44:20
python人工智能tensorflow函数tf.assign使用方法
2023-04-08 00:59:03
Python中typing模块与类型注解的使用方法
2022-10-30 14:09:42
SaaS中的用户体验设计
2009-05-20 12:28:00
用Asp+XmlHttp实现RssReader功能
2008-07-09 12:20:00
Pytorch 多块GPU的使用详解
2021-01-21 09:19:09
Django把SQLite数据库转换为Mysql数据库的过程
2024-01-26 09:42:35
在Django中创建URLconf相关的通用视图的方法
2021-09-17 06:07:58
MySQL-tpch 测试工具简要手册
2024-01-12 16:12:46
C#/.Net 中快速批量给SQLite数据库插入测试数据
2024-01-27 02:19:36
vue函数防抖与节流的正确使用方法
2024-05-29 22:43:01
用C++封装MySQL的API的教程
2024-01-25 07:51:51
10个很实用的js小脚本代码
2007-10-17 21:08:00
Python破解BiliBili滑块验证码的思路详解(完美避开人机识别)
2022-08-23 06:39:23
mysql变量用法实例分析【系统变量、用户变量】
2024-01-20 08:47:20
Pytorch 使用不同版本的cuda的方法步骤
2023-02-06 07:52:23
Python实现像awk一样分割字符串
2022-07-29 18:42:07
13个你希望早点知道的实用WordPress SQL查询语句[译]
2010-02-28 12:48:00