Python中怎么创建及读写HDF5文件
Admin 2022-08-06 群英技术资讯 990 次浏览
在实际应用中,我们有时候会遇到“Python中怎么创建及读写HDF5文件”这样的问题,我们该怎样来处理呢?下文给大家介绍了解决方法,希望这篇“Python中怎么创建及读写HDF5文件”文章能帮助大家解决问题。在Matlab操作HDF5文件中已经详细介绍了HDF5文件已经利用Matlab对其进行操作的方法。这篇文章总结一下如何在Python下使用HDF5文件。我们仍然按照Matlab操作HDF5文件的顺序进行,分别是创建HDF5文件,写入数据,读取数据。
Python下的HDF5文件依赖h5py工具包
使用`h5py.File()方法创建hdf5文件
h5file = h5py.File(filename,'w')
然后在此基础上创建数据集
X = h5file.create_dataset(shape=(0,args.patch_size,args.patch_size), #数据集的维度
maxshape = (None,args.patch_size,args.patch_size), #数据集的允许最大维度
dtype=float,compression='gzip',name='train', #数据类型、是否压缩,以及数据集的名字
chunks=(args.chunk_size,args.patch_size,args.patch_size)) #分块存储,每一分块的大小
最为关系的两个参数为shape和maxshape,很显然我们希望数据集的某一个维度是可以扩展的,所以在maxshape中,将希望扩展的维度标记为None,其他维度和shape参数里面的一样。还有一点值得注意的是,使用compression='gzip'以后,整个数据集能够被极大的压缩,对比较大的数据集非常又用,并且在数据读写的时候,不用用户显式的解码。
在使用上面的creat_dataset创建了dataset以后,读写数据集就如同读写numpy数组一样方便,比如上面的函数定义了数据集'train',也就是变量X以后,可以下面的方法来读写:
data = np.zeros((100,args.patch_size,arg)) X[0:100,:,:] = data
在前面创建数据集的时候,我们定义shape = (args.chunk_size,args.patch_size,args.patch_size),如果有更多的数据,怎么办呢?
可以使用resize方法来扩展在maxshape中定义为None的那个维度:
X.resize(X.shape[0]+args.chunk_size,axis=0)
因为我们在maxshape=(None,args.patch_size,args.patch_size)中将第零个维度定义为可扩展,所以,首先我们用X.shape[0]来找到该维度的长度,并将其扩展。该维度扩展以后,就可以继续向里面写入数据了。
读取h5文件的方法也非常简单,首先利用h5py.File方法打开对应的h5文件,然后将里面的某个数据集取出至变量,对这个变量的读取就如同numpy一样了。
h = h5py.File(hd5file,'r') train = h['train'] train[1] train[2] ...
但是上面的读取方法存在一个问题就是每一次使用的时候(train[1],train[2])都需要从硬盘读取数据,这将会导致读取的速度比较慢。一个比较好的方法是,每次从硬盘读取一个chunk_size的数据,然后将这些数据存储到内存中,在需要的时候从内存中读取,比如使用下面的方法:
h = h5py.File(hd5file,'r') train = h['train'] X = train[0:100] #一次从硬盘中读取比较多的数据,X将存储在内存中 X[1] #从内存中读取 X[2] #从内存中读取
这样的方法就会快很多。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
本文为大家重点介绍如何通过 python 编码来实现我们的接口测试以及通过Pycharm的实际应用编写一个简单接口测试,感兴趣的可以了解一下
这篇文章主要介绍了解决Python中的modf()函数取小数部分不准确问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
python中len是什么:Python中len表示的是len()函数,它可以表示各种对象的长度,例如字符串、元祖、列表、字典等。
这篇文章主要给大家分享得事提高 Python 开发效率的3个小工具,它们能够帮助我们提高工作效率。本文将介绍笔者在近一周发现的三个小工具,写文章以做记录,希望能对大家有所帮助
人脸识别目前正被用于让世界更安全、更智能、更方便。在本文中,你将学习如何使用 Python 构建人脸识别系统。人脸识别比人脸检测更进一步。感兴趣的可以学习一下
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008