如何使用Python处理HDF格式数据及可视化问题
作者:Mae_Liu 时间:2023-11-21 00:17:01
原文链接:https://blog.csdn.net/Fairy_Nan/article/details/105914203
HDF也是一种自描述格式文件,主要用于存储和分发科学数据。气象领域中卫星数据经常使用此格式,比如MODIS,OMI,LIS/OTD等卫星产品。对HDF格式细节感兴趣的可以Google了解一下。
这一次呢还是以Python为主,来介绍如何处理HDF格式数据。Python中有不少库都可以用来处理HDF格式数据,比如h5py可以处理HDF5格式(pandas中 read_hdf 函数),pyhdf可以用来处理HDF4格式。此外,gdal也可以处理HDF(NetCDF,GRIB等)格式数据。
安装
首先安装相关库
上述库均可以通过conda包管理器进行安装,如果conda包管理器无法安装,对于windows系统,可以查找是否存在已打包的安装包,而unix系统可以通过源码编译安装。
数据处理和可视化
以LIS/OTD卫星闪电成像数据为例,处理HDF4格式数据并进行绘图:
import numpy as np
import matplotlib.pyplot as plt
from matplotlib import cm, colors
import seaborn as sns
import cartopy.crs as ccrs
from cartopy.mpl.ticker import LongitudeFormatter, LatitudeFormatter
from pyhdf.SD import SD, SDC
sns.set_context('talk', font_scale=1.3)
data = SD('LISOTD_LRMTS_V2.3.2014.hdf', SDC.READ)
lon = data.select('Longitude')
lat = data.select('Latitude')
flash = data.select('LRMTS_COM_FR')
# 设置colormap
collev= ['#ffffff', '#ab18b0', '#07048f', '#1ba01f', '#dfdf18', '#e88f14', '#c87d23', '#d30001', '#383838']
levels = [0, 0.01, 0.02, 0.04, 0.06, 0.1, 0.12, 0.15, 0.18, 0.2]
cmaps = colors.ListedColormap(collev, 'indexed')
norm = colors.BoundaryNorm(levels, cmaps.N)
proj = ccrs.PlateCarree()
fig, ax = plt.subplots(figsize=(16, 9), subplot_kw=dict(projection=proj))
LON, LAT= np.meshgrid(lon[:], lat[:])
con = ax.contourf(LON, LAT, flash[:, :, 150], cmap=cmaps, norm=norm, levels=levels, extend='max')
cb = fig.colorbar(con, shrink=0.75, pad=0.02)
cb.cmap.set_over('#000000')
cb.ax.tick_params(direction='in', length=5)
ax.coastlines()
ax.set_xticks(np.linspace(-180, 180, 5), crs=proj)
ax.set_yticks(np.linspace(-90, 90, 5), crs=proj)
lon_formatter= LongitudeFormatter(zero_direction_label=True)
lat_formatter= LatitudeFormatter()
ax.xaxis.set_major_formatter(lon_formatter)
ax.yaxis.set_major_formatter(lat_formatter)
某月全球闪电密度分布
上述示例基于pyhdf进行HDF4格式数据处理和可视化,HDF4文件中包含的变量和属性获取方式见文末的Notebook,其中给出了 更详细的示例。
以下基于h5py读取HDF5格式数据,以OMI卫星O3数据为例:
import h5py
data = h5py.File('TES-Aura_L3-O3-M2005m07_F01_10.he5')
lon = data.get('/HDFEOS/GRIDS/NadirGrid/Data Fields/Longitude').value
lat = data.get('/HDFEOS/GRIDS/NadirGrid/Data Fields/Latitude').value
o3 = data.get('/HDFEOS/GRIDS/NadirGrid/Data Fields/O3').value
proj = ccrs.PlateCarree()
fig, ax = plt.subplots(figsize=(16, 9), subplot_kw=dict(projection=proj))
LON, LAT = np.meshgrid(lon[:], lat[:])
con = ax.contourf(LON, LAT, o3[10, :, :]*1e6, np.arange(0, 8.01, 0.1), vmin=0, vmax=8, cmap=cm.RdGy_r)
ax.coastlines()
ax.set_xticks(np.linspace(-180, 180, 5), crs=proj)
ax.set_yticks(np.linspace(-90, 90, 5), crs=proj)
lon_formatter = LongitudeFormatter(zero_direction_label=True)
lat_formatter = LatitudeFormatter()
ax.xaxis.set_major_formatter(lon_formatter)
ax.yaxis.set_major_formatter(lat_formatter)
cb = fig.colorbar(con, shrink=0.75, pad=0.02)
cb.set_ticks(np.arange(0, 8.01, 1))
cb.ax.tick_params(direction='in', length=5)
上述示例中使用类似unix中路径的方式获取相关变量,这在HDF格式数据中称为Groups。不同的组可以包含子组,从而形成类似嵌套的形式。详细的介绍可Google了解。
来源:https://blog.csdn.net/Mae_Liu/article/details/106898051
标签:Python,HDF,格式数据
0
投稿
猜你喜欢
MySQL Binlog 日志处理工具对比分析
2024-01-28 00:20:08
python常见的占位符总结及用法
2023-10-11 10:39:58
Python实现模拟时钟代码推荐
2023-08-03 05:26:09
详情解析TCP与UDP传输协议
2024-01-02 05:28:57
Go语言的反射机制详解
2024-05-09 14:58:51
悟道Web标准:让W3C标准兼容终端
2009-10-11 16:40:00
MySQL UPDATE 语句的非标准实现代码
2024-01-16 19:08:57
PyTorch 中的 torch.utils.data 解析(推荐)
2021-09-14 01:58:16
pytorch中的自定义反向传播,求导实例
2021-08-07 06:57:53
Opencv+Python实现图像运动模糊和高斯模糊的示例
2022-08-06 12:25:19
python多进程实现进程间通信实例
2023-01-30 10:39:35
Golang排列组合算法问题之全排列实现方法
2023-07-14 14:16:19
Python中实现变量赋值传递时的引用和拷贝方法
2021-12-26 04:05:54
Python实现向好友发送微信消息优化篇
2022-02-18 18:07:08
python如何基于redis实现ip代理池
2022-11-05 20:49:08
在命令行用 sort 进行排序的方法
2023-02-23 07:07:38
python 实现的车牌识别项目
2023-09-02 07:27:48
简单的文本内容处理工具
2010-01-28 12:31:00
python字典基本操作实例分析
2023-12-04 09:25:22
Vscode常用快捷键列表、插件安装、console.log详解
2023-02-11 01:29:04