GPM近实时反演数据对河南省2021年“7·20”极端暴雨的比较分析
2022-09-14胡庆芳李伶杰王银堂杨汉波牛凯杰
胡庆芳,张 野,李伶杰,王银堂,杨汉波,牛凯杰,李 哲
(1. 南京水利科学研究院水文水资源与水利工程科学国家重点实验室,江苏 南京 210029;2. 长江保护与绿色发展研究院,江苏 南京 210098;3. 清华大学水利水电工程系,北京 100084;4. Department of Electrical and Computer Engineering,Colorado State University,Fort Collins,CO 80523,USA)
降水是最基本的水循环要素之一,长期以来主要依赖地面雨量站网进行观测。受人力物力和地理环境等因素限制,雨量站网的分布具有明显的空间不均匀性,在海洋、大型湖泊、荒漠、高寒山区等地带甚至存在缺失。20世纪90年代以来,对地空间观测技术的进步为获取大范围降水空间分布信息提供了途径。目前,气象卫星是唯一具有全球尺度意义的降水观测和反演途径。与天气雷达相比,卫星降水数据的时空分辨率虽然相对较低,但其覆盖范围更广、开放性更强。
自1997年TRMM(Tropical Rainfall Measuring Mission)卫星投入使用以来,国际上先后研制了PERSIANN(Precipitation Estimation from Remotely Sensed Information using Artificial Neural Networks)[1]、CMORPH(Climate Prediction Center Morphing Technique)[2]、TMPA(TRMM Multi- satellite Precipitation Analysis)[3]等一系列全球性卫星降水数据。2014年以来,随着新的全球降水观测卫星的发射,卫星降水数据研制由TRMM时代进入GPM时代(The Global Precipitation Measurement mission)。GPM卫星搭载的多频段微波辐射仪(GPM Microwave Imager,GMI)和双频雷达(Dual- frequency Precipitation Radar,DPR)为多卫星联合降水反演提供了更加精准的校准参考[4]。研制GPM卫星降水反演算法,在不同时空尺度上检验和解析相应降水数据的精度,开展其在暴雨洪水监测预报、自然灾害防治等方面的应用是目前国内外的研究热点[5- 9]。
美国航天局和日本航天局各自主导研制的IMERG(Integrated Multi- Satellite Retrievals for GPM)和GSMaP(Global Satellite Mapping of Precipitation)数据是2类代表性的GPM近实时卫星降水反演数据[10],其对暴雨洪涝事件的监测预报能力备受关注。一些研究发现,由于新的数据源加入和降水反演算法的改进,GPM数据在探测强降水方面已展现出一些积极的迹象。Libertino等[11]采用1 a资料,在全球尺度上评价了IMERG数据对强降水事件的探测能力,发现其相对3B42V7数据具有明显提升;Tang等[12]比较了IMERG、GSMaP、3B42RTV7和PERSIANN数据对2016年夏季中国南方暴雨洪水的监测预警能力,发现IMERG和GSMaP的综合精度显著高于3B42RTV7,两者在小时和日尺度上的平均相对误差低于或接近10%,而IMERG精度又高于GSMaP;李伶杰等[13]以高密度地表雨量站网观测数据为基准,综合分析了IMERG early、IMERG late、GSMaP NRT、GSMaP NRT Gauge和3B42RTV7共5种近实时数据对南京及周边地区2017年6月10日1次破记录极端降水过程的监测能力,指出在这些数据中GSMaP NRT的综合精度高于3B42RTV7;章卫军[14]认为2018年8月台风“Pulasan”影响期间,IMERG近实时数据反映的山东省降水总量、时程分布特征和空间特征与新闻渠道获取的信息相似,并以此驱动水库调度和河道水力学模型,复盘了弥河洪水过程;Qi等[15]剖析了6种最新的GPM降水数据对2019年8月超强台风“Lekima”降水时空结构的表征能力,指出DPR成功捕捉到了强度达121 mm/h的降水过程峰值。但也有若干文献指出,GPM对强降水的探测能力仍无法令人满意,甚至还不如TRMM时代的数据。Mekonnen等[16]发现在埃塞俄比亚的Upper Awash河流域,IMERG- v06B等7种卫星降水数据精度均随降水强度增加而降低,指出卫星降水数据仍需在反演算法和后处理方面加以改进才能用于洪水预警预报;Hayashi等[17]剖析了日本3场局地性强降水和台风降水事件,指出当降水强度超过70 mm/d时,GSMaP数据监测到的降水信息与地基雷达有明显差异;Sahlu等[18]发现IMERG日降水精度仅略优于CMORPH,但检测大雨的能力反而不及后者;He等[19]指出IMERG提高了捕捉中等强度降水事件的能力,但仍显著高估了极端降水事件。现有研究说明GPM数据对强降水的探测能力仍具有很大不确定性,并且GPM数据序列的时间尚较短。因此,仍需针对不同气候地理背景,尽可能采用能够获取的实际降水样本对GPM数据的性能开展更加广泛的验证评估。
2021年7月17日至7月23日,受副热带高压、台风和冷涡等多种天气系统以及地形抬升作用等共同影响,河南省遭遇了历史上罕见的特大暴雨。本次暴雨过程累积雨量大、强降水时段集中、波及范围广,覆盖郑州、新乡、鹤壁、焦作和安阳等城市。作为暴雨中心之一的郑州市面平均累积雨量高达501.1 mm,7月20日,郑州气象站1 h最大降水量为201.9 mm,突破了中国大陆历史记录。以此次极端强降水为主的暴雨过程导致河南省398人遇难,直接经济损失达1 200.6亿元,造成了重大的社会影响[20]。河南省“7·20”暴雨作为罕见的极端强降水事件,为开展GPM降水数据性能验证、评估其在暴雨洪涝灾害监测预报中的应用潜力提供了难得的案例。因此,本文基于丰富的地面雨量观测资料,从累积降水量、降水过程和降水空间分布等角度综合解析和比较IMERG及GSMaP近实时卫星降水数据对“7·20”暴雨监测的精度,以期为深入认识GPM时代卫星降水数据误差特征、完善降水反演算法和合理使用相关数据提供科学依据。
1 数据资料
1.1 雨量站网数据
河南省范围内有116个国家级气象站,其空间分布见图1。这些站点记录了2021年7月17日00∶00至7月23日23∶00(UTC)逐小时降水量。降水数据质量经过了气候学界限值、区域界限值、时间一致性等环节的检查[13]。对于河南省“7·20”暴雨过程,累积雨量高于600 mm的气象站点有9个、高于500 mm的有14个,116个气象站点平均累积雨量达245.2 mm。降水主要集中在7月20—21日,分别占累积雨量的36%和22.2%。基于河南省气象站点雨量观测记录,采用距离反比平方进行空间插值,生成了1套时间分辨率为1 h、空间分辨率为0.1°×0.1°的栅格降水资料,作为评价GPM近实时降水数据性能和精度的基准资料。
图1 河南省雨量站空间分布Fig.1 Spatial distribution of rainfall gauges in Henan Province
1.2 GPM降水数据
收集了4种GPM近实时降水数据,其中包括2种IMERG数据和2种GSMaP数据,分别为IMERG early、IMERG late和GSMaP NOW、GSMaP Gauge NOW。4种数据的基本信息见表1。
表1 4种GPM近实时卫星降水数据基本信息
IMERG数据由美国航天局主导研制,在降水反演算法方面充分利用了GPM卫星的主被动微波传感器和各类红外数据传感器的探测信息,并对TRMM时代的各类卫星降水反演算法进行了有机融合。IMERG数据生成系统运行一次后得到early数据,在early数据的基础上再运行一次后得到late数据。GSMaP NOW数据则由日本航天局研制,采用被动微波资料和地球同步卫星的云矢量对降水进行外推得到;GSMaP Gauge NOW是GSMaP NOW采用地表日降水资料校准后的数据[21]。
2 研究方法
采用分类指标[22]、体积分类指标[23]与定量指标,从累积雨量、降水过程、降水空间格局3个方面综合评估4种GPM数据对“7·20”极端强降水过程的监测能力。相关指标既可用于分析某一具体时段GPM降水与地表降水的空间一致性,也可用于评估站点或区域尺度上GPM降水与地表降水在过程上的同步性过程。
分类指标采用探测率(POD)、误报率(FAR)和临界成功指数(CSI),用于反映卫星降水对地表降水事件是否发生的辨识能力。3项分类指标均介于0~1,若POD与CSI越接近于1、FAR越接近0,则表明GPM数据对降水事件的分类辨识能力越强。体积分类指标评估卫星降水精度,采用体积探测指数(VHI)、体积误报率(VFAR)和体积临界成功指数(VCSI)。与分类指标相比,体积分类指标的作用在于考虑了降水量级对降水事件辨识结果的权重,其计算公式如下:
(1)
(2)
(3)
式中:n为样本数量;Si为GPM降水;Gi为地面降水;T为降水事件阈值,取0.1 mm/h。
采用的定量指标包括相关系数(CC)、相对偏差(RB)、相对均方根误差(RRMSE)和相对连通性(RC)。CC越接近于1、RB的绝对值和RRMSE越接近于0,则说明卫星降水精度越高。RC用来描述不同降水阈值下降水场的空间连通相似性,其计算公式如下:
(4)
(5)
(6)
式中:NP为降水场中超过某一雨量阈值的格网单元数量;NC为孤立降水群落数量(降水群落是指在空间上彼此相连的超过某一降水阈值的格网单元组成的区域)。C介于0~1,C越接近1说明降水越集中,当超过降水阈值的格网彼此相连时,C=1。
3 结果分析与讨论
3.1 累积雨量
图2给出了雨量站点和GPM数据对应的“7·20”特大暴雨事件累积雨量(2021年7月17—23日)。根据图2(a)和图2(b)可见,“7·20”降水有2个雨量中心,分别位于郑州市和新乡市。IMERG early与IMERG late数据对应的累积雨量空间分布格局与雨量站点及其插值数据具有较强的相似性,但明显低估了累积雨量;而GSMaP NOW和GSMaP Gauge NOW反映的雨量中心位置与地表雨量有较大偏差。
图3给出了0.1°×0.1°网格尺度上GPM降水与站点距离反比平方(IDW)插值的累积雨量散点图。从图3中可知,4种GPM数据对累积雨量的估计误差均比较明显。其中,2种IMERG数据主要表现为低估,RB平均在-20%左右,尤其是对于极端降水事件捕捉能力较差,这与Zhang等[25]的研究结论相同;2种GSMaP数据主要表现为高估,GSMaP NOW和GSMaP Gauge NOW的RB平均分别超过35%和70%。从CC、RB和RRMSE各项指标来看,在0.1°×0.1°网格尺度上,IMERG数据对“7·20”降水事件累积雨量的估计精度总体上高于GSMaP数据。2种IMERG数据中,IMERG late的精度较高;2种GSMaP数据中,GSMaP NOW的精度总体上高于GSMaP Gauge NOW。
图2 雨量站点和GPM数据对应的河南省“7·20”降水事件累积雨量Fig.2 Rainfall gauges and GPM data corresponding to accumulated rainfall of “7·20” precipitation event in Henan Province
图3 0.1°×0.1°网格尺度上GPM数据与雨量站点插值的累积雨量散点图Fig.3 Scatters of accumulated rainfall between the rainfall gauges interpolation and GPM datasets at the scale of 0.1°×0.1°grids
需指出的是,虽然对于河南省“7·20”极端强降水事件,GSMaP数据精度总体上不及IMERG数据,但前者尤其是GSMaP Gauge NOW对于500 mm以上的累积雨量的估计能力更强。经统计,站点空间插值得到的雨量场中,累积雨量超过500 mm、600 mm的0.1°×0.1°栅格单元分别有140个和45个。IMERG early未能探测到任何累积雨量达到或超过500 mm的栅格单元,IMERG late正确探测到了29个累积雨量达到或超过500 mm的栅格单元,但未能探测到累积雨量达到或超过600 mm的栅格单元;而GSMaP NOW正确探测到累积雨量在500 mm、600 mm以上的网格单元分别为53个和2个,GSMaP Gauge NOW则分别有103个和33个。表2给出了河南省累积雨量大于600 mm的9个气象站以及郑州市范围内插值的累积雨量和GPM数据累积雨量对比。从表2中可知,GSMaP 数据对9个站点累积雨量的估计误差总体上明显低于IMERG数据,其中又以GSMaP Gauge NOW误差最小。对于淇县和辉县站,GSMaP Gauge NOW对累积雨量的估计误差低于20%,甚至在15%以下,对于暴雨中心郑州市面平均累积雨量估计相对误差仅2.2%。当然,GSMaP NOW数据经地面雨量校正后,对累积雨量在500 mm以上的极端降水事件的估计能力尽管有所提高,但由图3(c)和图3(d)可知,GSMaP Gauge NOW对累积雨量在500 mm以下的降水事件又明显产生了更大程度的高估。
表2 雨量站点和GPM数据获取的河南省“7·20”降水事件累积雨量对比
3.2 降水过程
对地表降水过程的动态追踪能力是衡量卫星降水数据性能的重要因素之一。图4给出了小时时间尺度上4种GPM数据在各自0.1°×0.1°栅格单元的时序精度指标。从图4可知,在多数栅格单元,GPM数据对于降水事件是否发生具有较强的辨识能力,其探测率较高、误报率较低。如果考虑降水量级影响,则分类辨识能力有进一步提高,GPM降水数据的分类辨识能力较低的栅格单元主要分布在河南省南部和西部边缘,主要属于山丘区。
定量指标方面,各卫星降水数据与地表雨量的相关系数(CC)介于-0.2~1.0,在河南省中部区域高、周边山丘区低的特征也比较明显。RB的分布范围较大,在空间上呈现东高西低的格局,与累积雨量分布相反,这说明4种GPM近实时降水数据对于较大雨量倾向低估、对于较小雨量倾向高估。RRMSE的空间分布特征与CC相似。进一步分析了4种GPM数据对暴雨中心郑州站降水过程的表征能力。从图5可知,卫星降水对站点逐小时降水过程具有一定表征能力,但均未成功捕捉到雨量峰值,导致其定量误差较大,这与文献[13]所得结论类似。从表3中的各项精度指标特别是定量指标来看,4种GPM数据在小时尺度上与站点降水过程同步性还有待大力提高。
图6进一步给出了0.1°×0.1°栅格单元尺度上GPM小时雨量误差随地面小时雨量的变化。从图6可知,即使在0.1°×0.1°的区域尺度上,4种GPM数据均成功探测到了小时雨量接近100 mm的极端强降水事件,但数据误差也比较突出。总体上,GPM数据相对地面降水的误差随小时雨量呈现较明显的负相关关系。在地面降水强度较小时,4种GPM数据倾向高估;在地面降水强度较大时,4种GPM数据倾向低估。由于对各等级的小时降水事件均存在漏报,故4种GPM数据小时雨量误差随地面雨量变化的下包线均接近y=-x。4种GPM数据对小时雨量低于10 mm的降水事件以高估为主;而对于小时雨量超过30 mm的降水事件以低估为主,甚至存在普遍低估。与IMERG数据相比,GSMaP数据对小时雨量低于10 mm的降水事件的高估幅度更大、误差分散性更强,同时还存在对小时雨量超过30 mm的降水事件估计误差为正的情况。
图4 0.1°×0.1°栅格尺度上GPM小时雨量精度指标Fig.4 Hourly GPM precipitation accuracy indices at the 0.1°×0.1°grid scale
图5 郑州气象站的GPM降水与地面站点观测小时降水过程对比Fig.5 Hourly GPM and ground surface gauge precipitation process at the Zhengzhou meteorological gauge
表3 郑州气象站GPM降水精度指标
图6 0.1°×0.1°栅格单元尺度上GPM小时雨量误差随地面小时雨量的变化Fig.6 Variation of hourly GPM rainfall error with ground surface hourly rainfall at the scale of 0.1°×0.1°grids
图7给出了GPM和气象站网降水在郑州市(面积约1 188 km2)、新乡市(面积约8 249 km2)、河南省(面积约16.7万km2)对应的面平均小时雨量过程对比。相对站点尺度,随着空间尺度的增加,GPM近实时卫星降水数据对强降水过程的动态监测能力有所提高,卫星降水与地面降水的匹配性明显提高。对于郑州市,4种GPM数据的相关系数均达到了0.8以上,VCSI>0.9,RB指标最优的已接近0(GSMaP Gauge NOW数据),同时对雨量峰值的捕捉能力明显增强;而对于新乡市,4种GPM数据的精度虽然有所降低,但相关系数均达到了0.6以上,VCSI>0.9,RB指标最优的也接近0(GSMaP NOW数据),也能够捕捉到雨峰。对于河南省而言,IMERG early与MERG late数据与地表雨量过程的吻合性更高,其相关系数接近甚至超过了0.9,对雨峰的捕捉也较为准确;GSMaP NOW与GSMaP Gauge NOW在峰前与地面雨量站接近,但对于雨峰仍有大幅度高估(表4)。
图7 GPM与雨量站网插值的区域面雨量过程对比Fig.7 Comparison of areal precipitation process between GPM and rainfall gauges interpolation
表4 GPM降水数据对郑州市、新乡市与河南省面平均雨量过程的精度指标
3.3 降水空间格局
图8 GPM降水数据的空间精度指标随时间的变化Fig.8 GPM precipitation datasets spatial accuracy indices changes with time
图8进一步给出了7月20—21日各时次GPM降水数据空间体积分类指标和定量指标。表5给出了7月20—21日的2个雨量峰值时刻对不同等级降水的探测情况。表6给出了7月20—21日的2个雨量峰值时刻的各项精度指标。其中,7月20日雨峰在当日9∶00,记作T1,小时面平均降水24.2 mm,5 h(当前时段与前后各2 h时段)降水量占当日累积降水量的27.5%,降水中心在郑州市;7月21日雨峰在当日8∶00,记作T2,小时面平均降水15.0 mm,5 h降水量占当日累积降水量的25.5%,降水中心在新乡市。
表5 GPM降水数据在雨峰所在时段探测到的高于不同雨量阈值的栅格单元数量
由图8可知,4种GPM数据的逐小时空间分类指标和定量指标均表现出明显的时间波动性,这说明在小时时间尺度上这些数据的空间监测能力受降水强度及雨量场空间结构特征影响。4种降水数据的空间体积分类指标的波动特征虽不完全相同,但在T1和T22个时段其分类辨识能力均具有明显下降,具体而言,VHI降低、VFAR上升和VCSI降低。CC在时程上表现出与体积分类指标类似的波动特征,在2个降水峰值时段明显低于其他时段。
RB的时程变化规律与CC不同。由图8(e)可知,在2个降水峰值时段,GSMaP 数据的RB优于其他时段。GSMaP NOW与GSMaP Gauge NOW在T1时段的RB分别为-18.0%与9.4%,在T2时段分别为-18.0%与6.3%。而IMERG数据的RB在时程上较为稳定,基本在-50%~-30%波动。综合CC和RB2项指标与表5可知,GSMaP数据更易于探测到雨量场中的高量级降水,但其空间位置和范围会产生明显偏差,这与图2所反映的情况是一致的;而IMERG数据与地面雨量的空间相关性较强,但对高量级降水存在较大低估,导致其在降水峰值附近的相对偏差较为突出。
4种GPM降水数据的RC基本在零以下波动(表6),这说明GPM小时雨量场在空间上的集中程度一般要低于地表雨量场。GSMaP数据的RC值高于IMERG数据,这说明GSMaP 数据反映的雨量在空间上集中性程度要高于IMERG数据。
总的来说,从降水空间格局来看,相对于GSMaP数据,IMERG late数据在雨区分布上更接近地面降水,但会漏掉大量强降水事件,而GSMaP Gauge NOW数据能够探测到更多的强降水事件,但会产生明显的位置偏差,这与图6所得结论也是吻合的。
表6 GPM降水数据在降水峰值时间的空间精度指标
4 结 论
针对河南省“7·20”极端降水事件,从累积雨量、降水过程和降水空间格局3个方面,开展了IMERG early、IMERG late、GSMaP NOW和GSMaP Gauge NOW共4种GPM近实时卫星降水数据性能的综合解析和比较,主要研究结论如下:
(1) IMERG early、IMERG late数据对河南省“7·20”降水事件累积雨量的平均低估程度在20%左右,GSMaP NOW和GSMaP Gauge NOW的平均高估程度分别达到了约35%和70%。IMERG early和IMERG late数据对应的累积雨量中心位置与地面观测具有较强的一致性,但难以探测到500 mm以上的累积雨量;而GSMaP NOW和GSMaP Gauge NOW反映的累积雨量中心位置和范围有较大偏差,但更易探测到500 mm以上的累积雨量。
(2) 在0.1°×0.1°栅格单元尺度上,4种GPM降水数据对小时降水过程均具有较强的分类辨识能力,均成功探测到了小时雨量接近100 mm的极端强降水事件,但定量估计误差较突出,且未能捕捉到主要雨峰过程。GPM数据相对地面降水的误差随小时雨量呈现较明显的负相关关系。对小时雨量低于10 mm的降水事件,GPM降水以高估为主;而对于小时雨量超过30 mm的降水事件以低估为主,甚至存在普遍低估。
(3) 对于“7·20”暴雨事件,GPM小时降水的空间精度指标均具有较强的时间波动性。相对于GSMaP数据,IMERG数据在雨区分布上更接近地面降水,但呈现较稳定的低估、会漏掉大量强降水事件,而GSMaP Gauge NOW数据能够探测到更多的强降水事件,在降水峰值附近的偏差较小。同时,GPM小时雨量场在空间上的集中程度一般要低于地表雨量场,但GSMaP 雨量场在空间上集中性程度要高于IMERG。
(4) 2种IMERG 数据中,IMERG late相对IMERG early的精度具有较明显的改善;而2种GSMaP数据中,GSMaP Gauge NOW相对GSMaP NOW提高了对较高量级降水的估计能力,但也明显增大了较低量级降水的估计误差。
总的来说,由于受到卫星重访周期、反演数据源、反演算法和地形特征等一系列因素的复杂影响,GPM近实时降水数据对河南省“7·20”极端降水事件的监测虽展现出一定的积极信息,但定量精度尚有很大改进空间。然而也应当考虑到GPM降水数据研制和研究对象的客观情况,目前GPM近实时降水数据序列还不够长,GSMaP的第1个实时版本GSMaP Now于2017年3月29日发布,其时间序列更短。因此,用于率定和校验降水算法的降水样本还不够丰富、代表性存在不足。而本文研究“7·20”极端降水事件属于破记录的历史大暴雨,即使在全球范围内也属罕见。不论如何,本文研究深化了对GPM数据性能的认识,为完善降水反演算法、提升强降水监测能力提供了重要反馈信息。
此外,本文研究发现IMERG数据和GSMaP数据作为代表性的GPM近实时卫星降水数据,两者的相对优劣关系也较为复杂,IMERG与地面雨量降水的时空同步性相对较强,但GSMaP更易探测到强降水事件。鉴于2类卫星降水数据的性能具有一定的互补性,因此今后可进一步开展两者的集成与融合研究。