五种卫星降水产品在沿海流域多时空尺度的综合精度评估
2022-04-12甘富万李彦婕
甘富万,李彦婕,倪 倩,高 扬
(1.广西大学土木建筑工程学院,南宁540004;2.广西珠江委员会南宁勘测设计院,南宁540000)
0 引言
降水的时空分布关乎生态系统的稳定,卫星降水反演的出现弥补了传统观测方式的缺陷[1]。其中,热带降雨观测任务(TRMM)的TMPA 产品和全球降水观测(GPM)的IMERG 产品是目前应用最广的降水反演产品,其中,TRMM 的时空分辨率分别是0.25°和3 h,而GPM则为0.1°和0.5 h[2]。
自TRMM 发射后,TMPA3B42 各版本的产品在很多地区被证实与雨量站有较好的一致性[3,4]。作为最新一代的卫星,GPM的降水产品IMERG 的新版本一般有更好的表现[5],但也有特殊情况[6]。在IMERG 子产品的评估中,IMERG-F 与雨量站有更高的相关性,但近实时产品在水文预报中有巨大潜力[7]。
很多研究表明IMERG 是TMPA 的可靠替代品[8,9],而且在二者众多降水子产品中,IMERG-F 往往表现最好[10]。但是,在一些地区GPM 的性能并没有明显比TRMM 提升[11,12]。因此,为比较这两个产品的适用性,仍有必要在更多的地区进行验证。此外,虽至今已有包含多种子产品的讨论,但同时涵括最新版本(IMERGV06-E,IMERGV06-L,IMERGV06-F,TMPA3B42-V7,TMPA3B42-RT)的研究还很少。所以,仍然很有必要更细致地综合分析这五种产品,以量化IMERG 和TMPA 的性能并反映出近实时和后实时产品的差异。
本文选择地形地貌复杂的亚热带沿海南流江流域,基于长达九年的降雨资料,从两个空间尺度(站点和流域)和三个时间尺度(日、月、季)来比较最新版本的IMERG 和TMPA 产品与实测降雨数据的一致性,评估卫星数据在南流江流域对雨量站数据的适用性,为卫星数据广泛应用于该流域的水文和气象研究提供依据,并且为类似亚热带沿海中小流域地区的相关研究提供借鉴。
1 研究区域和方法
1.1 研究区域
南流江流域位于中国广西南部沿海地区,南流江则是广西南部独流入海的河流中流程最长、流域面积最广、水量最丰富的河流。该流域面积为6 843.95 km2,地形地貌复杂,属于亚热带季风气候,多年平均降水量为1 400~1 760 mm,雨量丰富,是广西的暴雨中心区之一,具有重要的研究意义。
1.2 降雨数据
本研究使用的是IMERGV06 产品(IMERG-E,IMERG-L,IMERG-F)和TMPA3B42V7的产品(TMPA-V7,TMPA-RT)的日数据,在月和季尺度上的时间序列则由日数据累加得到。卫星数据从美国国家航空航天局网站下载(http://pmm.nasa.gov/data-access/downloads)。广西气象局提供了南流江流域逐小时的雨量观测数据,各站点在日、月和季尺度的降水数据由实测数据累加得到。站点数据经检查筛选出15 个降雨数据完整的站点,以此作为标准来评价卫星数据。在站点尺度上,每个雨量站按时间序列逐个进行分析,而在流域尺度上站点不再有所区分,所有站点数据按时间尺度分别整理成3个序列(日、月和季)来对流域进行整体评价。此外雨量站数据经过了时差转换,以与卫星数据的时间尺度保持一致。本文将15 个雨量站按从北到南,从西到东的顺序用字母代替,以便读者阅读。基于南流江流域属于中小流域,15 个站点在空间分布上较为密集,因此能够反映该流域降水的时空分布特征,图1 展示了研究区雨量站的空间分布。
图1 南流江流域及其气象站点的分布Fig.1 The map of the Nanliujiang River basin
1.3 研究方法
本研究基于两种空间尺度(站和流域)和3种时间尺度(日、月、季)对南流江流域进行综合分析。在季尺度上,依据中国传统的候平均气温法划分季节,即在该流域一年分为4个季节:2-4月,5-7月,8-11月,12-2月。
卫星降水产品的评估主要基于两类传统评价指标。统计指标包括CC、RMSE、RB,评价的是卫星降雨产品的精度性能。CC和RMSE分别反映线性相关程度和误差的整体水平,RB反映卫星数据对实测数据高估或低估的程度。分类指标包括POD、FAR、CSI,用来评价降雨产品检测降雨的能力。3 个指标的范围都是从0 到1,FAR越小说明表现越好,POD和CSI则是越高越好。为研究降雨强度变化对卫星探测能力的影响规律,本文选取了多个阈值对3个分类指标进行细致分析。在站点尺度下,依据我国降雨等级划分的原则,0.1、10、25 和50 mm/d 分别是小雨、中雨、大雨和暴雨的分类值,因此选取这4 个具有代表性的阈值。在流域尺度下,考虑到流域较长的数据序列,所以选择了跨度从0.1~100 mm/d 的15 个阈值来细分区间以综合评价卫星产品的探测性能。
2 结果和讨论
2.1 站点尺度上的精度评估
2.1.1 基于统计指标的比较
图2 展示了南流江流域15 个站点的CC的空间分布,五个产品在空间上没有明显差异,都反映了靠近东南的N(新田)和H 站(亚山)相关性较弱。在日尺度下,IMERG-E 有10 个站点的CC介于0.66~0.70。IMERG-L 和IMERG-E 分布相似,但IMERG-L 没有低于0.60 的CC。IMERG-F 有8 个站点的CC都大于0.7,最大值达0.74,最小值仅为0.63。除了H 站较低的CC(0.62),IMERG-F 与其他站点一致性较高,这可能是因为H 站有部分时间缺失实测降雨数据,对其进行数据插补之后产生了一定误差,其次该站与流域的暴雨中心博白县距离最近,暴雨快速的时空变化会影响卫星的信号。至于TMPA-V7和TMPART,CC主要在0.60-0.70 之间。因此,IMERG 产品表现明显优于TMPA 产品。IMERG 产品中,IMERG-F 表现最好,其次是IMERG-L、IMERG-E,这可能是因为IMERG-E只采用了云移动矢量传播算法中的前向传播算法,而IMERG-L 和IMERG-F 在此基础上还加入了后向传播算法。
图2 CC在3种时间尺度上的空间分布Fig.2 The spatial distribution of CC on the three scales
表1 评价指标及其公式Tab.1 Evaluation indicators applied to IMERG and TMPA
随时间尺度增大,CC明显变大。在月尺度下,IMERG-E,IMERG-L 和TMPA-RT 的CC高于0.68,而IMERG-F 和TMPAV7 的CC都大于0.76,表明后实时产品比近实时产品表现好。在季尺度下,CC主要集中在0.86~0.95 之间,可认为5 个产品的差异很小。5 个产品的最大值都出现在A 站(龙安),IMERG-E(0.95),IMERG-L(0.96),IMERG-F(0.95),TMPA-RT(0.94),TMPA-V7(0.92),这可能由于数据的抵消,从而在季尺度显现出更高的相关性。
根据图3,在日尺度下,卫星产品的RMSE范围在10~16 mm之间,没有明显的差异。在月尺度下,五个产品分布的值域增大,介于在50~140 mm。IMERG-F 和TMPA-V7 的值主要分布在50~75 mm,相比于近实时产品更为集中。在季尺度下,RMSE值剧烈增加,超过了100 mm,表明数据不够可信。从空间尺度来看,位于南部的N 和O 站(常乐)相比其他站点RMSE相当高,而靠北的A 站的RMSE相对较低。结合上文提到A 站的高CC,发现卫星在这个站点表现最好。从3种时间尺度综合来看,IMERG-F 的RMSE最小,相比于其他产品更加稳定,而TMPA-RT在五种产品中RMSE较高,表现最差。
图3 RMSE在3种时间尺度上的表现Fig.3 RMSE of each station on the three scales
从图4(a)可看出,有接近一半站点的最大RB值由TMPART 产生,误差最高。IMERG-E 和IMERG-L 的15 个站的平均RB值分别为0.055 和0.061,可被视为稳定水平。IMERG-F 和TMPA-V7 的RB的绝对值基本相似,平均值保持在0.07。图4(b)中,橙色表示高估,红色表示低估,数据条的长度表示偏差的程度。针对同一个站点,卫星产品的最大值与最小值的差值在0.04~0.34,其中80%的站点的差值都低于0.18,表明五个卫星产品在同一个站点的表现差异很小。但是对于同一个卫星降水产品,其在不同雨量站下的差异较大,最大值与最小值的差值都高于0.29。总体来说,C(新桥),L(张黄)和M 站(菱角)的绝对误差几乎没超过0.05,但是N 和H 站的RB很高,造成站点之间这种差异的原因可能是地面测量本身存在一定缺陷,存在不确定的测量误差。其次,蒸发损失会给雨量站带来影响。此外,博白县是南流江流域的暴雨中心之一,暴雨快速的时空变化会导致临近的H 站的不确定性。最后,由于东南位置靠近北部湾,受亚热带季风气候影响较大导致了测量的不准确性。
图4 15个站点的RB的比较Fig.4 Comparison of RB for 15 stations
2.1.2 基于分类指标的比较
由图(5)可知,当阈值为0.1 mm/d 时,TMPA 和IMERG 有很大差异,IMERG 产品的POD都高于0.65,而TMPA 都低于0.55。当阈值为10 mm/d 时,IMERG-F 的表现最好,87%的POD都高于0.6。TMPA 产品的POD比IMERG-E 和IMERG-L 的大,可看出相比小雨,对中雨的探测性能提高了很多。当阈值为25 mm/d 时,最大POD值出现在IMERG-F,但是五种产品的差异明显缩小。当阈值为50 mm/d 时,产品的POD都低于0.5,并且站点的POD的值域跨度变大,这可能是由于网格降尺度均匀化数据,卫星产品不能够反映局部区域的暴雨特性。有学者曾经指出,卫星的红外线算法会导致在风暴周期的早期,暴雨被低估[13]。
图5 在4个阈值下的POD的空间分布Fig.5 The spatial distribution of POD at four precipitation thresholds
根据图6,当阈值为0.1 mm/d 时,TMPA 和IMERG 产品的FAR分别在0.14~0.24 和0.23~0.33,很明显TMPA 误报率相对低。随阈值增大,卫星产品的误报率都上升,并且产品之间的差异逐渐增大。当阈值为50 mm/d 时,5 个产品误报很严重,最大值出现在TMPA-V7(0.72),最低值出现在IMERG-F(0.41),进一步反应出五个产品在强降雨方面的缺陷。因此,在强降雨事件中,卫星产品的精度仍需改进。分析FAR随阈值变化的整体趋势,发现TMPA 产品急剧上升(0.41,0.44),而IMERG 产品的稳定性更好(0.26,0.25,0.23)。
图6 在4个阈值下的FAR的空间分布Fig.6 The spatial distribution of FAR at four precipitation thresholds
在图7 中,当阈值为0.1 mm/d 时,IMERG 产品的CSI都高于0.50,而TMPA 产品都低于0.50,探测能力明显不在同一个水平。随阈值增大到10 mm/d,卫星产品之间的差异缩小,都在0.30~0.50 之间。当阈值为50 mm/d 时,CSI普遍低于0.40,同时IMERG 和TMPA 出现了显著的差距,这可能因为统计样本不够充足,而且暴雨会影响卫星传感器接受信号。总体来说,IMERG 产品的成功系数比TMPA 的高,具体而言,IMERG-L 优于IMERG-E 但次于IMERG-F,TMPA-RT 与TMPA-V7 水平相似。
图7 在4个阈值下的CSI的空间分布Fig.7 The spatial distribution of CSI at four precipitation thresholds
2.2 流域尺度上的精度评估
2.2.1 基于统计指标的比较
根据图8,日尺度下,5 个产品的CC分别为0.66、0.68、0.70、0.63、0.62,IMERG 的相关性整体比TMPA 好。TRMM 的传感器受到发射波长的限制,最小可观测降雨量为0.7 mm/h,因此CC相对低。月尺度下,卫星产品的相关性都大幅度提高,尤其是TMPA-V7 提高了0.21。TMPA-V7(0.84)的表现仅次于IMERG-F(0.85),表明IMERG 和TMPA 产品的差距缩小,这和在站点尺度下得出的结论是一致的。季尺度下,5 个产品的精度都相当高,CC都达到了0.85,最大值与最小值仅相差0.03,可认为几乎没有差异。在3 种时间尺度下,IMERG-F 的CC都最大,与实测数据有很强的相关性。
图8 流域尺度下的CC,RMSE和RBFig.8 Three statistical indicators at basin scale
产品在日尺度下的RMSE接近,基本在12 mm。在月和季尺度下,卫星产品的RMSE的范围分别在71~96 mm 和145~200 mm,误差的累积导致了较大的值。根据RB,IMERG-E、IMERG-L 和TMPA-V7 对降雨有不同程度的低估,而IMERG-F和TMPA-RT 则是高估。IMERG-L 数据整合了IMERG-E 的数据,因此结果有一致性,展现了相近的低估(3.4%、3.3%)。IMERG-F 对降雨轻微高估,RB仅为0.001,可能是由于联合地面月平均数据进行了校正[14]。根据以上结果,IMERG 的近实时产品有低估降水的倾向,后实时产品有高估降水的倾向,这与其他研究发现一致[10,14]。可看到,与TMPA-RT 相比,TMPA-V7与站点之间的偏差减小了近2 倍。因此,总体来说后实时产品比近实时产品有更强的相关性和更小的偏差。
2.2.2 基于分类指标的比较
从图9 知,在阈值为0.1 mm/d 时,TMPA 的POD比IMERG产品低了接近0.15,表明了TMPA 对小雨探测能力相当不好,但IMERG 在其基础上提高了对轻降雨的探测能力,这可能由于GPM 搭载的更为先进的雷达有更高的时空分辨率,进一步下降了降水探测的最小阈值,更有利于有效捕捉小雨。IMERG 和TMPA 在阈值为1~50 mm/d 之间时,探测能力较为相似,但是当降雨为超过50 mm/d的暴雨时,5个产品的差异剧烈变大。总体来说,IMERG-F 的POD随阈值的变化最为平稳,尤其在阈值小于60 mm/d 时反映出相对优异的探测能力,POD总是高于其他产品。五种产品的FAR和CSI变化趋势正好相反。随阈值增大,FAR呈现上升趋势,而CSI恰恰相反。当阈值为50 mm/d时,卫星产品的成功系数低(低于0.32)而误报率高(超过0.50),与站点尺度的结果相吻合,强降雨导致流域的样本数量减少,可能对探测统计结果产生一定影响。
图9 在15个降雨阈值下卫星产品探测能力的表现Fig.9 Three categorical indicators at basin scale under 15 precipitation thresholds
总体来说,通过比较近实时产品和后实时产品,雨量站月数据校正没有能明显帮助提高探测成功率。IMERG 产品表现优于TMPA 产品,可能有以下几点原因。首先,GPM 核心观测群能接收包括微波、红外、地面观测数据的更多数据来源。其次,GPMCO搭载的全球首个星载双频卫星雷达(DPR)和多波段锥扫微波成像仪(GMI)使GPM 对瞬时降水估计更加敏感。此外,GPM 算法有助于融合卫星群内所有卫星的传感器。最后,GPM有更复杂全面的地面验证系统。
3 结论
在本研究中,5 种卫星产品从2008年8月到2017年7月对南流江流域进行了综合的评价。主要结论如下:
(1)在日尺度上,从流域和站点来说,IMERG 产品的相关性都优于TMPA,相关性从高到低的顺序依次是IMERG-F、IMERG-L、IMERG-E、TMPA-V7 和TMPA-RT。随时间尺度增大,IMERG 和TMPA 之间精度的差异缩小,TMPA-V7 超过了IMERG的后实时产品。
(2)在日尺度上,IMERG 的稳定性在站点上略优于TRMM,但从流域整体来看基本没差异。在月和季尺度上,后实时产品比近实时产品稳定。从空间来看,最北的A 站稳定性最好,南部的N和O站稳定性最差。
(3)对于15 个站点,IMERG 在相对误差上没有展示出优势,但不同站点RB的差距比较大,新桥、张黄和菱角的相对偏差明显低于新田和亚山站。在流域上,IMERG-F倾向于轻微高估降雨,与IMERG-E 和IMERG-L 相反。TMPA-V7 与TMPART 相比,偏差减小了近2 倍。因此,总体来说后实时产品比近实时产品有更小的偏差。
(4)3 个分类指标随降水阈值的趋势在站点和流域尺度上相似,POD和CSI与阈值成反比,而FAR呈现正比。探测小雨时,TMPA 的能力相对较弱,而IMERG 作为其后继者有了明显的提升。当强降雨时,5 个产品的探测效果都不理想且站点值的分布更加分散,表明雨强对卫星探测影响很大。□