APP下载

多种降水再分析数据在长江流域的适用性对比

2022-10-06旭,郭力,,3,汤阳,张荣,郭

人民长江 2022年9期
关键词:气象站长江流域降水量

丁 光 旭,郭 家 力,,3,汤 正 阳,张 海 荣,郭 豪 豪

(1.三峡大学 水利与环境学院,湖北 宜昌 443002; 2.中国长江电力股份有限公司 智慧长江与水电科学湖北省重点实验室,湖北 宜昌 443000; 3.三峡大学 三峡库区生态环境教育部工程研究中心,湖北 宜昌 443002)

0 引 言

长江是世界第三大河流,长江流域人口密集,农业发达,水利工程众多(如三峡工程、南水北调中线工程等),但流域内地形和气候复杂、自然灾害频发[1]。获取准确的降水信息对长江流域水资源管理、农业生产、旱涝灾害防控等领域都起着至关重要的作用。

地面站点雨量计观测是传统获取降水资料最直接有效的办法,这种方法获得的降水资料精度较高,然而流域内降水过程一般较复杂且具有高度时空变异性,再加上流域内雨量站分布不均,使得很难准确获取地理位置偏远且地形复杂地区的降水资料。随着卫星遥感技术和数据反演算法的发展,同化了卫星及地面、高空等常规观测资料的气象再分析资料得到深入应用,再分析资料已成为新的降水数据来源。这些降水再分析数据可在一定程度上弥补传统站点降水观测的不足[2]。因此分析不同来源降水再分析数据在长江流域的误差及其适用性,对长江流域降水数据融合、水文预报、防汛抗旱等具有重要的数据支撑作用。

近几年来,一些具有较高时空分辨率的降水再分析数据相继发布,如中国区域高时空分辨率地面气象要素驱动数据集(China Meteorological Forcing Dataset,CMFD)、欧洲中期天气预报中心全球气候第五代产品ERA5以及多源加权集合降水数据(Multi-Source Weighted-Ensemble Precipitation,MSWEP)等。目前这3种降水数据已有针对国内一些区域的应用研究,邓越等[3]基于1979~2015年中国大陆824个气象站点观测数据,评估MSWEP在中国大陆区域的精度,发现MSWEP在中国大陆区域降水整体上存在高估现象。黄琦等[4]对MSWEP在祁连山地区的适用性进行了分析,结果表明订正后的MSWEP与地表降水更为吻合。罗潇等[5]对比分析了CMFD与CRA-40在湖南省的适用性,研究表明两套资料均能较好地反映湖南省降水空间分布特征。黄琦等[6]在雅砻江流域对3种降水产品进行适用性分析,发现CMFD在各时间尺度表现均优于IMERG和MSWEP。崔豪等[7]对CMFD在三峡库区的适应性进行分析,发现CMFD能较好地反映三峡库区内降水的空间分布特征;Hu等[8]研究发现,ERA5在青藏高原虽然能够反映降水总体时空特征,但仍存在明显的偏差。Jiang等[9]分析评估了ERA5在中国大陆地区的适用性,发现ERA5对中国大陆地区的降水有较大的偏差。Xin等[10]对ERA5在粤港澳大湾区的适用性进行了分析,发现ERA5降水数据在城镇化水平较高的地区精度不高,还需进一步改进。

对于降水再分析数据产品的适应性分析,不少学者仅针对单一降水产品进行研究,而对于同一流域或区域的不同种降水再分析数据,由于选用不同模式运算、观测资料及同化方法等带来的差异,使得不同数据之间的可信度也存在差异[11]。因此有必要对多种降水再分析数据之间的差异性进行对比研究。此外,对于CMFD、MSWEP降水再分析数据,虽然有对其在国内一些流域或区域进行适应性研究[3-7],但针对整个长江流域的研究较少。特别是对于ERA5,其包括温度、湿度、压强等多种要素,而对降水要素的适应性分析还只是针对青藏高原[8]、中国大陆区域[9]、粤港澳大湾区[10]等,对于整个长江流域的适应性研究较少。因此,本文拟采用1979~2016年长江流域226个地面气象站点资料作为基准资料,对比分析CMFD、MSWEP、ERA5这3种降水再分析产品在不同时间尺度以及不同量级降水强度下的精度,分析3种降水数据对比地面站点降水精度在长江流域的分布情况,并探索误差的时空分布规律,为长江流域降水及水文模拟等相关研究与应用选择可靠的降水再分析产品提供依据。

1 研究区域、数据和方法

1.1 研究区域概况

长江流域位于24°27′N~35°54′N,90°33′E~122°19′E之间,流域面积180万 km2,占全国总面积的18.75%,流域横跨青藏高原、四川盆地和长江中下游平原三大阶梯地貌,流域地形复杂,夏季从高原季风气候过渡到东亚季风气候,雨量充沛,极易发生洪涝灾害[12]。本次研究一共选取流域内226个地面气象站点,地面气象站点分布如图1所示。

1.2 研究数据

研究所采用地面气象站点资料来自国家气象信息中心的中国地面气候资料日值数据集(V3.0),观测数据经过气候界限值检查、台站极值检查、时空一致性检查等一系列质量控制。降水再分析资料包括中国区域高时空分辨率地面气象要素驱动数据集CMFD、多源加权集合降水数据MSWEP以及欧洲中期天气预报中心ERA5降水数据。

多源加权集合降水数据集(MSWEP)[13]结合站点数据、卫星观测数据以及模型模拟数据,具有时间尺度长、空间分辨率较高等优点。中国区域高时空分辨率地面气象要素驱动数据集(CMFD)[14]是中国科学院青藏高原研究所开发的一套近地面气象与环境要素再分析数据集,包含降水在内共7个要素,是以国际上现有的Princeton再分析资料、GLDAS资料、GEWEX-SRB辐射资料,以及TRMM降水资料为背景场,融合了中国气象局常规气象观测数据制作而成。ERA5是欧洲中期天气预报中心(ECMWF)发布的全球气候第五代产品,其性能与上一代产品ERA-Interim相比有了很大提升[15-16]。数据详细信息如表1所列。

表1 研究数据概况Tab.1 Overview of the research data

考虑到部分气象站点资料仅更新到2017年,因此选取1979~2016年作为研究时段,其中ERA5数据空间分辨率为0.25°×0.25°,为了排除空间分辨率对降水产品精度评估的影响,本文将ERA5数据经反距离加权(IDW)法插值到与MSWEP以及CMFD相同的空间分辨率0.1°×0.1°。CMFD与MSWEP时间分辨率为3 h,而ERA5时间分辨率为1 h,因此计算时分别将3 h和1 h降水量累加到日、月、年值降水量序列。

1.3 研究方法

1.3.1数据关联方法

由于将气象站点数据直接插值成空间数据有一定的误差[17],因此本文采用点对点方法进行数据之间的关联,即利用站点坐标提取其所在格网的降水数据值,以气象站点资料为基准,对比分析CMFD、MSWEP、ERA5这3种降水数据的质量精度。

1.3.2评价指标选取

采用皮尔逊相关系数(R)、均方根误差(RMSE)、平均绝对误差(MAE)和相对偏差(BIAS)4种定量评价指标评价降水再分析产品精度[18]。其中,R表示降水再分析数据与气象站点观测数据之间的线性相关程度,相关度越强,相关系数R越接近于1或-1;RMSE表征降水再分析数据与气象站点观测数据之间的离散程度,对特大特小误差反映非常敏感,值越大表示两组数据越离散,最优值为0;MAE反映降水再分析数据与气象站点观测数据之间的平均绝对偏差程度,可以避免误差相互抵消的问题,最优值为0;BIAS直观反映出降水再分析数据存在的系统误差大小及相对偏差程度,最优值为0。各指标计算公式如下:

(1)

(2)

(3)

(4)

此外,采用探测率(Probability of Detection,POD)、空报率(False Alarm Ratio,FAR)、偏差评分(B)、公平技巧评分(Equitable Threat Score,ETS)4个分类统计指标评估3种降水再分析数据对不同量级降水事件的捕捉能力。其中,POD表示降水再分析数据准确捕捉实际降水事件的能力;FAR表示降水再分析数据对降水事件的空报情况;B表示降水再分析数据是否高估(B>1)或者低估(B<1)了降水事件;ETS越大表示降水再分析数据对降水事件的综合预测能力越强。其计算公式如下:

(5)

(6)

(7)

(8)

(9)

式中:H代表命中降水数量;F代表空报降水数量;M代表漏报降水数量。POD和FAR的取值介于[0,1],B取值介于[0,+∞),ETS取值介于[-1/3,1];最优值POD=1,FAR=0,B=1,ETS=1。

依据国家气象局颁布的降水强度等级划分标准,选取降雨强度0.1~9.9,10.0~24.9,25.0~49.9,50.0~99.9,>100.0 mm/d作为发生小雨、中雨、大雨、暴雨及以上量级降水的判定标准。其中,以0.1 mm/d作为降水事件发生与否的阈值。

2 结果分析

2.1 多源降水产品年系列变化分析

图2为流域内226个气象站点与各降水再分析数据1979~2016年多年平均降水量散点图,其中每个点即代表一个站点,黑色虚线为理想状态分布线。可以看出ERA5多年平均降水量在绝大部分站点上均高估站点降水量,而MSWEP以及CMFD则能较密集且均匀地分布在理想分布线两侧,两者相关系数分别为0.93 与0.98,高于ERA5的0.82。

为了更直观地表示不同来源降水数据的空间差异,分别基于长江流域1979~2016年地面气象站点数据以及同期的CMFD、MSWEP和ERA5降水数据绘制多年平均降水量空间分布图,结果如图3所示。从图3中可以看出,长江流域多年平均降水量总体上呈现东高西低的趋势,降水的时空分布不均匀,东部地区多年平均降水量大于2 000 mm,西部地区则不足400 mm。ERA5在长江流域绝大部分地区都呈现高估的现象,部分站点高估程度甚至超过100%,高估较为严重。MSWEP在横断山脉、四川盆地以及长江下游表现为低估现象。CMFD在总体上则能较好地把握长江流域的降水空间分布。

表2为长江流域226个站点多年平均降水量在各相对偏差区间所占比重分析,可以看出ERA5对长江流域降水总体表现为高估现象,这与Jiang等[9]在中国大陆地区的研究结论相似。其中仅有3个站点,占站点总数的1.32%,相对偏差处于-20%~20%(可接受的范围)之间,其余站点相对偏差均大于20%,其中有48.23%的站点降水值高估程度处于50%~100%之间,有15.04%的站点降水值高估程度达到100%以上。对于MSWEP,其绝大部分站点(92.03%)的相对偏差处于-20%~20%之间,其中相对偏差低于0的站点占到总数的59.19%,说明MSWEP对大部分站点表现为低估的现象。同样对于CMFD,有99.12%的站点相对偏差处于-20%~20%之间,其中相对偏差处于0~20%之间的站点占到总数的71.24%,说明其整体上表现为略微高估的现象。相较于ERA5,CMFD与MSWEP这两种数据对长江流域降水值估算较好,精度较高,其中CMFD优于MSWEP。

表2 站点在各相对偏差区间所占比重Tab.2 The proportion of the stations in each BIAS interval %

2.2 多源降水产品月系列比较分析

根据长江流域226个站点算术面平均逐月降水量及其对应格点的CMFD、MSWEP、ERA5算术面平均逐月降水量,绘制多年月平均降水年内分布图,如图4所示。可以看出,3种降水产品中CMFD与MSWEP能较好地捕捉月平均降水年内分布特征,基本与站点月平均降水过程线重合,精度较高,其月平均降水在6月份达到最大,12月份达到最低。而对于ERA5降水数据,其各月平均降水均高于站点降水,虽然ERA5在长江流域月尺度上精度不高,但其年内各月降水分布趋势与地面站点降水一致。

依据长江流域226个站点算术面平均逐月降水量与其对应格点的CMFD、MSWEP、ERA5逐月降水量,计算各定量评价指标,结果如图5所示,可以明显看出ERA5的4种评价指标表现均较差。就相关系数R而言,CMFD与MSWEP表现均较好,其中CMFD的相关系数各月均在0.9以上,平均值达到0.95,MSWEP的平均值为0.92,相比之下,ERA5相关系数平均值只有0.61。就均方根误差RMSE而言,CMFD最大值为7月的46.42 mm,最小值为12月的10.62 mm,MSWEP最大值为7月的58.60 mm,最小值为12月的10.71 mm,ERA5最大值为8月127.70 mm,最小值为2月的55.41 mm。同样对于平均绝对误差MAE,3种降水再分析产品最大最小值发生月份与均方根误差相同,表明3种降水再分析产品误差在夏季月份要大于冬季月份。而就相对偏差BIAS而言,ERA5在11月至次年1月偏差最大,主要原因是在冬季月份降水量较少,在误差相同的情况下会导致偏差程度较其他月份高。综上可以看出,CMFD在月尺度上性能表现最好,其与各月份站点降水量拟合程度较高,相关系数最大,均方根误差以及平均绝对误差最小,MSWEP与ERA5次之。

从图5可以看出,汛期的月份和非汛期的月份3种降水产品的差异较大。因此,本文以5~10月作为汛期,11月至次年4月作为非汛期[19],进一步评估了3种降水再分析数据在汛期与非汛期的适用性。表3列出了3种降水产品在汛期与非汛期的精度对比,可以看出,3种降水产品在汛期与非汛期的精度均表现为CMFD>MSWEP>ERA5,其中CMFD与MSWEP的各指标值明显优于ERA5。就相对偏差BIAS而言,CMFD在汛期与非汛期均表现为轻微高估,MSWEP则表现为轻微低估。而ERA5均高估了汛期与非汛期的降水量,其BIAS值在汛期高估程度为47.74%,在非汛期高估程度达到88.82%。3种降水产品除相对偏差BIAS外,其余3个指标均是汛期表现要劣于非汛期。

表3 汛期与非汛期3种降水产品精度指标Tab.3 The accuracy indices for three precipitation products during flood season and non-flood season

2.3 多源降水产品日系列比较分析

基于日尺度序列计算3种降水产品相对226个站点观测数据的相关系数(R)、均方根误差(RMSE)、平均绝对误差(MAE)、相对偏差(BIAS)等指标,各指标空间分布如图6所示。图7为日尺度上各评价指标箱形图。通过对比发现,CMFD在长江流域表现出较高的相关性,其相关系数变化范围在0.65~0.97之间,平均值为0.87,远大于MSWEP的0.51与ERA5的0.49,原因可能是CMFD为中国区域高时空分辨率数据集,相较于MSWEP与ERA5,其结合了更多的中国地面气象站点,对降水的把握更精准[20]。对于MSWEP来说,其相关系数在金沙江下游及乌江流域较低,其值约在0.20~0.40之间。该地区地形相对复杂,可能导致该地区误差较大,该发现与邓越等[3]在中国大陆区域的研究结果相似。而ERA5则表现出相关系数自西向东逐渐增大的趋势。从均方根误差以及平均绝对误差来分析,3种产品都大致表现为自西向东逐渐增大的趋势,其中MSWEP与ERA5对这一趋势表现较为明显,这一现象与降水强度分布密切相关,长江下游降水强度大,降水量变化也比较大,最终使得误差也比较大。而长江上游流域地势较高,全年降水量较少,也就使得误差较小[21]。而CMFD无论是均方根误差还是平均绝对误差,其值在整个流域上都明显低于另外两种降水产品,对比图7(b)与图7(c)也能印证这一点。就相对偏差而言,CMFD与MSWEP都有较高的精确度,两者绝大部分站点的相对偏差都集中分布在-20%~20%之间,其平均值分别为1.09%和-1.18%。从图7(d)也能看出CMFD与MSWEP相对偏差值分布在0的两侧,因此平均值接近于0。从图6(l)可以看出,ERA5总体上高估日降水量,其各站点相对偏差平均值达到68%,高估较为严重。从空间上看,高估严重(BIAS>100%)的站点大多位于金沙江流域,该地区地处横断山脉,复杂的地形限制了卫星对降水的反演,阻碍了再分析资料的优化处理,赵平伟等[22]的研究结果也证实了这一点。

图8给出了3种降水产品在0.1 mm/d阈值下各分类统计指标的空间分布图,探测率(POD)、空报率(FAR)、偏差评分(B)以及公平技巧评分(ETS)表征3种降水再分析数据对降水/非降水事件的捕捉能力。对比图8(a)以及图8(c)可以发现,CMFD以及ERA5的探测率(POD)较高,绝大部分站点POD值都在0.9以上,表明CMFD与ERA5有较高的探测能力,其中ERA5的探测率(POD)又要明显高于CMFD,主要原因在于ERA5总体上高估日降水量,使得对0.1 mm/d 阈值下的降水事件有较高的探测能力。而MSWEP的POD值则相对较低,其值主要集中在0.75~0.90之间,从空间上看,MSWEP在金沙江流域的探测率最优,主要集中在0.85~0.95之间。

就空报率(FAR)而言,CMFD与MSWEP具有相似的空间分布格局,两者空报率(FAR)都集中在0.16~0.50之间,平均值分别为0.33与0.35,而ERA5则表现为长江下游流域的FAR值小于上游流域。

就偏差评分(B)而言,CMFD与MSWEP同样优于ERA5,两者主要集中在1.0~1.8之间,表明对降水的高估。ERA5则集中在1.2~3.0之间,从空间上看呈现自东向西逐渐增加的趋势。

从图8(j)可以看出,CMFD在乌江以及四川盆地的ETS评分要低于其他区域,其值主要集中在0.25~0.35之间,而MSWEP同样如此,ETS评分集中在0.15~0.35之间。ERA5则表现为下游ETS评分要明显高于上游流域,上游流域主要集中在0.10~0.30之间,下游流域主要集中在0.30~0.45之间。综上,CMFD对于各评价指标的空间分布要优于MSWEP与ERA5,表明CMFD对于降水事件发生与否的捕捉能力最强。

表4计算了CMFD、MSWEP和ERA5在不同量级降水上的POD、FAR、B以及ETS,从表中可以看出,3种降水产品的探测率POD均表现出一致的变化趋势,随着降水量级的增加,3种降水产品对降水的探测能力均减弱,但在不同量级降水上均表现为CMFD>ERA5>MSWEP的规律,表明CMFD对不同量级降水的探测能力最强。对于空报率FAR而言,CMFD的空报情况随着降水量级的增加有所缓解,ERA5则相反,MSWEP则对大雨空报最严重,对小雨空报最优。就偏差评分B而言,CMFD与MSWEP都存在小雨及中雨高估,大雨及以上量级降水低估的问题,这与武海喆等[23]在黄土高原的研究结果相似,而ERA5对不同量级降水均表现为高估。就ETS而言,CMFD在不同量级降水上均大于0.3,MSWEP以及ERA5都小于0.2,其中在小雨、大暴雨的评分上,MSWEP要优于ERA5,而在中雨、大雨、暴雨上,ERA5要优于MSWEP。总体而言,CMFD在4种指标上的表现均要优于MSWEP与ERA5,表明CMFD对不同量级降水的捕捉能力要强于另外两种产品。

表4 不同量级雨量探测能力Fig.4 The detecting capacities of rainfall at different magnitudes

3 结 论

本文基于长江流域1979~2016年226个地面气象站点以及同期的CMFD、MSWEP和ERA5这3种降水再分析数据,利用定量评价指标以及分类统计指标分析研究3种降水再分析产品在长江流域的适用性,得到以下结论:

(1) 3种降水数据中,ERA5在长江流域不同时间尺度上均呈现出严重高估现象,在使用时可考虑对其进行校正。

(2) 日尺度上,CMFD与站点观测资料一致性最高。相关系数各站点平均达到0.87。3种产品自上游向下游均不同程度表现出误差逐渐增大的趋势。对于不同量级降水的探测能力,总体上表现为CMFD>ERA5>MSWEP。

(3) 月尺度上,CMFD和MSWEP与地面站点降水具有较高的一致性,其相关系数明显高于ERA5,CMFD与MSWEP在汛期与非汛期的表现均优于ERA5。

(4) CMFD与MSWEP均能较好地反映长江流域多年平均降水量的空间分布特征。

综上,CMFD在长江流域不同时间尺度上均具有较高的精度,能在一定程度上克服地面雨量站点稀缺和空间分布不均的局限性。长江作为中国第一大河,流域内地形地势复杂、气候差异较大,因此在未来的研究中应该进一步精细化评估不同气候地形条件对降水产品造成的影响。此外,针对降水产品的精度评估,应当将其延长至水文验证端,即将降水再分析数据引入水文模型进行验证,增加降水再分析数据的实际应用价值。

猜你喜欢

气象站长江流域降水量
我国在珠穆朗玛峰架设世界最高海拔气象站
成都市年降水量时空分布特征
2020年主汛期长江流域短时强降水时空分布特征
防雷关键技术在自动气象站系统中的应用探究
珠峰上架起世界最高气象站
走遍长江流域的英国小伙
1961—2018年高密市降水量变化特征分析
1956—2014年铁岭县降水变化趋势分析
1970—2016年吕梁市离石区降水量变化特征分析
黄帝战蚩尤