APP下载

大渡河流域逐日降雨数据融合的误差分析

2022-12-13董丹丹蔡宏珂

成都信息工程大学学报 2022年6期
关键词:大渡河观测站雨量

陈 媛, 董丹丹, 申 飙, 蔡宏珂

(1.国能大渡河大数据服务有限公司,四川 成都 610041;2.成都信息工程大学,四川 成都 610225;3.重庆美天科技有限公司,重庆 401120)

0 引言

地面雨量站网可以提供精确的点降雨信息,但由于其空间分布不均,在雨量站网稀疏地区,如果仅用雨量网观测降雨估计流域面降雨量将会产生很大的不确定性。数值模式输出的降雨产品可以弥补观测系统部署不均造成的问题,但模式降雨产品本身亦存在严重的系统偏差[1-2]。基于单一来源的降雨资料各有利弊,如何有效结合不同来源降雨资料的优势,发展多源降雨融合技术,成为近年来国际上在高质量降雨产品研发中的主流趋势[3-5]。

数据融合是将来源和分辨率各异的、直接和间接的观测数据与模型模拟结果集成,生成在时间、空间和物理特性三个维度上具有一致性的各种数据集,通过数据融合技术对地面观测降雨和格点降雨产品进行综合分析以获取最优面降雨估计,融合后的降雨具有多种降雨资料的优势,能够精确反映降雨的空间分布状态[6-8]。数据融合方法有两种[9-10]:(1)全局校正融合方法的基本假设是格点降雨在空间域上具有连续分布的偏差,利用真实观测的站点数据对每个格点降雨进行修正,此方法融合了地面观测降雨的局部高精度和格点降雨资料覆盖范围广且空间分布合理的优点。(2)局部校正融合方法的核心是基于加权平均、回归分析等数学思想,主要利用单个格点所包含的雨量站点降雨信息对格点降雨信息进行局部修正,此融合方法考虑了降雨的空间自相关性,在雨量站网密度较大地区融合效果较好,但在雨量站网密度较低地区,雨量站点距离较大,其空间自相关性被高估,融合结果会产生很大的不确定性。

四 川 大 渡 河 流 域 位 于 99°42'E~103°48'E,28°15'N~33°33'N,青藏高原东南边缘向四川盆地西部的过渡地带,流域内地貌形态差异明显,地理特征复杂,气候差异明显[11-12],与降雨密切相关的滑坡、泥石流等地质灾害频繁发生[13-14],流域的流量、江河的抗洪能力以及水库的蓄洪规模都与流域的平均降雨量密切相关[15-16]。目前,大渡河流域气象观测站点分布不均且密度较低,存在某些区域缺乏雨量观测数据的问题。因此,有必要对大渡河流域降雨数据进行融合方法研究及其误差分析,从而改善流域内降雨数据精度不够的问题,为防灾减灾提供参考。

1 数据与方法

1.1 研究数据

采用资料:(1)1979-2018年大渡河流域自建测站和气象系统观测站网的气象观测资料,时间分辨率为逐日。(2)1979-2018年ERA5再分析数据,时间分辨率为逐小时,空间分辨率0.25°。(3)1979-2018年NCEP2再分析数据,时间分辨率为逐小时,空间分辨率2.5°。(4)1997-2018年 TRMM 数据。(5)1979-2018年由气象观测资料、ERA5再分析数据融合且再由气象观测资料、TRMM数据订正得到的逐日降雨融合数据(Grid数据)。(6)2008-2018年全流域、1~4区逐日Grid数据面雨量与观测资料面雨量数据。

1.2 研究方法

根据大渡河流域地理特征,将其分为4个区域,从西北到东南依次为一区、二区、三区和四区,如图1所示,为3条黑线所分隔,一区位于大渡河流域的上游,二区主要位于中游,三区和四区位于流域下游,其中四区主要位于大渡河的南侧。

图1 1979-2018年观测站点、Grid、ERA5、NCEP2日均降雨量空间分布

首先进行降雨数据融合得到一套新的完整逐日降雨数据 Grid数据;再结合气象站点资料、ERA5和NCEP2格点资料,从日均降雨量空间分布、4个分区日均面雨量、日降雨量均方根误差、日降雨量标准差及全流域、1~4区的面雨量时间序列这5个方面来评估融合资料,与站点资料、ERA5和NCEP2格点资料进行误差对比分析,探讨Grid数据的适用性。

1.2.1 数据融合方法

目前国际上使用较多的格点数据主要为ERA5和NCEP2再分析数据集,因此,首先将大渡河流域观测站点数据与ERA5降雨数据进行融合得到格点数据;然后,由于大渡河流域站点密度较低,局部校正融合方法不适用,因此采用最优插值数据融合方法进行全局校正[9-10],利用气象观测数据和TRMM卫星反演降雨数据进行校正,形成逐日降雨资料,数据的空间分辨率为0.1°×0.1°,即经融合订正后形成的逐日降雨融合数据(Grid数据)。使用的插值方法包括3次样条插值和反距离权重插值方法。

1.2.2 面雨量计算方法

在某个特定地点所测得的降落到地面的降雨量称作点雨量,气象部门观测和预报的一般是作为站点位置函数的点雨量,而水文部门需要的则是流域范围内的面雨量。流域面雨量可以通过点雨量来计算,表示为

式中,P是作为连续函数的点雨量,C是某一特定流域,AC为流域面积。

由于降雨观测站的离散性,不可能获得完全连续的点雨量场P。实际计算是通过将式(1)离散化来完成的,即先将流域C划分为N个包含一个雨量观测的小区域,用第i个小区域上的点雨量Pi代表小区域的平均降雨量,流域的面雨量近似为

式中:N为样本量

1.2.3 误差评估方法

采用标准差和均方根误差来进行误差评估。标准差在降雨数据的评估中是最常使用的指标,可作为表征变量变化程度的统计量。标准差定义是各样本距平的算数平方根,它反映样本的平均变化程度,能够反应降雨变化程度的统计量。公式如下:

均方根误差(RMSE)是用来衡量观测值同真值之间的偏差。公式如下:

式中,x和y为两组变量,N为样本量。

1.2.4 相关系数

采用皮尔逊相关系数来描述两个变量的线性相关,用r来表示相关系数,公式如下:

2 日均降雨量空间分布

从图1看,观测站点数据显示大渡河流域日均降雨在南部区域即3区和4区相对偏多,日均最大值可以达到7.1 mm以上,而在中北部区域即1区和2区相对偏少,日均降雨量最小值在2.9 mm以下,整体上大渡河流域降雨呈现出自北向南逐渐增加的趋势。ERA5降雨资料显示,大渡河流域总体上表现出“北低南高”的降雨趋势,但由于该套资料的分辨率仅为0.25°,因此在每个区域内并不能完全展示实际降雨的分布状况,尤其在1区、2区和4区内的降雨量明显偏小,在3区内降雨量比观测站点值又偏高;NCEP2数据同样由于空间分辨率(2.5°)过低,不能完全展现大渡河流域的降雨实况,甚至不能完全覆盖流域范围。

Grid数据,分辨率达到了0.1°,基本能完整地展示出大渡河流域的降雨分布,总体上的降雨分布与观测站点基本一致,同样呈现出北部多、南部少的分布状况,在每个区域内的降雨分布和观测站点展示出的降雨量基本吻合。

为进一步评估Grid、ERA5和NCEP2这3套降雨资料与观测站点数据具体差异情况,将Grid、ERA5和NCEP2日均降雨量数据分别插值到观测站点上,并与观测站点数据进行对比(图2)。

图2 1979-2018观测站点及Grid、ERA5、NCEP2插值到站点日均降雨量空间分布

从各个分区来看,ERA5数据插值到站点后的降雨量在3区和4区明显比观测站点数据偏小,而NCEP2数据插值到站点后的降雨量在3区和4区明显比观测站点偏大;Grid数据与观测站点相比在3区和4区相较于ERA5和NCEP2数据明显更好。在1区内,Grid和ERA5插值后的降雨量与观测站点数据比较接近,但ERA5数据在2区整体上偏高。此外,NCEP2插值后的数据在1区和2区均明显比观测站点数据偏高,多数站点日均降雨都在5.18 mm以上。

综上,对于Grid数据而言,其插值到站点后的数据优于ERA5和NCEP2数据,降雨量量级与观测站点数据差距小,且整个区域内的降雨量变化趋势与观测站点数据基本一致,在每个分区内的最大降雨量和最小降雨量与观测站点值相对接近。

3 各分区日均面雨量

为进一步定量化观测站点数据与 Grid、ERA5、NCEP2资料在各分区的接近程度,从不同区域的日均面雨量直方图来看(图3),在4个区域内Grid数据的日均面雨量均比观测站点偏高,这可能是由于站点分布较为稀疏,导致Grid数据中包含相对多的ERA5数据信息。同时,ERA5数据则在1~3区内日均面雨量同样比观测站点偏高,但是在4区表现相反,明显比观测站点低;NCEP2数据在各个区域都比观测站点偏高。

图3 1979-2018年观测站点、Grid、ERA5、NCEP2 1~4区日均面雨量

1区内,Grid、ERA5、NCEP2面雨量呈逐渐增大,其中Grid数据与观测站点数据最接近,NCEP2数据与观测站点的差距最大。2区内与观测站点差距最大的为ERA5,但由于融合数据Grid加入了站点信息,Grid数据比ERA5更接近观测站点数据。3区内,ERA5数据得出的日均面雨量数值最低,且与观测站点最为接近,但从图2日均降雨量空间分布来看,ERA5雨量在3区为“西少东多”,而实际站点为“西多东少”,因此Grid站点在3区与观测站点更为接近。4区内,Grid数据与观测站点数据更接近。

综上,Grid数据的日均面雨量和观测站点数据最接近。

4 日降雨量均方根误差

以观测站点降雨数据为基准,评估Grid、ERA5和NCEP2各数据对大渡河流域日降雨量的均方根误差(RMSE)情况(图4)。总体上看,Grid数据与站点数据的RMSE误差最小。从各个分区来看,在1区和2区内,Grid数据绝大部分RMSE值很小,误差值在2.6以下;ERA5和NCEP2数据误差约在8.9~12.5,部分站点误差更高。在3区和4区内,Grid数据依然表现最好,很多站点的误差值都在2.6以下,ERA5和NCEP2数据的表现远弱于Grid数据,其绝大部分站点数据的误差值都在8.9~12.5,甚至部分站点误差值超过22以上。因此,从3套数据的RMSE误差来看,Grid数据的要明显小于ERA5和NCEP2数据。

图4 1979-2018年Grid、ERA5、NCEP2日降雨量插值到站点RMSE空间分布

若从1~4区的RMSE区域平均来看(图5),Grid的优势更加明显。1区、2区和4区的Grid数据误差远低于其余两套数据。在3区内,Grid数据的误差虽有所增加,但相对于ERA5和NCEP2数据误差而言依然较小。因此在大渡河流域Grid降雨资料的准确性更高。

图5 1979-2018年Grid、ERA5、NCEP2 1~4区RMSE区域平均值

5 日降雨量标准差

标准差能够反映变量的平均变化程度。一个较大的标准差代表变量变化幅度较大;一个较小的标准差代表变化幅度较小。从图6可以看出,观测站点数据位于北部区域的1区和2区绝大部分站点标准差在4.5以下,而位于南部区域的3区和4区标准差相对较高,部分站点标准差在10以上。这说明3~4区降雨的变化程度比1~2区的变化程度大。

图6 1979-2018年观测站点、Grid、ERA5、NCEP2日降雨量标准差空间分布

将Grid、ERA5和NCEP2降雨数据的标准差与观测站点数据对比,可以看到,Grid数据的标准差空间分布特征明显与观测站点数据更接近,1区和2区内,Grid数据在标准差也基本在4.5以下,3区和4区内,标准差也较为接近,这说明各分区标准差与观测站点数据在不同分区内的标准差分布状况基本一致。ERA5数据在3区和4区内的标准差明显低于Grid数据,大部分在7.5以下,但部分区域标准差又较大。对于NCEP2数据而言,由于分辨率较低,并不能完全展示不同分区内的降雨标准差,其中更多的降雨细节被忽略。因此,从各套数据的标准差来看,Grid数据与观测站点数据最接近。

若将Grid、ERA5和NCEP2数据的标准差插值到各站点上(图7),同样可以看出,Grid数据在各站点上的标准差与观测站点数据的标准差基本一致,即“北部低、南部高”,北部的降雨量变化较小,南部的降雨量变化较大。从ERA5和NCEP2数据在各站点上的标准差来看,两者在整个大渡河流域的标准差均比较低,与观测站点数据的标准差存在较大差距,EAR5和NCEP2数据对大渡河流域的降雨表现不如高分辨率的Grid数据。进一步说明了Grid数据与观测站点数据最接近,Grid数据平均变化程度优于ERA5和NCEP2数据。

图7 1979-2018年观测站点及Grid、ERA5、NCEP2插值到站点日降雨量标准差空间分布

从不同区域内、不同降雨数据的标准差区域平均直方图来看(图8),1区内,Grid数据的标准差与观测站点数据十分接近;2区内Grid数据也最为接近观测站点数据;3区和4区内,ERA5的标准差明显低于观测站点,Grid的标准差与观测站点数据更接近。

图8 1979-2018 年观测站点、Grid、ERA5、NCEP2 1~4区日标准差区域平均值

综上,从标准差分析来看,Grid数据总体上、各分区内与观测站点数据最接近,Grid数据平均变化程度优于ERA5和NCEP2数据。

6 日降雨量近十年时间序列

为进一步对比Grid数据和观测数据,计算了大渡河整个流域和1~4区的面雨量在2008-2018年的逐日时间序列(图略)。用皮尔逊相关系数来表征Grid数据与观测资料的相关性,Grid数据的多个时间序列与观测资料相比,大多数相关系数都在0.9以上。从全流域来看,Grid数据除2008年和观测的相关系数<0.9外,其余年份都>0.9,部分年份>0.95,甚至等于0.99。此外,在降雨较少的1-3月及11月和12月,Grid数据也能较好地展示大渡河全流域和各分区的降雨变化,Grid数据和观测的降雨在降雨较少期也基本吻合。因此,从全流域和1~4分区的面雨量时间序列来看,Grid数据和观测值也比较接近。

7 结论

大渡河流域的复杂地形,导致在该区域内的气象观测站点分布不均,致使其在流域内的降雨无法完全通过常规意义的观测站点观测得到,因此需要精度更高的数据集来展示大渡河流域的降雨状况。对大渡河流域观测站点、Grid、ERA5和NCEP2数据在日尺度上,分别对比评估4套数据在大渡河流域的适用性。其主要结论如下:

(1)Grid数据的分辨率达到0.1°,基本能完整地展示出大渡河流域的日均降雨分布,总体上的降雨分布和观测站点基本一致,在每个区域内的降雨分布和观测站点展示出的降雨量基本吻合。

(2)Grid数据插值站点的数据优于ERA5和NCEP2数据,降雨量量级与观测站点数据差距小,且整个区域内的降雨量变化趋势与观测站点数据基本一致。

(3)从标准差来看,Grid数据在各站点上的标准差与观测站点数据的标准差基本一致,北部的日降雨量标准差小变化较小,南部的日降雨量标准差大变化大。从标准差分布的整体来看,EAR5和NCEP2数据对大渡河流域的降雨表现不如高分辨率的Grid数据。

(4)从均方根误差来看,Grid数据的误差要明显小于ERA5和NCEP2数据集。

(5)从标准差和均方根误差两方面综合来看,Grid数据在日均降雨量空间分布、日均面雨量、日降雨量RMSE和日降雨量标准差上和观测值比较接近;从全流域和1~4分区的面雨量时间序列来看,Grid数据和观测值也比较接近。总之,Grid数据能较好地反映大渡河流域的实际降雨情况。

猜你喜欢

大渡河观测站雨量
GPS导航对抗数据质量特征实例分析
基于高频GPS的沂沭断裂带两侧震时位移分析
宁夏红柳沟流域水沙变化及产沙分析
四川省甘孜州:航拍四川稻城高海拔宇宙线观测站
2009~2019年大渡河上游暴雨的时空分布和环流特征分析
基于小波去噪的称重雨量数据分析
暴雨强度公式编制之基础数据质量控制
水电样本:大渡河的智慧化应用
去中心化时差频差直接定位方法
SL—1 型雨量传感器故障分析排除和维护