不同空间插值方法对重庆地区降水的适用性分析
2022-07-08刘祥,庞玥,何军,陈欢
刘 祥 , 庞 玥 , 何 军 , 陈 欢
(1.重庆市气象服务中心,重庆 401147;2.重庆市气象台,重庆 401147)
引言
降水观测是气象观测中最为重要的观测项目之一,长时间的降水观测能反映该地区的气候状态[1],而短时间的降水观测能监测到降水极值的出现,对防汛减灾工作起到重要的指导作用[2-3]。我国是一个地形复杂多变、各地区发展不太均衡的国家,在降水观测站点的建设上存在着空间分布不均的情况[4]。虽然近年来加密观测站点的建设使得降水观测更加接近实况,但具有长时间尺度降水观测的国家级站点的空间分辨率仍然较低,往往需要通过空间插值方法得到适用的格点资料,从而对当地降水气候态进行反演计算[5]。
通过空间插值方法将站点降水转化为格点降水时必定与实际资料存在一定偏差,不同插值方法之间也有优劣之分[6-11],近年来,已有许多学者对比了不同插值方法在不同地区的适用性。陈雅婷等[12]比较了8种空间插值方法在我国主要流域降水数据中的优劣,指出不同插值方法在不同流域的表现并不稳定,在利用站点资料插值时需要针对不同流域选取最合理的插值方法。许娈等[13]利用我国东部地区自动站逐小时降水资料,设计了大范围强降水、大范围弱降水以及局地强降水共3组试验,表明在不同范围或量级的降水背景下,降水范围和强度对插值效果会产生一定影响。庄立伟等[14]基于逐日降水资料,分析了3种插值方法在我国东北地区使用的精度差异,发现造成这种差异的原因是站点降水在经向梯度、纬向梯度和海拔梯度上存在明显的季节变化,而将降水数据在经向、纬向以及垂直方向上赋予权重进行订正之后取得了较好的效果。解恒燕等[15]选取美国Upper Sangamon流域9个站点的月降水量数据,研究了小样本情况下不同插值方法的优劣,发现插值效果不仅受插值方法的影响,还与插值站点的密度和分布情况有关。
虽然前期在空间插值方法的对比上已经做了很多工作,但大多数研究只是针对不同插值方法进行对比,得出一个总体效果较好的插值方法,而实际上就算总体最优的插值方案,在反映具体降水特征时也不一定最为准确。因此,有必要在对比不同插值方法优劣的基础上,进一步分析各种插值方法是否能准确地模拟出实际的降水特征。本文选取重庆地区作为研究区域,对比分析6种常用的空间插值方法在重庆地区不同时间、不同区域降水插值中的优劣,并利用交叉检验法进一步探讨不同空间插值方法在重庆地区平均累计降水和降水极值方面的适用性,以期为降水监测及防汛减灾工作提供科学参考。
1 资料与方法
1.1 资料
本文采用中国气象局全国综合气象信息共享平台(CIMISS)提供的1981~2018年逐日降水资料,选取重庆地区35个国家气象站作为插值站点(图1)。重庆地区位于四川盆地东南部,是青藏高原与长江中下游平原的过渡地带,地形多以山地和丘陵为主,地势由南北两侧向中间的长江河谷地带逐渐降低。根据日常业务工作需求,将重庆地区划分为渝东北、渝东南、渝中以及渝西共4个区域,其中渝东北地区北部倚靠大巴山山脉,渝东南地区北部和渝西地区南部倚靠武陵山山脉,平均海拔较高,而渝中、渝西大部地区位于四川盆地东南部,海拔相对较低[16]。
图1 重庆地区国家气象站分布及区域划分
1.2 插值方法选取
为更好地反映一个特定空间内某一要素的水平分布情况,常利用空间插值方法将离散的站点资料转化为连续的格点资料。目前,空间插值方法主要分为确定性方法和地质统计学方法,确定性方法如反距离加权插值法(IDW)等,地质统计学方法如克里金插值法(KR)等[17-18]。本文选取最小曲率插值法(MC)、径向基函数插值法(RBF)、克里金插值法(KR)、局部多项式插值法(LP)、反距离加权插值法(IDW)以及改进的Shepard插值法(MS)共6种常用的空间插值方法,分析评估各种方法在降水模拟表现上的优劣。6种空间插值方法的简要说明如下:
(1)最小曲率插值法(MC):在尽可能接近原始数据时,使插值面通过每个数据时有最小的弯曲量,这样生成的图形或曲面在连续和圆润方面表现较为突出。
(2)径向基函数插值法(RBF):使插值面通过每个站点值,并内插出格点数据,在数据集比较接近的情况下表现更好。
(3)克里金插值法(KR):以数据的相关性和变异性为基础,通过半方差函数计算区域内未知格点的值,得到无偏、最优化的结果。
(4)局部多项式插值法(LP):根据已知有限的数据,利用最小二乘法求解指定领域内多个多项式拟合表面,并内插出格点数据。
(5)反距离加权插值法(IDW):将插值网格点与各站点之间的距离作为权重,距离越近的站点计算时所占的权重越大,最后进行加权平均得到插值网格点的值。通过计算发现在幂指数为4时有最好的插值效果,故本文选取幂指数为4的反距离加权插值法。
(6)改进的 Shepard 插值法(MS):又称改进的反距离加权插值法,改进了加权函数,同时用二次多项式函数代替离散点,使插值面更加圆滑。
1.3 插值方法检验
本文运用交叉检验法评估不同插值方法的优劣。具体操作流程是:先剔除某一站点的数据,用其他站点数据进行插值后,得到该站点的估计值,再对所有站点数据重复这一运算,得到各个站点的估计值,最后对所有站点的估计值与实况值进行对比,评估不同空间插值方法的优劣。评估指标包括平均绝对误差(MAE)、平均相对误差(MRE)以及均方根误差(RMSE)等,具体计算公式如下:
2 插值方法对平均累计降水的适用性分析
本文计算了1981~2018年重庆各季及全年的平均累计降水,分析各插值方法在重庆地区不同时段降水中的适用性。图2给出了6种插值方法处理各季及全年平均累计降水的均方根误差。如图所示,所有插值方法的均方根误差在全年平均累计降水中最大,而在冬季降水中最小,由于降水量由大到小分别为全年、夏季、春季、秋季、冬季(图略),说明降水量越大,插值后的估计值与实况值的绝对偏差越大,因此均方根误差随着降水量的增加而增大。在各季和全年平均累计降水中,均方根误差最小的插值方法是最小曲率插值法(MC),最大的插值方法是改进的Shepard插值法(MS),其余4种插值方法的均方根误差比较接近。此外,在冬季降水中,即降水量较小时,最小曲率插值法(MC)的优势不明显,6种插值方法的插值效果十分接近。随着降水量的增加,最小曲率插值法(MC)整体插值效果较其他插值方法的优势愈发突出,而表现最差的改进的Shepard插值法(MS)在冬季降水中效果略优,在其他季节和全年降水中与实况的差距均大于其他插值方法。
图2 不同插值方法处理各季及全年平均累计降水的均方根误差(单位:mm)
根据CIMISS数据统计,重庆市年平均降水量介于1100~1400 mm,整体呈现东多西少的分布特征,西北部潼南最少,其次为西南部江津,东南部秀山、酉阳最多,其次为东北部开州,此外中部武隆、丰都为相对少雨区,东北偏北的万州、梁平、城口为相对多雨区。为探究图2中不同插值方法表现差异的原因,绘制了不同插值方法年降水量空间分布(图3)。如图3a所示,由于最小曲率法的原理是在尽可能接近原始数据时,使插值面通过每个数据时有最小的弯曲量,因此,不论是西北、西南以及中部少雨中心,还是东北、东南多雨中心,该方法均能刻画得较为均匀准确,也未出现“牛眼”现象,符合重庆实际,同时线条比较平滑。而改进的Shepard法(图3f)在南部“牛眼”现象明显,中部少雨区未刻画出来,表现效果最差。其余4种插值方法在中部少雨区的刻画准确度以及线条平滑度上均不及最小曲率法。
图3 不同插值方法处理全年平均累计降水的空间分布(a.MC,b.RBF,c.KR,d.LP,e.IDW,f.MS,单位:mm)
为了分析6种插值方法在各季及全年平均累计降水中各站点的整体插值效果,图4给出了6种插值方法在各站点中相对误差的平均值分布。如图所示,各季及全年平均累计降水的插值相对误差在各站点表现并不一致,但总体表现出渝东北、渝东南地区北部以及渝西地区南部站点的相对误差较大,而渝西和渝中大部地区以及长江沿线地区站点的相对误差较小。结合重庆地区地形分布(图略)可知,相对误差较大的站点正好位于海拔较高且地形变化较大的山区,而相对误差较小的站点平均海拔较低,这说明复杂地形对插值效果的稳定性影响较大。此外,由于渝西地区观测站点相对较密,站点资料经过插值后在渝西地区更加接近降水实况,而在海拔较高的山区可能需要通过提高观测站密度等方法来增加插值后的准确度。
图4 不同插值方法处理各季及全年平均累计降水的站点相对误差平均值分布(a.春季,b.夏季,c.秋季,d.冬季,e.全年,单位:%)
通过计算可知,各季及全年降水中插值场与实况场相减得到的偏差场水平分布基本一致(图略),故仅以全年平均累计降水为例,分析各插值方法所得到的插值场与实况场的偏差分布(图5),探讨各插值方法在重庆地区不同区域的插值效果。如图所示,各插值方法在重庆地区不同区域的表现并不一致,差异最大的区域为渝东北和渝东南地区,而在渝中和渝西地区,各插值方法的偏差分布比较接近,偏多或偏少的区域基本一致。其中,径向基函数插值法(RBF)、克里金插值法(KR)、反距离加权插值法(IDW)在渝东北和渝东南大部地区的插值场低于实况场;最小曲率插值法(MC)在渝东北地区的插值场低于实况场,在渝东南地区的插值场高于实况场;局部多项式插值法(LP)和改进的Shepard插值法(MS)在渝东北大部地区的插值场都高于实况场,而在渝东南大部地区的插值场都低于实况场。同时,各插值方法均在渝东南地区的西部出现负偏差中心,在渝西地区的南部出现一对正负偏差中心,说明各插值方法在这些地区的插值效果都较差。
图5 不同插值法处理全年平均累计降水的插值场与实况场的偏差分布(a.MC,b.RBF,c.KR,d.LP,e.IDW,f.MS,单位:mm)
图5定性地反映出各插值方法在重庆不同区域的表现并不一致,为了进一步确认不同区域的最佳插值方法,表1定量地统计了6种插值方法在重庆地区各区域的平均相对误差。结果表明,最小曲率插值法(MC)在渝东南、渝中、渝西地区表现最优,其中在渝中、渝西的插值效果要明显优于其他插值方法,而在渝东北地区,最优插值方法为径向基函数插值法(RBF)。
表1 不同插值法在重庆地区各区域的平均相对误差(单位:%)
3 插值方法对降水极值的适用性分析
上节分析了6种插值方法在重庆地区平均累计降水中的表现,而作为降水因子重要特征之一的降水极值特征(量级、位置)却不能很好地展现出来,因此需要进一步对各插值方法在降水极值中的量级及位置进行分析。
首先,对各插值方法在降水极值量级方面进行适用性分析。图6给出了不同插值方法处理各季降水所得极值与实况的偏差。如图所示,不同插值方法在不同季节极值量级的模拟上表现并不一致,对极端降水的反映存在一定误差,使得插值后的降水强度和范围出现偏差。在极大值方面(图6a),春季降水中误差最小的插值方法是径向基函数插值法(RBF),比实况偏少3.9 mm;夏季降水中误差最小的是克里金插值法(KR),比实况偏多0.2 mm;秋季和冬季降水中误差最小的分别是径向基函数插值法(RBF)和改进的Shepard插值法(MS),分别比实况偏少9.7 mm和偏多2 mm。在极小值方面(图6b),春季降水中插值效果最好的方法仍然是径向基函数插值法(RBF),与实况基本没有偏差;夏、秋、冬季降水中误差最小的分别是最小曲率插值法(MC)、克里金插值法(KR)和径向基函数插值法(RBF),分别比实况偏多 10.3 mm、偏多 2.1 mm和偏多 2.5 mm。
图6 不同插值方法处理各季降水所得极值与实况的偏差(a.极大值,b.极小值,单位:mm)
图7为不同插值方法处理全年降水所得极值与实况的偏差。如图所示,不同于各插值方法在各季降水极值量级的模拟结果中存在偏多或偏少的情况,在全年降水极值量级模拟中均呈现出偏多的状态。其中,全年降水极大值与实况降水最接近的方法仍然是径向基函数插值法(RBF),比实况极大值偏多110 mm;全年降水极小值与实况降水最接近的方法是局部多项式插值法(LP),比实况极小值偏多115.9 mm。需要特别指出的是,偏差大小与降水量的多少并不相关,如径向基函数插值法(RBF)得到的极大值误差比极小值小,但局部多项式插值法(LP)得到的极大值误差却比极小值大。
图7 同图6,但为全年降水
表2总结了各季和全年降水极值量级中最优的插值方法。分析可知,整体表现最优的插值方法为径向基函数插值法(RBF),它在春季极值、秋季极大值、冬季极小值以及全年极大值的模拟表现均为最佳。在实际应用中,可根据表2选取合适的插值方法,使得插值后的极值更接近实况。
表2 各季与全年降水极值量级的最优插值方法
为了分析不同方法插值所得的极值降水位置与实况降水位置的偏差,表3统计了各插值方法通过交叉验证后所得的极值站点同实况极值站点的对比。分析可知,总体上各插值方法的极值位置与实况极值位置误差不大,与实况极值站点能保持在同一区域或相邻站点。其中,各插值方法对极大值位置的模拟要优于极小值,春季降水与全年降水站点插值之后极大值的位置与实况基本一致。此外,各插值方法中极值位置模拟表现最优的是最小曲率插值法(MC),10个极值位置中有5个位置准确,准确率达到50%,其次为径向基函数插值法(RBF)和局部多项式插值法(LP),准确率为30%。
表3 不同插值方法所得的极值降水站点与实况极值降水站点的对比
4 插值方法对夏季极端降水的适用性分析
随着气候变化加剧,极端降水尤其是夏季极端降水越来越受到关注。本节选取2020年6月26~28日重庆市一次暴雨天气过程作为研究个例,分析6种插值方法在极端降水上的表现差异。26日08时~27日08时,重庆西部至东部一线出现大到暴雨天气,西部偏西和东部偏东部分站点大暴雨,最大日雨量出现在重庆西部的永川区,为120 mm。从雨带分布(图8)来看,各插值方法均能较好反映实际情况,但局部多项式法(LP)和反距离加权法(IDW)对降水中心的反映较差(图8d、e),尤其反距离加权法(IDW)出现了较多的“牛眼”现象。在极大值的模拟上,最小曲率法(MC)和径向基函数法(RBF)分别为 109.6 mm和109.9 mm(图8a、b),与实况120 mm最为接近。从平均绝对误差和均方根误差来看,最小曲率法(MC)明显优于其他插值方法(图略),更适用于夏季极端降水。
图8 不同插值法处理的 2020年 6月 26~28日降水空间分布(a.MC,b.RBF,c.KR,d.LP,e.IDW,f.MS,单位:mm)
5 结论与讨论
本文利用1981~2018年重庆地区35个国家气象站的逐日降水数据,对6种空间插值方法处理各季和全年平均累计降水和降水极值的结果进行了对比分析,得到如下主要结论:
(1)在平均累计降水中,整体来看,随着降水量的增加,各插值方法的均方根误差都有所增加。在冬季降水中,各插值方法的插值效果差距不大,但随着降水量的增加,最小曲率插值法(MC)的优势明显加大。
(2)空间插值方法受复杂地形影响较大,在渝西和渝中大部分地区以及长江沿线地区适用性较好,在渝东北、渝东南地区北部以及渝西地区南部的山区适用性较差。各插值方法在重庆地区不同区域的表现并不一致,差异最大的区域为渝东北和渝东南地区,而在渝中和渝西地区,各插值方法的偏差分布比较接近。其中,最小曲率插值法(MC)在渝东南、渝中以及渝西地区最为适用,而径向基函数插值法(RBF)在渝东北最为适用。
(3)不同插值方法在极值量级的模拟上表现并不一致,在不同季节极值量级的模拟上表现出偏多或偏少的情况,而在全年降水极值模拟表现中均呈现出偏多的状态,整体表现最优的插值方法为径向基函数插值法(RBF);在位置方面,各插值方法的极值位置与实况极值位置误差不大,与实况极值站点能保持在同一区域或相邻站点,各插值方法对极大值位置的模拟要优于极小值,其中最小曲率插值法(MC)的插值效果最好。
(4)在夏季极端降水中,最小曲率法有更优的表现,其差值结果相较其他插值方法与实况更为接近。
本文主要利用长时间的站点降水资料对各种空间插值方法的适用性进行了分析评估,获得了一些有益的初步结论。但未能进一步探讨空间插值方法在区域性暴雨中的适用性分析,以及短时间降水观测在空间插值方法中的应用等问题,有待于在后续工作中利用更精细的站点资料开展深入研究。