APP下载

无定河流域降水量空间插值方法比较研究

2021-04-27张孟丹余钟波谷黄河朱奎

人民黄河 2021年4期
关键词:插值降雨量极值

张孟丹 余钟波 谷黄河 朱奎

摘 要:以黄土高原半干旱区的无定河流域81个雨量站的多年平均、年、月和场次降水量为基础数据,运用泰森多边形法(Thiessen)、一阶全局多项式法(Linear)、反距离加权法(IDW)、薄板样条函数法(TPS)和普通克里格法(Kriging)对降水量数据进行了空间插值和交叉验证,通过对数据和验证指标的对比分析,选出无定河流域不同时间尺度数据所适用的插值方法。研究表明:①多年平均年降水量和年降水量插值中Kriging法插值效果最好;②月降水量数据插值中IDW法插值效果比较稳定;③场次降雨量数据插值中,Kriging法插值效果比较稳定;④对不同时间尺度的降水量数据插值,Thiessen法插值效果差,Linear法插值结果图概化性强、所反映的降水空间信息较少,IDW法对月降水量数据的插值误差适中、插值效果比较稳定,TPS法对极值比较大的月降水量数据插值存在一定的优势、插值图局部光滑性较好,Kriging法对多年平均和年降水量数据插值效果最好。

关键词:泰森多边形法;一阶全局多项式法;反距离加权法;薄板样条函数法;普通克里格法;交叉验证;Morans I指数;无定河流域

中图分类号:P332.1 文献标志码:A

doi:10.3969/j.issn.1000-1379.2021.04.006

引用格式:张孟丹,余钟波,谷黄河,等.无定河流域降水量空间插值方法比较研究[J].人民黄河,2021,43(4):30-37,99.

Abstract: In this paper, five spatial interpolation methods, such as the Thiessen polygon method, the first order linear method, IDW method (Inverse Distance Weighting), TPS method (Thin Plate Spline function) and ordinary Kriging method, were compared and validated based on the different time scales (the multi-year average, yearly, monthly and daily) precipitation from 81 precipitation stations in the Wuding River Basin in the semi-arid Loess Plateau. Through the comparative analysis of the data and the verification indicators, the interpolation methods suitable for different time scale precipitation in this region were selected. The results indicate that: a) the Kriging method has higher accuracy for multi-year average and yearly precipitation; b) for the monthly precipitation, the IDW method shows a better result; c) the Kriging method has better performance in the precipitation events with higher spatial autocorrelation; d) overall, the Thiessen method has a worse interpolation performance. The linear interpolation results are disappointing in most cases and show limited spatial information. The IDW method has a moderate interpolation error for monthly precipitation, and shows stable interpolation performance. The TPS method has certain advantages in the interpolation of monthly precipitation with better performance on extremum and local information. Kriging method shows the best performance in interpolating multi-year average and yearly precipitation.

Key words: Thiessen Polygon method; Global Polynomial (1st order) method; Inverse Distance Weighting method; Thin Plate Spline Function method; ordinary Kriging method; cross-validation; Morans I index; Wuding River Basin

降水量是研究流域水文、水資源必要的基础数据,是水文模型中最重要的输入因子。准确的降水时空分布信息对提高径流模拟和洪峰预测的精度等至关重要[1-4]。随着分布式流域水文模型的发展,有限观测站点的资料密度远不能满足模型对高精度降水空间分布信息的需求[5],采用合适的空间插值方法对离散的站点数据进行空间插值以获取区域降水的精确空间分布信息是解决此问题的有效途径[6]。空间插值方法多种多样且各有优劣,在实际应用中,并不存在一种普适性的插值方法。不同插值方法对不同研究区域的不同降水数据所得的插值效果不同,彭晓芬等[7]对云南省年均降雨量进行插值,得出反距离加权法插值精度高于普通克里格法插值精度;秦伟良等[8]采用反距离加权法和普通克里格插值法对江苏省扬州市1999—2008年各年1月的月降水量插值,发现普通克里格插值法效果更好;任志勇[9]对辽宁省某市日降水量进行插值,得出距离反比加权法的插值精度比克里格插值法和样条函数法的插值精度高。

现有文献对黄土高原各流域降水量插值方法适用性的研究较少。万龙等[10]用克里格法和薄板样条函数法对黄土高原河龙区间的降水量进行了插值研究,但有关黄土高原范围内插值方法多时间尺度的综合比较研究较少。笔者选用泰森多边形法、一阶全局多项式插值法、反距离加权法、薄板样条函数法和普通克里格法5种插值方法对黄土高原无定河流域多年平均、年、月和场次降水量进行插值比较,以期为无定河流域分布式水文模型的构建提供参考。

1 研究区概况与数据预处理

1.1 研究区概况

本文以黄土高原半干旱区无定河流域为研究对象。无定河流域是黄河中游一级支流,干流全长491 km,流域面积为30 261 km2,地理坐标位于东经108°18′—111°45′、北纬37°14′—39°35′,位于陕西省北部与内蒙古自治区交界处。整个流域高程为583~1 834 m,地势起伏大,从西北向东南倾斜。

无定河流域位于东部季风气候区和西北干旱气候区的过渡带,属干旱半干旱地区,气候属温带大陆性季风气候。年平均气温为7.9~11.2 ℃,年水面蒸发量为1 700~2 000 mm。该流域降水量具有量少、集中、强度大的特点,年平均降水量为300~550 mm,由东南向西北递减,呈东多西少的特点;年际变化大,年内分布不均,春季干旱,夏、秋季节降水较多,且65%的降水量集中在7—9月,冬季降水稀少[11-12]。

1.2 数据预处理

选取流域内81个雨量站1980—2000年逐日降水量数据。在81个雨量站中,有69个雨量站数据在1980—2000年是连续的,有12个雨量站存在部分天数缺测现象,本文采用近雨量站的同日降雨量进行插补,以保证插值基础数据的连续性。DEM数据(90 m×90 m分辨率)来源于中国科学院计算机网络信息中心地理空间数据云平台(http://www.gscloud.cn/)。

流域范围内海拔583~800 m的低海拔区域集中在流域东南部的河流出口附近,1 600~1 834 m的高海拔区域主要为高山地区。受地形限制,这两部分区域没有布设气象站点,故而在研究区800~1 600 m海拔范围内,将各站点以海拔每升高100 m划分一级高程带,共分为8级。在保证空间分布均匀的条件下,每带各取1个代表性较好的站点作验证站。每次取1个验证站,其余站点作为插值站对该站点进行插值,插值站和验证站分布如图1所示,选取8个雨量站的实测数据进行插值效果验证(见图1)。

降雨场次的划分与相邻场次降雨的最小间歇时间的选择有关,以IETD(Inter-Event Time Definition)表示,降雨间歇时间小于IETD的,视为同一场雨。IETD的选择,需考虑研究范围的大小和自然降雨间歇的实际情况,可以为1 d、2 d或3 d等。一般来说,研究范围较大时,则IETD可选择较大的值[13]。本研究选取的IETD为3 d。

2 空间插值方法与验证方法介绍

2.1 空间插值方法

根据测量值与预测值是否一致,空间插值方法可分为精确性插值和非精确性插值,精确性插值有IDW法、TPS法,非精确性插值有Linear法、Kriging法。根据插值原理不同可分为统计插值(如Kriging法)、函数插值(如Linear法、IDW法和TPS法)以及几何法插值(如Thiessen法)等[14]。

本研究采用泰森多边形法(Thiessen)、一階全局多项式法(Linear)、反距离加权法(IDW)、薄板样条函数法(TPS)以及普通克里格法(Kriging)对无定河流域的实测降水数据进行空间插值,并选用交叉验证法对插值结果进行验证。

2.1.1 泰森多边形法

泰森多边形法(Thiessen)又叫最近邻点法,是由荷兰气候学家A·H·Thiessen提出的一种根据离散分布的气象站的降水量来计算平均降水量的方法,即将所有相邻气象站连成三角形,作这些三角形各边的垂直平分线,将每个气象站周围的若干垂直平分线围成一个多边形,用这个多边形内所包含的唯一一个气象站的降雨量来表示这个多边形区域内的降雨量,适用于分布均匀、空间变异性不明显的样本点[15]。

2.1.2 一阶全局多项式法

一阶全局多项式法又称为线性插值方法(Linear),在一个三维坐标系中,X、Y坐标表示样本点的经度和纬度,Z坐标表示样本点的降雨量。根据待模拟站点的空间位置和线性函数模拟其降雨量,几乎不需要前提假设[16]。

2.1.3 反距离加权法

反距离加权法(IDW)是基于相近相似的原理,以待模拟点与样本点间的距离幂次方的倒数为权重进行加权平均,离待模拟点越近的样本点被赋予的权重越大。此方法适用于样本点分布均匀且密集的情况[8]。

2.1.4 薄板样条函数法

薄板样条函数法(TPS)采用以经度和纬度为双变量的二次样条函数进行插值,公式如下:

采样数据局部变异性较大时,该方法难以保证数据的准确性[10]。

2.1.5 普通克里格法

普通克里格法(Kriging)假设数据变化呈正态分布,通过对数据的空间分析获取权重值,插值的整个过程相当于对未知区域化变量Z的期望值进行加权滑动求取平均值的过程。此方法适用于空间相关性较好的采样点[10,17]。

2.2 验证方法

交叉验证法,首先假定每一待模拟点的要素值未知,采用周围样点的值来估算,然后计算与实际观测值相比内插值的误差,以此来评判估值方法的优劣。本文将5种插值方法得到的插值结果与样本点数据比较,分析在研究区内各种插值方法的优劣[18]。

采用平均绝对误差MAE、平均相对误差MRE、均方根误差RMSE和一致性指标A(见表1)等4项指标评价插值结果的精度[19]。

2.3 数据空间自相关分析方法

采用全局型Morans I指数反映研究区降水量数据的空间自相关程度。

3 插值结果验证与分析

采用上述5种插值方法对无定河流域多年平均年降水量、年降水量、月降水量和场次降雨量进行了空间插值,并运用交叉验证法进行了检验,选用MAE、MRE、RMSE和A作为指标对插值结果进行验证分析。

3.1 研究区多年平均年降水量插值结果验证与分析

无定河流域属于温带大陆性季风气候区,受西北高、东南低地势特征影响,湿润气团难以到达。多年平均年降水量(1980—2000年)呈由东南向西北逐渐减少的空间分布趋势,如图2所示。多年平均年降水量的插值数据中极值比为1.74、均值为352.50 mm,Morans I指数值为0.166、Z(I)为5.514,具有明显的空间正相关性。5种方法插值成果空间分布趋势大致相同,Linear法非精确性插值,以线性函数进行降水量模拟,插值图呈明显的条带状;Thiessen法与IDW法所得流域内多年平均年降水量局部突变区域较多且IDW方法的插值图“牛眼”现象显著;TPS法和Kriging法的插值成果图趋势性较明显,带区分明且TPS法对极值降水量插值更细致。

由图3可知Thiessen法、Linear法和IDW法插值效果相差不大,TPS法和Kriging法插值效果相近,且Kriging法的模擬值灵敏度和极值情况比TPS法好。当插值原理较为简单时,非精确性插值的Linear法准确度差,Thiessen法极值情况和灵敏度较差,IDW法插值效果适中。

进一步对验证站点的误差值进行比较,图4表明Thiessen法、Linear法和IDW法对多年平均年降水量所得模拟值的误差大小接近,数据点在45°线附近波动,但幅度较大。而TPS方法和Kriging方法对多年平均年降水量所得模拟值的误差存在强相关性,数据点在45°线附近波动且幅度较小,验证站点中TPS法误差与Kriging法的误差大致相同,误差在-50~80 mm之间。如图2(a)和图4所示,验证站中站点2的实测降水量是局部极小值,5种插值方法对其模拟所得值误差均较大。综上可见,5种空间插值方法对多年平均年降水量插值效果依次为:Kriging法> TPS法> IDW法> Linear法≈Thiessen法。

3.2 研究区年降水量插值结果验证与分析

考虑雨量站数据的连续性,如图5所示,从1980—2000年中选取雨量站数据连续性效果较好的丰水年(1985年,473.38 mm)、平水年(1987年,344.80 mm)和少水年(1999年,247.88 mm),运用5种插值方法进行插值,并对插值结果进行比较分析。

3组年降水量数据Morans I指数值均大于0,且Z(I)值均大于1.96,表明降水量具有较显著的空间自相关性,见表2。

如图6所示,Thiessen法、IDW法和TPS法的插值成果图中局部极值信息描绘较细致,Thiessen法和IDW法模拟降水量范围与采样点最值范围相同,TPS法模拟雨量范围大于采样点最值范围。Linear法插值模拟降水量的数值区间较小,1985年模拟最大年降水量为557 mm,缺600 mm以上的降水量带;1987年的最大模拟年降水量为434 mm,缺440~480 mm的降水量带;少水年1999年模拟值在211~275 mm之间,缺320 mm以上降水量带。Kriging法对空间自相关性较好的1985年和1987年的年降水量的空间信息刻画较好,趋势分布明显且局部极值表现详细,但对空间自相关较差的1999年年降水量插值效果较差,插值成果图反映的空间信息模糊,趋势性不明显。

图7表明,1985年年降水量插值效果依次为Kriging法>Linear法> IDW法> TPS法>Thiessen法;1987年年降水量插值效果依次为Linear法>Kriging法≈IDW法> TPS法≈Thiessen法;1999年5种插值效果均较差,Kriging法> IDW法> TPS法>Linear法>Thiessen法。

3组年降水量数据中,Thiessen法插值误差大,效果差,插值准确度最低;Linear法插值效果不稳定,对空间自相关性较好的1985年和1987年的年降水量插值效果较好,对1999年的年降水量插值误差大;IDW法插值效果适中且稳定;3组采样数据极值比均大于2,极值均相差200 mm以上,局部变异性大,TPS法插值难以保证数据的准确性,TPS法整体插值效果较差;插值数据均具有显著的相关性,Kriging法插值效果较好。

3.3 研究区月降水量插值结果验证与分析

无定河流域降水量年内分布不均,冬、春季干旱,降水稀少;夏、秋季降水较多,65%的降水量集中在7—9月[11]。在流域月尺度降水量插值研究中,以1985年、1987年和1999年3个典型年的7月份降水量作为插值对象。3组月尺度降水量数据的Morans I指数值均大于0,且Z(I)值均大于1.96,表明这3组数据均存在显著的空间自相关性,见表3。

如图8所示,相对前两种时间尺度数据而言,月降水量数据插值成果图空间分布趋势性较弱。1985年7月,Thiessen法、IDW法、TPS法和Kriging法4种插值方法所得的插值图中雨量带的空间分布大致相同,流域西南部、中部、西北部以及东北局部降水量较大;1987年7月,雨量带分布存在一定的差异,TPS法和Thiessen法所得插值图中,流域东部存在暴雨中心且分布较广,而其余3种方法所得的插值图中流域东部小范围甚至没有出现类似情况;1999年7月降水量分布较为散乱,除Linear法外,其他4种插值方法的插值成果图均存在许多小范围强降雨区域。

图9表明,1985年7月月降水量插值效果依次为IDW法≈Linear法>Kriging法>TPS法>Thiessen法;1987年7月月降水量插值效果依次为Thiessen法>TPS法>Kriging>IDW法>Linear法;1999年7月月降雨量的5种插值效果均较差,Thiessen法总体插值效果好,TPS法MRE和RMSE值最大、A值却最高,TPS法插值准确度低,但消除异常值的敏感度高,Linear法和Kriging法插值效果较差。

月降水量的插值中,Thiessen法插值效果较差,但对极值比较大的1987年7月月降水量插值效果较好;Linear法插值效果不稳定,对1985年7月月降水量插值效果较好,对1987年7月月降水量插值MRE值高达0.897,插值准确度低,对极值比较大的数据插值时极大值偏小且极小值偏大;IDW法插值效果适中且稳定,3组采样数据极值差距较大;TPS法插值难以保证准确性,插值效果不稳定,但对1987年7月月降水量插值效果最好,消除异常值的灵敏度较高;Kriging法插值效果不稳定,3组数据中A值均相对偏低,消除异常值的灵敏度较差。

3.4 研究区场次降雨量的插值结果验证与分析

以81个雨量站1985年7月和8月(共62 d)逐日降雨量數据作为基础数据,绘制逐日降雨量过程线,如图10所示。设日降雨量小于0.5 mm为无雨。选取2场降雨(第7天—第16天,第27天—第36天)进行插值分析比较。

1985年7—8月的2场降雨暴雨中心位置不同,第1场的暴雨中心位于流域西南部,5种插值方法的成果图趋势性大致相同,如图11所示。其中IDW法局部极值较多,呈点状分布,TPS法和Kriging法成果图大致相同。第2场的暴雨中心位于东北部,中部降雨量较少,5种插值方法成果图中最大雨量带的范围各有不同。

两场降雨数据插值中,MRE值均较大,在0.297~0.542之间。Thiessen法插值误差较大,效果不好;Linear法插值效果不稳定,对局部极值情况较少的第2场是最优的插值方法;IDW法插值效果不稳定,第2场中A值仅为0.413,消除异常值敏感度最差;TPS法插值效果不稳定,对极值比较大的第2场降雨量插值误差较大,MRE值达0.542;Kriging法插值效果最稳定,各项验证指标值适中,如图12所示。

4 结 论

采用Thiessen法、Linear法、IDW法、TPS法和Kriging法等5种插值方法对无定河流域81个雨量站的多年平均、年、月和场次的降水量数据进行插值分析,并采用交叉验证法对插值结果进行了验证分析,在同一研究区内,各插值方法对不同时间尺度降水数据的适用性不同。

(1)多年平均年降水量空间自相关性显著,插值成果空间变化趋势明显,空间上呈由东南向西北逐渐减少的分布趋势。插值效果与插值方法原理的复杂程度有关。Kriging法插值效果比TPS法、IDW法、Linear法和Thiessen法都要好。其中TPS法与Kriging法验证指标值接近,但Kriging法插值准确度更高。对多年平均年降水量插值时,应优选Kriging法。

(2)年降水量插值中Thiessen法插值误差较大,准确度较差;Linear法受插值数据的空间变异性影响较大,对空间变异性较大的年降水量数据插值效果差;IDW法各项验证指标值适中;TPS法对空间变异性较大数据的插值存在一定的优势;Kriging法插值误差较小,插值效果较好且稳定。对年降水量插值时,应优选Kriging法。

(3)月降水量插值中,Thiessen法插值效果较差,但对空间变异性较大的月降水量插值效果较好;Linear法插值效果不稳定,对空间变异性较大的数据插值时,模拟极值准确度较低,极大值偏小、极小值偏大;IDW法插值效果适中且稳定;TPS法插值效果不稳定,但消除异常值的灵敏度较高,模拟值值域范围大于样本值值域范围;Kriging法插值效果不稳定,3组数据中A值均相对偏小,消除异常值的灵敏度较差。对月降雨量插值时,应优选IDW法。

(4)场次降雨量插值中,Thiessen法插值误差较大,效果不好;Linear法、IDW法和TPS法插值效果不稳定,插值效果不理想。Linear法对局部极值情况较少、空间变异性小的数据插值效果较好;TPS法对极值比较大的场次降雨量插值误差较大,模拟值值域范围大于样本值值域范围,模拟的准确度低;Kriging法插值效果最为稳定,各项验证指标值适中。对场次降雨量插值时,应优选Kriging法。

参考文献:

[1] YU Z B, GU H H, WANG J, et al. Effect of Projected Climate Change on the Hydrological Regime of the Yangtze River Basin, China[J].Stochastic Environmental Research and Risk Assessment,2018,32(1):1-16.

[2] 鲁帆,宋昕熠,朱奎,等.大渡河流域超阈值降雨样本模拟及不确定性分析[J].人民长江,2016,47(7):23-27.

[3] 吴迪,郭家力,向晓莉,等.降水径流特征变化对月水量平衡模型模拟精度及参数的影响[J].长江科学院院报,2020,37(7):41-46,52.

[4] 戴培培,靖常峰,杜明义.基于雨量计的城区降雨插值不确定性分析[J].人民黄河,2015,37(4):38-42.

[5] XU S, YU Z, JI X, et al. Comparing Three Models to Estimate Transpiration of Desert Shrubs[J].Journal of Hydrology,2017,550:603-615.

[6] ZHANG X, SRINIVASAN R. GIS-Based Spatial Precipitation Estimation Using Next Generation Radar and Raingauge Data[J].Environmental Modelling & Software,2010,25(12):1781-1788.

[7] 彭晓芬,黄甫则,周汝良.云南省年均降雨量空间插值模拟方法比较[J].西南林学院学报,2010,30(5): 25-28.

[8] 秦伟良,刘悦.空间插值法在降水分布中的应用[J].南京信息工程大学学报(自然科学版),2010,2(2):162-165.

[9] 任志勇.辽宁省某市降雨量的空间插值算法比较研究[J].北京测绘,2017,31(5):164-166.

[10] 万龙,马芹,张建军,等.黄土高原降雨量空间插值精度比较:KRIGING与TPS法[J].中国水土保持科学,2011,9(3):79-87.

[11] 刁文博.变化环境对无定河流域水沙的影响[D].杨凌:西北農林科技大学,2013:7-9.

[12] 杨媛媛,李占斌,任宗萍,等.人类活动对无定河流域不同地貌区水沙变化的影响[J].泥沙研究,2017,42(5):50-56.

[13] 唐莉华,吕贤弼,张思聪.雨水利用宏观规划模型[J].水利学报,2010,41(10):1179-1185.

[14] 张海平,周星星,代文.空间插值方法的适用性分析初探[J].地理与地理信息科学,2017,33(6):14-18,105.

[15] THIESSEN A H. Precipitation Averages for Large Areas[J].Monthly Weather Review,1911,39(7):1082.

[16] 袁艳艳.汉江流域降水量的空间插值研究[D].武汉:华中科技大学,2013:11-13.

[17] GIRALDO R, DELICADO P, MATEU J. Ordinary Kriging for Function-Valued Spatial Data[J].Environmental and Ecological Statistics,2011,18:411-426.

[18] 虎雄岗,谈树成,金艳珠,等.基于地形高程的云南省降雨量空间插值方法研究[J].热带地理,2012,32(4):370-377.

[19] 程朋,张珺,张茹,等.山西高原降水量空间插值分析[J].人民黄河,2016,38(2):24-27.

[20] 代侦勇,姜婧,肖明科.基于时空Morans I指数的全国降雨量自相关分析[J].华中师范大学学报(自然科学版),2014,48(6):923-929.

【责任编辑 张 帅】

猜你喜欢

插值降雨量极值
通过函数构造解决极值点偏移问题
例谈解答极值点偏移问题的方法
极值点偏移问题的解法
福州市PM2.5浓度分布的空间插值方法比较
关于Lagrange插值公式教学的体会
不同空间特征下插值精度及变化规律研究
也谈谈极值点偏移问题
豫南山区野生北虫草发生出草规律及采集利用调查初报
基于混合并行的Kriging插值算法研究