基于ATPRK算法江苏省降水量空间插值研究
2024-01-03盛亚琴刘清泉
盛亚琴,刘清泉
(1.泰州市河海勘测设计有限公司,江苏 泰州 225300 ;2.靖江市水利局夏仕港闸管理所,江苏 泰州 225300)
1 研究区与分析方法
1.1 江苏省概况
江苏省位于黄海南段、江淮平原东部,地理位置为116°18′~121°57′E、 30°45′~35°20′N,总面积10.72万km2。该地通南达北、跨列长江、淮河水系,属丘陵、平原、滨海地形,地势自西南向东倾斜,海岸线长954 km。境内由南至北依次为北亚热带季风性气候、温带季风性气候,具有季节分明、雨热同季的特点,多年平均气温13~16 ℃,降水量618~1359 mm,有效积温3750~4500 ℃,无霜期194~248 d。江苏省是我国重要经济板块,区域人口密集、经济活跃,但面临着旱涝灾害频发、水资源供需严峻的环境背景。
1.2 降水资料来源
本研究使用的地面降水观测资料是从中国气象科学数据信息中心(http://www.nmic.cn/)获取,其数据版本号为 3.0,经过0.1 m的质量控制。其包含66个标准气象站均匀分布于江苏省各地(图1),各站点降水资料时间尺度为2000—2020年,属日值降水数据。利用Excel 2016软件将多年日降水资料汇总为各站点年平均降水数据,以作为降水量空间插值的数据基础[1-2]。
图1 江苏省气象站点空间分布
1.3 降水量空间插值算法
1.3.1 ATPRK算法
为解决统计插值中残差空间自相关问题,Wang等[3]提出了基于空间环境过程的ATPRK算法,其特点在于不仅考虑了空间距离的影响,还加入辅助环境变量以确保要素空间连续性。
1.3.2 Anusplin插值法
Anusplin插值法是气候气象研究领域中经典空间预测技术之一,其基于薄板平滑样条函数与多维协变量理论发展而来。其优势在于局部使用函数逼近拟合,可扩展多维协变量。Anusplin插值法对空间未知位置i处的降水量插值zi如式(1):
zi=f(xi)+bTyi+ei,(i=1,2…,N)
(1)
式中:f(xi)为薄板样条光滑函数对实际观测点值xi的预测;xi为实际观测值;bTyi为i位置处T维独立变量;yi、ei为误差项。
本研究利用语言中的gtsts程序包实现降水量的Aunsplin空间插值。
1.4 降水量插值精度验证
将62个气象站点多年平均降水量数据按照7∶3的比例随机划分成训练集、验证集。其中,训练集用以空间插值,进而生成江苏省降水量空间分布图,验证集(19个)则进行独立验证。利用ArcGIS软件中“Extract multi-values to points”工具提取19个站点对应位置处的降水量插值结果。为评价ATPRK插值法的性能,以Anusplin算法为对照,通过计算验证集里站点实际降水量与插值降水量之间的决定系数(R2)、平均绝对误差(MAE)、均方根误差(RMSE)作为精度评价参数,如式(2)~式(4):
(2)
(3)
(4)
2 结果与分析
2.1 气象站点数据统计特征
研究区62个标准气象站点在2001—2020年间的平均降水量空间统计特征如表1。研究区年内降水量介于655.4~1395.4 mm之间,平均值达1008.2 mm,依据我国气候区划整体属湿润区。62个站点年降水量的变异系数达0.17,说明空间上表现出一定程度不均衡,经单样本K-S检验,其渐进显著性双尾sig值为0.07>0.05,表明其符合正态分布,可用于后续空间插值分析。
表1 气象站点(降水量)数据描述统计 mm
2.2 降水量空间插值精度分析
图2为基于ATPRK和Anusplin算法的降水量插值精度对比。可见,ATPRK方法插值精度R2为0.71,MAE和RMSE分别为34.69、304.52 mm;而Anusplin模型的相应精度参数为0.67、39.78和326.49 mm。由图2可知,ATPRK模型得到的散点图具有良好一致性,其离散度更低,相比于Anusplin模型的R2增加了6.16%,而MAE和RMSE分别降低了12.75%、6.73%。上述分析表明,ATPRK算法比经典Anusplin模型具有更高插值精度,在降水量空间可视化方面具有良好适用性。
图2 降水量插值结果与实际值之间散点图
利用19个站点插值残差与实际降水量进行拟合(图3),发现二者不存在显著线性关系(P>0.05),表明ATPRK和Anusplin模型较好拟合了区域降水量分布规律,因此,不存在残差相关性。
图3 残差与实际降水量散点图
2.3 降水量插值空间分布特征
基于对站点数据多年平均降水资料进行插值分析,得到研究区降水量栅格面,其结果见图4。可知ATPRK插值方法客观反映了降水量空间异质性见图4(a),总体呈现自南向北减少的地带性特征,表明海陆位置、季风路径等对江苏省降水量分布有重要影响。降水量高值区位于苏南的南京市、苏州市、常州市一带,达到1200 mm以上,而苏中地区次之,介于1000~1200 mm之间。降水低值区聚集于徐州市西北一带,年降水量低于800 mm,易于发生干旱现象。降水量空间分配不均衡对农业生产布局、水旱灾害管理有一定指示作用。
图4 江苏省降水量空间插值效果
由于ATPRK和Anusplin插值法的原理过程不同,导致其生成降水量分布图存在一定细节差异(图5)。利用ArcGIS栅格统计工具得到经ATPRK插值生成的降水量栅格范围为618~1355 mm,其空间栅格均值为1042 mm;而Anusplin插值结果显示其值域为635~1329 mm,平均值为1025 mm,显然ATPRK得到的降水量范围更大。此外,ATPRK方法能更清晰区分出临江北部地区降水量分布范围(950~1100 mm),而Anusplin对该处降水量插值存在一定模糊化,这是由于ATPRK插值曲面最小化了局部偏差,因此,插值结果具有良好平滑与渐变,这更符合区域降水量自然分布。
图5 江苏省降水量空间插值的误差分布
2.4 降水量空间插值误差分析
受插值原理、站点分布、地表环境等因素影响,各插值法得到的降水量分布图与实际值之间存在一定残差,在此基础上运用插值法生成误差分布。依图5可见,ATPRK和Anusplin插值法的误差分布具有一致性,残差均呈现自西向东由负转正,具体地在徐州、宿迁、泰州西部一带以低估为主,残差介于-567~0 mm之间,在东部和南部以高估为主,误差范围介于0~253 mm之间。栅格统计显示,ATPRK方法生成栅格误差平均值为23.5 mm,Anusplin则为27.2 mm(图5),可见前者生成的残差明显偏小,进一步证实了ATPRK方法的优越性。图5还反映了插值误差与多种因素有关,其中海陆位置和经度地带性是影响误差分布的主要因子。在后续研究中,可适当引入更多环境协变量如地形、季风路径、下垫面环境等,进而改善区域降水量插值精度。
3 结 论
以典型平原江苏省为案例区,测试新型ATPRK插值法的应用性,并以经典Anusplin方法为对照,获取区域降水量空间分布表面栅格。结果表明,ATPRK算法生成的区域降水量分布介于618~1355 mm之间,与地面站点观测值(655.4~1395.4 mm)吻合。ATPRK的插值精度R2为0.71,MAR和RMSE依次为34.69、304.52 mm,比Anusplin模型的R2提升了6.16%,而MAE和RMSE分别降低了12.75%、6.73%。且插值结果的残差不存在相关性,残差呈现经度地带性分布。综上表明,使用ATPRK算法可适当提高江苏省降水量空间插值精度。尽管ATPRK算法降水插值效果更理想,但其基于线性关系假设而忽视了降水量受多维环境要素非线性驱动的事实。随着遥感和大数据技术发展,可将影响降水量分布的空间要素与机器学习模型耦合,深入研究可改善气候要素空间插值的潜在方案。