应用回归克里格方法的河北省降水量空间插值研究
2023-12-19苏万磊
苏万磊
(河北省秦皇岛水文勘测研究中心,河北 秦皇岛 066000)
降水是促进陆地生态系统中物质能量循环的重要驱动因素,对作物生产、水资源安全、人居健康具有重要意义。准确的空间降水资料是水文预报、水质管理、气候变暖控制计划的基础。经典的降水空间插值方法如普通克里格、反距离加权和Anusplin 等已得到广泛应用,但这种单一模型不能较好拟合全局或局部变量与降水量空间变异性之间的关系,联合普通克里格与回归分析的回归克里格方法,有效解决了残差自相关与空间非平稳性问题,并在折叠地形区取得较好插值精度。河北省涵盖了滨海、荒漠、丛林、草原、山地、平原等复杂地貌地形,这导致从区域稀疏气象站中获得连续性降水分布信息存在一定挑战[1-3]。本文以河北省为案例,探究回归克里格方法在降水资料空间插值中的应用。
1 研究区与研究方法
1.1 研究区概况
河北位于太行山东麓、燕山南侧、南临华北平原腹地,区域面积21.8 万km2。该区位于我国第一、第二级阶梯过渡带,海拔变化明显,介于-5 m~2833 m 之间;其地貌分异复杂,形成前海低地、冲积平原、黄土丘陵山地及草原沙漠等复杂地形(图1)。域内属温带季风性气候,夏季高温且暴雨集中,冬季寒冷而干燥,春秋短促温凉,多年平均气温5℃~11℃,年降水量为318 mm~685 mm,其中60%~75%集中于6月~9月。该省地貌分异较大,适宜不同温带作为生长,但长期以来降水量受气候循环模式、下垫面、地形等因素影响,而空间分异较大。
图1 研究区气象站点分布
1.2 数据来源与处理
为反映区域降水量现势性特征,本研究从中国气象数据共享网络(http:// cdc.cma.gov.cn/)获取了河北省2001 年~2020 年158 个气象站点逐日观测数据,采用累加法将其生成年降雨数据,然后将20 年平均降水量数据作为当前站点降水量真值。研究区站点分布较均衡,可全面揭示研究区降水量空间差异。所使用的地形数据(Digital Elevation Model,DEM)(图1))Google earth engine 下载,其由美国航空总署利用雷达影像生成的SRTM 数据,空间分辨率达 90m。利用ArcGIS10.8 软件,先对研究区DEM 数据进行填洼处理,再经cubic 方法重采样至1km,进而区域降水量空间插值目标一致。同时利用处理好的DEM 数据经raster to point 转换后,生成各栅格点中心经纬度坐标信息。本文基于回归克里格方法区域降水量空间插值则通过ArcGIS 10.8 平台的Geostastical Analyst 模块完成。
1.3 回归克里格方法
除气候系统模式等因素外,降水量细节分布规律还与海陆位置、地形等密切相关。鉴于此,选用海拔(alt)、经度(lon)和纬度(lai)这3 个协变量作为降水量空间插值的辅助因素[2-3]。回归克里格是一种联合克里格(Kriging)插值与回归分析(Regression)的空间推理法;其中克里格方法基于统计学理论,纳入空间位置对变量空间自相关性的影响;而回归分析较好考虑了环境变量的局部效应。因此,应用回归克里格模型进行降水量插值的具体步骤如下:①基于站点尺度构建降水量与协变量之间回归关系模型,并分离趋势特征;②利用回归残差进行克里格插值;③将前两者结果加和,进而得到降水量插值最终结果。基于多元回归模型拟合降水量关系:
式中:Y、β0分别为站点实际降水量与常数项;β1、β2、β3分别为变量x1、x2、x3的估计系数。
其最终预测值表示为:
式中:y(Pi)为空间位置Pi处的降水量值;βj,(Pi)为其回归模型系数;xj,(Pi)为位置Pi处的第j 个自变量;ε(Pi)为回归模型残差;n 为协变量数,n=3。
2 结果与分析
2.1 河北气象站点数据统计特征
研究140 个气象站点在近20 年来的降水量观测值统计特征见表1,其最大、最小降水量分别为675.87 mm(兴隆县)、357.50 mm(康保县),相差达318.38 mm。计算得到降水量平均值为498.45 mm,介于400 mm~600 mm 降水量区域,按照中国气候区划属半湿润半干旱区;其偏差达58.03 mm,变异系数为11.69%,表明区域空间上降水量分布存在一定地带性分异。经单样本Kolmogorov~Smirnov(KS)检验表明,其P 值为0.06,未通过5%水平信度检验,为避免数据噪声,将原降水量数据进行log 对数变换,使其符合正态分布形式,以便进行后续插值分析。
表1 河北省气象站点降水量资料统计特征(n=140)单位:mm
为进一步了解该地站点数据使用回归克里格方法的可行性,使用地统计学Moran's I 方法进行空间检验。由表1 可知,其Moran's I 值达9.54,其标准化统计量为2.75>1.96,表明该地降水量呈现显著正向空间自相关性,因此可对其进行空间插值。
2.2 河北站点降水量与环境因子之间关系
基于站点尺度,克里格方法拟合了区域降水量空间分布趋势(图2)。图中x、y 轴分别指示正东、南方向,z 轴为降水量丰度,线性趋势线表明研究区降水量在经向上呈由南向北减少,在纬向上表现出自动向西减少特征。由此表明,研究区降水量分布符合经向、纬向地带性规律,将其纳入回归克里格模型可补充降水量分布结构性特征。海拔梯度影响着水汽运移过程、地表下垫面性质,进而对降水分布起作用。本研究中(图3)降水量与海拔之间呈负相关关系,其R2达0.23,且具有显著性,说明地形是解释区域降水量分布差异的有效因子。
图2 研究区降水量空间趋势特征
图3 研究区降水量与DEM 之间相关性
2.3 回归克里格模型建立与插值结果
基于2.2 部分的分析结果,以经度、纬度和坡度 3 个因子为局部变量进行回归克里格插值。其地统计函数见图4,可知随着空间距离增加,半方差值由小增大,在约7 km 距离时趋于平稳,表明降水量在该空间范围内分布具有相关性。进一步分析得到其块金值为6.28%<25%,说明其中空间上具有平稳性。区域降水量回归克里格插值的多元线性回归方程为:y=-2486.65+39.46 lon-32.44 lai+0.029 alt, 其R2=0.61,P<0.01,表明该模型具有较高解释能力,通过地理位置和地形等较好区分了降水量特征区域(高值、低值中心)。
图4 研究区降水量回归克里格插值半方差函数图
2.4 河北降水量空间分布特征
基于前述分析,生成研究区1 km 空间分辨率的降水量空间分布图。可见,研究区降水量分布差异显著,其中高值区为冀东的唐山,主要由于该地受副极地低压带影响相对强烈。河北省降水量分布次中心位于西南部太行山东侧,年降水量介于550 mm~600 mm 之间,最低区聚集于冀西北地区,仅为343.1 mm~450 mm,主要由于距海洋较远且受高峻地形影响,因此易发生干旱等灾害。该分布特征符合河北省实际。
图5 研究区降水量空间插值结果
3 结论
采用2010 年~2020 年河北范围内143 个国家级气象站点多年平均降水数据,运用回归克里格方法探究了区域降水量空间分布特征。河北境内地形差异显著,因此该文在考虑海陆位置影响基础上加入了海拔信息。分析表明,地理经度、纬度和海拔因素对河北省降水量空间分布具有全局性影响,使用该3 个协变量建立降水量插值的回归克里格模型具有较好应用性,该模型解释了区域降水量51%的变异性,因此具有较高可信度。此外,该文在实施空间插值时仅考虑了降水量与协变量之间线性关系,忽略了非线性因素,同时对协变量引用较少。因此,后期可尝试以机器学习为代表的非线性模型拟合降水量空间分布模式,并且加入地形曲率、土地利用、大气含水量、距离海洋位置等信息,进而优化降水量空间插值精度。