应用地理加权回归模型的辽宁省降雨量空间分布研究
2020-06-04石硕
石 硕
(阜蒙县水利事务服务中心,辽宁 阜新 123100)
降雨是描述地球表面能量流动的指标因子之一,在气候变化、陆面过程建模等众多领域中有广泛应用。基于站点观测资料插值是精确获取面域降雨分布的有效方法,然而常规插值对站点分布密度、数量、站点资料时间分辨率等有较强依赖性,从而导致在地形复杂、气候恶劣、站点分布稀疏地带难以取得较好的模拟效果[1]。因此有学者提出基于地形、经纬度、植被指数等辅助变量的回归克里格法(Regression Kriging),通过建立降雨量与环境变量之间的全局关系实现广域细致模拟。然而该方法假定降雨量在不同空间上对环境变量具有同质依赖性,从而忽略了局部相关性[2]。地理加权回归克里格(Geographically Weightedm3Regression Kriging,GWRK)是基于空间自相关原理的局部空间插值方法。其根据空间邻域尺度上变量自相关性大小设计局部插值加权,来探测空间关系的非平稳性,符合降雨变量空间异质性特点;并在地理学、水科学、土壤学、社会科学领域取得成功应用[3]。本研究以辽宁省为案例,试述GWRK方法在研究区降雨量空间分布的应用流程与适用性,从而为区域降雨资料空间可视化提供技术参考。
1 研究区概况
辽宁省地处欧亚大陆东岸中纬度带,东临黄海、朝鲜半岛,西接内蒙、河北,北望吉林,南滨渤海,地理位置(118°E~125°E;38°N~43°N),区域面积14.8万km2,人口4500万(2015年)。地势为辽西山地、中部辽河平原和辽东山地丘陵,海拔介于0~1763 m(图1)。区域发育有辽河、鸭绿江、浑河等较大河流,地表径流丰富,具有河道平缓、含沙量高、年内分配不均、泄洪差的水文特点。该省属于温带大陆性季风气候区,季候分明、雨热同期,年平均气温在7~11 ℃之间,年均降水量在600~1100 mm,日照时数2100~2600 h,无霜期在130~200 d。地带性植被为落叶阔叶林、针阔混交林、针叶林,森林覆盖率达38.47%。区域海岸线全长627.6 km,海鲜、滩涂等海洋资源丰富。
图1 研究区地势图与气象站点分布
2 研究方法
2.1 地理加权回归克里格原理
地理加权回归Kriging(GWRK)采用局部加权回归替代全局加权回归,从而对局部加权模型(GWR)中残差进行普通Kriging插值估计。GWR是基于普通偏最小二乘法(Ordinary Partial Least,OPLS)的一种扩展模型,其将空间数据坐标位置嵌入模型中,点Pi(xi,yi)处降雨量(Rainfall, RF)与环境变量之间的回归关系系数并非基于全局考虑,而是基于临近范围估计的;因此获取的回归系数是空间的函数。第i个点处降雨量Ri在GWR模型中表达为:
(1)
式中:i=1,2,…,n为样本数,β0(xi,yi)为空间xi,yi处的回归偏置;βik为第i个样点上第k个回归系数;Pik为第i个样点临域k的降水量值;εi为i点随机误差,εi~N(0,σ2)。基于普通偏最小二乘回归原理,第i个点P的回归系数计算如下:
(2)
式中:Wij为预测点i与其邻近观测点j之间距离权重函数[4]。
2.2 模型评价
本研究主要采用决定系数R2,均方根误差RMSE和MAE表征模型精度。R2为实际值x与预测值x′相关性系数的平方,表征模型解释能力,通常认为其越接近于1,表明该模型越稳定、可靠。RMSE、MAE为预测误差的度量,其值越小,表明拟合度越高。计算公式如下:
(3)
式中:R为实际值x与预测值x′相关性系数;RMSE为方差;MAE为平均值。
2.3 数据来源与处理
区域降雨站点资料来自中国气象数据中心(https://data.cma.cn/)58个站点(图1)逐年统计资料。数据年限为1980—2010年,以各站点31年的平均降雨量作为基础进行空间建模分析。DEM数据来源于USGS(United States Geologocal Surrey),数据序列为GDEMDEM,其空间分辨率为90 m。运用Spss19.0对各站点年均降雨量进行描述统计分析,ArcGIS10.5进行空间建模分析与降雨量分布制图。
3 结果与分析
3.1 降雨量空间描述统计特征
表1为辽宁省58个气象站点年均降雨量与环境变量统计特征。各站年均降雨量介于423.57~1098.21 mm,平均值为658.08 mm,空间变异性系数为21.94%,呈中等程度变异。正态分布分析表明,降雨量样本序列K-S检验值为PK-S为0.234,服从正态分布特征,因此符合GWRK插值分析的数据要求。另外可以发现,区域DEM具有强烈空间变异性(114.02%),坡度Slo呈中等程度变异(61.52%),坡向Asp、经度Lon、纬度Lai的变异系数依次为0.05%、1.23%、2.31%,呈现弱变异。
表1 降雨量与环境变量描述统计特征
3.2 降雨量地统计分析
地统计分析是进行GWRK插值分析的基础。通过ArcGIS平台的Geostatcial Analysis工具探究其空间结构,得到结果如图2所示。图中随着自相关距离增加,半方差值呈高斯函数变化,并且具有较高的拟合精度,R2=0.705,残差RSS为0.231。其中半方差函数初始值(Nugget)为0.135,稳定值(Sill)为0.685,因而可得其块基比(Nugget/Sill)为19.70%。结果表明其块金结构小于25%,属于强烈空间自相关性,并且其空间自相关距离较大,达400 km,因而可利用临近点值对全域降雨进行预测。
图2 研究区58个测站年均降雨量半方差结构图
3.3 降雨量地理加权空间分布分析
基于DEM、经度、纬度、坡度、坡向等变量,拟合得到降雨量RF的OLS回归模型:
RF=0.117DEM-0.127Asp+0.991Slo+88.467Lon-58.582Lai
(R2=0.654,P<0.05)
(4)
该全局模型解释能力达0.654,具有一定稳定性。在此基础上计算各变量的局部系数,如图3所示。
在ArcGIS环境中,运用地图代数工具将图3所示的变量局部权重与变量进行加权运算,从而得到区域降雨量空间分布图(图4)。该位图空间分辨率位90 m,共计像元数量为个9680×7295个,全局统计显示其最大值为386.7 mm,最高值为1098.2 mm,标准差为163.7 mm,变异系数为24.33%,与58个站点实测值吻合。区域降雨低值中心位于西部的朝阳市,局部低于450.0 mm以下,高值中心位于东部丹东市,局部可达1000.0 mm。全局来看,辽宁省年均降雨具有明显空间差异性,呈现自东向西减少分布格局。这主要与海陆位置以及地形有关。文献[5]研究表明影响东北地区降雨的气流主要是西北太平洋的日本海气流,东部地区位于长白山迎风坡带,海洋水汽到达后易于聚集、上升,进而成云致雨。辽河平原或辽西山地距离海洋位置远,并且东部有地势阻挡后,因而暖湿气流难以到达或损失较大,因而降雨量较少。
图3 地理加权回归系数空间分布图
图4 研究区降雨量空间分布图
3.4 模型精度分析
基于式(1)~式(3),评价了回归Kriging方法对降雨量插值的精度。如图5所示,58个样本点的实际值与预测值具有高度一致性,R2达到0.788,RMSE为265.36 mm,MAE为15.62 mm。表明该预测方法具有较高的解释能力与较低的绝对误差,因而具有一定适用性。
4 结 论
降雨作为区域性自然变量不仅具有全局分布规律,还存在局部变异性。GWRK基于局部加权与Kriging插值原理,以空间距离函数计算降雨量分布的局部自相关性,能很好解决广域复杂地形区环境高度变异与观测点分布离散带来的插值误差问题,体现了降雨量与环境变量之间回归关系的空间非平稳性。该插值模型构建过程中可基于区域环境背景特征选择协变量,具有变量鲁棒性与模型可变性,因而在气象数据空间可视化研究中具有一定应用价值。
图5 各气象站点年均降雨量实际值与预测值