新疆降水量空间插值方法对比研究
2022-01-08宋敬茹仝梓晨刘明月高均海张永彬满卫东
宋敬茹, 胡 尹, 仝梓晨, 刘明月,2,3,4,高均海, 张永彬, 满卫东,2,3,4*
(1.华北理工大学矿业工程学院;2.唐山市资源与环境遥感重点实验室;3.河北省矿区生态修复产业技术研究院;4.河北省矿业开发与安全技术重点实验室;5.中煤科工生态环境科技有限公司唐山分公司:河北 唐山 063012)
降水是生态环境循环的必要环节和农业用水的主要来源[1]。水资源管理、旱涝灾预防及生态治理等都离不开降水信息[2]。空间插值法是分析地理要素空间特征的强大工具[3],主要有克里格插值法(Kriging)、反距离加权法(Inverse Distance Weight,IDW)和径向基函数法(Radial Basis Functions,RBF)等[4]。
基于不同的插值方法对区域降水量进行分析,一直是当前研究的热点[5-6]。插值方法各自具有优势,插值精度存在很大的差异,一些学者根据研究领域特点采用了不同的研究方法。何红艳等[7]根据研究区域的特点,采用混合插值法绘制降水图。孟庆香等[8]将地统计学方法和普通插值方法进行对比研究,得到地统计学方法优于普通插值方法。马友平[9]利用遥感影像数据研究岩溶区石漠化,发现采用克里格插值法对数据的“缺失”区进行修复是值得借鉴的。朱珊珊[10]用地理信息系统的统计分析功能对流域年均降水量序列进行空间插值,认为克里格法是最优的插值。Sergio和Christopher Daly等[11-12]利用地统计学分析进行插值方法对比研究,获得了高质量的气候图。
如何依据已知降水数据和研究区域的特点选择最优的插值方法一直是需要探讨的难点[13]。现有的研究表明,新疆地区就普通插值方法而言克里格插值法精度最高,能更好地反映新疆区域的降水空间分布特征[14]。进一步研究发现,运用地理加权回归克里格法(geographically weighted regression Kriging,GWRK)建立插值变量与其影响因子之间的回归模型,将克里格插值和回归分析结合并引入与插值变量具有良好相关性的影响因子作为辅助变量,能够有效提高插值方法的精度[15-16]。
该文采用克里格法(Kriging)、反距离加权法(IDW)、径向基函数法(RBF)和地理加权回归克里格法(GWRK)的对比来研究新疆的降水空间变化,为该地区的生态环境治理等工作提供最优数据支持。
1 研究区与研究方法
1.1 研究区概况
新疆在中国西北部,面积约占全国总面积的1/6(图1)。中部天山横亘把新疆分为2部分,山脉盆地交替排列被喻“三山夹两盆”[17]。新疆地处北温带,日照时间长,远离海洋,深居内陆又有高山阻隔,造成其日气温差大、降水量稀少[18]。新疆年均降水量仅有105 mm,南部降水量只有10 mm左右,差异较大。新疆特殊的地理环境使其具有独特的气候特征,常发生干旱灾害[19],因而以新疆作为研究区域,揭示新疆区域降水分布特点与规律具有重要的意义。
1.2 数据来源和站点分布
新疆地区降水数据来自国家气象数据网(http://data.cma.cn/)的66个国家基础气象站,另外收集各气象站的经纬度和高程等信息。各气象站点分散均匀,具备一定的独立性、实用性和真实性,并选取20%的气象站点作为验证点站点,气象站点分布如图1所示。同时还结合了地形因子,获取了来自地理空间数据云的16幅包含新疆区域的DEM影像数据。
1.3 插值方法
从数量有限的气象站点获得了降水数据的实测值,那么怎样根据站点的数据指标信息推算到整个研究区域,国内外已经基于这一问题开展了大量的研究,并总结了多种方法[20-21]。其中就存在应用地统计学结合GIS平台阐明数据的空间变异性,并对比差异。在实现空间插值的过程中,该文主要采用Kriging、IDW、RBF和GWRK对空间降水进行模拟,并对这4种方法进行对比分析。
1.3.1 降水数据序列的正态性检验
各气象站点的年降水量数据变异程度中等,经拟合优度检验(Jarque-Bera)气象站点的年降水量数据序列(图2)符合正态分布。
1.3.2 克里格插值法(Kriging)
克里格插值法(Kriging)是一种经典的无偏内插估计算法[22],在地理、环境与大气等科学领域都被应用[23],一般公式:
(1)
式中,Yxi为观测值;x0为待估观测点;αi为加权因子;n为观测点总数。加权因子αi由无偏估计和最小方差来确定[24],其公式:
(2)
1.3.3 反距离加权法(IDW)
IDW插值方法的原理是样本点周围数值随着其到样本点的距离而发生变化,会以距离为权重进行加权平均,也就是距离采样点越近的点被赋予权重越大[26-27]。通过对插值数据的模拟和比较,选择球形模型作为降水的空间预测模型,其表示公式为:
(3)
式中,Y为降水预测值;Yi为第i个样本的数值(i=1,…,n);Di为距采样点距离;p为Di的幂,准则为最小平均绝对误差。
1.3.4 径向基函数法(RBF)
径向基函数法(Radial Basis Functions,RBF)是指一种随距离变化且径向对称的标量函数[28]。此方法利用不同的基函数来拟合成过已知样本点的平滑表面[29-30]。其计算公式为:
(4)
式中,Y为估算点降水预测值;Yi为第i(i=1,2,3,……n)个站点实测值;di为估算点到第i站点的距离;n为参与插值的实测站点数;G为欧氏距离的单调函数。
1.3.5 地理加权回归克里格(GWRK)
GWRK是结合地理加权回归(geographically weighted regression,GWR)和克里格插值法(Kriging)的一种混合插值方法[31]。其中,GWR是一种基于距离观测点的地理加权回归系数来探索空间非平稳性的局部地理回归方法[32]。相较于普通最小乘法(ordinary least squares,OLS)的全局回归技术,GWR能客观地量化空间上的变化关系。
该文考虑到新疆区域地形特色,采用GWRK方法,选取经度、纬度和高程为建立模型的自由变量,年降水量为模型的因变量进行分析。
1) 根据气象站样本点实测降水量值和GWR模型预测值得到样本点残差值,GWR模型[16]如下:
(5)
式中,YGWR(s0)为点s0处的预测值;k为自变量的数目;Xk(s0)为点s0处第k个自变量的测量值;βi(s0)为局部估量的系数。
2) 利用Kriging法对GWR回归的残差进行插值,其插值结果与GWR结果进行空间加运算[33],GWRK法表达式[16]为:
(6)
式中,ε(s0)为插值后得到的残差结果。
模型建立前对自由变量进行分析,筛选符合建模要求的因子,发现纬度和高程的回归系数均达到了显著水平(P<0.05),但经度的P>0.05,故不再将经度作为自由变量(表1)。方差膨胀因子(Variance Inflation Factor,VIF)均远小于7.5,说明自由变量间不存在多重共线性问题,结果可靠。
表1 模型回归计算结果
由表1可知,方差膨胀因子(Variance Inflation Factor,VIF)均远小于7.5,说明自由变量间不存在多重共线性问题,结果可靠。
1.3.6 评价方法
1) 模型评价 R2是模型的拟合优度的检验量,介于0~1,越接近1模型拟合效果越佳,RSS是用于检验回归模型的常用指标,其值越小,拟合效果越佳[34]。
(7)
(8)
2) 方法评价 将获取的降水量数据进行基本的预处理并求出其年均降水量。选取20%样本点的气象站点,即12个作为验证点,对其进行准确性验证,并用于空间插值。通过计算准确性(Accuracy)、均方根误差(RMSE)和平均相对误差(MRE)等指标评价不同插值方法的预测精度,公式如下:
(9)
(10)
(11)
(12)
2 结果与分析
2.1 插值结果比较
以全新疆区域66站点的多年年均降水量为指标进行降水量空间插值分析,对比发现Kriging、IDW、RBF和GWRK得出的结果与精度有所不同。根据空间数据的特征采用交叉验证的方法分析结果,用R2、RSS、Accuracy、RMSE和MRE指标评价不同插值方法的预测精度(表2), GWRK的R2值最接近1,且其RSS值相对最小;从Accuracy看,AccuracyKriging>AccuracyGWRK>AccuracyRBF>AccuracyIDW,即Kriging准确度最高;从RMSE看,RMSEGWRK 表2 不同插值方法的平均相对误差比较 基于上述4种插值方法生成了降水量的空间分布图,直观地分析新疆降水量的空间分布特征。依全局观察,新疆的降水量北部明显多于南部,并随纬度从北向南大致呈带状递减,有明显的南北分界。从局部观察来看,南北疆的山区部分会因地形因素有小范围的波动,降水量发生增减,降水量空间分析分布图见图3。 降水量属于气象数据,会受到多种驱动因素的影响,获取降水量信息单靠从国家气象观测站点观测的数据是不严谨的,存在片面性。随着研究的不断深入,已经有大量学者从单纯考虑降水数据本身到逐渐加入高程、经纬度等影响因素[35],且研究表明,区域降水会受到位置、地形以及大气的制约。该文在研究时主要考虑位置和地形因素,进行多方面的区域降水探讨,从而提高了降水插值的精度,其中,就新疆地区而言高程因素对降水影响相对较大,这与新疆地区三山脉夹两盆地的独特地形密切相关。但在实际生活中影响降水空间分布的还有许多随机因素,加入随机因素以及大气因素会不会进一步提高降水插值精度还有待于进一步的探讨。 每种空间插值方法都有自己的适用范围、研究目的、算法和优缺点。采用1981—2010年新疆范围内的66个国家基本站点年平均降水数据,分别运用Kriging、IDW、RBF和GWRK探讨了新疆降水的空间分布。新疆地区降水量差别大、气象台站少、高程变化大,不能仅仅考虑站点的降水数据和位置因素,故该文加入高程影响因子进一步研究。结果表明:GWRK得出的结果要优于Kriging、IDW和RBF。采用GWRK插值模型的方法进行新疆区域的降水分布特征的研究以及降水量的预测,会比普通的插值方法得到更高的插值精度。 研究表明,有关降水插值的研究应多加考虑位置、地形等相关因素的影响。针对不同研究区域的不同空间位置、地理和地形特点,分析研究出相关性较大的影响因子建模分析,插值分析获取更高插值精度。 此外,该文在研究时考虑的影响因子较少,后期可以尝试引入坡度、坡向、地形曲率、气温和湿度指数等进行分析研究。同时,还可以开发新的插值方法与遥感指数和雷达数据相结合,如引入归一化植被指数(NDVI)、归一化水体指数(NDWI)等以提高精度,这在未来还需要进一步研究。2.2 新疆降水量空间分布特征
3 讨论
4 结论