APP下载

基于GIS空间插值的降水分布模拟方法比较研究

2021-01-27易臻照

中国农村水利水电 2021年1期
关键词:样条插值克里

符 静,易臻照,赵 莎

(1. 衡阳师范学院古村古镇文化遗产数字化传承协同创新中心,湖南 衡阳 421002;2. 衡阳师范学院城市与旅游学院,湖南 衡阳 421002)

受地理条件限制,难以建立数量庞大且均匀分布的气象站点,从而为获取大范围降水空间分布信息,降水空间插值成为研究区域降水格局变化的重要手段[1-3]。气象数据空间插值方法常见的有克里金法、反距离权重法、样条函数法、趋势面法以及局部多项式法等[4],基本原理是通过数学建模利用离散数据来模拟连续的空间信息。

然而不同的插值方法在区域适用性上存在较大差异,近年来,大量学者利用已有观测资料,对各插值方法进行误差分析以获得区域最优插值方案。靳国栋等基于中国某煤矿矿区煤层数据,对比了距离加权反比插值法和普通克里金插值法,认为克里金法优于距离加权反比法[5]。李军龙等采用OK、Spline、IDS进行空间插值,得出OK法对年均温、年降雨量及年积温的插值精度均最高[6]。Garcia等使用反距离加权(IDW)和多重二次谐波(MQB)方法进行插值实验,结果证实MQB在所有条件下插值精度都优于IDW[7]。鲁振宇[8]、仲嘉亮[9]、林金煌[10]、宋丽琼[11]等分别以黄河源区、新疆地区、福建省、深圳市为例,对比几种常规的插值方法,结果表明普通克里金法精度较高。Chen等为获取中国地区日降水栅格数据,通过对比不同插值方法,得出基于季节半变异函数的普通克里金法插值效果最佳[12]。董晓华等以清江流域为研究区,插值结果表明协同克里格法要优于普通克里金法,而反距离加权法明显不如两种克里金法[13]。殷嘉霖等基于湖南省及其周边50个气象站点多年平均降水进行空间插值,得出局部多项式法插值精度最高[14]。何文英等以新安江流域为研究区,得出年尺度上残差克里金法插值精度最高,而月尺度上则需要基于不同的数据条件或地理条件选择最佳的插值方案[15]。王天华[16]、解恒燕[17]等以月尺度降雨量为基础,插值实验证实反距离权重法插值精度较高。

综上,结合区域实际对比不同插值方法的模拟精度,筛选适合区域的插值方法,进而模拟降水空间分布信息,对于区域生态系统管理以及生态安全等有重要意义。本文采用反距离权重法(IDW)、普通克里金法(OK)、样条函数法(Spline)以及趋势面法(Trend)对湖南省1960-2015年年均降水进行空间插值实验,进而对模拟结果进行交叉检验和站点验证,探讨了适合研究区降水的插值方法,并分析了区域降水空间分布特征。

1 材料与方法

1.1 数据来源及预处理

选取1960-2015年湖南省87个气象站点所记录的逐月降水资料,来源于湖南省气象局。在Excel 2013软件中计算生成标准化数据,对少量缺测或无效数据进行线性插补,进而通过计算获得各站点年尺度降水数据,并统计多年降水平均值,其中,南岳站降水量最大为2 023.4 mm,新晃站最少为1 164.3 mm。将站点数据导入ArcGIS 10.2中,利用坐标信息转换为Shapefile数据,采用随机交叉验证抽样方法,选取20%的站点数据作为验证样本,剩余80%作为插值样本(图1),考虑到数据对内插误差的影响,在选取验证样本时会去掉误差较大的站点。其他数据还包括湖南省行政区矢量数据、地形数据以及社会经济数据等。

1.2 研究方法

1.2.1 反距离权重法(IDW)

反距离权重法原理是基于地理学第一定律,依据相近相似原理,利用预测点和采样点之间的距离进行加权,距离预测点越近,采样点给出的权重也就越大。计算公式如下:

(1)

式中:Z表示降水量的预测值;Zi表示第i(i=1,2,3,…,n)个实测值;di为预测点到i点的距离;p为距离的幂,通常为2;n为参与插值的样本数。

1.2.2 普通克里金法(OK)

普通克里金法又称地统计法,是一种无偏估计的插值方法。其原理是利用已知样本的加权平均值估计平面上的未知点值,使估计值等于实际值的数学期望值,且方差最小。计算公式如下:

(2)

式中:Z为降雨量的预测值;λ表示克里金法权重系数;Z(Xi)表示实测点Xi处的降雨量。

1.2.3 样条函数法(Spline)

样条函数法基本原理是采用多项式拟合样本数据生成光滑插值曲线的一种插值方法。计算公式如下:

(3)

式中:Z为降雨量预测值;n为样本数;λi为线性方程组求解系数;di为预测点到i点的距离;x,y分别表示平面直角坐标系的横、纵坐标值;R(di)表示di为自变量的方程;T(x,y)表示x,y为自变量二元线性方程组。

1.2.4 趋势面法(Trend)

趋势面法是基于多项式回归分析原理,得到一个适合地理要素空间分布的光滑层面,而后依据面方程计算预测点的属性值。计算公式如下:

(4)

式中:Z(x,y)为降雨量预测值;n0表示多项式阶数;ε表示随机误差;ak,j为观测点值确定系数;x,y分别表示平面直角坐标系的横、纵坐标值。

1.2.5 插值精度验证

为检验研究区不同插值方法的预测精度,选取研究区20%的站点数据作为验证样本,剩余80%作为插值样本,用来分析预测值与验证点实测值之间的相关性,并验证年平均降水量空间插值结果的准确度。结合区域实际,精度评价采用平均绝对误差(MAE)和均方根误差(RMSE)两种常用的指标,二者计算公式如下:

(5)

(6)

式中:Zi表示验证样本点降雨量观测值;n为验证样本数量;Z(X)为降雨量预测值。为了更好地检验预测点与观测点之间的误差,选择将降雨量观测值与预测值导入SPSS软件或者Excel软件进行误差检验和分析。MAE和RMSE值越小,表明误差越小,插值精度越高。

2 研究结果

2.1 降水空间插值不确定性分析

降水空间插值的不确定性主要来源于气象站点数目、观测数据时空尺度、插值方法差异以及插值运算等误差特性。利用SPSS软件,基于湖南省87个气象站点降水数据绘制Q-Q正态分布图(图略),分析得出降水与海拔有很强的相关性。例如,南岳、安化、桂东三站的海拔及降水量均与周边其他站点差别较大,导致其正态分布偏差较大,而其余站点都集中于一条直线,数据近似符合正态分布。因此,在进行降水空间插值交叉验证时采用的样本需要剔除南岳、安化和桂东等,以免异常值导致误差偏大。此外,湖南省降水在时空尺度上分配不均,采用IDW、OK、Spline和Trend四种方法对该区域年均降水量进行空间插值,通过对比不同插值模型的均方根误差和平均绝对误差,从而获取适合该区域降水的最优插值方案。

2.2 不同插值方法交叉验证分析

采用普通克里金法、反距离权重法、样条函数法和趋势面法进行插值实验对比分析(表1)。其中,普通克里金法采用了5种半变异模型(球面函数、三角函数、指数函数、高斯函数、线性函数),其他参数设置为默认。反距离权重法,其搜索区域形状、幂指数以及邻近站点数的取值对插值结果有一定的影响,选取幂指数2、4、6、8和邻近站点数12。样条函数法选用REGULARIZED和TENSION两种模式。趋势面法取阶为1和2。

表1 不同插值结果误差分析Tab.1 Different interpolation methods validate the results of correlation test between measured and predicted values

交叉验证结果表明,不同插值方法的实测结果与预测结果有显著相关性。由表1可知,整体上,样条函数法、趋势面法、克里金插值法的均方根误差最小值分别为2.52、4.53、4.36 ,平均绝对误差最小值分别为49.22、60.74、60.12 mm,均大于反距离权重法的均方根误差和平均绝对误差的最小值,表明反距离权重误差较小,插值精度较高。具体地,克里金法采用的插值模型不同,平均绝对误差也不同,其中,误差最小的是三角函数模型(MAE=60.12),最大的是球面函数模型(MAE=61.51),由低到高排列依次为三角函数、高斯函数、线性函数、指数函数、球面函数,同样地,三角函数模型的均方根误差也小于指数函数、高斯函数、线性函数和球面函数。样条函数选取TENSION模型产生的误差远远小于REGULARIZED模型。趋势面插值随着阶数的增加误差逐渐降低。反距离权重法的插值精度随着幂值的增大有所提高,幂指数为4时误差最小,之后随着幂指数增大,误差逐渐变大,误差值排序为:IDW4

通过对比同一种插值方法的不同插值模型以及不同插值方法的交叉验证结果,得出反距离权重法(IDW4)插值结果误差最小,精度较高,基于TENSION模型的样条函数法次之,基于三角函数模型的克里金法精度略差,阶为2的趋势面法插值精度最差。由此可见,样条函数法、克里金法和趋势面法并不是湖南省年均降水量理想的插值方法,而反距离权重法(IDW4)插值精度最高,是适合该区域的一种相对较好的插值方法。

2.3 降水空间分布对比分析

为了直观地比较普通克里金法、反距离权重法、样条函数法和趋势面法的降水插值结果,选取IDW4、基于三角函数模型的OK、基于TENSION模型的Spline和阶为2的Trend,运用ArcGIS 10.2软件的Spatial Analyst模块对湖南省多年平均降水量进行插值实验。

由图2可知,4种插值方法一定程度上均能反映湖南省年均降水量的空间分布特征,总体大致呈自东南向西北逐渐减少趋势,研究区东部和东南部降水较多,西部和西北部降水相对较少,梯度变化较为明显,地域降水分布不均匀。而由于降水插值精度与插值方法的选择、插值模型参数设置以及样本的空间布局紧密相关,因此,不同插值方法空间插值结果存在明显的差异性。具体来看,反距离权重法和样条函数法的插值结果基本一致,插值面较为光滑,显示出研究区东部、东南部及南部地区降水多,北部洞庭湖区、衡邵地区以及西部降水相对较少,同时受地形因素影响较大,形成了明显的“牛眼”格局[图2(a)和图2(c)]。基于三角函数模型的OK插值相比较其他三种插值模型,插值面效果较为粗糙,可能与其参数设置默认有关,降水空间分布与反距离权重法及样条函数法的插值结果类似,显示研究区东部和南部降水相对较多,北部洞庭湖区、中部和西部部分地区降水偏少[图2(b)]。趋势面法显示出区域降水空间分布较为单调,表现为明显的自东南向西北递减趋势[图2(d)]。

3 结 论

基于1960-2015年湖南省87个气象站点资料,采用克里金法、反距离权重法、样条函数法和趋势面法对研究区年均降水量进行空间插值分析,主要结论如下:

(1)湖南省降水空间插值具有不确定性,主要与气象站点数量、观测数据时空尺度、插值方法差异以及插值运算等误差特性有关。

(2)湖南省降水空间插值误差分析显示幂值为4时的反距离权重法插值结果误差最小,精度较高,基于TENSION模型的样条函数法次之,基于三角函数模型的克里金法精度略差,阶为2的趋势面法插值精度最差,表明IDW4是适合该区域的一种相对较好的插值方法。

(3)基于三角函数模型的克里金法、IDW4、基于TENSION模型的样条函数法和阶为2的趋势面法一定程度上均能反映湖南省年降水量空间分布特征,总体上大致呈自东南向西北逐渐减少趋势,梯度变化较为明显,地域降水分布不均匀。

(4)反距离权重法和样条函数法的插值面较为光滑,受地形因素影响,形成了明显的“牛眼”格局。基于三角函数模型的普通克里金法插值面较为粗糙。趋势面法显示区域降水空间分布较为单调,表现为明显的自东南向西北递减趋势。

猜你喜欢

样条插值克里
滑动式Lagrange与Chebyshev插值方法对BDS精密星历内插及其精度分析
基于数值积分的最佳平方逼近样条函数
大银幕上的克里弗
二元Barycentric-Newton混合有理插值
你今天真好看
你今天真好看
基于pade逼近的重心有理混合插值新方法
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
三次样条函数的构造
要借你个肩膀吗?