ArcGIS插值方法对比及其在云南省土壤污染状况调查中的应用
2010-10-09赵娟
赵 娟
(云南省环境监测中心站,云南昆明 650034)
ArcGIS插值方法对比及其在云南省土壤污染状况调查中的应用
赵 娟
(云南省环境监测中心站,云南昆明 650034)
介绍了ArcGIS系统插值方法的基本原理,对比了各种插值方法。通过在云南省土壤污染状况调查中的应用对比,最后决定采用反距离权重插值法。
ArcGIS;插值法;对比
ArcGIS系统是 ESR I公司全面融合 GIS与数据库、软件工程、人工智能、网络技术及其它多方面的计算机主流技术之后,成功推出的代表 GIS最高技术水平的全系列平台,是一个统一的地理信息系统平台。
在ArcGIS提供的地统计模块中,有 6种空间插值方法提供选择,这 6种插值方法包括确定性插值以及地统计插值。
1 空间数据插值方法的基本原理
任何一种空间数据插值法都是基于空间相关性的基础上进行的。即空间位置上越靠近,则事物或现象就越相似,空间位置越远,则越相异或者越不相关,体现了事物对空间位置的依赖关系。
由于经典统计建模通常要求因变量是纯随机独立变量,而空间插值则要求插值变量具备某种程度的空间自相关性的具随机性和结构性的区域化变量。即区域内部是随机的,与位置无关的,而在整体的空间分布上又有一定的规律可循,这也是不宜用简单的统计分析方法进行插值预估的原因。然而无论用哪种插值方法,根据统计学假设可知,样本点越多越好,而样本的分布越均匀越好。
2 各种插值方法对比
2.1 IDW (Inverse Distance Weighting—反距离权重插值法)
反距离权重插值法是一种精确的快速决定插值法,可以进行确切的或者圆滑的方式插值。方次参数控制着权系数如何随着离开一个格网结点距离的增加而下降。对于一个较大的方次,较近的数据点被给定一个较高的权重份额,对于一个较小的方次,权重比较均匀地分配给各数据点。计算一个格网结点时给予一个特定数据点的权值与指定方次的从结点到观测点的该结点被赋予距离倒数成比例。该插值法适用于呈均匀分布且密集程度足以反映局部差异的样点数据集,插值生成的表面中预测的样点值与实测样点值完全相等。
2.2 Krige(kriging—克鲁金插值法)
克鲁金插值法又称空间自协方差最佳插值法,是一种很灵活很有用的地质统计格网化方法,可以调查图像的空间自相关作用。此方法获得预测图并不要求数据呈正态分布。但当数据呈正态分布时,克里格插值法将是无偏估计法中效果最好的一种方法。因此,在进行克里格插值前,可先对非正态分布的数据进行转换,然后再进行插值。
该方法在数学上可对所研究的对象提供一种最佳线性无偏估计 (某点处的确定值)的方法,输出包括预测、预测标准误差、概率等。它是考虑了信息样品的形状、大小及与待估计块段相互间的空间位置等几何特征以及品位的空间结构之后,为达到线性、无偏和最小估计方差的估计,对每一个样品赋与一定的系数,最后进行加权平均来估计块段品位的方法。是一种光滑的内插方法,在数据点多时,其内插的结果可信度较高。
2.3 Cokriging(Cokriging—协同克鲁金插值法)
协同克鲁金与克鲁金一样,是一种根据测量的误差模型可以精确或者模糊的适度插值方法。不同之处是协同克鲁金法把区域化变量理论的最佳估值方法从单一属性发展到二个以上的协同区域化属性。当某一属性由于各种原因无法充分采样时,协同克鲁金法可以利用它与另一个采样多的变量之间的空间相关性,有效地提供具有一定精度的估值。协同克鲁金在计算中要用到 Z1,Z2各自的半方差函数和交叉半方差函数,计算比较复杂。如果变量的空间模式与常见的物理过程相联系,协同克鲁金法最为成功。
2.4 GP(Global Polynomial Interpolation—全局多项式插值法)
全局多项式插值是一种平滑的快速决定插值法,但是并不精确,对于表面缓慢逐步变化的插值效果最好。它不能评定预测误差,因此可能结果过于平滑,边缘数据的位置对于插值平面可以产生较大影响。
通常用于分析趋势和异常而不追求高的拟合精度,一般达到 60%~80%,阶数在 1~4即可。该分析方法是经典统计学在点数据进行空间展面上的应用,即对整个研究区域用一个多项式进行拟合。
2.5 LP(Local Polynomial Interpolation—局部多项式插值法)
局部多项式是一种平滑的快速决定插值法,比全局多项式插值更灵活,但因此也更需要对数据参数进行更多的分析判断,且不能评估预测误差。它采用多个多项式进行拟合。每个多项式都只在特定重叠的邻近区域内有效,通过设定搜索半径和方向来定义邻近区域。显然,局部多项式插值是对全局多项式,即趋势面拟合的一大改进。
2.6 RBF(Radial Basis Functions—径向基函数插值法)
径向基函数即基函数是由单个变量的函数构成的,是精确插值法。此方法提供的预测插值面可与克鲁金的精确模式相比,但不提供数据的自相关分析,因此不如克鲁金方法灵活和自动。该方法适用于样点数据集大、表面变化平缓的情况;当局部变异性大,且无法确定样点数据的准确性,或样点数据具很大不确定性时,不适用该技术。
3 在云南省土壤污染状况调查中的应用
此次云南省土壤污染状况调查中要对所有普查采样点位的数据进行插值计算,从而对未知地理空间的土壤污染特征进行估计,在全省层面上得到分析结果。
根据以上各种方法的特性,在此采用 4种插值方法对土壤污染数据进行插值比对,其中反距离权重插值法采用二阶方程,局部多项式法采用一阶方程,克鲁金法和协同克鲁金法均采用球形模型进行运算。
4种方法对比后得到以下结果:
IDW—反距离权重插值法为精确插值方法,不改变监测样点原值,但在监测结果高值点附近出现“牛眼”,其预估的平均误差介于中间,非误差最大或最小的方法。
Krige—克鲁金法插值后曲线较平滑,但是在插值过程对样点的值重新进行计算,改变了样点原值,突出异常值,在评估误差中较小。
Cokriging—协同克鲁金插值结果类似于克鲁金,插值过程中对样点值重新计算,改变了样点原值,同样误差值较小。
LP—局部多项式法由于只考虑局部变量,导致平均误差最大。
综上,各种插值方法均能反应污染总体情况,从曲线形态和分布上可以明显看出克鲁金法与考虑海拔的协同克鲁金法插值结果十分相似,二者与反距离权重插值法、局部多项式法区别较大。
局部多项式法由于误差较大不予选择,克鲁金法和协同克鲁金法虽然误差最小,但是其在插值过程中会用插值计算后的值对样点原值进行替换,不能保证原样点值的准确性。在土壤污染状况调查中,监测值最好不被改变,才能保证评论结果的准确性。因此最后采用的插值方法为反距离权重插值法。此方法缺点是会在监测结果高值附近出现“牛眼”,导致对全省土壤污染面积评价结果偏高。
Comparison of Interpolation M ethod of ArcGIS and its Application in Soil Pollution Investigation of Yunnan
ZHAO Juan
(Yunnan Environmental Monitoring Center,Kunming Yunnan 650034 China)
The basic theory of interpolation method of Arc GIS is introduced,several methods are compared.The different interpolation methods are applied in soil pollution investigation of Yunnan and make a comparison.The inverse distance weighted method is selected in the end.
Arc GIS;interpolation method;comparison
X53
A
1673-9655(2010)增 1-0085-03
2009-03-10