APP下载

基于稳健估计局部多项式插值定权模型分析

2022-05-06刘亚静李胜男王诚聪

刘亚静 李胜男 王诚聪

摘要:在對DEM数据进行插值时,插值算法中对其插值精度影响最为显著的是权指数,但插值时对于含粗差的观测数据,传统的定权方法在计算时会将粗差引入,导致差值结果不准确。针对常用的局部多项式插值法,基于动态球半径选点法选取采样点,分别采用传统的反距离加权法和稳健估计选权迭代法中的Huber权函数法、Andrews权函数法、IGG方案对局部多项式插值的采样点进行定权,通过对比分析采用不同定权方法得到的插值曲面、预测高程相似度以及拟合优度,探讨在数据含有粗差时通过采用不同定权方法对粗差数据进行降权,以得到插值高程值与真实值最为接近的定权方法,对局部多项式插值的定权模型改进。结果表明:在对含粗差的测量数据进行多项式插值时,传统的反距离权重法的插值拟合优度为1.433 3,稳健估计选权迭代法中Huber权函数法的拟合优度为0.742 8;Andrews权函数法的拟合优度为0683 2;IGG方案的拟合优度最高为0.531 8,并且IGG方案对采样点定权所得到的高程值与真实值最为接近,插值曲面的拟合精度更高,插值效果更好。

关键词:局部多项式插值;稳健估计;选权迭代;IGG方案

中图分类号:P 207文献标志码:A

文章编号:1672-9315(2022)02-0283-07

DOI:10.13800/j.cnki.xakjdxxb.2022.0212开放科学(资源服务)标识码(OSID):

Analysis of local polynomial interpolation weighting

model based on robust estimationLIU Yajing LI Shengnan WANG Chengcong

(1.School of Mining Engineering,North China University of Science and Technology,Tangshan 063210,China;

2.Northeast Institue of Geography and Agrocology,Chinese Academy of Sciences,Changchun 130000,China)Abstract:In the interpolation of DEM data,the weight index has the most significant influence on the interpolation accuracy.The traditional weight method,however,will introduce gross error in the calculation,for the observation data with gross error,which leads to inaccurate difference results.In this paper,from the commonly-used local polynomial interpolation method,the sampling points are selected based on the dynamic spherical radius method.The traditional inverse distance weighting method and Huber weight function method,Andrews weight function method and IGG scheme in the robust estimation weight iteration method are used to determine the weights of the sampling points of local polynomial interpolation.The interpolation surface,and the similarity as well as goodness of fit of the predicted elevation obtained by different weight methods are compared and analyzed to examine the weight reduction of gross error data by using different weighting methods when the data contains gross error,so as to obtain the weighting method that the interpolation elevation value is closest to the real values,which would improve the local polynomial interpolation weighting model.The results show that the goodness of fit of traditional inverse distance weight method is 1.433 3,that of Huber weight function method is 0.742 8,that of Andrews weight function method is 0.683 2,and that of IGG scheme is 0.531 8.And the height value obtained by the IGG scheme is the closest to the real value and the fitting accuracy of the interpolation surface is higher,with the interpolation effect better.

Key words:local polynomial interpolation;robust estimation;weight iteration;IGG plan

0引言

局部多项式插值法是一种局部加权最小二乘拟合,根据有限个已知采样点数据,采用多个多项式来进行曲面的拟合[1],每一个插值点的预测值都对应一个多项式,利用局部多项式插值法得到的曲面,能够较好地描述短程变异[2]。在测量过程中,由于受到诸多因素的影响,会使测量数据中含有粗差,使得观测值将不服从正态分布,若直接使用这些数据进行曲面插值,其结果很难与真实情况相吻合[3]。抗差估计解决了这一问题,即使用等价权函数来代替一般权函数,对含粗差的数据进行降权处理,则可以有效提高模型的抗差能力。

在现有研究中,吴富梅等利用水准网数据,对选权迭代法的几种权函数在不同显著性水平下的抗差性进行了比较,认为当数据不稳定时,IGGⅢ和丹麦法的抗差效果略优于其他权函数[4]。徐波、杨勇喜等通过坐标参数转换实例对选权迭代法进行分析,发现通过IGG函数进行定权可有效降低含粗差观测值的权值,在进行三维坐标转换时能获取更高精度的转换参数[5-6]。孙同贺等将具有稳健初值的选权迭代法融入到DEM粗差探测中,证实稳健初值的选权迭代法具有很强的稳健性和粗差探测能力,可以实现对粗差的探测和剔除[7]。HOLLAND等提出选权迭代法,可通过反复迭代,逐步减小粗差观测值的权重,从而进行粗差定位和剔除[8]。稳健估计选权迭代法具有很好的抗差能力[9],但其相关研究大多是针对水准网测量和坐标转换方面的研究,对于多项式插值采样点的定权鲜有阐述。

一般认为DEM误差来源于源数据的采样误差和DEM插值过程中的插值误差[10]。在进行多项式插值时,常用的采样点定权函数包括反距离加权法和局部距离比法,但对于含粗差的观测数据,这2种传统的方法会将粗差当作一般数据处理,导致在构建曲面模型时粗差引入,使得曲面发生歪曲[11-14]。因此文中将稳健估计选权迭代法与局部多项式插值进行结合,分别采用传统的反距离加权法和稳健估计选权迭代法中的Huber权函数法、Andrews权函数法、IGG方案对局部多项式插值的采样点进行定权,通过均方根误差(root mean squared error,RMSE)对各方法的拟合精度进行比较分析,并且对比分析采用不同定权方法得到的插值曲面和预测高程相似度,探讨所引进的3种定权方法中,在数据含有粗差时采用不同定权方法降低含粗差观测值的权[15-17],对于含粗差数据插值拟合效果最优的方法,以提高其插值精度,对局部多项式插值的定权模型改进,为局部多项式插值曲面的建立提供保证。

1局部插值理论模型与精度评定

1.1动态球半径选点法

动态球半径选点法是以内插点为球心,R为半径,选取各内插点周围可用来计算的采样点[18-19](图1)。半径R可通过构造函数来确定

1.2二次曲面模型

高精度曲面的绘制必须保证每一个数据点在权值其有效范围内平滑过渡[11],采用二阶可导的二次曲面来建立局部曲面模型,其二次曲面模型表达式如下

1.3精度评定

选用均方根误差(RMSE)进行拟合优度的评价,当预测值与真实值相同RMSE=0,误差越大,该值越大。均方根误差计算公式为

2采样点权函数

采样点权函数可以用来反映采样点与内插点的相关程度。对区域内的采样点赋权,权重(Pi)的确定与该点到内插点的距离(di)有关,距离越小,该点对内插点的影响就越大,权重也越大。可采用反距离加权法、Huber权函数、Andrews權函数和IGG方案4种方法确定采样点的权重。

2.1反距离加权法

反距离加权法是常用的采样点定权法。该方法依据相近相似的原理[20],采样点权重的大小会随着其与插值点之间距离的增大而减小,距离插值点越近,采样点的权重就越大[14]。

2.2稳健估计权函数

采用稳健估计权函数进行采样点的定权,是以内插点与采样点之间的距离为自变量,内插点的值为因变量[18],通过采样点权函数计算其权重。权函数分别选用Huber权函数、Andrews权函数和IGG方案,其中Huber函数包含正常域和可疑域,只对可疑域内的观测值进行降权处理,不能将有害信息剔除掉;Andrews函数包含可疑域和淘汰域,将所有的观测值都进行降权处理;而IGG方案同时拥有正常域、可疑域和淘汰域,充分利用所有观测数据[4]。

2.2.1Huber权函数

Huber权函数确定的权因子为

2.2.2Andrews权函数

Andrews权函数确定的权因子为

3案例分析

3.1数据来源

实验采用《ArcGIS地理信息系统空间分析实验教程》中的实验数据。该组数据共有170个采样点,分布均匀,属性字段分别是横坐标x,纵坐标y,以及高程z。部分采样点数据见表1。

为验证Huber函数法、Andrews函数法及IGG方案对含有粗差数据的抗差性强度区别,在实验数据中随机加入3组粗差。运用MATLAB软件进行曲面插值和拟合,并在三维空间中显示出来(图2),同时将稳健估计采样点定权3种方法预测得到的高程数据进行对比分析,通过散点图表示(图3)。

3.2插值曲面对比分析

对比分析图2中的拟合曲面效果,可以看出选权迭代法对含有粗差的数据进行定权的插值结果与无粗差数据时结果很接近,效果较好,图中标注的部分为插值曲面中差异较明显的区域。

3.3预测高程相似度对比分析

将采用反距离加权法对无粗差数据计算出的高程,与采用稳健估计权函数对于含粗差数据计算出的高程,通过散点图(图3)来反应其结果的相似程度。纵轴代表数据无粗差时采用反距离权重法定权得到的高程值,横轴表示采用选权迭代法计算出的高程值。

[8]HOLLAND P W,WELSCH R E.Robust regression using iteratively reweighted least-squares[J].Communications in Statistics Theory and Methods,1977,6(9):813-827.

[9]王奉伟,周世健,周清,等.具有稳健初值的选权迭代法曲面拟合模型粗差探测[J].测绘与空间地理信息,2015,38(6):39-41.WANG Fengwei,ZHOU Shijian,ZHOU Qing,et al.Gross error elimination in surface fitting by weight interation with initial values[J].Geomatics & Spatial Information Technology,2015,38(6):39-41.

[10]FISHER P.Causes and consequences of error in digital elevation models[J].Progress in Physical Geography,2006,30(4):467-489.

[11]高彦林,胡斌,张瑞天,等.基于局部曲面加权的曲面插值法[J].石油地球物理勘探,2009,44(5):587-589.GAO Yanlin,HU Bin,ZHANG Ruitian,et al.Surface interpolation technique based on local surface weighted method[J].Oil Geophysical Prospecting,2009,44(5):587-589.

[12]周秋生.建立数字地面模型的算法研究[J].测绘工程,2001,10(1):14-18.ZHOU Qiusheng.Research on the algorithm of construction of digital terrian model[J].Engineering of Surveying and Mapping,2001,10(1):14-18.

[13]BHUNIA G S,SHIT P K,MAITI R.Comparsion of GIS based interpolation methods for spatial distribution of Soil Organic Carbon(SOC)[J].Journal of the Saudi Society of Agricultural Sciences,2018,17(2):114-126.

[14]张锦明,郭丽萍,张小丹.反距离加权插值算法中插值参数对DEM插值误差的影响[J].测绘科学技术学报,2012,29(1):51-56.ZHANG Jinming,GUO Liping,ZHANG Xiaodan.Effects of interpolation parameters in inverse distance weighted method on DEM accuracy[J].Journal of Geomatics Science and Technology,2012,29(1):51-56.

[15]张志伟,暴景阳,肖付民.抗差估计的多波束测深数据内插方法[J].测绘科学,2016,41(10):14-18.ZHANG Zhiwei,BAO Jingyang,XIAO Fumin.An interpolation method of multibeam data based on robust estimation[J].Science of Surveying and Mapping,2016,41(10):14-18.

[16]肖明.抗差估计等价权函数的优化及其抗差效果评价[D].淮南:安徽理工大学,2018.XIAO Ming.Optimizations for equivalent weight function in robust estimation and evaluation of its robustness[D].Huainan:Anhui University of Science and Technology,2018.

[17]刘文生,唐守路.稳健估计的两种粗差探测方法[J].辽宁工程技术大学学报(自然科学版),2016,35(1):54-58.LIU Wensheng,TANG Shoulu.Two kinds of gross error detection method based on robust estimation[J].Journal of Liaoning Technical University(Natural Science Edition),2016,35(1):54-58.

[18]劉亚静,王诚聪,刘明月.改进的局部多项式插值权函数研究[J].大地测量与地球动力学,2020,40(7):726-729,745.LIU Yajing,WANG Chengcong,LIU Mingyue.Study on improved local polynomial interpolation weight function[J].Journal of Geodesy and Geodynamics,2020,40(7):726-729,745.

[19]陈晓阳.基于二次曲面的高程异常拟合方法比较研究[J].测绘与空间地理信息,2020,43(1):218-220.CHEN Xiaoyang.Comparative study on abnormal height fitting method based on quadric surface[J].Geomatics & Spatial Information Technology,2020,43(1):218-220.

[20]CHAPLOT V.Accuracy of interpolation techniques for the derivation of digital elevation models in relation to landform types and data density[J].Geomorphology,2005,77:126-141.

[21]周江文.抗差最小二乘法[M].武汉:华中理工大学出版社,1997.

[22]张阔,张永彬,李树存.基于MATLAB的稳健估计中几种权函数处理对比[J].华北理工大学学报(自然科学版),2019,41(3):1-5,20.ZHANG Kuo,ZHANG Yongbin,LI Shucun.Comparisons of several weight functions in robust estimation based on MATLAB[J].Journal of North China University of Science and Technology(Natural Science Edition),2019,41(3):1-5,20.

[23]于志英,赵阳阳,张福浩.稳健度量选权迭代的地理加权回归研究[J].测绘科学,2019,44(11):28-34.YU Zhiying,ZHAO Yangyang,ZHANG Fuhao.Research on geographically weighted regression based on robust measurement and iterative weight[J].Science of Surveying and Mapping,2019,44(11):28-34.

[24]王颖,祝民强,乔康宁.航测数据处理中的空间插值方法比较[J].测绘与空间地理信息,2011,34(1):234-237,241.WANG Ying,ZHU Minqiang,QIAO Kangning.Spatial interpolation methods in aerial survey data processing[J].Geomatics & Spatial Information Technology,2011,34(1):234-237,241.

[25]肖城龙.基于ArcGIS的空间数据插值方法的研究与实验[J].城市勘测,2017(6):71-73,83.XIAO Chenglong.The study and experiment of spatial data interpolation based on ArcGIS[J].Urban Geotechnical Investigation & Surveying,2017(6):71-73,83.

[26]蘇涛,潘红光,黄向东.基于改进PSO-SVM的燃煤电厂烟气含氧量软测量[J].西安科技大学学报,2020,40(2):342-348.SU Tao,PAN Hongguang,HUANG Xiangdong.Soft measurement of oxygen content in flue gases based on improved PSO-SVM in coal-fired power plant[J].Journal of Xian University of Science and Technology,2020,40(2):342-348.