基于SVM的GPS高程拟合方法的参数选取研究
2017-05-30祝鹏范龙军
祝鹏 范龙军
摘 要:本文详细阐述SVM在GPS高程拟合的应用和原理,介绍SVM方法参数选取的意义和重要性,结合MATLAB在不同样本的情况下,对三种参数寻优方法进行对比试验。结果表明,PSO算法比其他两种算法更稳定,拟合精度也更高。
关键词:SVM;参数寻优;MATLAB软件;GPS高程拟合;PSO算法
中图分类号:P228.4 文献标识码:A 文章编号:1003-5168(2017)06-0026-02
Research on Parameters Selection of GPS Height Fitting based on SVM
Zhu Peng1 Fan Longjun2
(1.Henan Like Pipeline Detection Technology Co., Ltd.,Zhengzhou Henan 450000;
2.Beijing Zhongjiao Construction Engineering Tendering Co., Ltd. (Henan Branch),Zhengzhou Henan 450000)
Abstract: This paper introduced the theory of SVM and SVM in the application of GPS height fitting, and introduced the significance and the importance of selecting parameters of SVM method. By using of MATLAB software, the three parameters optimization methods were compared and tested in the case of different samples, The results show that the PSO algorithm is more stable than the other two algorithms, it has better fitting accuracy.
Keywords: SVM;Parameter optimization;MATLAB software;GPS height fitting;PSO algorithm
目前,GPS测量技术已经成为测量工作的重要技术之一。GPS测量是以WGS-84参考椭球面为基准,获取高精度的三维坐标。目前,我国广泛采用的是正常高,所以需要将GPS测量获得的大地高([H])转化为正常高([Hr]),其转化公式是[ξ=H-Hr],[ξ]是高程异常[1]。计算高程异常通常可以使用两种方法:一是直接法;二是拟合法。直接法是使用高精度、高密度的重力数据,再结合高分辨率的地形数据,使用严谨的计算方法,获取高精度的高程异常值的方法。拟合法就是利用数学方法对现有控制点的高程异常数据进行拟合,进而求得待定点的正常高,精度较低,可以满足低等级的工程水准测量需求[2]。
目前,GPS高程拟合的方法有曲面拟合法、多面函数拟合法、BP神经网络拟合法等[3-4]。SVM(支持向量机)的出现给GPS高程拟合带来新的路径和方法;SVM学习问题可以表示为凸优化问题,因此可以利用已知的有效算法发现目标函数的全局最小值。而其他分类方法(如人工神经网络)获得的大都是局部最优解,原因就是其原理是基于一种贪心学习的方案去搜索假设空间。在样本数据不大的情况下,SVM依然能够进行回归预测,在没有大量控制点数据和水准数据的情况下,也能获得较高精度的高程拟合结果。SVM的预测结果精度受参数优化选取影响较大,目前还没有统一公认的最好方法,还需要进一步的研究实验。
1 支持向量机理论和参数选取
对于线性回归,支持向量机函数拟合首先考虑用线性回归函数[f(x)=ω·x+b]拟合[(xi,yi),i=1,2,…,n],[xi∈Rn]为输入量,[yi∈R]为输出量,即需要求解[ω]和b。
支持向量机采用[ε]-不灵敏度函数,即假设所有训练数据在精度[ε]下用线性函数拟合。
[yi-f(xi)ε+ξif(xi)-yiε+ξ?iξi,ξ?i0 i=1,2,…,n] (1)
式(1)中,[ξi,ξ?i]是松弛因子,当划分有误差时,[ξ],[ξ?i]都大于0,误差不存在取0。此时,该问题转化为求优化目标函数最小化问题。
[R(ω,ξ,ξ?)=12ω×ω+Ci=1n(ξi+ξ?i)] (2)
式(2)中第一项使拟合函数更为平坦,从而提高泛化能力;第二项为减小误差;惩罚参数C表示对超出误差[ε]的样本的惩罚程度。为解这个凸二次优化问题,引入Lagrange函数:
[L=12ω×ω+Ci=1n(ξi+ξ?i)-i=1nαiξi+ε-yi+f(xi) -i=1nα?iξ?i+ε-yi+f(xi)-i=1n(ξiγi+ξ?iγ?i)](3)
式(3)中,[α],[α?i0],[γi],[γ?i0],为Lagrange乘数,[i=1,2,…,n]。求函数L对[ω],b,[ξi],[ξ?i]的最小化,对[αi],[α?i],[γi],[γ?i]的最大化,最终解得的线性拟合函数为:
[f(x)=ω×x+b=i=1n(αi-α?i)xi×x+b] (4)
首先将输入量x通过映射[Φ:Rn→H]映射到高维特征空间H中用函数[f(x)=ω×Φ(x)+b]拟合数据[xi,yi,i=1,2,…,n],引入核函数[K(xi,yj)=Φ(xi)×Φ(xj)],可求的非线性拟合函数的表示式为:
[f(x)=ω×Φ(x)+b=i=1n(αi-α?i)K(x,yi)+b] (5)
2 实例分析
本次试验共采用20个水准高程点分为三个方案(方案A、B、C),试验MATLAB R2010b编制模型程序。方案A是点6、14、17、19作为预测点,其余点作为训练点;方案B是点6、8、10、15、17、20作为预测点,其余点作为训练点;方案C是点3、6、8、10、14、15、17、20作为预测点,其余点作为训练点。试验所采用的GPS/水准数据来自文献[4]。试验采用的GPS高程/水准点位分布如图1所示。
试验首先将原始数据规整到[0,1]范围内,做归一化处理。使用训练点的数据建立训练模型,然后分别使用三种参数的寻优方法寻找模型最优参数,将最优参数带入模型预测拟合点的高程异常。拟合精度评定分别使用内、外符合精度作为精度评价指标,其计算公式如式(6)所示,V是已知点的高程异常和拟合值之差,n是样本数。
[σ=±VV/(n-1)] (6)
PSO算法对比其他两种算法显示出了良好的稳定性,使用该算法预测得到的结果外符合精度和内符合精度都比较高。即使训练样本数量不同时,使用PSO选优算法也比其他两种算法的回归预测精度要高;同时使用SVM进行高程异常拟合时,增加训练样本数量得到的预测精度并不一定高。训练样本数量所占样本总量的比例过大或者过小都会造成拟合结果较差,这也验证了SVM不需要过多的支持向量,就能取得较高的精度。
3 结语
本文介绍了SVM非线性回归模型的原理及几种模型参数寻优算法。SVM理论为GPS高程拟合提供了一种新途径,而且在样本数量较小的情况下,也能取得较好的预测结果。MATLAB R2010b在编程、模型参数寻优方面具有方便、快捷的优势,相对人为盲目选取模型参数极大地提高了效率。结合本文的算例可以的出以下结论:
①PSO寻优算法具有良好的稳定性,能够取得较好的预测结果且能够应用在GPS高程拟合中。
②在选择样本进行建立训练模型时,应考虑训练样本占总样本的比例,比例过大或过小都会影响拟合精度。对于训练样本选取的最优比例还有待进一步的研究、探索。
参考文献:
[1]黄声享,郭英起,易庆林.GPS在工程测量中的应用[M].北京:测绘出版社,2007.
[2]张书毕,张秋昭,杨化超.利用Von Karman模型的Kriging插值用于GPS高程拟合[J].测绘科學,2010(5):167-168,172.
[3]马腾,王耀强,花向红.遗传神经网络在GPS高程转换中的应用[J].测绘信息与工程,2008(3):9-10.
[4]魏好,邓喀中,刘弟林,等.基于SVM的GPS高程拟合模型研究[J].矿山测量,2011(6):21-24.