基于L曲线法的抗差岭估计模型
2014-08-21詹本勇
陈 帅,詹本勇
(1.天津市普迅电力信息技术有限公司,天津 300000;2.华能云南滇东能源有限责任公司白龙山煤矿,云南 曲靖 655508)
0 引 言
最小二乘法(又称最小平方法)是一种数学优化方法,采用最小二乘原理进行的最小二乘估计(LS估计)具有良好的统计性质,但在当今工程测量及数据处理过程中,当自变量较多时,往往会使法方程的系数阵病态,使得采用LS估计求得的参数估值与真值相差比较大。再者,由于观测值受到异常污染,使得观测值中含有粗差时,因LS估计不具有抗粗差干扰的能力,也会导致最终求取的参数估值与真值偏差较大,甚至完全失真。当存在上述问题时,需要采用抗差有偏估计的方法进行处理[1]。
现有的抗差有偏估计方法主要有抗差岭估计、抗差泛岭估计等,上述方法在对受到系数阵病态及观测粗差影响的参数估计取得了一定的成果,但大多数在迭代过程中采用的岭参数与最小二乘岭估计中的相同,而实际上在迭代过程中等价权是在不断变化的,所以在每次迭代计算中应选择最合适的岭参数。岭参数确定是影响估计结果非常重要的因素,因此,如何准确的选取岭参数是抗差有偏估计方法的关键。
L曲线法[2]是确定岭参数的一种有效方法,且在最小二乘岭估计中已成功得到应用。本文采用中位数和标准化残差构建抗差岭估计模型[3],使用L曲线法进行岭参数求解,通过迭代过程,最终选取精度最高、最合适的岭参数。
1 数学模型
设参数平差的函数模型[4]为
(1)
误差方程为
(2)
由最小二乘原理可知,式(1)的最小二乘解为
(3)
=min,
求得
(4)
(5)
采用双因子等价权模型[5],取
(6)
式中:wjj和wii表示自适应降权因子。由IGGⅢ计算得
wjj=
(7)
由式(2)和式(4)推导Qvv的计算公式为
Qvv=NggPNgg-2Ngg+P-1,
(8)
其中,Ngg=A(ATPA+αI)-1AT.
σ0为单位权中误差,由中位数计算,计算公式为[6]
(9)
导出抗差岭估计的迭代解式:
(10)
2 L曲线法求解岭参数的基本原理
以对数形式推导,设
(11)
两边同时取对数,有
(12)
L曲线上各点的曲率可由下式计算[7]:
(13)
3 算例分析
设计病态矩阵为
对数据做如下方案处理:
方案一:无粗差数据;方案二:将L1加入-5.5的模拟粗差;方案三:将L1、L14分别加入-5.5和-4.0的模拟粗差;方案四:将L1、L5和L7分别加入-5.5、-2.0和+4.5的模拟粗差;方案五:将L4、L12和L13分别加入+5.0、-3.0及+2.5的模拟粗差。
对上述无粗差数据及加入不同数量粗差的数据分别进行最小二乘估计、最小二乘岭估计以及抗差岭估计,通过三种不同方法求得的参数估计值的结果如表1所示。
表1 五种方案的参数估计值对比表
表2示出了加入粗差模拟的数据经最小二乘估计、最小二乘岭估计以及抗差岭估计后的残差及权因子为零的观测值序号。
表2加入粗差后的残差值及相应观测值序号统计表
方案零等价权观测值序号LS估计残差LS岭估计残差抗差岭估计残差模拟粗差数值 二1+4.076 2+4.139 7+5.722 7-5.5 三114+3.300 2+0.460 7+3.445 0+1.945 6+5.797 4+4.304 5-5.5 -4.0 1+3.027 8+3.192 4+5.761 3-5.5 四5+0.568 4+0.684 7+2.209 4-2.0 7-1.338 5-2.478 2-4.602 8+4.5 4-2.784 7-2.742 5-5.005 9+5.0 五12+1.131 6+2.153 9+3.147 0-3.013-1.547 9-1.700 8-2.303 3+2.5
通过以上计算结果的对比分析,可以看出:
若在抗差迭代过程中始终使用LS岭估计所采用的岭参数则难以达到这样的计算效果,这是由于在迭代过程中使用L曲线法选取适合每次迭代计算的岭参数在理论上更加合理。
4)由于抗差岭估计模型在迭代过程中采用的是L曲线法来确定岭参数的值,与LS岭估计模型中的岭参数比较是变化的。图1是采用L曲线法求解抗差岭估计模型最终确定的岭参数和LS岭估计模型中的岭参数的示意图。
图1 LS岭估计与抗差岭估计确定的岭参数示意图
4 结束语
由于受到系数阵病态以及观测粗差的影响,采用经典最小二乘估计求取参数估值是极其不稳定的,导致最终的计算结果与真值偏差较大,这时需要采用抗差有偏估计的方法进行处理。文章介绍了抗差岭估计模型,给出了关键公式的推导,并说明利用L曲线法求解抗差岭估计模型中岭参数的原理。最后结合实际算例作出五种方案的计算比较,通过对无粗差数据以及加入不同数量粗差的数据分别进行LS估计、LS岭估计、抗差岭估计,并对结果就行了详细的分析,结果表明:LS估计不能够克服系数阵病态的影响,抗粗差能力也非常弱;LS岭估计虽然能够有效的抵制系数阵病态的影响,但抗粗差能力也比较弱;与前两种方法相比较,基于L曲线法的抗差岭估计模型能够有效的改善和抵制系数阵病态和观测粗差带来的影响。
[1]GUI Q, J. ZHANG J. Robust biased estimation and its applications in geodetic adjustments[J]. Journal of Geodesy, 1998(72):430-435.
[2]HANSEN P C. Analysis of discrete ill-posed problems by means of the L-curve [J]. SIAM Review, 1992, 34(4):561-580.
[3]王 彬,高井祥,王 坚,等.一种高精度GPS基线网抗差估计方法[J].全球定位系统,2011,36(3):39-42.
[4]隋立芬.抗差岭估计原理及其应用[J].测绘通报,1994(1):7-8.
[5]YANG Y, SONG L,XU L. Robust estimation for correlated observations based on bifactor equivalent weights [J]. Journal of Geodesy, 2002(76):353-358.
[6]宋力杰.测量平差程序设计[M].北京:国防工业出版社,2009.
[7]王振杰,欧吉坤.用L-曲线法确定岭估计中的岭参数[J].武汉大学学报·信息科学版,2004,29(3):235-238.