几种粗差估值方法的比较
2016-07-15鲁铁定
鲁铁定
1. 东华理工大学测绘工程学院,江西 南昌 330013; 2. 长安大学地质工程与测量学院,陕西 西安 710054; 3. 流域生态与地理环境监测国家测绘地理信息局重点实验室,江西 南昌 330013
几种粗差估值方法的比较
鲁铁定1,2,3
1. 东华理工大学测绘工程学院,江西 南昌 330013; 2. 长安大学地质工程与测量学院,陕西 西安 710054; 3. 流域生态与地理环境监测国家测绘地理信息局重点实验室,江西 南昌 330013
Foundation support: The National Natural Science Foundation of China(Nos.41464001; 41374007); National Department Public Benefit Research Foundation of Surveying, Mapping and Geoinformation (No.201512026); Science and Technology Project of the Education Department of Jiangxi Province (Nos. KJLD12077; GJJ13457); China Postdoctoral Science Foundation (No.2012M511962); Voyage Project of Jiangxi Province (No.2013); Visiting Scholar Project of Faculty Development of Jiangxi Province (No.2012132)
摘要:基于均值漂移模型,重点讨论粗差估值的计算问题,给出了观测值统计相关时数据探测法(data snooping)的粗差估值公式。探讨数据探测法粗差估值与粗差的同时定位与定值法(LEGE)、拟准检定法(QUAD)、部分最小二乘法(PLS)的粗差估值之间的关系,证明当观测值统计相关时,部分最小二乘法和QUAD法在粗差估值的计算上具有等价性,与数据探测法和LEGE法都不一致。当观测值统计独立且不等权时,QUAD法、PLS法和数据探测法具有等价性,与LEGE法在粗差估值上不同;当观测值统计独立且等权时,4种方法在粗差估值计算上具有等价性。最后通过算例验证了结论。
关键词:数据探测法;粗差估值;粗差的同时定位与定值法(LEGE);拟准检定法(QUAD);部分最小二乘法(PLS)
粗差是指离群的误差[1]。处理测量中的粗差影响一直是测绘数据处理理论的研究热点。目前主要形成了两种不同的粗差处理模式:将粗差纳入函数模型,沿着巴尔达提出的粗差数据探测(data snooping)[2],该方法将观测值粗差的出现视为观测值的数学期望产生了平移,但方差不变;将粗差纳入随机模型,引进统计学中的抗差估计(robust estimation)[3-4],该方法将粗差观测值看成是观测值的数学期望不变,方差异常。文献[5]在函数模型基础上,根据被观测量的独立观测数判断其观测值能否容忍粗差,提出了一种基于局部分析法的粗差探测法。
随着观测量的不断增多,出现多个粗差观测值的概率将会增大,研究多个粗差的探测、识别和处理具有重要意义[6]。基于统计学原理的粗差探测和定位方法主要包括:数据探测法(data snooping)[2]、多维粗差的同时定位与定值法(the method of simultaneous locating and evaluating multidimensional gross errors,LEGE)[7]、拟准检定法(quasi-detection of gross errors,QUAD)[8-10]、部分最小二乘法或预测残差法(partly least squaes,PLS)[11-12]等。针对上述4种粗差探测和定位方法的异同,文献[13]对均值漂移模型数据探测法和LEGE法的原理、方法和粗差探测过程进行了比较,证明两者在原理上基本等价,探测结果基本相近。文献[14]对独立等精度情形下部分最小二乘法和QUAD法进行了比较,得出其结果具有相同效果。文献[15]讨论了拟准检定法、LEGE法和部分最小二乘法在独立等精度时,粗差估值具有等价性,相关时有一定差异。
本文以粗差观测值定位一致前提下,基于均值漂移模型探讨粗差估值公式,导出观测值统计相关时平移参数的简明表达式。通过对LEGE法、QUAD法和PLS法的进一步分析,证明了LEGE法、QUAD法、PLS法这3种方法与数据探测法在粗差估值方面的异同。理论上给出了4种方法在观测值统计相关、独立(等权和不等权)情形下的估值公式及其差异,揭示了4种方法的理论本质和内在联系。
1均值漂移模型数据探测法及其参数估计
对于线性误差方程式
(1)
(2)
则式(1)变为
(3)
(4)
根据最小二乘原理得到估值[16]
(5)
(6)
式中,QVV=P-1-A(ATPA)-1AT;R=I-A(ATPA)-1ATP[17]。
顾及粗差的未知参数x的估值为[16]
AT(P-PH(HTPH)-1HTP)l
(7)
由附录的结果代入式(7),可得
(8)
顾及附录式(3)′,则式(5)可以表示为
(9)
2部分最小二乘法粗差估值公式的分析与比较
文献[11]将部分最小二乘法应用于粗差的定位与定值,式(1)可表示为
(10a)
(10b)
(11)
受污染的观测值l2对应的预测残差为[19]
(12)
此预测残差即为粗差的估值[11,18]。
(13)
因此数据探测法计算的粗差估值与部分最小二乘计算的粗差估值具有等价性。
(14)
3拟准检定法的粗差估值公式的分析与比较
应用最小二乘准则VTPV=min对误差方程式求解可以得到[17]
V=-Rl
(15)
R为幂等矩阵,且满足[10]
(16)
对于高斯马尔科夫模型而言,其理论模型为
l+Δ=Ax
(17)
式中,Δ为观测值的真误差。
式(17)两边左乘矩阵R得[10]
Rl+RΔ=RAx
结合矩阵R的性质得到
RΔ=-Rl=V
(18)
如果将Δ视为未知参数,得到秩亏Gauss-Markov模型[6]
RΔ=-Rl
(19)
于是式(19)的最小(加权)范数解为[10,20]
(20)
注意到PR是RP-1的对称自反g逆[20],易得验证式(20)中(RP-1RT)-=PR[10]。
式(20)两边乘以ATP得
(21)
为了求解秩亏方程,选择r(r≥u)个拟准观测值,拟准观测范数极小条件[9-10]
(22)
选第一组观测值l1为拟准观测值,则有
(23)
式(23)等价于
(24)
于是将式(18)和式(24)联立,得到方程[8]
(25)
(26)
现对前面的部分最小二乘法进行分析,式(11)代入式(12)整理得到[15]
(27)
(28)
由于RA=0,所以式(28)为
(29)
于是式(27)可表示为
(30)
比较式(30)和式(26)可知,用QUAD法解算的粗差估值和用部分最小二乘解算的结果一致。
(31)
4LEGE法的粗差估计的分析与比较
将平差因子阵、真误差分为两部分[7],于是式(18)可表示为
(32)
假设l2为受粗差污染的观测值,且R2Δ2对于观测值残差V的影响远大于R1Δ1[7]。于是略去式(32)中R1Δ1的影响,得到近似关系[7]
(33)
(34)
式(34)为受粗差污染观测值l2的真误差估值,表现为粗差的影响[7]。
由式(16)可得到[15]
RA=R1A1+R2A2=0
(35)
所以
R1A1=-R2A2
(36)
(37)
(38)
(39)
将式(39)代入式(34)得
(40)
对式(37)进一步分析
(41)
比较式(40)和式(41)可以看出,当观测值之间为独立等权时,LEGE法和数据探测法的粗差估值具有等价性。
从而可以得出,对于独立等权观测值而言,4种粗差的估值具有严格的等价关系。
5算例分析
算例1取文献[21]中水准网如图1所示。设观测值为6个观测高差,设已知点高程为1000m,观测值的协因数矩阵为
假设高差观测值l1中存在粗差,加入不同大小粗差,计算结果如表1所示。
图1 水准网Fig.1 Leveling network
表1 水准网内部可靠性与单个粗差检验
注:表中w上标a、b、c、d、e、f、g表示在高差观测值l1中分别加入1m、2m、3m、4m、5m、10m粗差后计算的检验统计量
现设计3种试验方案,方案1为观测值统计相关的情形,其协因数阵Ql为非对角阵;方案2仅取Ql的对角线元素的对角阵,即观测值统计独立不等权;方案3取协因数阵Ql为单位阵,即观测值统计独立等权,试验结果如表2所示。
表2 不同粗差估值结果比较
算例2取文献[6]中的GPS基线向量网,A和B为控制点,C、D、E和F是待定点。总共观测了13条独立基线,多余观测量为27个。控制点A和B的坐标和GPS网中各条基线向量的有关数据见文献[6],在此略。
为比较几种方法在粗差估计方面的情况,将0.4 m、-0.3 m、-0.2 m、0.3 m和-0.4 m共5个模拟粗差分别加在第5、15、21、31和第37号5个观测值上[20]。不同方法计算的粗差估值比较见表3。从表3的GPS网数据解算结果也可以看出几种方法的相互关系,其关系与前面理论分析一致。
表3 不同方法计算的粗差估计值比较
6结论
由于本文限于粗差已准确定位,这些方法的粗差探测和定位性能还有待深入研究。
参考文献:
[1]周江文. 经典误差理论与抗差估计[J]. 测绘学报, 1989, 18(2): 115-120.
ZHOUJiangwen.ClassicalTheoryofErrorsandRobustEstimation[J].ActaGeodaeticaetCartographicaSinica, 1989, 18(2): 115-120.
[2]BAARDAW.ATestingProcedureforUseinGeodeticNetworks[M].Delft:NetherlandsGeodeticCommission,PublicationonGeodesy, 1968.
[3]杨元喜. 抗差估计理论及其应用[M]. 北京: 八一出版社, 1993.
YANGYuanxi.RobustEstimationTheoryandItsApplications[M].Beijing:BayiPublishingHouse, 1993.
[4]YANGYuanxi,SONGLijie,XUTianhe.RobustEstimatorforCorrelatedObservationsBasedonBifactorEquivalentWeights[J].JournalofGeodesy, 2002, 76(6-7): 353-358.
[5]孙海燕, 黄华兵, 王喜娜. 多维平差问题粗差的局部分析法[J]. 测绘学报, 2012, 41(1): 54-58.
SUNHaiyan,HUANGHuabing,WANGXi’na.LocalAnalysisMethodonGrossErrorofMultidimensionalAdjustmentProblem[J].ActaGeodaeticaetCartographicaSinica, 2012, 41(1): 54-58.
[6]WOLFPR,GHILANICD.AdjustmentComputations:StatisticsandLeastSquaresinSurveyingandGIS[M]. 3rded.NewYork:Wiley, 1997.
[7]於宗俦, 李明峰. 多维粗差的同时定位与定值[J]. 武汉测绘科技大学学报, 1996, 21(4): 323-329.
YUZongchou,LIMingfeng.SimultaneousLocationandEvaluationofMultidimensionalGrossErrors[J].JournalofWuhanTechnicalUniversityofSurveyingandMapping, 1996, 21(4): 323-329.
[8]OUJikun.ANewMethodofIdentifyingandLocatingGrossErrors:Quasi-accurateDetection[J].ChineseScienceBulletin, 1999, 44(23): 2200-2204.
[9]欧吉坤. 粗差的拟准检定法(QUAD法)[J]. 测绘学报, 1999, 28(1): 15-20.
OUJikun.Quasi-accurateDetectionofGrossErrors(QUAD)[J].ActaGeodaeticaetCartographicaSinica, 1999, 28(1): 15-20.
[10]GUOJianfeng,OUJikun,WANGHaitao.Quasi-accurateDetectionofOutliersforCorrelatedObservations[J].JournalofSurveyingEngineering, 2007, 133(3): 129-133.
[11]王爱生, 欧吉坤. 部分最小二乘平差方法及在粗差定值与定位中的应用[J]. 测绘科学, 2005, 30(2): 70-72.
WANGAisheng,OUJikun.MethodofPartlyLeastSquaresandApplicationinGrossErrorLocationandEstimation[J].ScienceofSurveyingandMapping, 2005, 30(2): 70-72.
[12]徐培亮. 可剔除多个粗差的F-T法[J]. 武汉测绘科技大学学报, 1987, 12(2): 41-46.
XUPeiliang.AF-TMethodforOutliers[J].JournalofWuhanTechnicalUniversityofSurveyingandMapping, 1987, 12(2): 41-46.
[13]宋力杰, 杨元喜. 均值漂移模型粗差探测法与LEGE法的比较[J]. 测绘学报, 1999, 28(4): 295-300.
SONGLijie,YANGYuanxi.ComparisonbetweenDataSnoopingandLEGE[J].ActaGeodaeticaetCartographicaSinica, 1999, 28(4): 295-300.
[14]刘根友, 郝晓光, 柳林涛. 粗差检定的两种途径[J]. 大地测量与地球动力学, 2005, 25(3): 29-33.LIUGenyou,HAOXiaoguang,LIULintao.TwoApproachestoGrossErrorDetection[J].JournalofGeodesyandGeodynamics, 2005, 25(3): 29-33.
[15]王海涛, 欧吉坤, 袁运斌, 等. 估计观测值粗差三种方法的等价性讨论[J]. 武汉大学学报(信息科学版), 2013, 38(2): 162-166.WANGHaitao,OUJikun,YUANYunbin,etal.OnEquivalenceofThreeEstimatorsforOutliersinLinearModel[J].GeomaticsandInformationScienceofWuhanUniversity, 2013, 38(2): 162-166.
[16]李德仁, 袁修孝. 误差处理与可靠性理论[M]. 武汉: 武汉大学出版社, 2002.LIDeren,YUANXiuxiao.ErrorProcessingandReliabilityTheory[M].Wuhan:WuhanUniversityPress, 2002.
[17]周江文, 黄幼才, 杨元喜, 等. 抗差最小二乘法[M]. 武汉: 华中理工大学出版社, 1997.
ZHOUJiangwen,HUANGYoucai,YANGYuanxi,etal.RobustLeastSquaresMethod[M].Wuhan:HuazhongUniversityofScienceandTechnologyPress, 1997.
[18]王金岭, 陈永奇. 粗差数学期望平移模型的理论研究[J]. 武汉测绘科技大学学报, 1995, 20(2): 146-150.
WANGJinling,CHENYongqi.AResearchontheMeanShiftOutlierModels[J].JournalofWuhanTechnicalUniversityofSurveyingandMapping, 1995, 20(2): 146-150.
[19]宋力杰, 杨元喜. 论粗差修正与粗差剔除[J]. 测绘通报, 1999(6): 5-6, 38.SONGLijie,YANGYuanxi.DiscussionofOutlierCorrectionModelandDeletingModel[J].BulletinofSurveyingandMapping, 1999(6): 5-6, 38.
[20]郭建锋. 模型误差理论若干问题研究及其在GPS数据处理中的应用[D]. 武汉: 中国科学院测量与地球物理研究所, 2007.GUOJianfeng.TheoryofModelErrorsandItsApplicationsinGPSDataProcessing[D].Wuhan:InstituteofGeodesyandGeophysicsofChineseAcademyofSciences, 2007.
[21]KNIGHTNL,WANGJinling,RIZOSC.GeneralisedMeasuresofReliabilityforMultipleOutliers[J].JournalofGeodesy, 2010, 84(10): 625-635.
[22]王金岭, 陈永奇. 论观测值的可靠性度量[J]. 测绘学报, 1994, 23(4): 252-258.WANGJinling,CHENYongqi.OntheReliabilityMeasureofObservations[J].ActaGeodaeticaetCartographicaSinica, 1994, 23(4): 252-258.
(责任编辑:丛树平)
修回日期: 2016-03-08
Author:LUTieding(1974—),male,PhD,professor,majorsinerrortheoryandadjustment.
E-mail:tdlu@whu.edu.cn
【附录】
由关系式
(1)′
式(1)′相乘可得
(2)′
(3)′
于是矩阵相乘可表示为
(4)′
AT(P-PH(HTPH)-1HTP)A=
(5)′
AT(P-PH(HTPH)-1HTP)l=
(6)′
Comparison of Several Methods for Outlier Estimation
LU Tieding1,2,3
1. School of Geomatics, East China University of Technology, Nanchang 330013,China; 2. School of Geological and Surveying Engineering, Chang’an University, Xi’an 710054,China; 3. Key Laboratory of Watershed Ecology and Geographical Environment Monitoring, NASG, Nanchang 330013,China
Abstract:Computational problem of gross errors estimation is discussed based on the mean shift model, and the gross errors estimation formulas of the observed statistical correlation data snooping method are given. The relationships of gross errors estimation of the data snooping method, the method of simultaneous locating and evaluating multidimensional gross errors (LEGE), quasi-accurate detection of gross errors (QUAD) method and the partial least-squares (PLS) method are discussed. It is proved that ①in the case of correlated observations, calculation of gross errors estimation of the PLS method and the QUAD method are equivalent. However, these two methods are different with the data snooping method and the LEGE method; ②in the case of uncorrelated and unequal weight observations, calculation of gross errors estimation of the QUAD method, the PLS method and the data snooping method are equivalent, but these three methods are different with the LEGE method; ③in the case of uncorrelated and equal weight observations, calculation of gross errors estimated value of these four methods are equivalent. Finally, the case studies verify the conclusions.
Key words:mean shift data snooping; outlier estimation; the method of simultaneous locating and evaluating multidimensional gross errors(LEGE); quasi-detection of gross errors(QUAD); partly least squares(PLS)
中图分类号:P207
文献标识码:A
文章编号:1001-1595(2016)06-0656-07
基金项目:国家自然科学基金(41464001;41374007);测绘地理信息公益性行业科技专项(201512026);江西省教育厅科技项目(KJLD12077;GJJ13457);中国博士后基金(2012M511962);江西省远航工程计划(2013);江西省中青年教师发展计划访问学者专项(2012132)
收稿日期:2013-12-09
作者简介:鲁铁定(1974—),男,博士,教授,研究方向为误差理论与测量平差。
引文格式:鲁铁定.几种粗差估值方法的比较[J].测绘学报,2016,45(6):656-662. DOI:10.11947/j.AGCS.2016.20130745.
LU Tieding.Comparison of Several Methods for Outlier Estimation[J]. Acta Geodaetica et Cartographica Sinica,2016,45(6):656-662. DOI:10.11947/j.AGCS.2016.20130745.