基于Kullback-Leiber距离粗差探测的Bayes方法*

2012-11-14王延停归庆明张倩倩

大地测量与地球动力学 2012年2期

关键词：后验度量方差

王延停归庆明张倩倩

(1)解放军信息工程大学理学院，郑州 450001 2)解放军信息工程大学测绘学院，郑州450052)

基于Kullback-Leiber距离粗差探测的Bayes方法*

王延停1)归庆明1，2)张倩倩1)

(1)解放军信息工程大学理学院，郑州 450001 2)解放军信息工程大学测绘学院，郑州450052)

从影响分析角度，基于Kullback-Leiber距离提出了粗差探测的Bayes方法。对非等权独立观测情形，在一定先验分布下，对数据删除模型、方差膨胀模型和均值漂移模型进行了比较分析，给出3种模型相应的Kullback-Leiber距离的计算公式，建立了粗差探测的判别法则。最后将该方法应用于边角网的粗差探测，取得了较好的效果。

Bayes方法;影响分析;Kullback-Leiber距离;粗差探测;方差膨胀模型

1 引言

在我国，就粗差探测研究而言，起步较晚，相应成果发表甚少［1］。归庆明等［2，3］提出的基于事件后验概率的粗差探测法和基于真误差的后验概率法，没有给出判别粗差的阈值且运算复杂，计算效率低下，从而使这些方法还只停留在理论研究上。李新娜等［4］提出的基于识别变量的后验概率法，解决了多个粗差的探测问题，并讨论了粗差的掩盖和淹没现象，同时引入MCMC等现代统计计算方法，大大提高了计算效率。衡广辉等［5］提出的相关观测粗差探测的Bayes方法，对相关观测数据的粗差探测进行了讨论。考察这些粗差探测方法［2-10］，都不是从影响分析的角度进行研究。为此，本文从影响分析角度，基于Kullback-Leiber距离，根据测量平差实际，运用Bayes统计理论和方法［11］，给出了数据删除模型、方差膨胀模型和均值漂移模型相应的距离计算公式，建立了粗差探测的判别法则，提出了基于Kullback-Leiber距离的粗差探测的Bayes方法。最后将该方法应用于边角网的粗差探测，取得了很好的效果。

2 3种扰动模型参数的后验分布

其中L=(L1，L2，…，Ln)T为n×1观测值向量，A= (a1，…，an)T为n×1设计矩阵且列满秩，X为t×1未知参数向量，Δ=(Δ1，…，Δn)T为n×1观测误差向量为未知单位权方差。记P=diag(p1，…，pn)，τ=

假定参数(X，τ)服从正态-伽玛先验分布，即{X |τ}～Nt(X0，τ-1)，τ～Γ(α0，α1)，其中X0为给定的t×1向量，Σ0为给定的t×t阶正定矩阵，α0和α1为给定的常数。

定理1 参数X、τ的后验分布以及X的边缘后验分布分别为

将上式在X的参数空间内积分，即可证式(3)。同理将上式对τ积分，即可证式(4)。

考虑测量平差的Gauss-Markov模型，第i个观测值相应的数据删除模型、方差膨胀模型和均值漂移模型分别为:

定理2 在上述假定下，关于参数X、τ的后验分布以及X的边缘后验分布结果有:

其中，τ的后验分布为Gamma分布，各变量的具体表达式为:

证明过程类似定理1，在此忽略。

3 3种扰动模型参数的影响度量

设p1、p2分别为两个分布的密度函数，定义两个分布的Kullback-Leiber距离为

K(p1，p2)是衡量两个分布接近程度的一种很好的度量，因此可应用这个距离作为Bayes估计的影响度量。

定义

Ki(X)反映了第i个观测值删除前后对于X的Bayes估计的影响。它的值越大，则基于L求得的X的Bayes估计和基于L(i)求得的X的Bayes估计的差异越大，因而第i个观测值对于X的Bayes估计的影响也越大。定义

它反映了第i个观测值方差膨胀前后对于参数X的Bayes估计的影响。定义

它反映了第i个观测值均值漂移前后对于参数X的Bayes估计的影响。

定理3 在上述假定下，第i个观测值关于Bayes估计的影响度量有:

1)对于数据删除模型

2)对于方差膨胀模型

3)对于均值漂移模型

因此3种扰动模型的影响度量在形式上是统一的，都是Cook距离与协方差统计量形成的距离的叠加。又因为3种扰动模型的有关参数的统计性质相同，所以用它们研究第i个观测值关于Bayes估计的影响度量的推断结果也相同。

4 基于Kullback-Leiber距离的粗差探测

在实际应用中，首先计算得到每个观测值的Kullback-Leiber距离的大小，然后相互比较各个观测值之间的距离大小，如果一个观测值的Kullback-Leiber距离相对较大，就认为该观测值的影响较大。但大到何种程度，该点才能称为粗差?该方法中没有一个客观而明确的基准值作为判断标准。为解决这一问题，我们对Kullback-Leiber距离的基准值作如下探讨。

假定每一观测值的Kullback-Leiber距离相同，也即影响相同，那么

如果第i个观测值的Kullback-Leiber距离满足

5 算例与分析

算例取自文献［12］中的边角网。网中共观测了12个角度和6个边长，测角中误差为±1.5″，测边中误差为±2.0 cm。为检验本文提出的Bayes方法的粗差定位性能，我们对第14个观测值加上-14.0 cm的模拟粗差，并按照文中方法进行计算(表1)。通过表1我们可以看到，当α=0.05，c=1.64时，对于数据删除模型、方差膨胀模型和均值漂移模型，均可判定第14个观测值为粗差。

表1 按3个模型进行的粗差探测计算Tab.1 Computation of gross error detection with the three models

6 结论

1)本文从影响分析角度，在非等权独立观测情形及正态-伽玛先验分布下，给出了基于Kullback-Leiber距离的粗差探测的Bayes方法;

2)对基于Kullback-Leiber距离的影响度量给出了一种确定粗差的方法;

3)根据3种扰动模型的影响度量的计算公式及有关参数的统计性质，得出它们研究第个观测值关于Bayes估计的影响度量相同。

1 韦博成，鲁国斌，史建清.统计诊断引论［M］.南京:东南大学出版社，1991.(Wei Bocheng，Lu Guobin and Shi Jianqing.Introduction to statistical diagnostics［M］.Nanjing:Publishing House of Dongnan University，1991)

2 归庆明，等.粗差探测的Bayes方法［J］.测绘学报，2006，35(4):303-307.(Gui Qingming，et al.Bayesian method for detection of gross errors［J］.Acta Geodaetica et Cartographic Sinica，2006，35(4):303-307)

3 归庆明，等.基于观测误差后验分布的粗差探测的Bayes方法［J］.测绘科学技术学报，2007，24(2):87-89.(Gui Qingming，et al.Bayesian approach to detection of gross errors based on posterior distribution of observation error［J］.Journal of Zhengzhou Institude of Surveying and Mapping，2007，24(2):87-89)

4 李新娜，归庆明，许阿裴.基于识别变量的粗差探测的Bayes方法［J］.测绘学报，2008，37(3):355-360.(Li Xinna，Gui Qingming and Xu Apei.Bayesian method for detection of gross errors based on classification variable［J］.Acta Geodaetica et Cartographic Sinica，2008，37(3):355 -360)

5 衡广辉.相关观测粗差探测的Bayes方法及其在GPS网平差中的应用［D］.解放军信息工程大学，2009.(Heng guanghui.Bayesian methods for gross errors detection of correlated observations and its application in GPS network adjustment［D］.Information Engineering University，2009)

6 Abraham B and Box G E P.Linear models and spurious observations［J］.Appl Statist.，1978:131-138.

7 Ethrog U.Statistical test of significance for testing outlying observations［J］.Survey Review，1991，31(240):62-70.

8 Baarda W A.Test procedure for use in geodetic networks［J］.Neth Geod Comm Publ Geod，New Ser.，1968，2 (5):27-55.

9 Box G E P and Tiao G C.A Bayesian approach to some outlier problems［J］.Biometrika，1968，55:119-129.

10 Cox D R and Weisberg S.Diagnostics for heteroscedasticity in regression［J］.Biome-trika，1983，70:1-10.

11 茆诗松.贝叶斯统计［M］.北京:中国统计出版社，1999.(Mao Shisong.Bayesian statistics［M］.Beijing:Publishing House of Chinese Statistics，1999)

12 崔希璋，於宗俦，陶本藻.广义测量平差(新版)［M］.武汉:武汉测绘科技大学出版社，2001.(Cui Xizhang，Yu Zhougchou and Tao benzao.Generalized surveying adjustment(new edition)［M］.Wuhan:Publishing House of Wuhan Technical University of Surveying and Mapping，2001)

BAYESIAN APPROACH TO DETECTION OF GROSS ERRORS BASED ON DIVERGENCE OF KULLBACK-LEIBER

Wang Yanting1)，Gui Qingming1，2)and Zhang Qianqian1)

With the view of influence analysis，a new Bayesian method for gross errors detection based on divergence of Kullback-Leiber is proposed.Under the condition of unequal weight and independent observations，a comparison among the data deletion model，the variance inflation model and the mean shift model based on certain prior distribution is made，and the computational formula of divergence of Kullback-Leiber about the three models is given and a judge rule of gross error detection is established.Finally，the method is used for gross error detection in triangulateration network and a good result is obtained.

Bayesian method;influence analysis;Kullback-Leiber divergence;gross errors detection;variance inflation model

1671-5942(2012)02-0051-05

2011-11-24

国家自然科学基金(40974009);郑州市科技计划攻关项目(0910SGYG21198)

王延停，男，1986年生，硕士研究生，主要从事误差理论和测量数据处理等方面的研究.E-mail:wangyanting454799@163.com

P227;P207

(1)Institute of Science，Information Engineering University，Zhengzhou 450001 2)Institute of Surveying and Mapping，Information Engineering University，Zhengzhou 450052)