APP下载

病态加权总体最小二乘模型的正则化抗差解法

2021-11-02邹时林王奉伟

大地测量与地球动力学 2021年11期
关键词:权函数病态正则

邹时林 吴 星 王奉伟

1 东华理工大学测绘工程学院,南昌市广兰大道418号,330013 2 东华理工大学勘察设计研究院,江西省抚州市学府路56号,344000 3 同济大学测绘与地理信息学院,上海市四平路1239号,200092

大地测量领域中部分解算模型如GPS快速定位[1-2]、大地测量反演[3-4]以及重力场向下延拓[5-6]等均存在病态问题。当模型病态时,常规的最小二乘解受系数阵的小奇异值影响而精度较低。为获得稳定、可靠的参数估值,部分学者提出一系列有偏估计,如Tikhonov正则化法[7]和TSVD(truncated singular value decomposition)正则化法[8]。当处理病态问题需同时顾及系数矩阵误差时,即病态总体最小二乘模型的解算,是当前测量数据处理研究的热点之一。Fierro等[9]基于广义奇异值分解(generalized singular value decomposition, GSVD)导出病态总体最小二乘问题的截断奇异值法; 葛旭明等[10]基于狭义正则化原理,推导出病态总体最小二乘问题的广义正则化解法; 孙同贺等[11]将Tikhonov正则化和TV正则化有效结合, 提出一种混合正则化解法; 文献[12-13]利用平差参数之间的相互独立性作为先验约束条件,导出病态总体最小二乘问题的虚拟观测值解法。然而,目前已有的病态总体最小二乘问题解法几乎全是在等权条件下推导得到的,对于观测值和系数阵精度不同的情形,缺少实用的解法。王乐洋等[14]将变量误差模型(errors-in-variables, EIV)线性化并用岭估计法解算病态加权总体最小二乘问题,由于线性化过程中舍去二阶项,估值的精度受到影响。在实际测量过程中,观测值除含有偶然误差外,往往还受到粗差的影响。当观测数据中含有粗差时,会极大影响参数估值,因此有必要研究病态总体最小二乘问题的抗差解法。目前有关抗差估计的研究多集中于最小二乘估计(least squares, LS)或总体最小二乘估计(total least squares, TLS), 鲜有关于病态加权总体最小二乘问题的抗差估计研究。本文首先建立病态加权总体最小二乘模型的正则化准则, 构建拉格朗日极值函数,利用Euler-Lagrange必要条件导出病态加权总体最小二乘模型的正则化解;在此基础上,针对观测值中的粗差,提出一种基于中位数法的病态加权总体最小二乘模型的正则化抗差解法。

1 等权病态总体最小二乘模型的正则化解

常用的变量误差模型(errors-in-variables, EIV)可表示为[15-16]:

y-ey=(A-EA)x

(1)

式中,y∈Rm和A∈Rm×n分别为观测向量和系数矩阵;ey∈Rm和EA∈Rm×n分别为观测向量和系数矩阵的误差;m、n分别表示观测值个数和未知参数个数。其随机模型为:

(2)

(3)

式中,α为正则化参数。根据式(3)可导出参数估值的迭代计算式:

(4)

2 病态加权总体最小二乘模型的正则化抗差解

2.1 正则化解

为不失一般性且顾及观测值和系数阵的协因数阵可记为:

(5)

(6)

式(6)即为病态加权总体最小二乘模型的正则化准则,由此可建立拉格朗日极值函数:

αxTx+2λT(y-Ax-ey+(xT⊗In)·eA)

(7)

式中,λ为联系数向量。将式(7)分别对各变量进行求导并令其为0,则:

(8a)

(8b)

(8c)

(8d)

由式(8a)和(8b)可得:

(9a)

(9b)

(9c)

将式(9)代入式(8c)可得:

(10)

将式(10)代入式(8d)可得:

(11)

(12)

通过推导可知,病态加权总体最小二乘模型的正则化解为:

(13)

(14)

现考虑等权情形,即取Qy=Im,Q0=In,Qx=Im,则:

(15)

将式(15)代入式(13)可得:

(16)

2.2 基于中位数法的正则化抗差解

当观测数据受到粗差污染时,参数估值必定会受粗差影响,严重时甚至会偏离真值。选取迭代法是应用较为广泛的抗差估计方法之一,其基本思想是根据参数估值的残差,利用等价权函数重构观测值的权重,并利用新的权值对参数估值进行迭代求解。对于病态加权总体最小二乘模型,利用式(13)求得正则化解后,由式(9a)和(9b)获得观测向量和系数矩阵元素的改正值,利用等价权函数对其重新定权,以IGG权函数为例:

(17)

(18)

(19)

(20)

3 算例分析

3.1 数值算例

第一类Fredholm积分方程为典型的病态问题,其基本形式为:

(21)

式中,K(x,y)为核函数,f(x)为真值函数,分别取为:

(22)

K(xj+1,yi)f(xj+1)]

(23)

(24)

图1 最小二乘解和总体最小二乘解

图2 正则化解、正则化抗差解与真值对比

模拟500次实验,每次实验均采用相同策略模拟随机误差和粗差,分别采用4种算法估计参数及其RMSE,结果见图3。由图可知,受病态性以及粗差影响,最小二乘解和总体最小二乘解的精度最差,其平均RMSE分别为0.137 3和0.407 7;正则化解可顾及系数阵的病态性及误差,其精度较最小二乘解和总体最小二乘解有较大提升,平均RMSE为0.006 0;正则化抗差解可顾及粗差的影响,通过等价权函数重构权阵,能有效抵御粗差的影响,其精度最高,平均RMSE为0.002 3。

图3 不同算法500次实验获得估值的RMSE

3.2 病态测边网算例

模拟一个病态测边网算例,该算例中共有9个坐标已知点和2个坐标未知点。其中,已知点与未知点的距离观测值已经给定(表1),图4为点位二维平面分布图。2个未知点位之间的观测距离为13.107 8 m,其真实三维坐标分别为(0,0,0)和(7,10,-5), 要求通过已知的距离观测值组建误差方程来求解未知点坐标。

表1 控制点坐标及距离观测值

图4 空间测边网平面点位分布

在该算例中,法矩阵的条件数为4.585 1×103,存在病态性。将1号点x坐标和2号点y坐标混入4~5 dm粗差,其余点坐标混入1~2 cm随机误差。与数值算例相同,分别采用4种算法估计参数,表2为不同算法获得的参数估值及其RMSE。由表可知,最小二乘解和总体最小二乘解受模型病态性和粗差影响,其精度较低,RMSE分别为4.573 8和10.876 3。从结果来看,总体最小二乘解受病态性和粗差的影响更加严重;正则化解可同时顾及系数阵和观测值的误差,并且可通过正则化参数削弱模型的病态性,其精度相比最小二乘解和总体最小二乘解有较大提升,RMSE为0.745 7;正则化抗差解在正则化解的基础上,利用等价权函数有效削弱粗差的影响,因此精度最高,RMSE为0.250 2。

表2 不同算法获得的参数估值及其RMSE

4 结 语

当变量误差模型的系数阵存在病态时,常规的最小二乘解和总体最小二乘解均不再适用。本文基于Tikhonov正则化原理,通过构建拉格朗日函数导出病态加权总体最小二乘模型的正则化解。当观测值和系数阵的权阵均取单位阵时,本文公式退化为等权病态总体最小二乘模型的正则化解。在此基础上,进一步提出基于中位数法的病态加权总体最小二乘模型的正则化抗差解法,该方法能够自适应地对观测值和系数矩阵元素进行分类定权,可提高等价权函数的有效性。算例分析结果表明,本文提出的正则化解法能够较好地处理病态加权总体最小二乘问题,并且当模型混入粗差时,正则化抗差解法能够自适应地重构权阵以抵御粗差的影响,得到较为稳定且可靠的参数估值。

猜你喜欢

权函数病态正则
基于改进权函数的探地雷达和无网格模拟检测混凝土结构空洞缺陷工程中的数学问题
一类广义的十次Freud-型权函数
病态肥胖对门诊全关节置换术一夜留院和早期并发症的影响
病态肥胖对门诊关节置换术留夜观察和早期并发症的影响
异径电磁流量传感器权函数分布规律研究*
剩余有限Minimax可解群的4阶正则自同构
类似于VNL环的环
君子之道:能移而相天——王夫之《庄子解》对“社会病态”的气论诊疗
两类ω-超广义函数空间的结构表示
有限秩的可解群的正则自同构