APP下载

残差自适应回归TLS*

2012-11-14陈西江花向红鲁铁定翟高鹏杨燕景

大地测量与地球动力学 2012年3期
关键词:曲线拟合回归方程残差

陈西江 花向红 鲁铁定 翟高鹏 杨燕景

(1)武汉大学测绘学院,武汉 430079 2)武汉大学灾害监测与防治研究中心,武汉 430079 3)东华理工大学测绘工程学院,抚州 344000 4)河北省测绘产品质量监督检验站,石家庄050000)

残差自适应回归TLS*

陈西江1,2)花向红1,2)鲁铁定3)翟高鹏4)杨燕景3)

(1)武汉大学测绘学院,武汉 430079 2)武汉大学灾害监测与防治研究中心,武汉 430079 3)东华理工大学测绘工程学院,抚州 344000 4)河北省测绘产品质量监督检验站,石家庄050000)

TLS在拟合及推估过程中,其拟合和推估的残差会随着观测数据量的增加而呈现上扬的趋势,为了抑制残差的上扬,将自适应回归模型引入到TLS的拟合及推估中,采用适宜的回归模型对经过灰色数据处理的残差进行分析,将分析的结果与TLS的拟合和推估结果进行组合以减弱残差的影响,从而对整体的残差起到了抑制的作用。经过实例分析,验证了该方法的可行性。

TLS;残差;自适应回归;拟合;回归模型

1 前言

总体最小二乘是在最小二乘基础上发展起来的同时考虑自变量和因变量误差的模型,众多学者对其进行了深入的研究,文献[1]推导了正交TLS模型,Schaffrin[2,3]等人研究了带权情况下的 WTLS,Van Huffel和 Vandewalle[4]给出了混合 LS-TLS模型,该模型对于整体误差起到了平滑作用。但并没有起到抑制残差的作用,在利用拟合确定参数后的TLS模型进行推估的时候仍将带有误差的原始观测数据x、y作为自变量,这样推估的结果不仅具有本身的误差vz,还将自变量的误差vx、vy转嫁到所需推估的变量上,其推估的精度就会降低,从而造成了推估残差的凸凹现象,为了平滑推估残差的凸凹及抑制残差上扬的趋势,本文将自适应回归模型引入到TLS模型中,对TLS的初始拟合残差进行分析,确定适宜的残差回归模型来对残差进行推估,从而可以抵消TLS推估残差的凸凹及上扬,提高了TLS拟合及推估的精度。

2 TLS模型

总体最小二乘的基本数学模型为

文献[5]提出了同时顾及x和y相互影响的TLS模型:

本文考虑到对TLS解算结果的稳定性,采用文献[1]提出的正交TLS模型:

将式(3)一元正交TLS模型延伸到多元,则:

3 TLS残差自适应回归模型的构建

3.1 基于TLS残差的灰色处理

残差自适应回归TLS的基础是对TLS模型的残差进行分析,根据原始观测数据,利用正交TLS的性质,可以解得参数a、b、c的值,根据公式(6)得到因变量的拟合值[…],并利用公式(7)将拟合值与真值[z1z2… zn]进行残差处理得到残差vi:

由于拟合残差较小或者可能存在负值,利用公式(8)适当加一常数b把vi序列变为非负Vi,即

根据灰色理论的数据预处理,为了较为准确地对残差序列Vi进行趋势分析,需要对Vi做一次累加以凸显其规律性,得出生成序列,即:

式中

其中i为时间序列,an、a、b、c为待定系数。

3.2 自适应回归模型的构建

根据处理之后的残差数据,利用最小二乘对式(11)、(12)、(13)中的未知参数an、a,b,c进行解算,最终可确定多项式、冥函数、指数曲线方程,根据前n序列的已有拟合残差信息,利用曲线回归方程对残差信息进行拟合,并进行拟合结果误差的解算,从而得到多项式曲线拟合中误差、冥函数曲线拟合中误差、指数曲线拟合中误差,其中,对于多项式曲线拟合回归方程,如果项数太多,就会陷入过拟合现象,因此本文选用常用的二项式、三项式、四项式曲线回归方程。根据拟合结果图,剔除偏离残差离散点最大的曲线回归方程,对剩余的曲线拟合中误差进行对比分析,为了同时能够顾及到拟合精度及过度拟合的情况下,将拟合精度最低和拟合精度最高的曲线回归方程排除,再对剩余的曲线拟合中误差进行对比分析,最终将拟合精度较高的回归方程f (i)作为的推估方程,利用f(i)计算n+i时刻的推估值,对进行累减得出残差Vi的推估值,再将所加入的常数b消去,便得到TLS拟合残差vi的推估值。最终利用式(6)对推估样本进行推估,得到初始推估值,将初始推估值与残差推估值进行结合,形成最终的TLS推估值zi:

4 实例分析

以文献[6]中例5.4的数据作为样本(表1),将温度、压力作为自变量,变形值作为因变量,将20组观测数据分为两部分,前15组数据作为拟合样本,后5组数据作为推估样本,利用公式(5)对拟合样本进行拟合得到总体最小二乘的参数为a= 0.397 1,b=-0.055,c=0.916 1,根据所求的参数利用公式(6)对变形值进行拟合,并将拟合结果与原始数据相减得到拟合残差。

表1 观测数据Tab.1 Observations

通过公式(8)、(9)对拟合残差进行处理,利用几种常用的曲线回归方程对处理结果的V1i进行拟合(图1)。

图1 曲线拟合Fig.1 Curve fitting

通过图1可直观判定能够较为准确拟合V1i的曲线方程为多项式或冥函数回归方程,根据最小二乘解算原则,确定这两种曲线回归方程为:

从表2可知二项式曲线回归方程拟合精度最低、四项式曲线回归方程拟合精度最高,在综合考虑拟合精度及过拟合现象的情况下,将二项式、四项式曲线拟合方程去除,对于三项式及冥函数曲线拟合方程,确定精度较高的三项式曲线拟合方程为V1i的回归模型。利用式(16)与(6)组成的残差自适应回归TLS对原始观测数据进行模拟及推估,并将模拟,推估结果与最小二乘、TLS进行对比分析,结果如表3、4所示。从表3可知,TLS、最小二乘模拟精度相当,而残差自适应回归TLS模拟精度要优于其他两种方法;从表4可明显看出残差自适应回归TLS推估精度较优于其他两种方法,同时从推估残差可看出,其残差分布较为平滑,不会出现太大的凸凹,从而抑制了残差的上扬趋势,增强了模型的稳定度,提高了拟合精度。

表2 曲线拟合误差对比分析Tab.2 Comparison of curve fitting error

表3 三种模型的模拟值对比分析Tab.3 Comparison among the simulation values with three models

表4 三种模型的推估值对比分析Tab.4 Comparison among the estimation values with three models

5 结论

本文对拟合后的数据进行了分析,将几种常用的回归模型引入到拟合残差中,对不同回归模型的拟合精度进行了评价分析,选取最佳的回归模型作为拟合残差的推估模型并对拟合残差进行模拟及推估,实现了残差的推估,同时随着序列号的增加,其模型推估的残差也呈现出上扬趋势,因此对残差进行分析并将残差推估结果与观测数据的TLS推估结果进行结合,实现了残差的平滑处理,提高了推估精度。

由于对残差序列的分析采用的是几种常用的回归模型,而这几种回归模型是否适用于所有变形体拟合后的残差序列,对多项式曲线拟合过程中,次数越高,模拟精度越高,但推估的精度可能会降低,怎样平衡残差的拟合精度与推估精度及怎样选用最佳回归方程将有待进一步探讨。

1 张贤达.矩阵分析与应用[M],北京:清华大学出版社,2004.(Zhang Xianda.Matrix analysis and applications[M].Beijing:Tsinghua University Press,2004)

2 Schaffrin B and Felus Y A.On total least squares adjustment with constraints[J].A Windows on the Future of Geodesy,2005,128(4):417-421.

3 Felus Y and Schaffrin B.Performing similarity transformations using the Errors-In-Variables Model[R].American Society for Photogrammetry and Remote Sensing(ASPRS) Annual Meeting,2005.

4 Huffel S Van and Vandewalle J.The least square problem: Computational aspects and analysis,Frontiers in Appl[R].Math.SIAM,Philadelphia,1991.

5 鲁铁定,陶本藻,周世健.基于总体最小二乘法的线性回归建模和解法[J],武汉大学学报(信息科学版),2008,33(5):504-507.(Lu Tieding,Tao Benzao and Zhou Shijian.Modeling and algorithm of linear regression based on total Least squares[J].Geomatics and Information Science of Wuhan University,2008,33(5):504-507)

6 邱卫宁,等.测量数据处理理论与方法[M].武汉:武汉大学出版社,2008.(Qiu Weining,et al.The theory and method of surveying data processing[M].Wuhan:Wuhan University Press,2008)

RESIDUALS ADAPTIVE REGRESSION TLS

Chen Xijiang1,2),Hua Xianghong1,2),Lu Tieding3),Zhai Gaopeng4)and Yang Yanjing3)

(1)Institute of Surveying and Mapping,Wuhan University,Wuhan 430079 2)Hazard monitoringamp;prevention Research Center,Wuhan University,Wuhan 430079 3)Institute of Surveying and Mapping,East China Institute of Technology,Fuzhou 344000 4)The Station of Quality Supervision and Inspection about Surveying and Mapping Products,Shijiazhuang050000)

The TLS fitting and estimation residuals will be upward with the increasing in the amount of observed data in the process of TLS fitting and estimation.In order to curb the trend,the adaptive regression is introduced to the TLS fitting and estimation.The appropriate regression model is used to analyze the residuals handled by gray method.The results of residual analysis is combined to the results of TLS fitting and estimation to weaken the impact of residuals.The experimental results confirm the feasibility of the method.

TLS;residual;adaptive regression;fitting;regression model

1671-5942(2012)03-0090-04

2011-12-26

国家自然科学基金(41174010,41074025);精密工程与工业测量国家测绘地理信息局重点实验室开放基金(PF2011-17)

陈西江,男,1985年生,博士研究生,主要从事三维激光点云数据处理研究工作.E-mail:cxj_0421@163.com

P207

A

猜你喜欢

曲线拟合回归方程残差
基于双向GRU与残差拟合的车辆跟驰建模
不同阶曲线拟合扰动场对下平流层重力波气候特征影响研究*
采用直线回归方程预测桑瘿蚊防治适期
线性回归方程的求解与应用
线性回归方程要点导学
基于MATLAB 和1stOpt 的非线性曲线拟合比较
基于残差学习的自适应无人机目标跟踪算法
浅谈Lingo 软件求解非线性曲线拟合
基于递归残差网络的图像超分辨率重建
走进回归分析,让回归方程不再是你高考的绊脚石