APP下载

基于遗传算法的极短弧定轨(续)∗

2016-06-27李鑫冉王歆

天文学报 2016年2期
关键词:弧长残差遗传算法

李鑫冉 王歆

(1中国科学院紫金山天文台 南京 210008) (2中国科学院空间目标与碎片观测重点实验室 南京 210008) (3中国科学院大学 北京 100049)

基于遗传算法的极短弧定轨(续)∗

李鑫冉1,2,3†王歆1,2‡

(1中国科学院紫金山天文台 南京 210008) (2中国科学院空间目标与碎片观测重点实验室 南京 210008) (3中国科学院大学 北京 100049)

采用遗传算法解决极短弧定轨问题时,由于遗传算法不同于经典方法的计算过程,野值剔除方法不再适用.在遗传算法中通过在适值函数中采用不同损失函数实现了稳健估计,解决了极短弧定轨中的野值处理问题.在遗传算法中不同损失函数的引入较经典方法大大简化.通过对多种损失函数的计算比较,表明采用最小中值二乘(LMS,Least M edian Square)和截尾最小二乘(LTS,Least Trimm ed Square)估计可大幅度提高极短弧定轨的稳健性,具有极高的崩溃点.

航天器,天体力学,方法:数值,统计

1 引言

近年来空间目标的巡天观测采集了大量数据,但不同于传统的跟踪观测,巡天方式采集到的弧段都十分短,往往只有数十秒.为了有效利用这些数据,极短弧(TSA,Too Short A rc)定轨越来越受到关注[1].

由于短弧定轨问题本质上是病态的,极短弧的病态性更为突出,传统方法几乎无法获得合理的结果.文献[2]将遗传算法用于解决极短弧定轨问题,采用遗传算法将定轨问题转换为优选问题,避免了求解线性代数方程,从而克服了经典方法的一些不足.遗传算法也不同于经典优选算法,对初值没有特殊要求,不容易陷入局部极值,因此是解决极短弧定轨的一种有效手段.文献[3]采用完全不同的变量和遗传算子,也给出了一种遗传算法求解极短弧定轨的具体方法.

上述研究给出了轨道计算方法,但都没有涉及野值剔除的问题.在实测资料的初轨计算中,野值问题是不可回避的,观测数据中的少量野值会对计算结果产生很大影响,甚至是破坏性的[4].最常见的野值处理的方法是采用3σ准则,在迭代过程中对于大偏差的观测资料进行剔除,使其不参与轨道计算,逐步收敛后得到可靠的结果.遗传算法不同于经典计算过程,无法采用这样的野值剔除过程.同时由于野值的判断与剔除需要在轨道计算过程中逐步确定,而剔除本身影响轨道计算结果,因此野值剔除并不容易.

野值处理的另一种手段是采用稳健估计方法,文献[5]在轨道计算中采用了M估计,但其求解方法比较复杂,特别是需要可靠初值,可靠初值获取本身就是一个难题,受此局限方法的崩溃点不高.此外方法中引入了额外的参数,参数确定尚无可靠手段.文献[5]中根据历史数据的统计特性给出参数,然而对于极短弧数据而言,由于数据量少,这种做法并不合适.

文献[6-7]采用了最小一乘(LAD,Least Absolute Deviation)估计,由于最小一乘估计无需额外参数,避免了参数确定问题,但其求解采用了线性规划方法,该方法和一般计算过程完全不同,仅适用于最小一乘这一特例情况.

在初轨计算的实践中,野值剔除是不可或缺的环节.本文在文献[3]的工作基础上对遗传算法中野值的处理进行了讨论,根据遗传算法的特点采用了稳健估计方法来克服野值的影响,并对几种损失函数进行了分析,建立了基于遗传算法的稳健初轨计算方法.

2 初轨计算的遗传算法

遗传算法是通过模拟自然进化优胜劣汰的过程来搜索问题的最优解,算法将问题的解向量编码为染色体,通过遗传操作实现染色体的进化,从而找到全局最优解[8].

为了后续阐述方便,简要回顾一下文献[3]的方法.其基本思路是将定轨问题转换为分层优化问题,先优选(a,e,M0)3个Kep ler根数,然后保持(a,e,M0)不变,再优选(i,Ω,ω) 3个Kep ler根数.与文献[2]选择了观测首末时刻的斜距(ρ1,ρ2)作为优选变量不同,采用轨道根数作为优选变量解除了和观测资料的耦合,便于资料处理,不受特定资料误差的影响.采用(ρ1,ρ2)作为优选变量时,轨道量无法通过优选变量直接得到,需要结合对应时刻的观测量才能得到,对应的观测资料则尤为重要,其误差将直接影响计算结果,当其为野值时,解将会完全失败并且无法克服.

与优选法相同,采用遗传算法初轨计算主要是要构造对比量,将对比量采用优选变量以及优选量结合观测量分别构造.文献[3]选择了两个观测时刻的真近点角f的差作为对比量,令仅采用优选变量构造的f的差记为Δfc,而采用优选量结合观测量构造的记为Δfo,两者的差为残差ϵ=Δfo−Δfc.对于n个观测资料共可形成N=C2n个对比量,其残差记为ϵi,i=1,2,···,N.轨道计算问题即求下列适值函数最小的解:

计算中按照适值函数对每个染色体进行适应度评估,然后通过选择、交叉、变异的遗传操作,使染色体不断进化从而获得适应度更好的新种群,最终获得最优解.

不同于经典方法逐步逼近的过程,遗传算法是基于种群的计算方法,在进化(迭代)过程中遗传操作对原种群是破坏的,3σ剔除方法将前一次迭代结果作为后一次迭代的参考,对于遗传算法显然是不适用的.从遗传算法计算过程中可看出,只需要调整(1)式的适值函数,无需对其他计算环节进行任何改变即可实现不同适值函数的初轨计算.较经典计算框架而言十分简便.在遗传算法中采用稳健估计方法处理野值问题是非常合适的.

3 损失函数

3.1 最小二乘(OLS,O rd inary Least Square)

在遗传算法中,(1)式被称为评价函数或适值函数,是残差的函数,因此在估计理论中一般称为损失函数.不同估计方法主要区别在于不同的损失函数形式.(1)式即为最常用的OLS估计的损失函数.OLS方法自Gauss提出以来,已成为数据处理中使用最为广泛的方法,甚至成为了一种事实上的标准.

OLS估计计算方法简便,在误差正态分布且没有野值的情况下,解具有最优的性质.但当误差偏离正态分布以及有野值时,OLS方法是不稳健的,主要原因在于以残差平方和作为损失函数时,对于大的残差在平方作用下将会放大,解会更倾向于大残差的观测数据,从而会使解彻底偏离.由于经典初轨计算中都采用OLS估计,因此必须对野值进行处理,不然在实践中几乎无用.

3.2 最小一乘(LAD)

为了避免平方对残差放大这一影响,改用LAD方法成为了自然的想法.文献[6-7]采用LAD估计实现了稳健初轨计算,LAD估计的损失函数为:

LAD方法的出现早于OLS方法,但由于其求解比较困难,一直没有得到重视.直到20世纪中期由于其稳健性才重新被人们重视.理想情况下LAD解的统计性质原不及OLS解,但即使在少量野值存在时,LAD也不易受到野值影响,此时OLS解的优良统计性质也不再有任何优势[9].

3.3 最小中值二乘(LM S)

LAD估计的稳健性是相对于观测矩阵的,对于设计矩阵并不稳健,因此并不是完全稳健的,此外LAD估计的解不唯一.针对这些缺陷,文献[10]提出了LMS估计,结合LAD估计和OLS估计各自的优点,其损失函数为:

其中medi表示对所有i取其中位数.显然,采用该损失函数时解是唯一的,同时个别大残差对损失函数并无贡献,LMS估计具有理论最高崩溃点,接近50%.LMS解也具有十分明确的几何意义,即覆盖一半观测资料的最窄带的中线,LMS估计直观上十分适合轨道计算.

3.4 截尾最小二乘(LTS)

从稳健性角度来看,LMS估计具有极好的特性,但其渐近效率较低,这对于定轨问题而言并不重要.文献[10]在LMS估计基础上,提出了LTS估计,等价于损失函数:其中ϵ2r:N表示对于N个残差ϵ2i按照从小到大排序后第r个值,[N/2]表示不大于N/2的最大整数.可见LTS估计与OLS估计十分类似,区别在于仅考虑最小的[N/2]+1个残差. LTS估计保留了OLS估计的渐近效率,同时和LMS估计具有相同的高崩溃点.

除OLS估计外,上述3个估计都是稳健估计,但与常用的Huber估计以及Hample估计不同,这3个估计准则中都不需要额外的参数.

4 数值验证

根据前面的分析,在文献[3]的基础上,只需对适值函数做很小的变化即可实现上述损失函数.采用和文献[3]相同的中国科学院空间目标与碎片光学观测网中的一圈实测资料进行了数值验证,资料精度优于5′′,采样频率1 Hz.选取弧段开始的不同弧长进行了计算.历元选择为第1个观测时刻,算法中参数和文献[3]完全相同.

首先为了考察不同损失函数在无野值情况下的计算结果,对于60 s的弧段分别采用不同损失函数进行了计算,结果见表1.计算中采用了缺省的随机数种子,其中POD表示由多天多站精密定轨得到的结果,作为参考标准,OLS为最小二乘法的结果,和文献[3]中的结果一致.LAD、LTS、LMS分别为对应损失函数的结果,在求解(a,e,M0)和(i,Ω,ω)中采用了相同的损失函数.

表1 采用不同损失函数时60 s弧长的轨道根数Tab le 1 The resu lts of 60-second arc length with d ifferen t loss fun ctions

由表1可见,在无野值的情况下,4种方法得到的结果相当,在精度范围内是一致的.理论上OLS估计具有最好的统计性质,但对于极短弧定轨而言,精度要求不高而且较少的观测资料在统计性质上与正态分布的偏差相对更大,OLS估计的优势并不能显现.

为了比较不同方法的稳健性,对观测资料引入野值.野值选取来自[120′′,240′′]的均匀分布,对不同野值比例分别采用4种损失函数进行了计算.考虑到随机数种子对计算的影响,对每组采用不同随机数种子计算了10次.表2给出了10 s弧长情况下对于初轨计算最为关心的轨道半长径a的结果,其中p为野值比例,¯a、amin和amax分别为10次计算结果的平均值、最小值和最大值.可明显看出:当p>10%时,OLS估计已无法保证结果的可靠性,出现较大偏差,超出了精度范围;p=40%时,LAD估计出现一定偏差,而LMS估计和LTS估计仍获得了可接受的结果.

图1给出了20 s弧长的计算结果,在相同野值比例情况下,LTS估计和LMS估计结果比较接近,OLS估计结果偏离比较大,LAD估计结果在p=40%时出现了较大偏离,和10 s弧长结果类似.图2给出了30 s弧长下的计算结果,横向比较每种方法随着野值增多后的表现,可明显看出:对于OLS估计,随野值增加结果变化很大,LAD方法的结果变化有一定范围,但变化缓慢,LMS估计和LTS估计则随着p的增加变化不大.

表2 10 s弧长不同野值比例下的轨道半长径aTab le 2 T he sem i-m a jor ax is a of 10-secon d arc length with d ifferen t p rop or tion s of ou tliers

LMS估计和LTS估计在理论上效果非常接近,仅在渐近效率上有所区别.由于渐近效率在极短弧定轨中并不是主要问题,从计算结果看,两者也确实十分类似,从处理的数据结果来看,LMS略微占优.结合极短弧定轨问题本身的特点,在日常计算中推荐使用LMS估计或LTS估计代替OLS估计.

5 结论与讨论

短弧定轨问题观测数据较少,即便可采用野值剔除手段,由于剔除标准是在迭代过程中建立的,在前几次迭代中不当剔除反而会对解产生较大的影响,迭代中可用资料数量大大减少,对解的稳定收敛会有较大影响.由于剔除标准总是以当前解作为参考,这种做法显然也会对收敛至全局最优解产生影响.遗传算法过程中无法使用野值剔除方法,采用稳健估计方法可有效克服野值带来的影响,而且在遗传算法过程中引入不同的损失函数几乎不增加额外负担.

图1 不同野值比例下20 s弧长的结果Fig.1 T he resu lts of 20-second arc length with d ifferen t p rop ortions of ou tliers

图2 不同野值比例下30 s弧长的结果Fig.2 T he resu lts of 30-second arc length with d ifferen t p rop ortions of ou tliers

综合本文和文献[3],采用遗传算法后经典计算框架下的各种处理手段都可有效利用,并且引入的方法直观、简洁,较原有计算框架大大简化,能够满足实测数据处理的各种需求.

本文讨论不仅针对遗传算法,由于绝大多数的现代优化方法都有类似的情况,结果也可应用于这些算法.

[1]M ilani A,Knezevic Z.CeM DA,2005,92:1

[2]Ansa lone L,Cu rti F.A d SpR,2013,52:477

[3]李鑫冉,王歆.天文学报,2016,57:66

[4]吴连大.人造卫星和空间碎片的轨道和探测.北京:中国科学技术出版社,2011:181-210

[5]贾沛璋,吴连大.天文学报,2000,41:123

[6]王歆.天文学报,2013,54:274

[7]W ang X.ChA&A,2013,37:455

[8]De Jong K A.Evo lu tionary Com pu tation—A Un ified A pp roach.Cam b ridge:M IT P ress,2006:26-27

[9]Portnoy S,K oenker R.StaSc,1997,12:279

[10]Rousseeum P,Leroy A.Robust Regression and Outlier Detection.New York:John W iley&Sons, 1987:112-142

Genetic A lgorithm for Initial O rbit Determ ination with Too Short A rc(Continued)

LIXin-ran1,2,3WANG Xin1,2

(1 Pu rp le M oun tain Observatory,Chinese Academ y of Scien ces,Nan jing 210008) (2 K ey Labo rato ry fo r Space O bjec t and D ebris O bserva tion,Pu rp le M oun tain O bserva to ry,Chinese Academ y of Scien ces,Nan jing 210008) (3 Un iversity of Chinese A cadem y of Scien ces,Beijing 100049)

W hen using the genetic algorithm to solve the problem of too-short-arc (TSA)determ ination,due to the difference of com puting processes between the genetic algorithm and classicalmethod,the methods for outliers editing are no longer app licable.In the genetic algorithm,the robust estimation is acquired by means of using different loss functions in the fitness function,then the outlier problem of TSAs is solved.Compared with the classicalmethod,the app lication of loss functions in the genetic algorithm is greatly simplified.Through the comparison of results of different loss functions,it is clear that themethods of least median square and least trimmed square can greatly im prove the robustness of TSAs,and have a high breakdown point.

space vehicles,celestialmechanics,methods:numerical,statistical

P135;

A

10.15940/j.cnki.0001-5245.2016.02.005

2015-07-16收到原稿,2015-08-21收到修改稿

∗国家自然科学基金项目(11373072)资助

†lixr@pm o.ac.cn

‡wangxin@pmo.ac.cn

猜你喜欢

弧长残差遗传算法
强间断多介质流的高精度伪弧长方法
基于双向GRU与残差拟合的车辆跟驰建模
三角函数的有关概念(弧长、面积)
三角函数的有关概念(弧长、面积)
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
基于遗传算法的智能交通灯控制研究
弧长和扇形面积教学设计
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于改进的遗传算法的模糊聚类算法