APP下载

地球静止轨道高能电子通量在线预测模型*

2016-07-26林瑞淋龚建村刘四清

国防科技大学学报 2016年2期
关键词:粒子群优化算法互信息

刘 帅,李 智,林瑞淋,龚建村,刘四清

(1. 装备学院 航天指挥系, 北京 101416; 2. 中国科学院 国家空间科学中心, 北京 100190)



地球静止轨道高能电子通量在线预测模型*

刘帅1,李智1,林瑞淋2,龚建村2,刘四清2

(1. 装备学院 航天指挥系, 北京101416; 2. 中国科学院 国家空间科学中心, 北京100190)

摘要:利用粒子群优化算法和最小二乘支持向量机,建立地球静止轨道高能电子通量在线预测模型。针对粒子群优化算法,提出一种新的粒子群多样性测度计算方法,有效改善其早熟收敛现象。运用改进的粒子群优化算法优化最小二乘支持向量机的正则化参数和核参数。利用滑动时间窗口策略更新模型数据,选择触发机制以及模型的再学习机制为设计变量,实现模型的在线预测功能。对2000年电子通量监测数据和相关太阳风、地磁参数等实际数据进行的提前1~3天的预测实验,表明所建在线预测模型具有较高的预测性能,并具有一定的实用价值。

关键词:粒子群优化算法;最小二乘支持向量机;变量选择;互信息;距离相关系数;高能电子通量

地球静止轨道位于地球的外辐射带区域,轨道上运行着大量的通信、气象、导航、预警等卫星。外辐射带区域的高能电子能量高、穿透性强,可穿透卫星防护层并沉积在卫星内部的电解质材料中,长期的积累可形成局部强电场,诱发介质的充放电现象,轻则形成伪信号影响卫星工作,重则击穿绝缘体,导致卫星故障甚至永久损坏[1]。因此,采取有效方法对静止轨道高能电子通量进行预测,可以辅助操作人员对卫星设备提前采取措施,降低甚至避免高能电子对卫星的危害,对保障航天器的安全具有重要的现实意义。

鉴于高能电子环境的复杂性以及现有观测手段的局限性,对辐射带高能电子的产生、加速、消亡过程目前还很难建立准确的物理过程模型,因此,现阶段对高能电子通量的预测模型主要是基于历史测量数据的经验或半经验模型。典型的理论和经验模型包括Fokker-Planck径向扩散方程[2]、线性预测滤波器(Linear Prediction Filter, LPF)模型[3]、状态空间模型[4]、人工神经网络(Artificial Neural Network, ANN)模型[5]、带外生变量的非线性自回归滑动平均(Nonlinear Autoregressive Moving Average with exogenous input, NARMAX)模型[6]以及支持向量机(Support Vector Machines, SVM)模型[7]等。

现以1.8 MeV~3.5 MeV能段的电子日均值通量为例,引入最小二乘支持向量机(Least Squares Support Vector Machines, LSSVM)建立预测模型,并结合智能优化算法——粒子群优化算法,实现对模型参数的快速寻优,建立地球静止轨道上的高能电子日均值通量在线预测模型。

1理论基础

1.1最小二乘支持向量机

同经典SVM相比,LSSVM具有更优的求解速度与收敛性能,可有效地克服神经网络容易陷入局部极小值的问题,在小样本下具有较强的泛化能力[8]。

y(x)=wT·φ(x)+b

(1)

最小二乘支持向量机优化问题可表述为:

(2)

约束条件为:

yk=wT.φ(xk)+b+εkk=1,2,…,n

(3)

其中:w是超曲面的法向量;b是超曲面的截距;γ为模型的正则化参数;ε为误差向量;εk为误差项。

对应式(2)、式(3)的拉格朗日函数为:

(4)

其中:α=[α1,α2,…,αn]T为拉格朗日乘子。

对式(4)进行求解,令L对{w,b,ε,α}的偏导数均等于零,得到:

(5)

其中:1=[1,1,…,1]T;Λ=K(xk, xl)=φ(xk)T.φ(xl),K(xk,x)称为核函数;I为n×n维单位阵。

由式(5)用最小二乘法求出α与b后,对应于输入向量x的回归函数为:

(6)

综上,LSSVM仅包括两个参数(正则化参数γ和核参数σ),算法复杂度低。γ和σ的选取决定了模型的学习与泛化能力。

1.2粒子群优化算法

粒子群优化算法(Particle Swarm Optimization, PSO)是一种群智能仿生算法。由于其实现简单、寻优效率高,自提出以来便获得了广泛的应用和研究。为降低LSSVM参数选取的盲目性,采用PSO算法优化γ和σ。

1.2.1标准粒子群算法

PSO的核心内容[9]为:每个粒子代表解空间中的一个解,用位置矢量来表示。粒子以一定的速度在解空间中随机搜索以寻找更优的解,粒子的运动受自身积累的经验和种群共享信息的共同指导。

PSO的动力学方程包括速度更新方程式(7)和位置更新方程式(8)。

(7)

(8)

将LSSVM的两个参数编码为粒子的两个维度,粒子按照式(7)、式(8)不断迭代直至满足一定条件。详细的流程可参考文献[14]。

1.2.2粒子群多样性定义

PSO算法及其他群智能算法的一个共同问题就是保证种群的多样性,避免陷入局部最优。

常用来衡量种群多样性的指标包括信息熵、方差及平均点距等[9],但他们并不能很好地反映粒子在解空间的分散程度,如熵值的计算依赖于各适应度值出现的概率,特别是对连续实值函数,不同粒子适应度值通常会不同,造成熵值结果变化的歧义性;方差反映的是相对于均值的偏离程度,如A={1,2,3,4,5}和B={1,1,1,1,5},前者方差为2,后者方差为2.56,但显然前者异化程度更高;平均点距虽然一定程度上克服了上述问题,但取均值的同时并没有考虑偏离程度对结果的影响,如C={1,1,1,7}和D={1,2,3,4},前者平均点距为2.25,后者平均点距为1,但显然后者异化程度更好。

因此,提出以粒子群适应度的均值来判定群体的多样性。定义粒子群多样性测度计算公式为:

对前述集合分别计算多样性得到:DA=0.83,DB=0.63,DC=0.67,DD=1。与直观的认识是一致的。

基于多样性测度,设计粒子群多样性的控制策略为:当多样性D<Δd=0.75时,从两个子群各选取一半粒子重新初始化。

2高能电子通量在线预测模型构建

2.1输入变量选择

输入变量的选择是预测模型建立的关键步骤之一。在空间天气领域,传统的建模手段都是给定一个延迟项d,基于d构建输入回归项,并将所有输入项都考虑到最后的模型中,以多输入单输出模型为例。

(10)

将统计学习领域的变量选择引入到空间环境预测模型构建过程中,以互信息为变量间关系的评价准则,采用“前向+后向”结合的过滤式变量选择策略实现对变量的筛选。有关变量选取的详细介绍,请参考文献[10-11]。输入参数见表1,所有变量都为日均值数据。

表1 输入参数列表

如果产生时间序列的物理系统内部机制发生了变化,相应的输入项亦会改变。因此,为了实现模型的动态改变,需要引入模型再学习的触发机制。

距离相关系数是最近提出的一个用于描述不同变量间定量关系的量,能够描述变量间的线性关系和非线性关系。现将其用于衡量两个时间序列的相似度,即前一训练数据集和当前计算窗口内的数据。如果两者足够相似,则认为物理系统未发生大的变化,预测模型的输入保持不变;如果两者发生大的差异,则认为物理系统发生变化,需要以当前计算窗口内的数据为训练集,重新进行变量的筛选,并保持当前训练集,直到下一次发生变化。

两个多维变量的距离相关系数[12]定义为:

(11)

其中,dCov(X,Y)为距离协方差函数。

(12)

定义a,b为随机变量X和Y的点距矩阵,有:

(13)

(14)

dVAR(X)表示变量的距离方差函数,有dVAR2(X)=dCov2(X,X)。

当前后两个电子通量样本集的距离相关系数dCor<Δc时,基于最新样本集重新选择输入变量。

2.2LSSVM在线模型构建

结构选择是建立模型的另一个关键因素。当输入未变,而模型输出有较大误差时,可能是基于先前样本学习到的模型结构或参数已经失效;而当输入发生改变时,模型的结构必然也要发生变化。因此,在建立在线模型的过程中,将输入选取和模型结构分别考虑,有利于对物理系统和所建模型的监控,也有利于减少再学习时的工作量。

以LSSVM为基本预测模型,以PSO实现对模型参数的选取。为了实现在线功能,同样需要设置一定的触发机制使得LSSVM模型具备再学习的能力。以相对输出误差为准则,设计重建的策略为:初始阶段以训练集合预测误差均值的2倍为阈值,当误差高于此阈值时运用新窗口内的样本重建预测模型,随着模型的运行,误差阈值则过渡到实际预测误差Δe。

完整的在线预测模型结构框图如图1所示。

图1 在线预测模型框架图Fig.1 On-line prediction model framework

2.3滑动时间窗口策略

由于空间环境的复杂多变特性,对固定样本集训练出的模型的泛化能力提出了挑战。为了反映最近时刻观测值的影响,使模型具备在线能力,同时又不使得预测数据的处理过于复杂,比较常用的策略就是滑动时间窗口。即设定学习样本的长度N,当有新的观测数据时,剔除老的观测数据,保持N不变,如图2所示。

图2 滑动时间窗口示意图Fig.2 Sliding time window diagram

3实例分析

3.1数据

采用的高能电子通量数据来自美国洛斯阿拉莫斯国家实验室[13],能段为1.8 MeV~3.5 MeV,时间段为2000年全年去除最后两天的无效值,共364组(天)数据。太阳风和地磁数据来自美国国家空间科学数据中心的OMNI2网站。

分别采集364组样本的太阳风速度、太阳风密度、行星际磁场、AE指数和电子通量数据。为了消除不同变量的数量级差别对预测过程的影响,对所有样本数据进行标准化处理。

为了评价预测模型的效果,采用线性相关系数(R)和预测效率(EP)作为定量评价指标。预测效率EP定义为:

(15)

3.2LSSVM参数优化及变量选择实验

本节实验旨在说明PSO对LSSVM参数优化和输入选择对LSSVM预测模型的有效性,具体参数设置如下:

以前300组样本数据为训练数据集,后64组数据为测试数据集;粒子群大小设置为30,最大迭代次数为100,惯性权重以线性递减的形式表示为w=wmin+icur·(wmax-wmin)/MaxIter,icur表示当前迭代次数,MaxIter表示最大迭代次数,wmax=0.9,wmin=0.4,c1=c2=2;延迟项d=7,采用10-折交叉验证方法进行训练,以训练样本的一步预测结果平均绝对误差为适应度函数。

不同条件下的实验重复10次,取平均结果,见表2。其中考虑所有回归项的情况用“All”表示,经过变量选择后的情况用“V.S.”表示。

表2 PSO优化结果对比

由表2中结果可知:PSO优化的LSSVM能够获得与最新LSSVM包自带的寻优算法(耦合模拟退火+单纯形法)相当的性能,说明PSO基于多样性的变异准则在LSSVM预测模型中有效;对测试数据而言,经过变量选择后的模型预测性能相对于全部变量做输入的情况有更好的表现,预测效率最高,表明变量选择有效。

图3为一次实验中粒子群多样性的变化曲线(清晰起见,只显示了最后50次迭代结果),w1为固定惯性权重(w1=0.7)时多样性测度曲线,均值为0.641 8;w2为惯性权重线性变化时多样性测度的变化曲线,均值为0.660 6;w3为加入随机初始化策略后惯性权重线性递减时的多样性测度曲线,均值为0.754 0,水平虚线表示设定的阈值。

图3 多样性测度变化曲线Fig.3 Diversity measure curves

由图3可知,多样性基本保持w3>w2>w1的关系,说明该多样性测度计算公式及保持策略有效。

3.3不同时间起点的变量选择实验

3.2节中所有的实验均固定前300组数据为训练数据集。为了验证输入变量随系统的变化,本节选取不同的时间起点,分别进行变量筛选,以对比实验结果。

对65组不同的训练数据和式(10)中不同的延迟项7,10,15进行变量筛选试验,结果为:y(t)平均被选中65次,ns(t)平均被选中65次,Vsw(t)平均被选中55次。

图4 距离相关系数变化曲线Fig.4 Distance correlation curves

由于目标是预测电子通量,故以不同时段的电子通量作为表征系统特性的数据序列。图4绘出了不同训练集相对于初始训练集的距离相关系数随着时间的变化曲线。由图4可知,随着时间的推移,样本集发生了变化,因而需要进行动态的变量筛选。

为了说明输入的变化对模型预测结果的影响,进一步设计如下实验方案:固定训练集,进行变量选择和模型训练(静态情况);训练集随着时间的推移不断变化,同时进行变量选择和模型训练;训练集随时间发生变化,但经过变量选择后的输入维持不变,只进行模型训练。三种情况分别对应于表3的C.1~C.3,其他模型参数设置同3.2节。

表3 不同训练集预测效果对比

由表3结果可知,当考虑训练数据集的改变引起输入变量的变化或者模型结构的变化时,能够提高模型的预测性能,而且变量选择的结果略优,验证了变量选择的有效性。

3.4运用LSSVM的在线预测模型

(16)

(17)

参数设置与3.2节相同,距离相关系数的阈值设置为Δc=0.75,输出误差阈值设置为Δe=0.2,Δc越大或Δe越小表明要求越严格。

仍然以10次实验结果的均值作为最终的评价指标,对比了常用的静态单层后向传播前馈神经网络预测模型(Back Propagation Neural Network, BP-NN)、PSO-LSSVM模型和在线PSO-LSSVM模型的预测结果,见表4。静态模型采用2000年前300天的固定训练样本集。由表4可知,PSO-LSSVM模型的预测效果要优于BP-ANN,而在线PSO-LSSVM模型综合效果要优于静态PSO-LSSVM,且一步预测效果明显好于多步预测效果,与直观上的判断一致。

图5为一次预测结果曲线图。由图5可进一步看出,多步预测在相位上更加滞后。

表4 不同模型的电子通量预测效果对比

图5 基于在线模型的不同提前量电子通量预测值Fig.5 Predictions of electron flux with different steps based on online model

4结论

围绕静止轨道高能电子通量预测问题,建立了基于PSO-LSSVM的在线预测模型。主要贡献在于:提出一个新的多样性测度公式,给出简单的多样性控制策略,保证粒子群的多样性,以此改进PSO算法;结合滑动时间窗口策略,引入距离相关系数引导变量选择的再学习过程;设计LSSVM模型的重建机制,并基于LSSVM建立了提前1~3天的在线预测模型。

通过对2000年高能电子通量和太阳风参数、地磁参数的比较试验,在线PSO-LSSVM预测模型提前1天预报效率达到0.793 3。由BP-ANN,PSO-LSSVM和在线PSO-LSSVM三个模式提前1~3天预测结果可知,预报提前时间越长,模式所得预报结果越差,而且随预报提前时间增加,模型预报效率下降得比较快。

变量选择的评价标准和选择方案对后续模型的结果有重要影响,探讨在线模式下变量选择工

作对于描述空间环境这种复杂系统将会是一个值得深入的工作;考虑输出之间的依赖关系建立目标序列多步预测的多输入多输出预测模型,将会获得比单一输出更好的结果,也是未来工作的重要内容。

参考文献(References)

[1]Ecoffet R. Overview of in-orbit radiation induced spacecraft anomalies[J]. IEEE Transactions on Nuclear Science, 2013, 60(3): 1791-1815.

[2]Li X L, Temerin M, Baker D N, et al. Quantitative prediction of radiation belt electrons at geostationary orbit based on solar wind measurements [J]. Geophysical Research Letters, 2001, 28(9): 1887-1890.

[3]Baker D N, McPherron R I, Cayton T E, et al. Linear prediction filter analysis of relativistic electron properties at 6.6RE[J]. Journal of Geophysical Research,1990, 95(A9): 15133-15140.

[4]Rigler E J, Baker D N. A state-space model of radiation belt electron flux dynamics[J]. Journal of Atmospheric and Solar-Terrestrial Physics, 2008, 70(14): 1797-1809.

[5]Kitamura K, Nakamura Y, Tokumitsu M, et al. Prediction of the electron flux environment in geosynchronous orbit using a neural network technique[J]. Artificial Life and Robotics, 2011, 16(3): 389-392.

[6]Wei H L, Billings S A, Surjalal Sharma A. Forecasting relativistic electron flux using dynamic multiple regression models[J]. Annales Geophysicae, 2011, 29(2): 415-420.

[7]王任重, 师立勤. 基于支持向量机方法的地球同步轨道相对论电子事件预报模型研究[J]. 空间科学学报, 2012, 32(3): 354-361.

WANG Renzhong, SHI Liqin. Study on the forecasting method of relativistic electron flux at geostationary orbit based on support vector machine[J]. Chinese Journal of Space Science, 2012, 32(3): 354-361. (in Chinese)

[8]Karevan Z, Mehrkanoon S, Suykens J A K. Black-box modeling for temperature prediction in weather forecasting[C]// Proceedings of the International Joint Conference on Neural Networks, Killarney, IEEE, 2015: 1-8.

[9]崔志华, 曾建潮. 微粒群优化算法[M]. 北京: 科学出版社, 2011.CUI Zhihua, ZENG Jianchao. Particle swarm optimization[M]. Beijing: Science Press, 2011. (in Chinese)

[10]Yousefi M R, Kasmaei B S, Vahabie A, et al. Input selection based on information theory for constructing predictor models of solar and geomagnetic activity indices[J]. Solar Physics, 2009, 258(2): 297-318.

[11]Sorjamaa A, Hao J, Reyhani N, et al. Methodology for long-term prediction of time series[J]. Neurocomputing, 2007, 70(16/17/18): 2861-2869.

[12]Székely G J, Rizzo M L. Brownian distance covariance[J]. Annals of Applied Statistics, 2009, 3(4): 1233-1303.

[13]Reeves G D, Morley S K, Friedel R H W,et al. On the relationship between relativistic electron flux and solar wind velocity: Paulikas and Blake revisited[J]. Journal of Geophysical Research, 2011, 116(A2): 1-14.

doi:10.11887/j.cn.201602020

*收稿日期:2015-06-22

基金项目:教育部新世纪优秀人才支持计划资助项目(Y52133A23S)

作者简介:刘帅(1986—),男,河北保定人,博士研究生,E-mail:liushuai00@sina.com; 李智(通信作者),男,教授,博士,博士生导师,E-mail:lizhizys@126.com

中图分类号:TP13;P353.4

文献标志码:A

文章编号:1001-2486(2016)02-117-06

Online prediction model for energetic electronflux at geostationary orbit

LIU Shuai1, LI Zhi1, LIN Ruilin2, GONG Jiancun2, LIU Siqing2

(1. Space Command Department, Equipment Academy, Beijing 101416, China;2. National Space Science Center, Chinese Academy of Sciences, Beijing 100190, China)

Abstract:An online prediction model for the energetic electron flux at the geostationary orbit was built based on the PSO (particle swarm optimization) algorithm and the LSSVM (least squares support vector machines) method. To overcome the premature convergence problem in PSO, a new diversity measure was put forward. The improved PSO was utilized to optimize the LSSVM′s parameters. Through a sliding time window strategy, a variable selection invoking threshold and a model re-training mechanism, the online characteristic of the model was realized. 1~3 day ahead prediction experiments were done on the basis of the electron flux data, solar wind parameters and geomagnetic parameters in 2000, and the analysis results show that the proposed online PSO-LSSVM model works well and has practicable value for prediction.

Key words:particle swarm optimization algorithm; least squares support vector machines; variable selection; mutual information; distance correlation; energetic electron flux

http://journal.nudt.edu.cn

猜你喜欢

粒子群优化算法互信息
基于改进互信息和邻接熵的微博新词发现方法
基于改进SVM的通信干扰识别
基于自适应线程束的GPU并行粒子群优化算法
基于混合粒子群算法的供热管网优化设计
基于改进支持向量机的船舶纵摇预报模型
基于互信息的图像分割算法研究与设计
基于互信息的贝叶斯网络结构学习
联合互信息水下目标特征选择算法
一种利用点特征和互信息的多源遥感影像配准方法
PMU最优配置及其在舰船电力系统中应用研究