APP下载

果蝇算法优化的相关向量机在电子装备中的应用*

2016-04-26康建设

火力与指挥控制 2016年3期

吴 坤,康建设,杨 东

(1.军械工程学院,石家庄 050003;2.解放军77538部队,拉萨 850000)



果蝇算法优化的相关向量机在电子装备中的应用*

吴坤1,康建设1,杨东2

(1.军械工程学院,石家庄050003;2.解放军77538部队,拉萨850000)

摘要:针对电子装备渐变故障预测问题,提出一种基于果蝇算法优化相关向量机的故障预测方法。该方法将原始时间序列数据进行相空间重构处理,并基于折交叉验证和果蝇算法优化相关向量机模型的核函数参数,从而建立故障预测模型,并以某型雷达发射机速调管监测数据对模型性能进行了验证。实验结果表明,相比已有方法,该方法在全局优化、收敛速度、预测精度以及预测可靠性方面都具有一定优势。

关键词:电子装备,果蝇优化算法,相关向量机,故障预测,k折交叉验证

0 引言

随着我军信息化建设的不断深入,电子装备在整体武器系统中的比重越来越大,对未来战场整体作战效能的影响越来越重要,随之而来的故障损失和维修保障等问题也日益凸显。鉴于上述情况,对电子装备进行故障预测和维修保障问题的研究势在必行。目前故障预测方法中应用较多的有基于时间序列分析的预测方法、基于灰色理论的预测方法、基于人工神经网络的预测方法和基于支持向量机的预测方法等。基于时间序列分析的预测方法虽然模型简单、易于实现,但不适用于非线性系统和非平稳序列的预测[1];基于灰色理论的方法数据量小、计算简便,但只适用于具有指数变化规律的序列[2];基于人工神经网络的方法不需要建立具体的数学模型,具有极强的非线性映射能力,适合非线性系统的回归预测,但需要大量数据样本,且存在训练时间长、易陷入局部最小等缺陷[3-4];基于支持向量机的预测方法具有适用于小样本情况、非线性系统、可得到全局最优解等优势,但缺点是输出缺乏概率信息、无法对预测结果的不确定性进行度量、核函数选取需满足Mercer条件等[5-6]。

相关向量机(Relevance Vector Machine,RVM)模型是Michacl E.Tipping博士于2000年提出的一种基于贝叶斯学习理论的稀疏概率模型,具有与支持向量机相似的函数形式和相当的泛化性能[7-8]。该模型能够在输出预测结果的同时给出其概率分布,目前在污水检测[9]、高光谱图像分类[10]、故障预测[11]等领域的工程研究中均取得了较好应用效果。鉴于电子装备故障数据小样本、非线性的特点,在原始数据相空间重构处理的基础上,本文将RVM模型应用于时间序列预测中,并针对以往研究中人为选取核函数参数缺乏科学依据的问题,基于k折交叉验证(Cross Validation,CV)和果蝇优化算法(Fruit Fly Optimization Algorithm,FOA)进行参数优化选取,最终以具有渐变故障趋势的某型雷达发射机监测数据验证上述预测方法性能。

1相空间重构过程

对于电子系统的故障预测,一般利用前几个时刻的监测值对后一时刻的监测值作出预测,这样可以弱化原始数据中随机因素的扰动影响,增强数据的规律性,克服奇异数据点对模型预测结果的影响。该过程可以归结为时间序列预测中的相空间重构过程。

对于原始数据时间序列{y1,y2,…,yl},需要应用相空间重构预测模型的输入输出,即目标值yn与其之前d个目标值yn-1,yn-2,…,yn-d有如下映射关系

其中d为嵌入维数,f(·)为映射函数,故预测模型的输入样本X、输出样本t分别为

输入样本和输出样本共同构成模型的训练样本集,N=l-d为样本数。应用相空间重构得到预测模型训练样本集,进而训练模型以逼近映射函数f(·),最终完成数据预测工作。

2 RVM回归预测模型

式中k(x,xi)为核函数(不必满足Mercer条件),,显然有,因此,所有训练样本集的似然函数可表示为

通过最大化该似然函数可以不断迭代求取αMP和σ2MP,同时超参数向量α中的很多元素值在迭代过程中都趋近于无穷大,对应的权值向量w的后验分布也趋向于服从N(0,0)的正态分布,即p(wi|t,α,σ2)趋向于0,而且在迭代过程中设计矩阵Φ的很多不参与实际运算的基函数项将被删减。因此,运算后剩下的非0权值的训练样本即为相关向量,该定义与支持向量的定义相类似,支持向量对应于边界样本。最终给定新的输入x*和αMP、σ2MP,则对于x*的估计值t*的预测分布为

3基于k折交叉验证和果蝇算法的参数寻优

对于预测模型性能优劣,一般采用k折交叉验证[12]的方法进行评价,即将整个训练样本分为k份,以k-1份作为训练样本集以训练模型,将剩下1份样本作为测试样本集并计算误差,如此重复循环k次,每次将不同的样本作为测试集,由此得到不同的训练误差(一般采用均方误差),最终将其平均值选定为k折交叉验证误差。因此,为优化预测模型性能,本文将训练样本集的k折交叉验证误差最小作为优化目标,最终优选出具有合适模型参数的RVM模型。

相关研究文献[13]表明,影响RVM预测模型性能的因素主要是RVM核参数的选择、构造及其参数的优化。由于高斯核性能优异,一般常用其作为RVM核函数,其数学表达式为

显然核参数σ对RVM模型性能的影响至关重要,以往RVM模型中多是采用凭借主观经验人工选取核参数,缺乏科学合理的依据,也不易推广应用,需要对其进行优化求取。目前智能优化算法主要有遗传算法、粒子群算法、蚁群算法等,但都有其各自的局限性和不足[14]。果蝇优化算法是由台湾学者潘文超教授于2011年根据果蝇觅食行为所推演出的一种新型智能群体寻优算法[15]。果蝇算法主要是通过果蝇群体的嗅觉来随机觅食,随后利用视觉聚群在味道浓度最浓的位置,从而完成寻优过程,具有计算简便、调节参数少、寻优精度高、全局寻优能力强且易于转化为程序代码等优点。目前该算法已在电力负荷预测[16]等方面得到了应用,并取得了较理想的寻优效果。

因此,为提升模型预测性能,本文以RVM预测模型训练k折交叉验证误差最小为优化目标,采用果蝇算法对高斯核宽度σ进行迭代调整,最终确定最优参数值。具体优化步骤可归纳如下:

步骤1参数初始化

初始化FOA算法的主要参数:最大迭代次数maxgen,种群数sizepop,初始果蝇种群位置(X_axis,Y_axis)。

步骤2种群初始化

随机设定果蝇个体通过嗅觉觅食的飞行方向和距离。

步骤3种群估计

首先,需要计算食物位置与初始位置之间的距离Dist;然后,需要计算味道浓度判定值S(即核宽度σ),且S的值为距离值Dist的倒数。

随后将味道浓度判定值S代入到味道浓度判定函数(可设定为求取训练集的交叉验证均方误差的倒数)中,从而计算果蝇个体位置味道浓度Smelli(均方误差值的倒数)。最后求出整个种群中具有最大味道浓度(Smelli最大值,即均方误差值最小)的果蝇个体。

步骤4选择操作

保留最大味道浓度值及X,Y位置,然后依靠视觉果蝇种群向具有最大味道浓度的位置飞行。重复步骤2~步骤3进行迭代寻优,当味道浓度不再变化或达到迭代上限值时停止迭代,最终将训练样本的RVM模型均方误差调整到最小。

由上述迭代步骤可以得出果蝇算法需要调节的参数仅仅为种群规模、迭代次数、种群初始位置和个体随机飞行方向与距离区间,与粒子群等优化算法相比明显减少,便于转化为程序代码、计算方便。

4 CVFOARVM故障预测模型

CVFOARVM故障预测方法的基本原理是:在模型训练阶段,对原始时间数据序列进行相空间重构,得到后续RVM模型的训练及测试样本,进而在确定RVM核函数的基础上,对于训练样本采用基于k折交叉验证的果蝇算法确定最优核函数参数,最终建立CVFOARVM预测模型;在模型预测阶段,利用建立的CVFOARVM模型对测试样本得出模型预测值。CVFOARVM模型的故障预测流程如下页图1所示。

5应用实例分析

行波管、速调管等真空微波管是雷达发射机中放大微波信号的核心部件,同时由于其本身故障率较高且价格昂贵,其状态好坏与否将直接影响到雷达发射机的发射功率等指标和系统寿命,对系统整机的可靠性至关重要。而真空微波管随着工作时间的增加,其阴极发射电子的能力会逐渐变弱,体现为状态监测时阴极电流的衰减,当低于某一特定阈值时,就不再满足功能要求,即故障状态[17-18]。该过程属于电子系统故障中的渐变故障,可以利用状态监测信息对其进行状态评估、故障预测等一系列工作,实现装备的视情维修。下面以文献[19]中某型雷达发射机速调管阴极电流等间隔状态监测数据为例,来对上述RVM预测模型性能进行验证。

图1 CVFOARVM故障预测模型流程

表1 阴极电流监测数据单位:mA

为便于模型训练及预测,对数据进行归一化处理,使其都在区间[0,1]内,随后设定嵌入维数d=5(便于后面与其他预测方法比较),则上述40个原始数据经过相空间重构后可形成35组样本,其中将前25组样本作为训练样本,后10组作为测试样本。在采用果蝇算法优化参数σ时,设定随机初始化果蝇群体位置区间为[0,1]、迭代的果蝇搜寻食物的随机飞行方向与距离区间为[-10,10]、种群规模为20、迭代次数为100,采用k=5折交叉验证,以均方误差最小为优化目标,最终得到的核函数参数为σ=2.73且果蝇种群飞行路径如图2所示。同时由于粒子群算法(Particle Swarm Optimization,PSO)是目前应用比较广泛的一种智能优化算法,在此也采用该算法对上述模型的参数展开寻优,并与果蝇算法优化过程进行对比,为不失一般性,同样设置种群规模为20、迭代次数为100,其他参数加速度因子c1和c2均设为1.5,惯性权重w范围设为[0.4,0.9],个体最大最小值分别设为200、0,速度最大最小值分别设为1.0、-1.0,二者的优化迭代过程如图3所示。

图2 果蝇种群飞行路径

图3 参数优化过程

从上图可以得出,果蝇算法只用4次就能迅速收敛到模型平稳的最佳参数值,表明种群初始位置基本不影响辨识精度;而且粒子群算法在搜索时呈阶梯状,果蝇算法则是折线状,说明其收敛性能更好,不易陷入局部极值,全局寻优能力强。最终可以得出结论:该算法寻优性能良好,可以满足模型参数科学选取的要求。确定最优核函数参数后,建立的CVFOARVM预测模型如图4所示。

图4 CVFOARVM预测模型

由图4可以得出,RVM模型稀疏性良好,相关向量个数为3;同时采用SVR算法对训练样本进行计算(应用Libsvm工具包,同样设置嵌入维数d=5,交叉验证k=5折,经网格搜索c、g最优参数值),建立SVR预测模型,得到支持向量个数为6。两者训练样本拟合精度相当,但相关向量个数明显低于支持向量个数,极大降低了对系统运行内存的要求,更适合于在线故障预测。

应用建立的CVFOARVM模型对测试样本10组数据进行一步预测,得到的预测值、实际值及相对误差如表2所示。

表2 预测值与实际值的比较

同时将该误差结果与文献[19]中几种预测方法进行对比,预测结果如表3所示。

表3 预测结果

由表3可知,CVFOARVM模型比CVLSSVM、PSOAGM等模型预测精度要高,平均预测相对误差分别降低了0.001 5 %和0.000 1 %。并且由于预测输出服从N(y*,σ*2),RVM预测模型最大的优势在于不仅可以给出预测均值y*,而且可以根据得出的方差σ*2估计均值的置信区间,从而使得RVM模型预测得出的结果更加可靠,对于雷达等对可靠性要求颇高的系统显得极为重要。以测试集的10个数据为例,其实际值、预测值及置信度为90 %的上下界的计算结果如图5所示。

图5 阴极电流预测置信区间

由图5可以得出,阴极电流的实际值均包含在置信度为90 %的置信区间内,证明RVM故障预测模型是行之有效的,可以为后续的维修决策的实施提供科学参考。

6 结论

本文以某型雷达发射机速调管部件监测数据为例,应用相空间重构原始数据,基于RVM回归理论建立了故障预测模型,并采用折交叉验证和果蝇算法优化其核函数参数,与其他方法相比,取得了较高的预测精度。同时该方法还具有以下优势:

①果蝇算法和相关向量机模型中参数设置均较少,不像其他模型中参数设置繁多,运算量大;

②模型稀疏性好,相关向量个数明显少于SVM中支持向量个数,适于在线预测;

③对输出的预测值给出了相应置信区间,可以有效避免预测的不可靠性所引起的损失,具有一定的工程实际应用前景。

参考文献:

[1]胡泽文,肖明清.基于时间序列模型的故障预测研究[J].计算机测量与控制,2013,21(6):1421-1423.

[2]贾云涛.基于改进灰色系统的电力电子装置故障预测技术研究[D].南京:南京航空航天大学,2012.

[3]胡雷刚,肖明清,谢斓.基于免疫神经网络的航空设备故障预测研究[J].计算机工程与应用,2011,47(20):231-233.

[4]文莹,肖明清,胡雷刚,等.基于粗糙神经网络的航空电子设备故障预测研究[J].计算机测量与控制,2010,18(4):807-809.

[5]薛辉辉,肖明清,段军峰.基于杂合支持向量回归机的电子装备故障预测[J].计算机工程,2012,38(8):283-286.

[6]许丽佳.基于LSSVM_HMM的发射机故障预测研究[J].仪器仪表学报,2008,29(1):21-26.

[7]TIPPING M E.The relevance vector machine[J].Advances in Neural Information Processing Systems,2000(12):652-658.

[8]TIPPING M E.Sparse bayesian learning and the relevance vector machine[J].Journal of Machine Learning Research,2001,1(3):211-244.

[9]曾甜玲,温志渝,温中泉.相关向量机在污水硝氮检测中的应用[J].光谱学与光谱分析,2013,33(4):1048-1051.

[10]齐滨,赵春晖,王玉磊.基于支持向量机与相关向量机的高光谱图像分类[J].吉林大学学报(工学版):2013,43 (S):143-147.

[11]范庚,马登武,邓力,等.基于灰色相关向量机的故障预测模型[J].系统工程与电子技术,2012,34(2):424-428.

[12]REFAEILZADEH P,TANG L,LIU H.Cross-validation [M].Ozsu M T,Liu L.Encyclopedia of database systems.New York:Springer,2009.

[13]马登武,范庚,张继军.相关向量机及其在故障诊断与预测中的应用[J].海军航空工程学院学报,2013,28(2):154-160.

[14]吴小文,李擎.果蝇算法和5种群智能算法的寻优性能研究[J].火力与指挥控制,2013,38(4):17-20.

[15]潘文超.果蝇最佳化演算法-最新演化式计算技术[M].台湾:沧海书局,2011.

[16]LI H Z,GUO S,LI C J,et al.A hybrid annual power load forecasting model based on generalized regression neural network with fruit fly optimization algorithm[J].Knowledge-Based Systems,2013,(37):378–387.

[17]郑辉,李文辉,潘厚忠.雷达发射机技术[M].北京:电子工业出版社,2006.

[18]赵春宇,高优,韦猛.电子装备故障诊断训练中虚拟仪器仿真及应用[M].四川兵工学报,2009,29(10):107-110.

[19]许丽佳.电子系统的故障预测与健康管理技术研究[D].成都:电子科技大学,2009.

[20]张弦,王宏力,张金生,等.状态时间序列预测的贝叶斯最小二乘支持向量机方法[J].西安交通大学学报,2010,44(10):42-46.

Application of RVM Based on FOA to Fault Prognostic of Electronic Equipment

WU Kun1,KANG Jian-she1,YANG Dong2
(1.Ordnance Engineering College,Shijiazhuang 050003,China;2.Unit 77538 of PLA,Lasa 850000,China)

Abstract:To solve the gradually varied fault prognostic problem of electronic equipment,a method of Relevance Vector Machine(RVM)based on fruit Fly Optimization Algorithm(FOA)is presented.The original time sequence data are reconstructed in the phase space as input,and the kernel function parameter of RVM model is optimized based on FOA and k-fold cross validation to establish the prediction model.And the performance of the proposed model is validated by radar transmitter fault prediction experiment.The results demonstrate that the presented method has better global optimization,convergengce speed,prediction accuracy and reliability than the existed methods.

Key words:electronic equipment,Fruit fly Optimization Algorithm(FOA),Relevance Vector Machine (RVM),fault prognostic,k-fold cross validation

作者简介:吴坤(1986-),男,安徽池州人,博士研究生。研究方向:电子装备PHM等。

*基金项目:国家自然科学基金资助项目(61271153)

收稿日期:2015-02-25修回日期:2015-05-12

文章编号:1002-0640(2016)03-0106-05

中图分类号:TP206

文献标识码:A