APP下载

基于GAPSO-SVM的航空发动机典型故障诊断

2012-11-27张俊红马文朋李林洁

关键词:模拟退火适应度种群

张俊红,刘 昱,马文朋,马 梁,李林洁

(天津大学内燃机燃烧学国家重点实验室,天津 300072)

我国即将开放 3,km 以下低空,飞机的持有量将大幅度提高.航空发动机故障在飞机的常见故障中占有很高的比例.航空发动机运行工况复杂、维修成本高、难度大,对故障诊断的要求很高.许多航空发动机公司都为自己的发动机安装了航空发动机状态监控与故障诊断系统,完善的故障诊断理论对提高发动机可靠性、延长寿命、保证飞行安全、降低维修成本等方面具有重要作用.目前应用于故障诊断的理论主要有人工神经网络和支持向量机(support vector machine,SVM)等.人工神经网络对训练样本的要求很高,而且存在过学习和欠学习等问题,SVM凭借其小样本、非线性、高维模式识别的特点在故障诊断中得到了越来越广泛的应用.参数c、g的选取对 SVM的性能起着关键作用.Min等[1]和 Wu等[2]应用遗传算法(genetic algorithm,GA)对c、g进行寻优,Fei等[3]和 Huang等[4]应用粒子群优化(particle swarm optimization,PSO)算法对c、g进行寻优,笔者通过总结和分析前人所取得的成果与不足,提出了一种融合 GA、PSO、模拟退火算法的遗传粒子群优化(genetic algorithm particle swarm optimization,GAPSO)混合算法,用于 SVM 参数c、g的寻优,对航空发动机的一些典型故障进行诊断.

1 SVM原理及相关理论

1.1 SVM原理

SVM是建立在统计学习 VC维(Vapnik-Chervonenkis dimension)理论和结构风险最小化原理基础上的.传统的算法,如神经网络,只遵循经验风险最小化原理,因此泛化能力很差,而 SVM 遵循经验风险与置信风险之和最小化即结构风险最小化原理,有非常强的泛化能力.SVM[5]将向量映射到一个更高维的空间里,在这个空间里建立一个最大间隔超平面H.在超平面H的两边建立两个互相平行的超平面H1、H2.平行超平面间的距离越大,分类器的总误差越小.图1为SVM分类示意,H1、H2上的样本为支持向量.寻找最优分类面的问题可转化为

式中:ω为分类超平面的权系数向量;Φ(·)为从低维空间向高维空间的线性映射;c为惩罚因子;iξ为松弛变量.利用拉格朗日乘子法,并引入核函数,问题转化为

核函数取径向基函数

式中ai为拉格朗日乘子.核函数中参数g的取值对模型的分类精度有重要影响.惩罚因子c用于控制模型复杂度和逼近误差的折中,c越大则对数据的拟合程度越高,但泛化能力将降低.通过求解可得ai,进而求得ω和b,从而确定分类超平面.

SVM 采用一对一的思想实现多分类,采用k组交叉验证(k-fold cross validation,k-CV)的思想进行训练,将数据分成k组,每组分别做一次测试集,其余作为训练集,这样得到k个模型,用这k个模型分类准确率的平均值作为k-CV下分类器的性能指标,此处取k=3.

图1 SVM分类示意Fig.1 SVM classifier figure

1.2 GA和PSO基本原理

GA是一类借鉴生物界的进化规律(适者生存、优胜劣汰遗传机制)演化而来的随机化搜索方法.其主要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定;具有内在的隐并行性和较好的全局寻优能力;采用概率化的寻优方法,能自动获取和指导优化的搜索空间,自适应地调整搜索方向,不需要确定的规则.GA[6]主要包括以下操作.

(1) 选择操作:计算种群中所有个体的适应度之和,把个体适应度与所有个体适应度之和的比值作为个体被选中并遗传到下一代的概率,采用模拟轮盘赌法确定个体被选中的次数.

(2) 交叉操作:对个体进行两两配对,随机选择某一基因,把此位置作为交叉点,通过交换两个体交叉点之后的部分产生新个体.

(3) 变异操作:随机产生变异点并改变该点的基因值.

PSO同GA类似,是一种进化计算技术,源于对鸟群捕食的行为研究.系统初始化一组随机解,通过迭代寻优.但是它没有遗传算法用的交叉以及变异,而是粒子在解空间中追随最优的粒子进行搜索.速度和位置更新公式[6]可表示为

式中:v为粒子速度向量;m为迭代次数;i为粒子编号;w为惯性因子;k为粒子维数编号;x为粒子位置;学习因子c1=1.5,c2=1.7;r1、r2为 0到 1之间的随机数;Pi为个体最优位置;Pg为全局最优位置.w体现粒子继承先前速度的能力,当取较大的惯性因子时,粒子群的前期搜索能力较强,但不利于后期的局部搜索,取较小的惯性因子时粒子群的全局搜索能力下降,后期局部搜索能力增强.为了更好地平衡算法的全局与局部搜索能力,采用可变惯性权重

式中t为最大进化代数.这样算法初期惯性因子较大,能够保证全局搜索;后期惯性因子较小,能够保证局部的搜索能力.

1.3 模拟退火算法基本原理

模拟退火算法[7-8]是一种通用概率算法,用来在一个大的搜寻空间内找寻命题的最优解.模拟退火来自冶金学的专有名词退火,材料中的原子会停留在使内能有局部最小值的位置,加热使内能增大,原子离开原来的位置,随机向其他位置移动,最终原子可以找到内能比原先更低的位置.为了改善 PSO后期的局部搜索能力将模拟退火算法融入到 PSO中,根据Metropolis准则判断是否接受粒子新位置,设粒子新位置的适应度的变化量为ΔE,如果ΔE≥0则接受新位置,如果ΔE<0则以概率

接受坏位置,其中R为均值为0、方差为1的标准正态分布随机变量.接受新位置后利用公式

降温直到冷却到终止温度.初始温度T0=180,降温速度a=0.5;N为退火次数.

2 改进的参数寻优算法

2.1 常用的SVM参数寻优算法分析

参数c、g的选择一直是 SVM 研究者探讨的一个重要话题,使用较为广泛的主要有 4种方法:网格搜索法寻优,粒子群算法寻优,遗传算法寻优,根据经验选择.4种方法在实际中都有一定的应用,取得了不错的效果,但是各自都存在着自己的问题.网格搜索法的缺陷在于步长的选择,步长选择过大容易错过全局最优,选择过小计算量太大.PSO收敛速度快,可调参数少,但是容易陷入局部最优解.GA相对复杂,可调参数较多,需要进行二进制编码,收敛速度较慢,但是由于有变异操作,所以比PSO陷入局部最优解的概率相对较小.两种优化算法处理一些实际问题时还会出现稳定性差的问题.两次运行的结果可能有较大的差异.经验选择参数方法对使用者的经验和样本的依赖性过大,没有充分的理论基础,但是可以作为一种试探性的尝试.

2.2 GAPSO算法

针对 GA和 PSO都采用迭代寻优的共性,同时为了综合利用PSO的快速收敛能力和GA的局部搜索能力,提出了 GAPSO算法.该算法通过对每一代两个算法各自群体最优解的比较,寻找总体最优解,如果 PSO最优解的适应度(以训练分类准确率作为适应度)比 GA高,则将其作为总体最优解并且赋值给GA中最差的染色体,反之则将适应度最高的染色体作为总体最优解并且赋值给适应度最差的粒子,然后调整相关参数.GAPSO算法步骤如下.

(1) 初始化种群及 GA、PSO 相关参数.对种群进行二进制编码生成GA种群.解码生成PSO种群,并初始化粒子速度.

(2) 计算个体适应度,GA种群选择最优解,PSO种群进行个体极值和群体极值更新.

(3) 根据两个种群最优解产生总体最优解,若满足终止条件,则跳转至步骤(7).否则,进行两种算法间的赋值(从第2次循环开始).

(4) GA种群选择父代种群,PSO种群更新粒子速度和位置.

(5) GA种群进行交叉变异操作,PSO种群根据模拟退火原理选择是否接受粒子的新速度和位置.

(6) 返回步骤(2).

(7) 输出总体最优解.

进化代数为 200,种群数目为 10,交叉概率为0.4,变异概率为 0.01,c的范围为 0.1~100,g的范围为0.01~1,000.GAPSO算法流程见图2.

图2 GAPSO算法流程Fig.2 GAPSO algorithm flow chart

3 GAPSO-SVM应用于发动机故障诊断

3.1 算法验证

为了验证 GAPSO-SVM的可行性,使用 UCI数据库中著名的Iris数据对算法进行验证,随机从3类数据中各取 30组数据作为训练集,余下的作为测试集,分别用 GA-SVM 和 GAPSO-SVM 进行仿真研究,结果见表1.

表1 Iris数据验证Tab.1 Iris data validation

仿真结果表明 GAPSO-SVM 的计算精度优于GA-SVM,由于每一代都有两个种群间最优解的赋值,能够充分利用 PSO快速收敛的特性,所以GAPSO-SVM 比 GA-SVM 计算时间更短,更适合用于故障诊断中.

3.2 故障样本的生成

航空发动机故障诊断需要大量故障样本,但是实际中样本很难获得.Urban[9]提出故障影响系数矩阵,范作民等[10]对此也做了细致的研究,使该理论不断完善.作者引用了某型航空发动机的故障系数表(如表 2所示),以故障影响系数矩阵作为实际样本,通过仿真生成模拟样本.采用实际样本和模拟样本相结合的方式,选取涡轮机匣冷却系统故障、3.0放气活门不能关闭等 6种典型故障训练 SVM.样本数据的参数见表2(表中N1为低压转子转速偏差,N2为高压转子转速偏差,tEGT为排气温度偏差,F为燃油流量偏差).

表2 某型航空发动机故障影响系数Tab.2 Fault influence coefficient of one aircraft engine

模拟样本的生成方法[11]为

式中:xm为模拟样本;xs为实际样本;ε为数据幅度控制参数,取 2;传感器散射度的标准差σ=[7.26,1.09,0.34,0.33];λ为均值为 0、方差为 1的标准正态分布随机变量.

3.3 航空发动机典型故障诊断结果与分析

从航空发动机故障样本中选取60组作为训练样本,42组作为测试样本,进行归一化处理,然后分别对BP神经网络、自组织神经网络、标准的SVM(c=1,g=1)、GA-SVM 和 GAPSO-SVM 进行训练和测试,结果表明 GAPSO-SVM 分类准确率明显高于其他算法.通过参数寻优得到最优c=0.023,8、最优g=0.992,4.各算法分类结果见表3,GAPSO-SVM分类示意、适应度曲线见图3和图4.

表3 各方案诊断结果比较Tab.3 Comparison of diagnosis results of each scheme

图3 GAPSO-SVM分类示意Fig.3 GAPSO-SVM classifier figure

图4 GAPSO-SVM适应度曲线Fig.4 GAPSO-SVM fitness curve

4 结 论

(1) 改进的参数寻优算法运用 Matlab软件进行编程,综合了 GA、PSO、模拟退火算法各自的优点,实现了全局和局部搜索之前的平衡.通过最优粒子与最差染色体(或最优染色体与最差粒子)间的赋值实现了两种算法的互补,利用模拟退火算法选择是否接受新粒子,一定程度上加强了PSO的局部寻优能力.

(2) GAPSO-SVM 算法相比人工神经网络有更高的诊断精度,在小样本、非线性等情况下更具优势,并且没有过学习和欠学习的问题.

(3) GAPSO-SVM算法比GA-SVM算法诊断效果更好,并且能够充分利用PSO快速收敛的特性,使算法能够快速收敛,因此比 GA-SVM 算法计算时间短、计算量小,此外算法还具有非常高的鲁棒性,能够更好地满足航空发动机对故障诊断系统的高要求.

[1] Min S H,Lee J,Han I. Hybrid genetic algorithms and support vector machines for bankruptcy prediction[J].Expert Systems with Applications,2006,31(3):652-660.

[2] Wu C H,Tzeng G H,Goo Y J,et al. A real-valued genetic algorithm to optimize the parameters of support vector machine for predicting bankruptcy[J].Expert Systems with Applications,2007,32(2):397-408.

[3] Fei Weisheng,Wang Junming,Miao Binyu,et al.Particle swarm optimization-based support vector machine for forecasting dissolved gases content in power transformer oil[J].Energy Conversion and Management,2009,50(6):1604-1609.

[4] Huang L C,Dun F J. A distributed PSO-SVM hybrid system with feature selection and parameter optimization[J].Applied Soft Computing,2008,8(4):1381-1391.

[5] Vapnik N. An overview of statistical learning theory[J].IEEE Transactions on Neural Networks,1999,10(5):988-999.

[6] 史 峰,王小川,郁 磊,等. MATLAB神经网络30个案例分析[M]. 北京:北京航空航天大学出版社,2010.Shi Feng,Wang Xiaochuan,Yu Lei,et al.MATLAB Neural Network30Cases Analysis[M]. Beijing:Beihang University Press,2010(in Chinese).

[7] Kuo C C. A novel coding scheme for practical economic dispatch by modified particle swarm approach[J].IEEE Transactions on Power Systems,2008,23(4):1825-1835.

[8] Wang Huaixi,Li Junjun. Hybrid particle swarm optimization with simulated annealing[C]//Proceedings of the International Conference on Machine Learning and Cybernetics. Shanghai,China,2004:2402-2405.

[9] Urban L A. Gas path analysis applied to turbine engine condition monitoring [C]//Proceedings of the AIAA /SAE8th Joint Propulsion Specialist Conference. New Orleans,US,1972:72-1082.

[10] 范作民,孙春林,白 杰. 航空发动机故障诊断导论[M]. 北京:科学出版社,2004.Fan Zuomin,Sun Chunlin,Bai Jie.Aviation Engine Fault Diagnosis Introduction[M]. Beijing:Science Press,2004(in Chinese).

[11] Lu P J,Hsu T C,Zhang M C,et al. An evaluation of engine faults diagnostics using artificial neural networks[J].ASME Gas Turbines Power,2001,123(2):340-346.

猜你喜欢

模拟退火适应度种群
结合模拟退火和多分配策略的密度峰值聚类算法
改进的自适应复制、交叉和突变遗传算法
山西省发现刺五加种群分布
基于双种群CSO算法重构的含DG配网故障恢复
基于遗传模拟退火法的大地电磁非线性反演研究
中华蜂种群急剧萎缩的生态人类学探讨
一种基于改进适应度的多机器人协作策略
改进模拟退火算法在TSP中的应用
基于模拟退火剩余矩形算法的矩形件排样
基于空调导风板成型工艺的Kriging模型适应度研究