APP下载

改进和声搜索算法优化支持向量机的柴油机故障诊断研究*

2016-10-29沈绍辉姚竹亭

组合机床与自动化加工技术 2016年4期
关键词:搜索算法正确率柴油机

沈绍辉,姚竹亭

(中北大学 机械与动力工程学院,太原 030051)



改进和声搜索算法优化支持向量机的柴油机故障诊断研究*

沈绍辉,姚竹亭

(中北大学 机械与动力工程学院,太原030051)

针对基本和声搜索算法在优化支持向量机参数时,其局部搜索能力不足且后期收敛速度比较慢的缺点,提出利用改进和声搜索算法对支持向量机相关参数进行选择优化(IHS-SVM)的方法。在这一方法中,将原算法中控制参数—记忆库取值概率(HMCR)、微调概率(PAR)和调节宽度(bw)由静态值改进为随迭代次数的不同而进行动态变化。通过对UCI中的2个数据集进行分类正确率测试,并与未优化的支持向量机(SVM)和基本和声算法优化的支持向量机(HS-SVM)测试结果对比,证明了该改进方法的优越性。最后,将其用于柴油机故障诊断,并将分类正确率与未优化SVM和HS-SVM分类结果进行比较,进一步说明改进和声搜索算法优化的支持向量机(IHS-SVM)能获得更高的分类结果正确率,即证明了该改进方法的实用性。

改进和声搜索算法;支持向量机;参数优化;柴油机故障诊断

0 引言

随着现代化工业的不断发展,柴油机作为动力设备已广泛应用到社会生产的各个场合,如石油勘探、工程机械、矿山开采等领域。然而柴油机复杂的结构和恶劣的工作环境,使其发生故障的可能性较大[1-3]。当故障发生时,不仅会直接中断整个工作系统的运行,严重时甚至引起重大事故的发生,造成经济损失。因此,为避免有害影响的产生,对柴油机进行故障诊断成为必要工作。

支持向量机(Support Vector Machine, SVM)是以统计学习理论为基础,针对有限样本的一种通用学习方法,能有效解决小样本、高维数、非线性等问题,具有良好的泛化性能[4-7],是进行机械故障识别的重要工具。然而Vapnik等通过研究证明:在解决实际问题时,支持向量机核函数选择的不同对其分类性能影响较小,以RBF核函数应用较多,但核函数参数σ和惩罚因子C的选择却会直接影响到其分类性能的好坏,因此,分类识别中常利用一些智能优化算法对支持向量机参数进行选择以提高最终的分类正确率、增加结果的可靠性。基本和声搜索算法(HS)具有很强的全局搜索能力和较快的收敛速度,但是在进行参数选择优化时,其局部搜索能力存在不足且后期收敛速度减慢。对此,提出一种基于自适应控制参数—记忆库取值概率(HMCR)、微调概率(PAR)和调节宽度(bw)的改进和声搜索算法(IHS)优化RBF核函数的支持向量机来进行柴油机故障识别的方法,以期能够获得更高的故障识别率,进而能够正确判断故障类型,便于采取有效处理措施以保证系统正常运转、减少损失。

1 和声搜索算法优化支持向量机的基本理论

1.1支持向量机(SVM)基本原理

SVM基本思想是寻找一个能够满足分类要求的最佳超平面,并在保证正确分类的基础上,该平面使得两类数据集的距离最大[8-10]。其基本原理如下[11-12]:

给定样本:(xi,yi),i=1,…n,xi∈Rd,yi∈{+1,-1}。xi为输入特征,yi为决策属性。则超平面寻优问题可以转为如下函数求最小解:

(1)

约束条件:

yi[(w·xi)-b]+ξ-1≥0,ξ≥0

(2)

其中w为超平面的法向量;C>0为错分样本的惩罚因子;ξ为松弛变量;b∈R为阈值。紧接着引入Lagrange乘子,将问题变为对偶函数求最大值

(3)

其中0≤ai≤C,i=1,…l。

引入满足Mercer条件的核函数K(xi,yi),将输入向量映射到一个高维数的特征空间,则可得到决策函数:

(4)

其中ai≠0,且所对应的向量支撑了最优超平面,即称为支持向量。

1.2基本和声搜索算法原理

1.2.1和声搜索算法简述

和声搜索(Harmonysearch,HS)算法[13-15]是2001年韩国学者GeemZW等人提出的一种新颖的智能优化算法。该算法模拟的是音乐师们演奏音乐的过程,即乐师们在音乐创作中,凭借自己的记忆,通过反复调整乐队中各乐器的音调,最终达到一种美妙的和声状态[16-17]。应用中每个乐器产生的音调用于求解目标函数值,满足条件的最优值对应的解即为最美和声。和声搜索算法原理简单、可控参数少、易于实现。文献[18]利用和声搜索算法解决冗余系统的优化问题并最终取得了满意效果;文献[19]提出利用和声搜索算法求解零空闲流水线调度问题,并通过仿真实验证明了该方法的优越性。

1.2.2基本和声搜索算法实现步骤

在解决实际问题时,和声搜索算法核心内容主要包括三方面[20-22]:①和声记忆库初始化;②随机产生新和声;③更新原始记忆库。其具体实现步骤如下:

(1)和声记忆库初始化

随机产生HMS个和声初始解,并将其存储于和声记忆库(HM)中,如下所示:

(5)

(2)随机产生新和声

新的和声的生成就是产生新的解。其产生方式遵循三个规则:①从原和声记忆库中选取;②随机创作新的和声(即随机生成新的解);③对新解进行微调。

(6)

其中,rand1为(0,1)均匀分布的随机数;HMCR为和声记忆库取值概率;Xi为第i个解的取值范围。

如果产生的新和声来自原始和声记忆库,则要以如下方式对其进行微调扰动。

(7)

其中,bw为音调微调宽带;PAR为音调微调概率;rand和rand2为(0,1)均匀分布的随机数;当取值空间连续时,微调是在原音调的基础上加上一个介于-bw和+bw之间的随机步长;k=1,…HMS,当取值空间离散时,其微调是在和声记忆库取出的音调的“左右邻居”中重新选择。

(3)更新原始记忆库

利用目标函数对步骤(2)产生的新解进行评价,若新和声得到的值优于原始记忆库的最差和声对应的值,则将新和声替换原来的差和声;否则原始记忆库不改变。

(4)算法循环迭代至满足终止条件

重复步骤(2)和步骤(3)直至达到最大迭代次数并输出最优解。

1.3改进和声搜索算法

随着和声搜索算法的不断发展和广泛应用,为弥补不足、改善算法性能,许多学者对其进行了改进,主要是对算法中的一些控制参数进行重新设置,并在解决实际问题过程中取得了良好的效果。

在算法中,和声记忆库取值概率HMCR,微调概率PAR和调节宽度bw是三个重要参数,其取值关系到算法的收敛速度和求解的精度。在基本和声搜索算法中,由于这三个参数均为固定值,整个迭代过程保持不变。而随着迭代次数的增加,算法对三个参数的取值要求发生变化,因此,它们的取值固定便影响了算法的性能。

鉴于上述原因,为保证算法的寻优能力和增加解的多样性,对原算法进行改进,即对参数HMCR、PAR和bw进行如下的自适应优化设置:

(8)

(9)

(10)

其中,Tmax为最大迭代次数,t为当前迭代次数,HMCR(t)、PAR(t)和bw(t)为第t代的记忆库取值概率、微调概率和调节宽度;HMCRmax和HMCRmin为记忆库取值概率的最大值和最小值;PARmax和PARmin为微调概率的最大值和最小值,bwmax和bwmin为调节宽度的最大值和最小值。算法开始运行时,希望有小的HMCR、PAR和大的bw,这样算法可以在全局范围内进行搜索,增加解的多样性;当算法迭代多次后,希望算法有大的HMCR、PAR和小的bw,这样算法在局部范围内寻找最优解[23]。

改进和声搜索算法流程图如图1所示。

图1 改进和声搜索算法流程图

1.4基于改进和声搜索算法优化支持向量机的参

数选择

利用改进和声搜索算法对支持向量机进行优化时,需要对一些相关控制参数进行设置,以便支持向量机最终获得较高的分类正确率。

(1)初始化算法中的一些主要参数。如:和声记忆库HM容量,即初始和声数HMS取值;记忆库取值概率HMCRmax和HMCRmin;音调微调概率PARmax和PARmin;音调微调宽带bwmax和bwmin;它们的取值影响到算法的性能。

(2)设置目标函数。目标函数用于评价解的优劣,改进和声搜索算法对支持向量机进行优化的目的是为了获取更高的分类正确率,因此,将目标函数设置为:

f(x)=Vacc

(11)

其中Vacc为分类正确率。

(3)初始化支持向量机关键参数的搜索范围。由于支持向量机惩罚因子C和核函数参数σ的不同取值关系到算法优化支持向量机过程中寻求最优解的能力,即会影响到最后分类结果的好坏,因此,应当确定合适的搜索范围以有助于分类正确率的提高。

为了验证参数改进后的和声搜索算法(IHS)的优越性,在MATLAB7.0环境下利用2个UCI数据集进行分类正确率测试,如表1所示,并将分类结果与参数未优化的支持向量机(SVM)、基本和声搜索算法优化的支持向量机(HS-SVM)的测试结果进行比较,如表2和表3所示;其中设置和声记忆库大小HMS=20,改进算法中记忆库取值概率为HMCRmax=0.95和HMCRmin=0.90,音调微调概率为PARmax=0.55和PARmin=0.25,音调微调宽带为bwmax=0.06和bwmin=0.01;而基本算法中的记忆库取值概率HMCR=0.9,音调微调概率PAR=0.3,音调微调宽bw=0.06;算法的最大迭代次数Tmax=100,参数C和σ的初始搜索范围为[0.1 50]。从中可以看出,该改进算法优化的支持向量机进行分类测试的时间虽与原始算法相差不多,但分类正确率却有一定程度的提高。

表1 UCI数据集说明

表2 Auto MPG数据集测试结果

表3 Ecoli数据集测试结果

2 改进和声搜索算法优化的支持向量机用于柴油机故障诊断

2.1 实验方案设计

实验对象是某12缸柴油机,故障设置为G1—左一缸渗油、G2—右六缸断油、G3—供油提前角增大2.5°、故障G4—空气滤清器堵塞;信号采集装置有压电式加速度传感器、电荷放大器、DASP数据采集仪及笔记本电脑等;实验中采集正常状况、故障G1、故障G2、故障G3、故障G4五种情况下柴油机转速1500r/min、采样频率40kHz、左一缸缸罩处的振动信号数据,提取每种工况下样本各12组,并取一个转动周期的信号样本作为研究对象。

2.2信号分析与特征值提取

2.2.1信号分析

在故障诊断过程中,从振动信号中提取相关故障的特征,是对机械设备准确诊断的关键[24]。局域均值分解(LMD)方法是Smith于2005年提出的一种新的时频分析方法[25]。其基本思想是首先对采集到的复杂信号进行分解得到一系列的包络信号和纯调频信号,接着将两者作乘积运算得到PF分量,最后将所有的PF分量的瞬时幅值(即包络信号)和瞬时频率(由纯调频信号获取)进行组合便得到原信号的时频信息。它是进行柴油机非平稳振动信号分析的有利工具。

对于任意信号x(t),局域均值分解步骤如下[26-27]:

(1)利用信号x(t)的所有局部极值点组成局部均值函数m11(t)和包络函数a11(t),并分离出局部均值函数m11(t),得到:

h11(t)=x(t)-m11(t)

(12)

式中的下标表示第一个包络信号的第一次迭代。

(2)解调h11(t)得到:

s11(t)=h11(t)/a11(t)

(13)

理想状况下,s11(t)应该为纯调频信号,即局域包络函数a12(t)满足a12(t)=1。如果a12(t)≠1,即s11(t)没有达到要求,则将s11(t)作为原始数据再次进行上述步骤操作,以最终使s11(t)成为纯调频信号,而此时局域包络函数a1(n+1)(t)满足等式a1(n+1)(t)=1。

(3)将迭代过程中得到的所有具有包络函数相乘得到PF分量的包络信号,即:

(14)

(4)将包络信号a1(t)与纯调频信号s1n(t)乘积运算得到第一个PF分量,即:

PF1=a1(t)·s1n(t)

(15)

PF1的幅值为a1(t),瞬时频率f1(t)可直接由s1n(t)求得,即:

(16)

(5)从x(t)中将PF1分量分离以获取新的信号u1(t),接着将其作为原始信号进行k次上述步骤循环,最后形成一个单调信号uk(t),即:

u1(t)=x(t)-PF1(t)

u2(t)=u1(t)-PF2(t)

uk(t)=uk-1(t)-PFk(t)

(17)

(6)经上述步骤,信号x(t)最终被分解为k个PF分量和一个单调信号uk(t),即:

(18)

对五种工况下采集到的振动信号利用上述步骤进行局域均值分解,以便于后续对故障特征值的顺利提取。其中正常状况和故障G2两种工况下的振动信号局域均值分解结果图如图2所示。

图2 其中两种工况下的局域均值分解图

2.2.2特征值提取

为提高柴油机故障诊断的分类正确率、增加诊断结果的可靠性,对于局域均值分解后形成的8个PF分量,为提高分类正确率、保证诊断结果的可靠性,提取包含较多故障信息的前5个分量组成特征向量T0,即

T0=[E1,E2…E5]

(19)

为减少计算量和便于数据处理,对特征向量T0进行归一化,取总能量

,归一化后的特征向量为T,则

T=[E1/E,E2/E…E5/E]

(20)

表4所示为五种工况下各一组振动信号提取到的PF分量经归一化处理后的特征值。

表4 五种工况下各一组振动信号提取到的特征值

2.3柴油机故障诊断

2.3.1获取诊断样本数据

实验时每种工况下的柴油机振动信号采集12次,因此,经局域均值分解并进行特征值后可以得到60个样本数据。在故障诊断中,每种工况的前8个样本特征值组成训练样本,其余组成测试样本,即最终得到五种工况下的训练样本数8×5个,测试样本数4×5个。表5和表6列出了五种工况下各一组训练样本和测试样本。

表5 一组训练样本

表6 一组测试样本

2.3.2支持向量机故障诊断

支持向量机进行柴油机故障诊断的流程图如图3所示。设置和声搜索算法的和声记忆库大小HMS=20,其中改进算法中记忆库取值概率为HMCRmax=0.95和HMCRmin=0.90;改进算法中的音调微调概率为PARmax=0.55和PARmin=0.25,音调微调宽带为bwmax=0.06和bwmin=0.01;而基本算法中的记忆库取值概率HMCR=0.9,音调微调概率PAR=0.3,音调微调宽bw=0.06;取算法的最大迭代次数Tmax=50,参数C和σ的初始搜索范围为[0.1 50]。则在MATLAB7.0环境下利用改进和声搜索算法训练支持向量机并用于对柴油机样本数据进行分类正确率测试,将分类结果与未优化支持向量机(SVM)和基本和声搜索算法优化的支持向量机(HS-SVM)进行比较,其各自故障分类结果图如图4所示,分类正确率对应的参数值及运行时间如表7所示。结果表明,改进和声搜索算法优化的支持向量机进行柴油机故障诊断的识别率更高。

图3 支持向量机进行柴油机故障诊断的流程图

图4 故障分类结果图

指标未优化SVMHS-SVMIHS-SVM分类正确率90%95%100%运行时间—3.216676s3.375206s参数C38.724024.9583参数σ13.572724.1206

3 结束语

支持向量机核函数参数和惩罚因子取值的好坏会影响到其在故障识别中分类正确率获取的高低,而基本和声搜索算法在参数优化时局部搜搜能力较差。针对这一问题,本文提出利用改进和声搜索算法对支持向量机相关参数进行优化,不仅克服了在使用时对惩罚因子和核函数参数盲目选择的缺点,而且在UCI数据集测试和柴油机故障诊断实验中获得的良好效果证明了该改进方法能够获得比原始算法更高的分类正确率,即表明改进和声搜索算法优化的支持向量机对于柴油机故障诊断具有重要的应用价值。

[1] 田沛,沈颖刚,毕凤荣,等.基于小波包和BP神经网络的柴油机故障分析[J].小型内燃机与摩托车,2014,43(2):44-49.

[2] 刘学坤.基于支持向量机和油液检测的船舶柴油机故障诊断研究[D].大连:大连海事大学,2013.

[3] 王强龙.基于 ARM 的嵌入式柴油机故障诊断系统的设计与研究[D].太原:中北大学,2013.

[4] 谭鹏,曹平.基于灰色关联支持向量机的地表沉降预测[J].中南大学学报(自然科学版),2012,43(2):632-637.

[5] Wang Xiaolan, Li Hui. One-month ahead prediction of wind speed and output power based on EMD and LSSVM[C]//International Conference on Energy and Environment Technology. Guilin, China:IEEE,2009:431-442.

[6] Yang Xiyun, Cui Yuqi, Zhang Hongsheng, et al.Research on modeling of wind turbine based on LS·SVM[C]// International Conference on Sustainable Power Generation and Supply. Nanjing, China,2009:1-6.

[7] 钱渊,宋军,傅柯.基于支持向量机补偿的灰色模型网络流量预测[J].探测与控制学报,2012,34(1):69-72.

[8] 丁世飞,齐丙娟,谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报,2011,40(1):2-10.

[9] 万鹏,王红军,徐小力. 局部切空间排列和支持向量机的故障诊断模型[J].仪器仪表学报,2012,33(12):2789-2795.

[10] 刘朔孺,杨敏,张方辉,等.基于支持向量机分类的嘉陵江草街水库甲藻水华预警[J].湖泊科学,2015,27(1):38-43.

[11] 顾亚祥,丁世飞.支持向量机研究进展[J].计算机科学,2011,38(2):14-17.

[12] 刘冲.基于优化支持向量机的采煤机故障诊断技术[J].山东农业大学学报(自然科学版),2015,46(1):132-135.

[13] Geem ZW, Kiln JH,Loganathan GV.A new heuristic optimization algorithm: harmony search[J]. Simulation,2001,76(2):60-68.

[14] MAHDAVI M,FESANGHARY M,DAMANGIR E.An improved harmony search algorithm for solving optimization problems[J].Applied Mathematics and computation,2007,188(2):1567-1579.

[15] ALIA O, MANDAVA R. The variants of the harmony search algorithm: an overview [J]. Artificial Intelligence Review,2011,36(1):49-68.

[16] Sivasubramani S, Swarup K S. Multi-objective harmony search algorithm for optimal power flow problem[J].International Journal of Electrical Power and Energy Systems,2011,33(3):745-752

[17] GEEM Z W. Novel derivative of harmony search algorithm for discrete design variables[J].Applied Mathematics and Computation,2008,199(1):223-230.

[18] Nahas, Nabil, Thien-My, et al. Harmony search algorithm: Application to the redundancy optimization problem[J].Engineering Optimization,2010,42(9):845-861.

[19] 武磊,潘全科,桑红燕,等.求解零空闲流水线调度问题的和声搜索算法[J].计算机集成制造系统,2009,15(10):1960-1967.

[20] 陈祝峰.配电网重构及可靠性评估方法的研究[D].长沙:湖南大学,2014.

[21] 刘梦云.基于多目标和声搜索算法的给水管网优化设计的研究[D].杭州:浙江工业大学,2013.

[22] Geem Z W. State-of-the-art in the structure of harmony Search algorithm[J].Studies in Computational Intelligence,2010,270(5):1-10.

[23] 曲良东,何登旭,黄勇.自适应改进和声模式搜索算法[J].小型微型计算机系统, 2014,35(1):189-192.

[24] 李红芳,张清华.基于自适应免疫选择模型的齿轮故障诊断[J].煤矿机械,2014,35(2):232-234.

[25] Smith S J.The local mean decomposition and its application to EEG perception data[J].Journal of the Royal Society Interface, 2005,2(5):443-454.

[26] Jonathan S. Smith. The local mean decomposition and its application to EEG perception data[J].Journal of the Royal Society Interface,2005,2(5):444-450.

[27] 李志农,刘卫兵,易小兵.基于局域均值分解的机械故障 欠定盲源分离方法研究[J].机械工程学报,2011,47(7):97-102.

(编辑赵蓉)

Research on Diesel Engine Fault Diagnosis Based on Support Vector Machine Optimized by Improved Harmony Search Algorithm

SHEN Shao-hui, YAO Zhu-ting

(School of Mechanical and Power Engineering, North University of China, Taiyuan 030051, China)

In view of the question which insufficient local search ability and slow convergence speed at the late period of basic harmony search algorithm in the optimization of support vector machine parameters, the paper uses improved harmony search algorithm to optimize the related parameters of support vector machine. In the method, it changes the static values of control parameters- memory value probability (HMCR), trimming probability (PAR) and width (bw) in the original algorithm to dynamic values depending on the number of iterations. Through classification accuracy test of two UCI data sets and comparison with test results from unoptimized SVM and HS-SVM, it demonstrates the superiority of the method. Finally, the method is for diesel engine fault diagnosis, and through comparison with unoptimized SVM and HS-SVM, it further proves that IHS-SVM can obtain higher classification accuracy. Namely, it illustrates practicability of the proposed method.

improved harmony search algorithm; support vector machine; parameter optimization; diesel engine fault diagnosis

1001-2265(2016)04-0083-06DOI:10.13462/j.cnki.mmtamt.2016.04.023

2015-06-26

国家自然科学基金资助项目(51175480)

沈绍辉(1988—),男,河北邢台人,中北大学硕士研究生,研究方向为机械系统故障诊断,(E-mail)1209161964@qq.com。

TH165+.3;TG506

A

猜你喜欢

搜索算法正确率柴油机
一种基于分层前探回溯搜索算法的合环回路拓扑分析方法
个性化护理干预对提高住院患者留取痰标本正确率的影响
改进的非结构化对等网络动态搜索算法
改进的和声搜索算法求解凸二次规划及线性规划
门诊分诊服务态度与正确率对护患关系的影响
美国FCA 推出第三代EcoDie s e l V6 柴油机
谭旭光:柴油机50年内仍大有可为
生意
生意
现代柴油机的技术发展趋势