基于SVM的船用柴油机增压换气系统的故障诊断*
2022-05-12胡以怀方云虎
汪 猛,胡以怀,曾 存,方云虎,张 陈,王 东
(1.上海海事大学商船学院,上海 201306;2.招商局金陵鼎衡船舶(扬州)有限公司,江苏扬州 225217)
0 引言
柴油机是船舶的核心设备。据统计,在船舶机舱设备中,主机系统仍然是事故发生率最高的设备,主机(柴油机和废气涡轮增压器)各部件的损伤占机损事故的35%~45%[1]。柴油机系统的故障诊断可以极大地提高维修效率,降低维修成本,保护生命和财产安全,所以研究船舶的故障诊断具有深远的意义。由于大型船用二冲程柴油机故障数据很难通过实验方法获得[2],目前对柴油机的性能故障诊断都是利用热工参数,但柴油机热工参数不仅受多种性能故障的影响,柴油机还与运行工况有关。
随着机器学习算法在工程领域的应用与发展,越来越受到众多学者的重视,在船舶故障诊断领域也进行了大量的研究。曾存等[3]采用交叉验证方法对SVM进行了模型参数的寻优,并且应用于船用低速柴油机换气系统的故障诊断,采用SVM对模拟参数进行分类识别,将分类效果与基于BP神经网络的故障检测效果相比,验证了在小样本数据条件下SVM分类效果优于BP神经网络;张茜等[4]提出了遗传算法对SVM参数进行寻优,将其应用于船舶机舱火灾温度的快速预测,采用GA-SVM比SVM和BP神经网络模型预测效果优异,但样本的特征参数较少,使GA-SVM的优越性表现有局限性;杨远达[5]运用了网格搜索算法和粒子群算法优化SVM参数,然后应用于船舶辅锅炉中,经过参数优化的SVM故障诊断模型比未优化的参数支持SVM性能表现更佳,但是没有进行不同运行工况下船舶辅锅炉的故障诊断,忽略运行工况的影响,缺乏一定的说服力。本文主要研究对船舶柴油机增压换气系统的故障类型进行识别分类,对于上述所提到的近年来利用SVM在船舶领域研究来看,关键在于选择适当的SVM模型,而SVM模型的参数寻优又是重中之重,所以对于复杂且故障频发的增压换气系统,选择何种方法对SVM模型的参数进行优化,对最终的分类效果取到至关重要的作用。在这里提出4种方法来进行SVM模型参数寻优并进行对比分析,为船用柴油机故障诊断方法的推广应用提供参考。
本文以船用二冲程柴油机增压换气系统为例,在Matlab∕Simulink中搭建该系统的平均值热力学模拟计算模型[6],运用模型对不同工况下主要性能故障进行了模拟计算获得故障诊断的训练样本。最后采用支持向量机对柴油机增压换气系统模拟参数进行识别分类,为柴油机故障诊断提供训练样本和趋势分析。本文提出了利用热工参数的相对偏差进行标准建模,在诊断分析之前先对各运行工况下的热工参数相对偏差进行归一化处理的方法,使不同工况的相对偏差统一在相同的尺度下,可以克服运行工况对柴油机性能故障诊断的影响。
1 支持向量机
支持向量机(Support Vector Machine,SVM)是一种基于统计学习理论的模式识别方法[7],在解决小样本、非线性及高维模式识别问题中表现出特有的优势[8]。SVM包含两类分类和多类分类。本文把换气系统的故障诊断归为两类分类问题,1代表正常状态,-1代表故障状态。SVM方法是从线性可分情况下的最优分类超平面提出的,对于n个样本的训练集能被一个超平面H:w·x+b=0有效地分开,并且离超平面最近的向量与超平面之间的距离是最大的,该超平面就称为最优超平面[9]。如图1所示,实心点和空心点分别代表两类样本。
图1 支持向量机最优超平面Fig.1 Schematic diagram of optimal hyperplane for support vector machines
定义两个标准超平面:H1:w·x+b=-1和H2:w·x+b=1,其中H1和H2分别为过各类中离分类超平面最近的样本且平行于分类超平面的平面,它们之间的距离就是分类间隔[10]。则H1到分类超平面H:w·x+b=0的距离为 |w·x+b|∕‖w‖,H1与H2之间的距离为2∕‖w‖。使间隔最大等价于使‖w‖(或‖w‖2)最小[11],并且保证H1与H2之间没有样本存在,即训练集D中所有的n个样本(xi,yi)都应该满足:
由上述可知,在线性可分的条件下,构造最优超平面的问题可以转化为求解如下式的最值问题:
式(2)为一个凸二次规划问题,可以定义如下拉格朗日函数将其转化为对偶问题处理,即:
式(3)中αi≥0,为拉格朗日乘子,分别对w和b求偏导,可求得:
将式(4)代入到式(3),可得优化函数ψ(α):
根据对偶理论,构建最优超平面的问题就可以转化成一个对偶二次规划问题:
由序列最小优化算法(SMO),可以求解出α*,然后代入求出最优的w*。根据KKT条件,该优化问题还必须满足:
将不为零的α*代入到式(7)中,可以求得分类阈值b*。
求解上述问题后得到最优的分类函数为:
对于线性不可分软间隔情况,需要引入非负松弛变量,式(3)问题就转变为:
式中:ξi≥0,为引入的非负松弛变量;C(C≥0)为惩罚因子[4]。
为了避免在高维特征空间进行复杂的运算,还需要引入核函数,式(6)就转换成如下式对偶二次规划问题:
本文选用Matlab中的Libsvm工具箱对模拟故障数据进行训练,其核函数选择RBF函数,即:
式中:K(xi,xj)为引入核函数。
2 增压换气系统的故障模拟
本文以自动化机舱实验室MAN B&W 6S35ME-B9型船用二冲程低速柴油机为模拟对象,将柴油机增压换气系统划分为空气滤器、压气机、中冷器、扫气箱、缸内燃烧、排气管及涡轮,利用Matlab∕Simulink建立系统主要模块的热力学模型。在自动化机舱记录柴油机在25%、50%、75%、90%工况下的转速、功率、机舱温度、增压器转速等热工参数,与模拟计算结果对比分析表明,除少数参数外大部分实测参数与仿真模型计算参数的误差在5%以内,说明所建立的柴油机模型的温度、压力、转速、燃油消耗率等热工参数可基本反映柴油机不同工况的热工参数的变化,证明所建立的仿真模型基本正确。基于上述柴油机热力学模型,通过改变模型参数来模拟增压换气系统的一些典型故障[11],并获得不同故障状态的热工参数。本文针对机舱温度过高、空气滤器脏堵、中冷器水侧污垢、中冷器冷却水温过高、扫气口脏堵、增压器轴承磨损、涡轮排气道脏堵等典型故障进行模拟,表1所示为不同性能故障的模型参数设置和各热工参数的变化情况。表中Tcin、l∕d、e、Tw、hv、hm、Pb分别表示环境温度、滤网长径比、冷却系数、冷却水温度、充气系数、涡轮转子机械效率、涡轮背压。
表1 柴油机不同故障下热工参数设置Tab.1 Setting of thermal parameters of diesel engine under different failures
不同故障和不同运行工况下的柴油机热工参数的相对偏差:
式中:δ为热工参数相对偏差;x为故障工况下热工参数;x0为正常工况下的热工参数。
研究表明,热工参数的相对偏差可以很好地揭示柴油机增压换气系统不同的性能故障,尽管不同的运行工况下各参数相对偏差变化程度不一样,但各偏差值之间的相互关系还是比较确定的,受运行工况的影响较小。
3 基于支持向量机的故障诊断
3.1 SVM模型的参数寻优
用支持向量机作分类时,由于惩罚因子c和核函数参数g对分类效果影响较大[12],选择合适的c和g直接关系到SVM模型分类的准确率。现有常用的参数寻优方式主要有交叉验证方法(K-CV)、粒子群算法(PSO)、网格搜索算法(GR)、遗传算法(GA)这4种常用方法,具体算法见有关资料,这里不再赘述。本文选取这4种方式分别对仿真数据进行训练来寻找最佳的参数(c,g),提高支持向量机对样本分类的准确性。7种典型故障在不同运行工况下部分热工参数的相对偏差数据样本,部分样本数据相对偏差如表2所示。
表2 部分故障样本数据相对偏差Tab.2 Relativedeviation of partial fault sampledata
分别对表1中提到的7种故障类型的参数样本进行参数选优和SVM分类,基于4种算法寻优后SVM对各故障类型样本分类准确率对比如表3~9所示。
表3 机舱温度过高故障样本分类效果Tab.3 Classification effect of failure samples with excessivecabin temperature
表4 空气滤器脏堵故障样本分类效果Tab.4 Classification effect of air filter foulingfailuresamples
表5 中冷器水侧污垢故障样本分类效果Tab.5 Classification effect of dirt failure samples at the water sideof theintercooler
表6 中冷器冷却水温过高故障样本分类效果Tab.6 Classification effect of failure samples with excessive cooling water temperature of intercooler
表7 扫气口脏堵故障样本分类效果Tab.7 Classification effect of scavenging port dirty plugging failure samples
表8 增压器磨损故障样本分类效果Tab.8 Classification effect of supercharger wear failure sampleclassification effect
表9 涡轮排气道脏堵故障样本分类效果Tab.9 Classification effect of turbineexhaust duct fouling fault samples
可以看出,交叉验证和网格搜索算法总体上还是比较稳定的,准确率也相对较高。虽然在个别故障情况下,粒子群算法和遗传算法寻优后SVM故障数据分类准确率也能达到与交叉验证和网格搜索算法参数寻优的准确率,但是由于前两者寻优的参数对比,惩罚因子c与核函数参数g相对较大,惩罚因子c较大,会出现过学习的情况,从经验来看,选择c、g较小的参数值比较合理。所以在这种情况下,优先考虑交叉验证方法和网格搜索算法来对船用柴油机增压换气系统进行支持向量机的故障诊断。鉴于网格搜索算法的基本原理是让惩罚因子c和核函数参数g在一定范围内划分网格,并且遍历了在搜索范围内的所有参数组合,搜索到最优参数,对于较小样本数据的识别预测有较好的优势,比较适合本文的研究内容,并能为下一步改进的网格搜索算法在SVM故障诊断中的应用提供保障。
3.2 SVM分类验证效果
以中冷器水侧污垢故障为例,利用传统的交叉验证方法、网格搜索算法、粒子群算法和遗传算法寻优结果和验证效果如图2~5所示。从各方法寻优结果图看出,不同的寻优方法得到的c和g各异,比较使用各方法得到得训练效果准确度,交叉验证和网格搜索算法的训练准确度达90.909 1%,要高于粒子群算法和遗传算法训练准确度的81.818 2%;利用这4种方法寻优等到的c和g,得到4个SVM模型,采用样本空间的测试集法,比较各方法验证效果图可以看出,使用网格搜索算法的验证效果达到100%,要高于基于交叉验证方法的验证效果的90%,粒子群算法和遗传算法的验证效果80%和60%。可见本文提出的热工参数相对偏差,在经过归一化处理之后,可以充分利用不同性能故障下各热工参数的相对偏差关系。再利用支持向量机方法进行柴油机增压换气系统的故障诊断,充分考虑柴油机不同运行工况下热工参数的变化,可有效地解决了柴油机不同运行工况下性能的故障诊断问题。
图2 基于交叉验证方法优化的SVM的故障诊断Fig.2 Failure diagnosis of SVM optimized by cross validation method
图4 基于粒子群算法优化的SVM的故障诊断Fig.4 Failure diagnosis of SVM optimized by particle swarm optimization algorithm
4 改进的网格搜索算法优化SVM在故障诊断中的应用
图5 基于遗传算法优化的SVM的故障诊断Fig.5 Failurediagnosisof SVM based on genetic algorithmoptimization
通过前文的分析,肯定了通过网格搜索算法优化SVM用于船用柴油机换气系统的故障诊断,但是根据图3(a)(b)可以看出,基于传统网格搜索算法进行的参数寻优,惩罚因子c和核函数参数g在一定的区间上对应的分类准确率较高,达到了90.909 1%,但是绝大部分范围内的分类准确率却相当的低,而且用时相对较长。为了实现对本文中提到的7种柴油机增压换气系统典型故障的故障诊断,使SVM模型的参数寻优结果最佳,寻优过程耗时最短,在这里提出一种对传统网格搜索算法寻优的改进思路。首先,使用交叉验证的方法,选择c的初始范围为[2-10,210],g的初始范围也设置为[2-10,210],采用的K-CV方法对训练样本进行测试,此时的K选择为3,得到此时准确率最高的(c,g);然后以这组(c,g)为区间搜索中心,在其附近选择一个小区间,在这个小范围内若采用越小步长,搜索的精确率理论上也越高,相应的耗时也将会非常长,但鉴于本文的样本数据较少,本章节提出的改进方法仅需要证明优于传统网格搜索算法优化SVM对换气系统的故障诊断即可,所以没必要选择非常小的步长,而且为了提高改进后的网格搜索算法寻优效果与采用传统的网格搜索算法寻优效果对比的严谨性,故采用与传统网格搜索算法中相同的中等步长(即步长为0.1),以此进行二次精确寻优。改进后的网格搜索算法和传统的网格搜索算法寻优效果对比如表10所示。
图3 基于网格搜索算法优化的SVM的故障诊断Fig.3 Failurediagnosisof SVMbased on grid search algorithmoptimization
表10 两种网格搜索算法寻优效果对比Tab.10 Comparison of optimization resultsof thetwogrid search algorithms
通过以上的寻优效果对比得出,传统的网格搜索算法虽然能够得到较高的准确率,但是耗时相比于改进后的网格搜索算法较长,将近3倍左右,而且改进后的网格搜索算法优化SVM应用于船用柴油机换气系统的故障诊断中分类准确率也较高,与传统的网格搜索算法优化的SVM分类准确率相差不大,但是对于船用柴油机换气系统这种复杂且特殊的装备,故障诊断的研究就显得很有意义,而进行故障诊断所需的时间就尤为重要,所以本文提出改进的网格搜索算法可以满足柴油机换气系统故障诊断对时间的要求。
5 结束语
本文利用柴油机热工参数的相对偏差可以较好地反映增压换气系统主要性能故障的特征,经过归一化处理后可以消除柴油机运行工况对热工参数不同运行工况下柴油机的影响,得出如下结论:
(1)支持向量机诊断方法,基于网格搜索算法优化的SVM分类效果比交叉验证方法、粒子群算法和遗传算法相比更为优异;
(2)本文选择对传统的网格搜索算法提出改进,结果显示改进的网格搜索算法优化SVM对柴油机换气系统进行故障诊断准确率较高,与传统的网格搜索算法相差不大,但是大幅度减少了寻优时间,能满足船舶柴油机换气系统对时间的要求;
(3)虽然有些不同工况的样本分类准确率没有达到100%,但是总体上可以验证支持向量机在不同运行工况下故障诊断的有效性,可以克服柴油机运行不同工况下故障诊断的标准建模困难。