APP下载

基于随机森林和支持向量机的船舶柴油机故障诊断

2017-10-30贺立敏王岘昕

中国航海 2017年2期
关键词:柴油机故障诊断向量

贺立敏, 王岘昕, 韩 冰

(1.中远海运发展股份有限公司,上海 200135;2.上海船舶运输科学研究所 航运技术与安全国家重点实验室,上海 200135)

基于随机森林和支持向量机的船舶柴油机故障诊断

贺立敏1, 王岘昕2, 韩 冰2

(1.中远海运发展股份有限公司,上海 200135;2.上海船舶运输科学研究所 航运技术与安全国家重点实验室,上海 200135)

针对船舶低速二冲程柴油机故障的分析问题,提出基于随机森林和支持向量机的船舶柴油机故障诊断方法。对船舶低速二冲程柴油机MAN B&W 6S50MC-C建立故障仿真模型并验证其有效性;在此基础上,通过故障仿真模型生成故障样本。运用基于随机森林的VarSelRF特征选择算法对故障数据进行降维,提出运用支持向量机对降维后的故障数据进行分类的方法。通过仿真试验验证并分析该方法的有效性。

船舶工程;船舶柴油机;故障诊断;随机森林;特征选择;支持向量机

船舶柴油机作为船舶动力系统中的关键设备,在保证船舶正常运行方面发挥着重要作用。船舶柴油机出现故障不仅会直接影响船舶动力系统,而且会间接影响船舶其他重要设备。因此,对船舶柴油机进行维护和维修具有重要意义。[1]以往船舶柴油机故障是依靠轮机员的经验判断的,随着柴油机实时监控系统逐步普及,可将传感器采集到的状态参数作为专家分析评估柴油机运行状态的依据。此外,随着智能算法的研究逐步深入,众多有效的模式识别算法已应用到船舶柴油机故障诊断中,用智能算法取代专家分析法来对船舶柴油机进行故障诊断是未来的发展趋势,能快速、有效、实时地对柴油机的状态进行诊断,提高维护效率,降低人力成本。

船舶柴油机是包含众多子系统的复杂非线性系统,各子系统之间相互影响,将常规的基于线性假设的模型应用到船舶柴油机故障诊断中往往难以达到理想的效果。[2]此外,目前配备实时监测系统的船舶柴油机上布置有众多用来采集柴油机实时状态参数的测点,大量数据在不处理的情况下利用会增加诊断系统的运算开销,对系统的快速性产生不利影响。这里针对上述2个问题对船舶柴油机故障诊断方法进行研究。

支持向量机算法适于解决小样本、非线性等问题,对船舶柴油机表现较好;随机森林算法具有准确率高、鲁棒性好、易于使用和运算开销小等优点,运用该类方法对监测数据进行处理有利于简化故障诊断系统的运算,提高诊断的效率。因此,这里提出基于随机森林和支持向量机的船舶柴油机故障诊断方法,建立故障诊断的模型,对低速二冲程柴油机的几种常见故障进行分析,并通过数值试验验证该方法的有效性。

1 船舶低速二冲程柴油机故障模型

对船舶低速二冲程柴油机MAN B&W 6S50MC-C进行故障分析。[3]由于柴油机故障状态数据难以通过试验获得,因此利用AVL Boost 2016软件对柴油机常见的4种故障进行仿真,并通过与正常工况下的状态参数相对比验证仿真模型的有效性。MAN B&W 6S50MC-C的主要参数见表1。

表1 MAN B&W 6S50MC-C的主要参数

AVL Boost 2016平台下的MAN B&W 6S50MC-C仿真模型见图1。系统共包含33个元件,其中:SB1~SB3为系统边界;VP1~VP5为扫气箱;PL1为进气总管;CO1为空冷器;TC1为涡轮增压器;C1~C6为气缸;MP1~MP8为传感器测点。

图1 AVL Boost 2016平台下的 MAN B&W 6S50MC-C仿真模型

为获得理想的仿真结果,对仿真模型的参数进行合理的设置,尤其是关键部件(如气缸和燃烧模型)的参数。仿真模型主要参数见表2。

表2 MAN B&W 6S50MC-C仿真模型主要参数

气缸及燃烧模型是仿真中的关键模块,对仿真结果的影响明显,因此需谨慎设置。活塞随曲轴角的运动曲线见图2,燃烧放热规律和已燃燃油质量分数曲线见图3,排气阀升程曲线见图4。仿真结果与台架试验值对比见表3。

由仿真结果可知,除了透平后温度以外,其余状态参数均控制在5%以内,同时一个循环内气缸内的温度和压力变化曲线及柴油机扭矩变化曲线(见图5~图7)与实际柴油机的运行规律拟合良好,故该仿真模型能较好地模拟真实工况。通过改变正常工况下的参数来产生故障样本,记录故障状态下各测点的观测值。

图2 活塞随曲轴角的运动曲线

a) 燃烧放热规律

b) 已燃烧油质量分数图3 燃烧放热规律和已燃燃油质量分数

图4 排气阀升程曲线

表3 仿真结果与台架试验值对比

对各缸供油量减少、压缩比降低、排气阀提前关闭和增压器效率降低等4种常见的船舶柴油机故障进行仿真,在仿真模型中改变各部件对应的参数,对故障工况进行模拟。定义各参数在5%范围内的偏离为正常工况;5%~10%,10%~20%及20%以上的偏离分别为轻微、中等和严重故障。总共仿真生成100个故障样本,每种故障样本中轻微、中等和严重故障的比例分别为40%,40%和20%。对于参数在5%范围内变化的正常工况,对每种故障类型仿真生成30个正常工况样本。

图5 气缸压力变化曲线

图6 气缸温度变化曲线

图7 柴油机扭矩变化曲线

在仿真结果中,每个样本包含17种状态值,分别为压缩前温度及压力、透平前温度及压力、透平后温度及压力、中冷前温度及压力、中冷后温度及压力、扫气箱进口温度及压力、扫气温度及压力、排气温度及压力和最大燃烧压力。

2 基于随机森林和支持向量机的故障诊断方法

船舶柴油机的测点众多,采集到的数据量庞大,需对监测数据进行筛选处理,以简化运算,提高诊断的快速性。因此,采用基于随机森林的特征选择算法对故障样本数据进行处理。

采用支持向量机对降维之后的数据进行分类和诊断,由于是多种故障的分类,因此采用多分类支持向量机中一对一的分类策略进行诊断,即对每种状态两两建立分类平面,生成决策函数,采用投票法将得分最高的一类作为诊断结果。[4]

2.1基于随机森林的VarSelRF算法[5]

随机森林算法[6]是一种包含多个决策树的集成学习方法,以决策树为基学习器,运用Bagging的方法进行集成,能显著提高基学习器的性能,具有泛化性能强、运算开销小和不存在过拟合等优点。随机森林采用自助法(Bootstrap)重采样技术生成多个随机决策树作为基分类器,在生成若干决策树之后采用Bagging方法集成。

随机决策树生成方法为:从样本中有放回地选取样本集,重复k次,这k个样本集作为决策树的训练集生成k个决策树,未被抽取的约36.8%的样本作为袋外样本(OOB)。从原有的特征中随机选取m个特征进行最优分割点筛选,重复上述步骤生成决策树。

VarSelRF是基于随机森林的特征选择算法,采用基于袋外样本误差率的反向删除方法。该方法根据随机森林中每个变量的重要性得分对变量进行排序,将一定比例的得分最低的变量剔除,从而实现特征选择。

2.2支持向量机算法

船舶柴油机故障诊断实质上是一个分类问题,有众多解决方法。由故障样本数据的产生过程可知其为监督学习问题,通常采用的分类方法有神经网络、随机森林和支持向量机等。针对船舶柴油机故障的特点,支持向量机更加适合解决该问题。支持向量机更加适合解决复杂非线性的小样本问题,神经网络在训练过程需大量样本,且纳入新故障类型之后需重新训练,对新故障类型的推广能力差。随机森林简单易实现,不存在过拟合问题,但针对复杂非线性的小样本问题的表现不如支持向量机。[7]因此,在对故障模型进行分类时采用支持向量机的方法。

支持向量机的主要原理为:寻找特征空间中的最优分离超平面,使不同类别样本间的几何间隔最大化,用最优分离超平面作为分类的依据。[8]

支持向量机算法等价于求解二次规划问题,即

(1)

s.t.yi(ωi·x+b)≥1,i=1,2,…,l

(2)

式(1)和式(2)中:αi为拉格朗日乘子。令目标函数的偏导数为零,可得

(3)

(4)

由此,目标函数可转化为一个简单的形式。考虑到误分类点的存在,引入软间隔最大化,原问题等价于

(5)

(6)

式(5)和式(6)中:C为惩罚系数,反映分类器能在多大程度上允许误分类点存在。

对于非线性问题,不能通过一个超平面分离正负例,但存在一个超曲面能区分正负例,因此可采用核方法将原空间样本映射到高维的特征空间,在特征空间里样本线性可分。[9]核方法不直接寻求原空间到特征空间的映射关系,而是引入核函数直接计算内积。核函数定义为

K(xi,xj)=〈Φ(xi),Φ(xj)〉 (i,j=1,2,…,l)

(7)

常用的核函数有高斯径向基函数和多项式核函数,其表达式分别为

由此核函数形式的支持向量机分类问题可表示为

(10)

(11)

通过求解该规划问题,最终得到的决策函数为

(12)

3 数值试验与结果分析

采用基于随机森林和支持向量机的故障诊断方法对故障数据进行计算,各参数分别为:压缩前压力P1,压缩前温度T1,中冷前压力P2,中冷前温度T2,中冷后压力P3,中冷后温度T3,扫气箱进口压力P4,扫气箱进口温度T4,扫气压力P5,扫气温度T5,排气压力P6,排气温度T6,透平前压力P7,透平前温度T7,透平后压力P8,透平后温度T8,最大燃烧压力Pz。故障1为各缸供油量减少,故障2为压缩比降低,故障3为排气阀提前关闭,故障4为增压器效率降低。

数值试验的流程见图8,将故障原始数据均分为训练集和测试集,对训练集中的样本进行特征选择处理并建立支持向量机的故障分类模型,最后用测试样本验证故障诊断模型的有效性。

图8 数值试验流程

采用VarSelRF算法对故障样本及正常样本进行特征提取,反向删除过程中每轮迭代的变量剔除率设为0.2。根据随机森林重要性得分的定义计算出每个变量的平均准确率下降,归一化后得到各变量的重要性得分,4种故障对应特征的重要性得分见图9。

利用支持向量机对筛选出的变量进行诊断,核函数采用高斯径向基函数,利用网格法调整参数,根据经验取惩罚系数C=10,根据不同的故障特点调整σ2的取值,可得到4种常见故障与正常工况的决策函数。用测试集进行验证,可得到分类器的识别准确率,最终结果见表4。

根据提出的方法,对每种状态两两建立决策函数。为方便展示结果,只对故障状态和正常状态建立分类模型,在与其他故障状态进行区分时采用的方法与此类似。由表4可知,该方法在从17个输入变量中选取2个变量的同时取得了很高的诊断准确率,因此该方法能有效选取相关特征,剔除冗余特征,并能准确诊断故障状态。

a) 故障1重要性得分

b) 故障2重要性得分

c) 故障3重要性得分

d) 故障4重要性得分图9 4种故障对应特征的重要性得分

表4 特征选择与诊断准确率

4 结束语

本文提出基于随机森林和支持向量机的故障诊断方法对船舶低速柴油机MAN B&W 6S50MC-C进行分析。建立MAN B&W 6S50MC-C的仿真模型,验证模型的有效性;利用该模型生成柴油机正常工况和故障工况下的状态数据,并将其作为训练数据。

由计算结果可知,该方法能有效提取船舶柴油机故障的特征变量,减少无关变量和冗余变量,并能准确诊断故障的状态,对提高船舶柴油机故障诊断系统的快速性和准确性具有一定的指导意义。

[1] 郭江华,侯馨光,陈国钧,等.船舶柴油机故障诊断技术研究[J].中国航海,2005,28(4):75-78.

[2] 柴艳有.基于核学习理论的船舶柴油机故障诊断研究[D].哈尔滨:哈尔滨工程大学,2012.

[3] 王公胜.船用低速二冲程柴油机工作过程仿真与故障模拟[D].大连:大连海事大学,2010.

[4] 潘明清.基于支持向量机的机械故障模式分类研究[D].杭州:浙江大学,2005.

[5] BREIMAN L.Random Forests [J].Machine Learning,2001,45:5-32.

[6] ZHOU Zhihua.Ensemble Methods:Foundation and Algorithm [M].Boca Raton:CRC Press,2012:57-61.

[7] OZER S,CHEN C H,CIRPAN H A.A Set of New Chebyshev Kernel Functions for Support Vector Machine Pattern Classification [J].Pattern Recognition,2011,44:1435-1447

[8] 李航.统计学习方法[M].北京:清华大学出版社,2012:95-124 .

[9] KUNG S Y.Kernel Methods and Machine Learning [M].Cambridge:Cambridge University Press,2014:360-364.

FaultDiagnosisofMarineDieselEngineBasedonRandomForestandSupportVectorMachine

HELimin1,WANGXianxin2,HANBing2

(1.COSCO SHIPPING Development Co.,Ltd.,Shanghai 200135,China; 2.State Key Laboratory of Navigation and Safety Technology,Shanghai Ship and Shipping Research Institute,Shanghai 200135,China)

A fault diagnosis method for marine diesel engine based on random forest and support vector machine is proposed.The fault model of MAN B&W 6S50MC-C marine diesel engine is established and verified with test-bed experiment results.The model is used to generate sample simulations of typical engine faults for processing.The VarSelRF algorithm based on the random forest is used to exclude irrelevant factors and identify effective features to facilitate the diagnosis process,improving the process speed.The processed data is classified by support vector machine classification algorithm.The effectiveness of the proposed method is verified by numerical experiments.

ship engineering; marine diesel engine;fault diagnosis;random forest;feature selection;support vector machine

U664.121.1

A

2017-03-17

上海市青年科技启明星计划资助项目(15QB1400800)

贺立敏(1961—),男,上海人,工程师,研究方向为柴油机应用及管理、船舶经济运行管理。E-mail:he.limin@coscoshipping.com

1000-4653(2017)02-0029-05

猜你喜欢

柴油机故障诊断向量
比亚迪秦EV充电系统故障诊断与排除
向量的分解
基于包络解调原理的低转速滚动轴承故障诊断
聚焦“向量与三角”创新题
美国FCA 推出第三代EcoDie s e l V6 柴油机
谭旭光:柴油机50年内仍大有可为
数控机床电气系统的故障诊断与维修
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线
现代柴油机的技术发展趋势