APP下载

基于相对混乱度特征选择的船舶风机智能状态监测与故障诊断

2023-06-22蒋佳炜胡以怀丁梦豪高雨颀周辉

上海海事大学学报 2023年1期
关键词:状态监测支持向量机特征选择

蒋佳炜 胡以怀 丁梦豪 高雨颀 周辉

摘要:为提高船舶机舱状态监测的实时性和故障诊断的准确性,提出一种由数据获取、特征提取、特征选择和故障识别组成的智能状态监测和故障诊断框架,以及基于相对混乱度的特征选择方法和基于特征选择的支持向量机训练方法。该方法相比传统方法在故障识别准确率上有所提升,可达到94.46%,并且可有效缩短分类器计算耗时,最快可将其缩短77.8%。文中提出的算法框架、特征选择方法、基于特征选择的支持向量机训练方法和智能故障诊断方法相比现有方法有一定的优势,对机舱中回转机械设备的状态监测和故障诊断有一定的参考价值。

关键词:智能故障诊断; 特征选择; 支持向量机; 状态监测; 智能机舱

中图分类号:  U676.4+2文献标志码:  A

Intelligent condition monitoring and fault diagnosis of marine fans

based on feature selection of relative chaos

JIANG Jiawei, HU Yihuai, DING Menghao, GAO Yuqi, ZHOU Hui

(Merchant Marine College, Shanghai Maritime University, Shanghai 201306, China)

Abstract: In order to improve the real-time performance of condition monitoring and the accuracy of fault diagnosis of ship intelligent engine rooms, this paper proposes a framework of intelligent condition monitoring and fault diagnosis composed of data acquisition, feature extraction, feature selection and fault recognition, as well as the feature selection method based on relative chaos and the support vector machine training method based on feature selection. Compared with traditional methods, this method improves the fault recognition accuracy, reaching 94.46%. It can effectively reduce the calculation time of the classifier, and it can be reduced by 77.8% at the fastest. The algorithm framework, the feature selection method, the support vector machine training method and the intelligent fault diagnosis method proposed in this paper have certain advantages over the existing methods, which  have certain reference value for the condition monitoring and fault diagnosis of  rotating machinery equipments in the engine room.

Key words: intelligent fault diagnosis; feature selection; support vector machine; condition monitoring; intelligent engine room

0 引 言

在《中國制造2025》中,高科技造船被列为十大重点领域之一,其中智能船舶是其重要组成部分[1]。可以预见,未来10~20年内智能船舶是航运业发展的重要方向之一。在全球航运的大背景下,船舶航行安全是保障航运业健康良好运行和发展的前提。智能船舶技术中的智能机舱技术是决定船舶安全、高效、平稳航行的核心要素。在智能船舶的发展过程中,船舶也在向大型化、高速化、少人化方向发展,大型远洋船舶的机舱设备不断增多,且船舶机械设备不断向自动化、复杂化、智能化的方向发展。使用适当的方法对船舶机械设备进行状态监测、健康管理和故障诊断是智能机舱技术研究的热点之一,船舶机械设备智能故障诊断也是智能船舶发展中的重要一环[2]。

机械设备的故障诊断方法主要分为基于模型驱动和基于数据驱动的故障诊断方法[3]。基于模型驱动的故障诊断方法是先建立机械设备的数学模型然后通过残差分析实现故障诊断[4],这种方法需要深入研究机械的原理和数学模型。船舶机械种类繁多且船用机械系统复杂,要对这些机械设备逐一建模分析是一项非常繁重的工作任务,因此基于模型驱动的故障诊断方法

并不是最理想的,基于数据驱动的故障诊断方法并不要求太多机械设备的先验知识[5-6]。这种方法使用智能算法和训练数据去训练机器学习模型,使用训练好的模型完成故障识别,最终实现故障诊断,十分适合自动化程度较高且机械设备复杂的船舶机舱系统。

现有机械设备的故障诊断大多被概括为3个主要步骤[7]:数据获取、特征提取和故障分类。

(1)数据获取。现代自动化船舶机舱中配备着各类传感器监测机械设备的不同信息。而设备的故障信息大多存在于热力学、动力学、摩擦学、声学等物理场中。基于一种或多种类型传感器数据展开分析是故障诊断的第一步。

(2)特征提取。某些类型的数据(如机械设备的电压、温度等)可以直接用于分析,但机械设备的振动信号、噪声信号等还需要先对其进行特征提取才能进行分析[8]。雷亚国等[7]对不同信号的特征提取方法做了对比。

(3)故障分类。基于机械原始监测数据或特征提取后的数据,使用不同的机器学习分类方法对故障进行识别是机械故障诊断中较为常用的方法[9]。机器学习分类方法分为监督学习和无监督学习[10]。无监督学习指数据中不含有标签的机器学习方法,这类方法大多使用聚类算法将数据分为几个类别。本文主要讨论监督学习。通过带有标签的数据来训练分类器,进行一定调整后得到一个理想的分类器,再用其对新的数据进行故障分类。常见的监督学习分类方法有K最邻近算法、支持向量机和人工神经网络。

对于船舶风机设备和其他机械设备,无论是经过特征提取后的振动信号还是原始的热工参数信号,其对应的数据集往往是一个包含很多项的高维数据集。高维数据集不仅会增加分类器训练难度,还会降低分类器的运算速度并增加运算成本,而且其中的冗余信息会导致分类器的准确率降低[11]。为保证航行安全,船舶机舱机械设备的故障诊断对实时性和准确性要求非常高,这就要求故障诊断算法能够快速准确地识别出机械故障。为此,本文在船舶机械设备的智能状态监测与故障诊断方法中引入特征选择方法以期加快分类器的运算速度并提高分类器的识别准确率。

1 智能状态监测和故障诊断框架

本文提出的基于特征选择的船舶机械设备状态监测和故障诊断框架见图1。

本方法由模型训练和状态监测与故障诊断这2部分组成,属于基于数据驱动的故障诊断方法。首先,进行机械设备的故障诊断实验,对获取到的正常状态下的信号和不同故障状态下的信号进行标记。然后,针对不同的信号类型对信号进行相应的特征提取,降低数据冗余。对振动信号进行特征提取的方法有:快速傅里叶变换、小波分析、希尔伯特-黄变换和变分模态分解等。将经特征提取后得到的数据以一定比例划分为训练集和测试集。对多个特征使用特征选择方法进行数据降维,去除无关特征从而进一步降低数据冗余。使用训练集训练指定的分类器。这时可以通过交叉验证和迭代寻优等方法进一步对模型进行优化。最后,使用测试集验证分类器的准确性和有效性,得到有效模型和特征后就可以开始实施机械设备的状态监测与故障诊断。步骤如下:

(1)使用相同的传感器对机械设备进行监测,并使用同样的特征提取方法处理得到的监测信号。

(2)从得到的特征数据集中选择模型训练时选定的特征子集。

(3)使用得到的待测向量和训练好的故障诊断分类器进行故障识别。

(4)识别完成后输出相应的故障类型,并继续监测被测机械设备。

该船舶机械设备状态监测和智能故障诊断框架是一个通用的框架,不同的特征提取方法、特征选择方法和机器学习分类器模型在该框架下均有效。研究人员可以针对某些方法或步骤进行优化,并不影响整体流程的有效性。

2 基于相对混乱度的特征选择

以数据降维、降低数据冗余、提高模型透明度和计算速度为目标的特征选择方法主要有过滤式、封装式、嵌入式和集成式等4种[12]。过滤式特征选择方法与机器学习算法互不相干,独立于算法,适合本文提出的故障诊断框架。LUUKKA[13]基于相似度和模糊熵提出一种过滤式特征选择方法,该方法在应用时比同类方法取得了更好的效果[11]。本文基于特征与标签的相对混乱度提出一种新的过滤式特征选择方法——基于相对混乱度的特征选择方法。

2.1 特征-标签映射空间

对一个特定对象进行监测并获取状态数据时,设该对象在所有状态下的某个特征Fn取值分布在区间[fn,min,fn,max]内。如果该对象的状态为有限个,可以将相似状态归为同类,并设其所有状态类型集合为P。每次在某个状态下取得特征Fn的值时会得到一个对象的状态类型pi。可以将pi设置为标签,如果获取了足够多的特征的值和对应的标签类型,就可以通过机器学习对分类器进行训练。若Fn與P的相关性不强,甚至不相关,则认为该特征对分类器的贡献很小甚至产生了负面影响。

假设P中包含M(M >2)个不同的类。对pi进行独热编码[14],使其成为一个M维0-1向量,每个维度取值为0或1。可以将特征Fn和其对应的标签pi映射到一个M+1维空间。这个空间的维度为集合P中元素的数量,x轴为特征Fn的值,其余轴与pi一一对应。特别地,若M=2,则pi可以是一维向量,取值为0或1。

3 基于特征选择的支持向量机训练

使用选出的特征数据可直接训练多分类器[12],但是无法将不同特征与不同标签的关系完全表述出来。为取得更好的特征选择效果并优化多分类器的预测准确率,本文提出基于特征选择的支持向量机训练方法。

支持向量机[15]的目标是寻找最优分类超平面。在保证分类精度的前提下,使最优分类超平面两侧的区域最大。

单个支持向量机本质是二分类器。对于多分类问题,学者提出了一对多和一对一模型[16],特征选择一般在支持向量机训练前完成。然而,基于特征选择的支持向量机训练方法是先复制多个训练集,训练时针对每个二分类器训练集的特征计算对应的特征相对混乱度,选择相对混乱度较低的特征值构成特征子集,针对每个二分类器筛选出不同的训练子集进行训练。这样可以在不同标签之前使用不同的特征,完全发挥每个特征的效果。本文以一对多模型为例,若目前有M个类别,则训练M个二分类器,每个二分类器对应训练集的标签为yi∈{1,-1}。对于第m个分类器,第m类的标签为1,其余标签为-1,则基于特征选择的支持向量机训练方法如图2所示。

对每组训练数据求所有特征的相对混乱度,得到特征相对混乱度集合R。在R中选择n个相对混乱度较小的特征,将训练数据以这些特征构成新的训练子集。用每组子集训练对应的二分类器,最后得到多分类器模型。

设训练样本中共有F个特征,则对于每个二分类器来说,剔除掉F-n个对分类器贡献较小的特征,可以在准确率基本不变的情况下有效提高模型预测速度。如果剔除的特征为冗余特征,对分类器没有贡献,那么准确率不会降低。如果剔除掉的是无效特征,那么分类器在预测速度提高的同时识别准确率也能提高。

4 实验验证

以船用风机故障诊断为例分析并讨论本文提出方法的有效性。以机械振动信号为基础,使用由快速傅里叶变换得到的频谱对应的幅值为特征数据。将特征数据作为支持向量机训练和测试的数据。

4.1 实验设置

对三相异步电动机驱动的船用风机进行故障诊断实验。风机相关参数见表1。

对风机7种不同状态下运行的振动数据进行分析,故障设置见表2。

在经典旋转机械故障诊断中将机械回转频率相关倍频作为特征值,但是复合故障和轻微故障的故障特征可能存在于其他频域中,因此本文使用全频域对应的振幅作为特征值构建训练集,每个频率对应一个特征值,保留每个频率对应的振幅大小。

使用磁吸式加速度传感器,灵敏度和偏置电压分别是10.20 mV/g和12.4 V,其中g为重力加速度。采样频率为1 652 Hz,每个样本时长为2 s,对7种不同的故障分别在不同环境下进行多次重复模拟实验,共计得到2 460组实验数据。实验测点布置见图3。

4.2 数据处理

风机在7种运行状态下得到的振动信号见图4。

对得到的振动信号采用快速傅里叶变换进行特征提取,每个样本在0~826 Hz的频域下均得到1 652个特征。给2 460个样本贴上故障编号作为标签,构成故障模拟实验中故障诊断的数据集。图5为对振动信号进行快速傅里叶变换后0~300 Hz的频谱图。

4.3 故障识别

在工程应用中,训练数据往往比实测数据小。

为模拟实测数据的变化以及不确定性,实验中将数据集以1∶4的比例划分为训练集和测试集。其中训练集包含492个学习样本,测试集包含1 968个待测样本,两个训练集都包含1 652个特征。计算训练集中所有特征的相对混乱度归一化值并由小到大排序,结果见图6。由图6可以看出,特征相对混乱度归一化值分散在0.1~0.3内,而且大部分分布在0.15~0.20内。对数值进行分析可知,大多数特征对分类帮助不大,仅部分特征对分类有较大的帮助,比较符合机械故障诊断的实际情况。

使用第3节提出的方法训练一对多模型(基于特征选择的支持向量机模型)。对于7个不同的类别训练7个二分类支持向量机,组合成支持向量机集。所有分类器进行i次训练,每次选择不同的特征数量n,n=100i。对1 652组数据共进行16次特征选择。最后使用1 652组特征值对分类器进行训练,对比特征筛选效果。使用训练好的分类器进行故障识别,其识别准确率与特征数量关系见图7。

不进行特征选择而使用全部特征进行训练的支持向量机识别准确率为93.9%。当只选取100个特征时识别准确率为89.8%,随着选取特征数量的增加识别准确率也逐步提升。选取800个特征时识别准确率达到93.95%,已经超过了不进行特征选择的识别准确率。当选择1 200个特征时识别准确率达到了最高值94.46%。继续增加特征数量会导致识别准确率的降低,这主要是因为使用了相对混乱度归一化值较大的特征。这些特征会对分类器造成一定干扰,削弱相关性较大特征的贡献,从而导致分类器识别准确率降低。图6的结果可以说明,经过基于归一化后的特征相对混乱度的特征选择后,筛除了对分类器产生干扰的特征,提高了识别准确率。同时使用特征选择方法还可以在只使用较少特征的前提下进行有效的故障识别,这对分类器模型的透明度和分类速度的提升有良好效果。

4.4 方法对比

为进一步说明本文方法的有效性,分别使用模糊熵和归一化后的特征相对混乱度分别训练基于特征选择的支持向量机。为体现基于特征选择的支持向量机训练方法充分利用了不同特征与不同标签的对应关系,使用常规方法对多分类支持向量机进行训练,对比本文提出方法的效果。数据集划分和训练次数与前文相同。每种分类器的识别准确率见图8。

由图8可以看出,使用相對混乱度进行特征选择的效果优于模糊熵的。使用模糊熵进行特征选择时,特征数量少于600时效果较差,无法有效进行故障识别。而使用相对混乱度时特征数量达到400以上时即可维持85%以上的识别准确率。尤其是本文提出的归一化特征相对混乱度结合基于特征选择的支持向量机的效果最为突出,仅使用100个特征识别准确度依然接近90%。对比支持向量机和基于特征选择的支持向量机时可以发现,不论使用那种特征选择方法,基于特征选择的支持向量机的效果都优于同参数下的多分类支持向量机,也证明了第3节提出方法的有效性。

4.5 模型分类速度分析

对于船舶智能机舱系统来说,无论是故障诊断还是状态监测,在产生故障的第一时间进行报警对避免事故是非常重要的,这就要求故障识别分类器具有较高的分类速度。提高模型的运算速度也是特征选择的另一个关键目标,数据维度也就是特征数量是影响分类器分类的一个指标。本文对选取不同特征数量的分类器的分类速度进行对比,结果见图9。分类器的计算耗时与数据样本特征数量呈正相关关系,筛除冗余的特征有利于加快分类器的分类速度,提高分类器效率。

从图9可以看出,使用全部特征的分类器计算耗时大于500 ms,而进行特征选择后的分类器耗时均小于500 ms,其中在使用100个特征时计算耗时115.3 ms,相比使用全部特征的分类器,缩短了77.8%的计算耗时。在追求准确率最高的前提下,特征数量定为1 200,计算耗时为482.2 ms,相比全部特征计算耗时缩短了17.59%。可以看出,经过特征选择可以有效缩短分类器的计算耗时,提高故障诊断速度,增加整体算法的实时性和有效性,使用特征提取方法对实现船舶风机的状态监测与故障诊断有重要的作用。

就工程应用而言,在本文数据和模型的前提下,基于对模型的不同要求可以对选择的特征数量进行调整。若精度优先则可以选择1 200个特征,达到94.46%的识别准确率。若速度优先则可以选择100个特征,计算耗时为115.3 ms。若均衡考虑则可以选择300个特征,在仅耗时172.6 ms的前提下达到93.5%的识别准确率。

如图1所示,在工程应用中,特征选择是图中左半边故障诊断模型训练的一个步骤。一旦完成特征选择和分类器的训练,就可以开始对机械进行状态监测。选择较少的特征可以让分类器在状态监测时使用更短的时间完成分类,识别故障,这有助于提升状态监测和故障预测报警的实时性。

5 结 论

以提高船舶机械状态监测的实时性和故障诊断的准确性为目标提出一种基于特征选择的船舶机械智能状态监测与故障诊断方法,并以船舶风机故障诊断为例对本文方法的有效性进行验证。文中提出的基于特征选择的支持向量机训练方法相比传统的一对多支持向量机,在特征选择算法中有更高的准确性,并且准确率较为稳定,在选择的特征数量较少时仍能保证分类器的有效性。文中提出的故障诊断方法比现有方法在准确率和分类速度上均有提升。在精度优先的情况下可以达到94.46%的识别准确率,在速度优先的情况下可缩短77.8%的计算耗时。

综上,本文提出的算法框架、特征选择方法、基于特征选择的支持向量机训练方法和智能故障诊断方法可以有效改进现有算法,对船舶风机的状态监测与故障诊断的实现有重要意义,对机舱中回转机械设备的状态监测与故障诊断有一定参考价值。

参考文献:

[1]吴强. 加快转型升级,推动船舶工业在“中国制造2025”中率先实现突破[N]. 中国船舶报, 2015-12-16(2). DOI: 10.28054/n.cnki.nccpb.2015.000176.

[2]蒋佳炜, 胡以怀, 方云虎, 等. 船舶动力装置智能故障诊断技术的应用与展望[J]. 中国舰船研究, 2020, 15(1): 56-67. DOI: 10.19693/j.issn.1673-3185.01679.

[3]TAN Y H, ZHANG J D, TIAN H, et al. Multi-label classification for simultaneous fault diagnosis of marine machinery: a comparative study[J]. Ocean Engineering, 2021, 239: 109723. DOI: 10.1016/j.oceaneng.2021.109723.

[4]CHEN H T, JIANG B. A review of fault detection and diagnosis for the traction system in high-speed trains[J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 21(2): 450-465. DOI: 10.1109/TITS.2019.2897583.

[5]HUANG R Y, LI W H, CUI L L. An intelligent compound fault diagnosis method using one-dimensional deep convolutional neural network with multi-label classifier[C]//2019 IEEE International Instrumentation and Measurement Technology Conference. IEEE, 2019: 1-6. DOI: 10.1109/I2MTC.2019.8827030.

[6]楊剑锋, 乔佩蕊, 李永梅, 等. 机器学习分类问题及算法研究综述[J]. 统计与决策, 2019, 35(6): 36-40. DOI: 10.13546/j.cnki.tjyjc.2019.06.008.

[7]雷亚国, 贾峰, 孔德同, 等. 大数据下机械智能故障诊断的机遇与挑战[J]. 机械工程学报, 2018, 54(5): 94-104. DOI: 10.3901/JME.2018.05.094.

[8]赵志宏. 基于振动信号的机械故障特征提取与诊断研究[D]. 北京: 北京交通大学, 2012.

[9]时培明, 梁凯, 赵娜, 等. 基于深度学习特征提取和粒子群支持向量机状态识别的齿轮智能故障诊断[J]. 中国机械工程, 2017, 28(9): 1056-1061. DOI: 10.3969/j.issn.1004-132x.2017.09.009.

[10]刘建伟, 刘媛, 罗雄麟. 半监督学习方法[J]. 计算机学报, 2015, 38(8): 1592-1617. DOI: 10.11897/SP.J.1016.2015.01592.

[11]LOHRMANN C, LUUKKA P, JABLONSKA-SABUKA M, et al. A combination of fuzzy similarity measures and fuzzy entropy measures for supervised feature selection[J]. Expert Systems with Applications, 2018, 110: 216-236. DOI: 10.1016/j.eswa.2018.06.002.

[12]李郅琴, 杜建强, 聂斌, 等. 特征选择方法综述[J]. 计算机工程与应用, 2019, 55(24): 10-19. DOI: 10.3778/j.issn.1002-8331.1909-0066.

[13]LUUKKA P. Feature selection using fuzzy entropy measures with similarity classifier[J]. Expert Systems with Applications, 2011, 38: 4600-4607. DOI: 10.1016/j.eswa.2010.09.133.

[14]YU L, ZHOU R T, CHEN R D, et al. Missing data preprocessing in credit classification: one-hot encoding or imputation?[J]. Emerging Markets Finance and Trade, 2022, 58(2): 472-482. DOI: 10.1080/1540496X.2020.1825935.

[15]SUYKENS J A K, VANDEWALLE J. Least squares support vector machine classifiers[J]. Neural Processing Letters, 1999, 9: 293-300. DOI: 10.1023/A:1018628609742.

[16]SCHWENKER F. Hierarchical support vector machines for multi-class pattern recognition[C]//Fourth International Conference on Knowledge-Based Intelligent Engineering Systems and Allied Technologies. IEEE, 2000: 561-565. DOI: 10.1109/KES.2000.884111.

(編辑 贾裙平)

收稿日期: 2021-11-23

修回日期: 2022-03-17

基金项目: 上海市科技计划(20DZ2252300)

作者简介: 蒋佳炜(1992—),男,山西太原人,博士研究生,研究方向为船舶机械设备智能故障诊断,(E-mail)83003599@qq.com;

胡以怀(1964—),男,江苏高邮人,教授,博士,研究方向为船舶动力装置振动分析、故障诊断和系统仿真,(E-mail)yhhu@shmtu.edu.cn

猜你喜欢

状态监测支持向量机特征选择
Kmeans 应用与特征选择
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
智能变电站设备诊断与状态监测技术研究
基于熵技术的公共事业费最优组合预测
多通道采煤机状态监测与分析装置设计及应用
基于支持向量机的金融数据分析研究
联合互信息水下目标特征选择算法
基于特征选择和RRVPMCD的滚动轴承故障诊断方法
基于二元搭配词的微博情感特征选择