支持张量机在柴油机故障预测中的应用研究
2015-03-17许小伟严运兵王小辉
许小伟,严运兵,王小辉
(1.武汉科技大学汽车与交通工程学院,湖北 武汉,430081; 2.武汉理工大学能源与动力工程学院,湖北 武汉,430063)
支持张量机在柴油机故障预测中的应用研究
许小伟1,严运兵1,王小辉2
(1.武汉科技大学汽车与交通工程学院,湖北 武汉,430081; 2.武汉理工大学能源与动力工程学院,湖北 武汉,430063)
为了解决柴油机故障预测中大样本、非线性以及高维数据的数据预测问题,避免以向量输入带来的结构信息丢失和数据相关性被破坏等现象,结合支持向量机(SVM)的学习框架和交替投影的思想,研究基于在线支持张量机(OSTM)的柴油机故障预测算法和流程,并以测试精度、学习时间和均方根误差作为评价指标,利用远程监测系统采集的数据,分别应用在线支持向量机(OSVM)和OSTM进行故障预测和分析。结果表明,与OSVM方法相比,OSTM方法测试精度较高,学习时间大幅缩短,预测模型的收敛速度较快,能有效在线预测柴油机故障。
柴油机;在线支持向量机;在线支持张量机;故障预测
柴油机是集机、电、液、气于一体的多部件复杂混联系统,具有信号源多、运动部件多等特点,监测信号众多且多为非平稳信号,相互干扰较大且带有非线性和复杂耦合的特征,导致故障信号的幅值、频率难以掌握,很难建立准确的数学模型描述其故障的发生机理。同时,柴油机各零部件的劣化方式各不相同,不仅各种预测的方法不能通用,而且依靠单一预测模型也难以准确进行故障预测。另外,柴油机企业逐渐重视视情维修,在柴油机中安装了大量的监控装置和设备,采集的大量数据使故障预测的计算过程过于繁琐,导致传统的预测模型无法满足柴油机维护与管理的需要。因此,为了解决柴油机故障预测中的超大样本、非线性以及高维复杂数据等问题,研究者结合传统的故障诊断和预测方法,引入了寿命消耗监控(Life Consumption Monitoring,LCM)[1]、粒子滤波(Particle Filter,PF)[2]、贝叶斯网络[3]以及支持向量机(Support Vector Machine,SVM)[4]等机器学习工具进行柴油机的故障预测分析。
传统的机器学习往往采用批量或离线式学习方法,但在柴油机故障预测的工程应用中,学习机的数据是以序列的方式获取的,数据被源源不断地送往学习系统。在这种情况下,对大规模样本进行训练的代价较高、耗时较长、精度较低,因此需要采用在线学习算法进行分析[5]。其中,常见的在线学习算法包括在线支持向量机(Online Support Vector Machine,OSVM)[6]、双重更新在线学习(Double Updating Online Learning,DUOL)[7]等。
同时,在柴油机故障诊断与预测中,监测参数包括飞轮段瞬时转速信号、气缸盖振动信号、油底壳油液信号以及润滑系统、冷却系统温度和压力信号等数据源,通常被表示成多维数组,即张量。但是在工程应用中,传统的机器学习算法多采用向量输入模式。对于复杂的柴油机状态参数,为了满足当前学习机的要求,通常假设各参数之间相互独立,或者采用加权平均的方式将高维数据简化为一维或者低维数据,并以向量的模式作为模型的输入。将张量数据向量化解决了高维数据的模型输入问题,但同时会导致数据之间的结构信息丢失和相关性被破坏等问题[8-9]。因此,本文基于支持向量机的学习框架和交替投影的思想,分析以序列方式获取张量数据的在线二分类问题,并针对柴油机监测的原始数据进行应用分析。
1 在线支持张量机的基本原理
在模式识别、机器学习、计算机视觉和图像处理等研究领域中,如人脸图像被表示成二阶张量,步态轮廓序列[10]和多光谱影像[11]通常被表示成三阶张量。而在工程实际应用中,数据一般采用向量模式表示,即无论原始数据是一维向量、两维矩阵还是高阶张量,几乎总是转换成对应的向量模式来处理。将张量向量化可能出现破坏原始数据的结构和内在相关性,掩盖数据原本存在的冗余信息和高阶依赖性,以及维数灾难和过拟合等问题[9]。为了避免出现上述问题,基于支持向量机的学习框架和交替投影的思想,Tao[8]把经典的线性C-SVM、V-SVM和最小二乘支持向量机(Least Squares Support Sector Machine,LS-SVM)扩展到一般的张量模式,进而扩展了支持张量机(Support Tensor Machine,STM)的应用领域。
1.1 支持张量机
基于支持张量机的柴油机故障诊断与预测是利用支持张量机的模型对高维的样本进行分类或者回归,判断其工作状态为正常还是故障,即确定其样本标签为+1或者-1,属于样本的二分类问题。
(1)
构建式(1)的拉格朗日方程:
(2)
式中:αi、βi为Lagrange乘子,αi≥0,βi≥0。
L(ω,b,α,β,ε)对各变量的偏导数为:
(3)
(4)
(5)
(6)
1.2 在线支持张量机
先前讨论的STM都是批量学习(batchlearning),在算法执行之前所有样本的细节都很清楚,根据所有的样本学习出故障预测函数;而在线支持张量机(OnlineSupportTensorMachine,OSTM)在算法设计阶段或执行之前无完全信息可用,输入的样本往往是实时到达的,根据每个新来的样本,边学习边给出结果。
根据样本获得的先后顺序,将样本定义为(x1,y1),(x2,y2),…,(xi,yi),…,(xm,ym)。OSTM算法对于新获得样本,利用预测函数给出其类别标签yi的预测值,然后对比样本标签yi的真实值,如果预测值与真实值相同,则接受该预测函数,否则优化模型参数,确定新的预测函数。整个过程是重复迭代的过程,直至所有样本完成运算。
2 应用分析
本文以某钢铁企业内部运输机车的16缸柴油机动力系统为例,利用远程监测与管理系统,实时采集与燃油系统相关的状态参数,包括振动信号、瞬时转速、油液参数和热工参数等,并结合传统的故障诊断和预测方法,引入机器学习工具OSTM进行柴油机工作状态的故障预测分析。
2.1 试验平台
根据柴油机动力系统的工作特点,结合现有动力系统的状态监测技术,设计了柴油机工作状态监测的功能结构示意图,如图1所示。
通过采集柴油机动力系统的状态参数,进行初步的状态监测与故障诊断,并将诊断的结果及状态参数通过3G/GPRS无线通信模块发送到柴油机远程监测与管理中心,再进行柴油机动力系统的故障预测与健康管理。其中,故障预测分析试验平台以Visual C++6.0作为可视化集成开发环境,MATLABR2010a为数据分析工具,Microsoft SQL Server 2008为后端数据库管理系统,所使用电脑的CPU为Intel T2400 1.83 GHz,内存为2.50 GB,操作系统为Windows 7。
Fig.1 Schematic diagram of the functional structure of the monitoring system
2.2 试验数据的采集及分析流程
该柴油机平均每天工作20 h。在数据采集的试验中,将柴油机的工作状态分为怠速、低速、中速、高速和空载5种工况。柴油机运行时,每小时采集10组振动信号和转速信号,每天采集1组油液信号,每分钟采集1组热工参数,共采集了3个月。
故障分析数据样本集的参数如表1所示。在每组数据中,振动信号包括16个气缸、三维空间的3项数据,每项1024个点;转速信号包括16个气缸分别发生故障以及全部正常工况下的17项数据,每项1024个点;油液信号包括油底壳中润滑油的温度和压力以及不同成分磨粒的密度等共计25项数据,每项100个点;热工参数包括冷却水、润滑油、燃油的温度和压力等共计25项数据,每项100个点。利用OSTM进行数据分析时,若对于某一空间的状态参数没有更新,则用上一组数据替代。
在试验完成后查阅机车数据记录日志,发现该燃油系统从第72 天开始柴油机出现冒黑烟、机体偶尔有异常振动的现象;第86天进行拆装检修时,发现主机第5缸的喷油嘴针阀烧蚀而导致喷油嘴卡死的现象。
为了验证在线支持张量机在柴油机故障预测应用中的可行性,以预测精度、学习时间和均方根误差作为评价标准,采用OSTM和OSVM两种算法进行对比分析,其分析流程如图2所示。
2.3 结果与分析
在柴油机的故障预测分析时,将样本集的前60%作为训练集,剩下的40%作为测试集。由于数据量较大,故每间隔15 天取一组数据,共取6组进行数据分析。
两种算法下预测精度随时间的变化趋势如图3所示。从图3中可以看出,二者的预测精度均较高,满足工程应用的要求。在样本采集时间的前75 天,随着样本采集时间的延长,分析的样本数量增多,两种算法的预测精度都逐渐提高,但其增幅逐渐减小,预测模型和参数逐渐趋于稳定;当出现故障样本时,预测精度会稍微下降,其原因在于先前的正常样本数目远大于故障样本的数目,即存在数据偏移现象,导致预测结果与实际工况存在一定的偏差,需要通过对不同类别的样本采用不同的惩罚因子,调节因数据偏移造成的分类误差。因此,可以预计经过一定的参数调整后,其预测精度将会继续上升至稳定状态。而根据机车日志中的数据记录,可以发现该燃油系统在第72天之后开始出现故障,即出现了故障样本,从而导致预测精度的变化曲线出现拐点,即柴油机的实际运行工况与数据分析的结果比较一致。
Fig.3 Variation of prediction accuracy with sample collecting time
另外从图3中还可看出, OSTM的预测精度总体上高于OSVM的预测精度,其原因在于将张量向量化可能出现破坏原始数据的结构和内在相关性,掩盖数据原本存在的冗余信息和高阶依赖性以及维数灾难和过拟合等问题;当突然出现故障样本时,OSVM曲线的变化速率要快于OSTM,这是因为其模型相对简单,更容易遭受数据偏差的影响。
图4所示为两种算法下学习时间随样本采集时间的变化趋势。从图4可以看出,随着样本采集时间的增加,OSTM的学习时间远小于OSVM的学习时间,其原因在于将张量向量化的过程中,需要使用交叉投影以及主成分分析等方法降维,运算时间较长,且样本数量越大耗时越长。另外,采用OSVM和OSTM的在线学习算法,其学习时间在理想情况下应该是稳定不变或者是缓慢增长的,而图4中两种方法的学习时间均按一定斜率的斜线形式增长,表明本文所使用的故障预测模型需要继续优化。
Fig.4 Variation of learning time with sample collecting time
图5所示为两种算法下的均方根误差随样本采集时间的变化趋势。从图5可以看出,OSTM的均方根误差较小,预测模型的收敛速度较快;但当出现故障样本时,其均方根误差也会出现一段上升的过程,其原因同预测精度的变化原因一致。
3 结语
本文结合SVM的学习框架和交替投影的思想,研究了基于OSTM的柴油机故障预测算法和流程,并利用远程监测系统采集的柴油机瞬时转速和热工参数等数据,分别采用OSVM和OSTM两种方法进行故障预测的应用分析。以预测精度、学习时间和均方根误差作为3个评价指标,对比分析两种算法下的故障预测结果,发现OSTM充分利用了数据更充分的结构信息及其相关性,预测精度较高,学习时间大幅降低,预测模型的收敛速度较快,而且其故障预测结果与实际记录一致。因此,数据分析和试验结果都证明了基于OSTM进行柴油机故障预测具有可行性和有效性,有一定的推广价值。
[1] Vincent Rouet , Frédéric Minault, Guillaume Diancourt, et al. Concept of smart integrated life consumption monitoring system for electronics[J]. Microelectronics Reliability, 2007,47(12):1921-1927.
[2] 林国语,贾云献,孙磊,等. 基于粒子滤波的非线性设备状态估计[J]. 现代制造工程, 2014(1):97-101.
[3] 蔡志强,孙树栋,司书宾,等.基于FMECA的复杂装备故障预测贝叶斯网络建模[J].系统工程理论与实践,2013,33(1):187-193.
[4] 别锋锋,刘扬,周国强,等. 基于局域波法和SVM模型的往复机械故障预测方法研究[J]. 中国机械工程, 2011,22(6):687-691.
[5] Cavallanti G, Cesa-Bianchi N, Gentile C. Tracking the best hyperplane with a simple budget perceptron[J]. Machine Learning, 2007, 69(2/3): 143-167.
[6] Orabona F, Castellini C, Caputo B, et al. On-line independent support vector machines [J]. Pattern Recognition, 2010, 43(4): 1402-1412.
[7] Zhao Peilin, Hoi S C H, Jin Rong. Double updating online learning[J]. Journal of Machine Learning Research, 2011, 12: 1587-1615.
[8] Tao Dacheng, Li Xuelong, Wu Xindong, et al. Supervised tensor learning[J]. Knowledge and Information Systems, 2007, 13(1): 1-42.
[9] 周蓉,杨晓伟,吴广潮. 在线支持张量机[J]. 计算机科学与探索,2013,7(7):611-619.
[10] Lu Haiping, Plataniotis K N, Venetsanopoulos A N. MPCA: multilinear principal component analysis of tensor objects[J]. IEEE Transactions on Neural Networks, 2008, 19(1): 18-39.
[11]张乐飞,黄昕,张良培.高分辨率遥感影像的支持张量机分类方法[J]. 武汉大学学报:信息科学版,2012, 37(3): 314-317.
[12]Kolda T G, Bader B W. Tensor decompositions and applications[J]. SIAM Review, 2009, 51(3): 455-500.
[责任编辑 郑淑芳]
Prediction of diesel engine failure based on OSTM
XuXiaowei1,YanYunbing1,WangXiaohui2
(1. College of Automobile and Traffic Engineering, Wuhan University of Science and Technology, Wuhan 430081, China;2. School of Energy and Power Engineering, Wuhan University of Technology, Wuhan 430063, China)
To resolve the prediction problems with giant sample size, nonlinear and high dimensional data for diesel engines, this paper, aided by the framework of support vector machine (SVM) and the alternating projection method, studied the algorithm and process of diesel engine failure prediction on the basis of online support tensor machine (OSTM) to avoid loss of structural information and damage to data correlation resulting from vector input. Prediction accuracy, learning time and mean square error (MSE) were employed as evaluation indicators, and data collected by distant monitoring system were used in diesel engine failure prediction on the basis of OSVM and OSTM, respectively. The results show that compared with OSVM, OSTM is more accurate in failure prediction, boasting less learning time, higher convergence speed and greater efficiency.
diesel engine; OSVM; OSTM; failure prediction
2014-12-11
许小伟(1983-),男,武汉科技大学讲师,博士.E-mail:xxw15@163.com
TK428
A
1674-3644(2015)02-0106-05