基于CNN特征提取及模型融合的飞机液压系统故障诊断
2020-10-21李时奇赵东标申珂楠丰嬴政
李时奇,赵东标,申珂楠,丰嬴政
(南京航空航天大学 机电学院,江苏 南京 210016)
0 引言
智能故障诊断是未来飞机液压系统故障诊断发展的趋势之一[1-2]。国内通常采用小波包分解或者信息熵等方法对复杂的液压系统压力信号进行特征提取,然后输入BP神经网络或者支持向量机等学习器进行故障诊断分类[3-5]。这些特征提取的方法对人的经验要求比较高:不具备通用性;对于多传感器压力信号难以有效融合;单一模型有较大过拟合风险。
针对上述问题,提出了一种卷积神经网络(CNN)特征提取加多模型融合的故障诊断方法。使用一维多通道CNN可以直接接收多传感器一维压力时间序列,从而实现多传感器融合。选取少量数据对CNN进行有监督训练提取特征。再用提取出的特征训练如线性多分类、决策树、支持向量分类、k邻近等学习器分别对其进行故障诊断。最后使用Stacking技术对这些模型进行融合。使用Amesim软件对典型飞机液压系统建模并进行故障仿真,验证了算法效果。结果表明,本文算法在准确率和训练用时上更优。
1 算法理论介绍
1.1 一维多通道CNN
由于飞机液压系统的压力信号是一维时间序列曲线,而且不同位置的多个传感器可以采集多条曲线,为同时将多个传感器的一维时间序列输入CNN,采用一维多通道CNN。网络中的所有卷积层、池化层均使用一维结构。
设Hl为第l层的输入特征图,S为卷积操作的结果,Hl+1为卷积层的输出特征图,K为卷积核,i代表特征图上的索引,p代表卷积核上索引,c为通道的索引,Hl(∶,c)为通道c的特征图,b为偏移量,f(x)为激活函数,则一维多通道卷积公式如下[6]:
S(i)=∑c∑pHl(i+p,c)K(p)
(1)
Hl+1=f(S+b)
(2)
池化操作分为最大池化和均值池化。设第l层为池化层,k为池化窗口的大小,p代表池化窗口上的索引。最大池化和均值池化操作公式分别为式(3)和式(4):
(3)
(4)
1.2 线性多分类器
对数几率回归(logistic regression, LR)是一种用线性回归模型的预测结果去逼近真实标记的对数几率,虽然名字是“回归”,实际上是一种分类算法。设x为输入向量,y为输出标记,w和b为待学习的权重和偏置。公式如下:
(5)
当y>0.5时预测为正类,y<0.5时预测为反类,y=0.5时可以随机预测。通过OvO(One vs. One)或者OvR(One vs. Rest)等拆分策略可以推广到多分类[7]。
1.3 决策树分类器
决策树通过树型结构对样本进行学习。树的节点代表某个属性,该节点下的路径代表属性的不同取值。每个叶节点代表某个类。随机森林(random forest, RF)[8]是多个决策树通过bagging策略集成的, RF能引入随机性,有效减少过拟合。
1.4 支持向量分类器
支持向量机(support vector machine, SVM)通过寻找一个超平面划分两类样本,离超平面最近的几个训练样本称为“支持向量”,两个不同类别的支持向量到超平面距离和称为“间隔”,支持向量机算法试图找到间隔最大的超平面来划分不同类[9]。SVM同样可以使用拆分策略推广到多分类。
1.5 k邻域分类器
k邻近算法(k- nearest neighbor,KNN)的训练过程就是保存训练集所有数据。当新的样本输入时,计算训练集中距离它最近的k个样本,根据这k个样本的类别来决定新样本的类别[10]。
2 算法流程
图1为算法流程示意图。首先对典型飞机液压系统进行Amesim建模,通过改变某些部件参数来模拟飞机液压系统的常见故障。采集不同故障状态以及正常状态的压力信号,进行归一化处理并通过划窗重采样进行数据集增强。将训练集分为A和B两个子集。用A集数据对CNN进行有监督训练。再将数据集B输入训练好的CNN,提取中间层的特征,将中间提取出的特征输入其他学习器进行训练。之后将多个学习器的结果用Stacking融合技术融合。最后将测试集输入训练好的模型,验证算法效果。
图1 算法流程示意图
2.1 CNN特征提取
CNN各个层的结构如表1所示。CNN可以接受一维多通道数据,可将不同飞机液压系统中不同传感器获取到的一维压力时间序列输入CNN。表中filter指卷积核(又叫滤波器)或者池化滤波器。filter大小1100指窗口大小为100的卷积核在特征图上滑动,步长指的是filter在特征图上滑动步长。
表1 CNN各层参数
用A集监督训练CNN,目的是让CNN的每一层获得不错的权重从而使网络具备提取抽象特征能力。将B集输入到训练好的网络,提取全连接层2尺寸为128的特征。此时向量的总数据维度从1 800降到了128,此时的特征已经过滤掉一些无效信息并提取到有用的抽象特征,能极大地加快训练速度,简化训练难度,提高训练准确率。
2.2 Stacking模型融合技术
Stacking模型融合技术[11]是一种两级的模型融合技术,将初级学习器学习到的分类结果作为次级学习器的输入,再进行一次学习。
Stacking模型融合技术示意图如图2、图3所示。首先需要每个学习器使用k折交叉验证(图中k=5)。将原训练集分为k折,用k-1折训练,预测剩下的1折,预测结果作为次级学习器的输入,重复k次,每次用不同的折划分。对于测试集,将k次的结果取平均值。用不同初级学习器重复相同操作,最终次级学习器的输入特征为n个初级学习器的预测结果(图中n=4)。用次级学习器对新生成的训练集进行训练,预测新测试集,得到最终结果。
图2 Stacking融合每个学习器训练步骤
图3 Stacking融合多学习器融合步骤
由于不同学习器的学习原理有所差异,通过融合可以互相弥补不足,提高总准确率的同时减少过拟合的风险。
3 算例分析
3.1 飞机液压系统故障仿真及数据生成
图4为典型飞机液压系统Amesim模型。为简化模型,只保留液压系统核心部件以及一个用于故障诊断的作动器,其余作动器均用“液压用户”代替。
图4 典型飞机液压系统 Amesim模型
表2为Amesim模型中各元件参数以及含义[12]。
表2 飞机液压系统Amesim模型参数
系统故障模拟方法如下:通过在泵两端并联溢流阀模拟泵泄漏;改变油滤等效孔径参数模拟油滤堵塞;改变液压油中气体含量模拟液压油污染;用伺服阀和作动器直接串联溢流阀模拟伺服阀堵塞;改变作动器内泄漏参数模拟作动器内泄漏。5种故障状况加上正常情况共6种类别,类别标号和类别编码如表3所示。
表3 故障类别表
取仿真时长为18s,提取图4中A、B、C 3处的压力信号进行故障诊断。设采样周期为0.01s,取长度为6s的曲线用于故障诊断。将6s的窗口在18s的曲线上滑动取点来增强数据集。通过在正常或者故障范围内微调参数多次仿真可以增加数据量。最终每个样本含3条(A、B、C 3个位置)6s的曲线,即原始输入特征的尺寸为16003。
图5为液压油污染情况以及正常情况下泵出口压力曲线对比图。由图可知液压油气体含量上升导致的污染会使压力曲线滞后。
图5 故障与正常情况压力曲线对比图
3.2 CNN特征提取效果分析
若用在A集上训练的CNN直接预测B集的故障诊断结果,准确率仅为84.3%,这是因为A集只占总数据集的很少一部分,但是足够提取出有效的特征用于下一步训练。
图6为A集大小对CNN训练时间以及最终准确率的影响。图7为从CNN不同中间层提取的特征对后续训练时间以及最终准确率的影响。由图可知,为使准确率高的同时训练时间尽可能少, A集大小取20%,提取CNN中间层的卷连接层2作为特征进行下一步训练。
图6 A集占比对结果的影响
图7 CNN不同层特征训练结果
3.3 故障诊断结果分析
表4为各学习器用CNN提取到的特征进行训练(表中i)与直接用原始输入压力曲线训练(表中ii)的对比。由表可知,经过CNN提取到的特征能极大加快训练速度,提高故障诊断的准确率,降低模型大小。
表4 用特征与用原始数据训练对比
表5为用不同次级学习器进行Stacking融合的比较
以及和直接用简单投票法融合的准确率比较。可以看到,使用LR作为次级学习器准确率最高。
表5 不同模型融合方法比较
图8为Stacking模型融合后与各个模型的对比。由图可知,融合后的模型比所有原模型的准确率都要高。
图8 Stacking模型融合与各个模型对比图
表6为CNN特征提取加Stacking模型融合与直接用CNN训练全部数据集进行故障诊断的对比。由表可知,在准确率方面多模型融合略高,在训练耗时上多模型融合更少,但是所占的空间更大。
表6 两种方法效果对比
4 结语
本文采用CNN特征提取加Stacking多模型融合技术对飞机液压系统进行了故障诊断。使用Amesim软件对典型飞机液压系统建模并进行故障仿真来验证算法效果,结果如下:
1)使用少量数据监督训练CNN也能提取出不错的中间特征,用提取出的特征训练比用原始输入信号训练在各方面都有较大提升。
2)Stacking多模型融合准确率高于各个单一模型。
3)相比于直接用CNN训练全部数据集进行故障诊断,CNN特征提取加多模型融合训练速度明显更快,准确率也有少量提升。