基于自学习SOM和ARMA算法的数控机床滚动轴承健康预警研究
2019-01-24夏筱筠
夏筱筠,林 浒
1(中国科学院大学,北京 100049)2(中国科学院 沈阳计算技术研究所,沈阳 110168)
1 引 言
滚动轴承的状态监测与预测一直是机械故障预测技术的主要内容之一.统计结果表明,包括数控机床在内的旋转机械中所发生的故障中,究其原因,约 30%与滚动轴承有关.由于滚动轴承工作环境、工作状态等的复杂性,难于通过建立数学模型的方式进行滚动轴承故障诊断与预警,并且在没有相关专家经验、知识指导的情况下,研究如何充分利用历史数据,挖掘其中隐藏的知识,了解当前设备的健康状况及性能退化趋势对实现机床的长期可靠运动是及其必要的.
目前,国内外很多专家学者对滚动轴承的故障诊断已开展了相关研究,文献[1]采用自组织网络评价模型及支持向量机等实现形成混合智能预测模型,提高了轴承性能退化趋势预测精度.文献[2]提出一种基于小波能谱熵的滚动轴承故障预测特征提取方法,此外基于隐半马尔可夫模型的滚动轴承故障预测方法,较准确的实现对滚动轴承的故障预测.文献[3]采用自适应滤波算法实现了对所采集信号的降噪处理,提高了滚动轴承的故障诊断的可靠性.以上所取得的研究成果对实现滚动轴承的故障预警具有重要的参考价值,但大多的健康预警算法针对性较强,所采用的算法自学习能力不足,因此导致所采用算法的适用性、灵活性存在较大的局限性.为此,本文提出了采用基于自学习SOM和ARMA算法的数控机床滚动轴承健康预警研究以克服以上研究所存在的不足.
本文提出了基于状态维修的滚动轴承故障诊断及预警的实现方案,该方案将滚动轴承的故障监测与维护划分为:状态监测、故障诊断以及决策维护等三部分内容,本文以后两部分内容为研究重点,分别采用了具有自学习能力的SOM与ARMA算法进行滚动轴承的故障诊断及预警,并完成了相关仿真实验,验证了所采用的故障诊断及预测算法的可行性.
2 基于状态维修的滚动轴承故障诊断和预警方案设计
如图1所示,滚动轴承故障诊断与维护方法包含三部分内容:状态监测、故障诊断以及决策维护,这也是预测与健康管理的基本内容.通过对滚动轴承的信号采集、处理,挖掘信号特征,实现对滚动轴承状态的实时监测,结合历史数据分析,辨识滚动轴承的故障特征.根据所辨识的故障特征,最终识别滚动轴承的故障模式及趋势预判,包括对滚动轴承状态的退化监测以及故障模式诊断.结合后续的决策维护技术,对被测部件实现一个闭环反馈监控调节.
图1 滚动轴承故障诊断与维护方案示意图Fig.1 Schematic diagram of fault diagnosis and maintenance of rolling bearing
信号特征挖掘及故障状态模式识别是实现滚动轴承故障诊断及预警的基础,而特征挖据及识别的信号的获取更是重中之重,它是后续进行系列处理的源头,该部分的研究属于信号处理学科的范畴,信号采集后,为了便于信号的分析,通常将信号在时域、频域和时频域等多个域内进行组合处理,围绕该部分内容,国内外专家学者展开了大量的研究工作.文献[4]采用小波包分解方法进行信号处理,提取特征向量;采用模糊C均值聚类(FCM)实现对滚动轴承不同退化模式的识别.文献[7]提出一种新的混合聚类算法,该算法利用三层前馈神经网络、点密度函数算法和聚类有效性指标对FCM进行改进,提高了算法聚类性能.文献[10]提出基于集成经验模态分解的希尔伯特黄变换诊断方法,实现故障特征的提取.
本文对信号特征挖掘及故障状态模式识别采用小波包分解的方法实现对信号特征信息的采集,采用模糊C均值聚类(FCM)实现对不同退化模式的识别.对于该部分内容的具体实现请参见文献[4].
3 SOM和ARMA算法的理论基础
高效的算法设计是实现智能化滚动轴承故障诊断及预警的关键问题之一.本课题采用具有自学习特点的SOM和ARMA算法,可以实现轴承故障的自动聚类及状态趋势的预测,如下分别对以上两种算法进行相关的理论分析.
3.1 SOM神经网络结构
SOM神经网络为一种无导师神经元网络.通过接受输入向量P和输入权重矩阵IW1,1,并产生具有S1维元素的向量n1.该距离值是由输入向量和由输入权重矩阵的行形成的,并且该距离值取负值,如式(1)所示.
(1)
通过上式中输入向量P与权重向量之间的负距离来计算竞争层的净输入n1,进而通过竞争层确定神经元的输出a1,如果输入向量P等于神经元的权重向量时,则神经元可以具有的最大净输入为0,对应输出该神经元的最大值.
如图2所示为SOM神经网络的架构,该架构与竞争网络架构类似,但不包含竞争网络所具有的偏差计算部分.此外,改变了迭代调整时竞争神经网络只有获胜神经元才具有权值调整的机会,而实现靠近获胜神经元的领域神经元与获胜神经元一起进行权值更新,从而实现将各个神经元进行分类,并通过特征映射图呈现各类间的距离关系.
图2 SOM网络架构示意图Fig.2 Schematic diagram of SOM network architecture
3.2 SOM神经网络的自学习机制
SOM神经网络通过对历史数据的学习以满足对故障的分类及预警功能.设时间序列Y由在等时间间隔所测量的Yt观测序列构成的.可以将多步超前预报描述为基于Y的当前和过去观测值的H预测值序列的估计,其中H是大于1的整数.SOM神经网络遵循迭代策略,每次迭代生成新的估计值,并使用先前预测值来估算下一个预测值.
如前所述,确定模型的选择和组合,以满足对测试样本的多样性水平的分辨效果为预测模型建立的目标,以及各分类间定量关系的描述.SOM神经网络采用“链接距离”来区分两个神经元的最小步数,各类间的相互区分度是预测模型的主要指标之一,如果各类间相互区分度不明显,势必造成较差的预测效果.
SOM神经网络采用输入层与输出层组织的二维阵列结构.围绕优胜神经元的邻域神经元是由神经元之间的链路距离来定义,较大的链路距离包含具有链路距离的邻域.如图3所示,具有链接距离为2的邻域包含距离为1的邻域,且这两种邻域中都包含在链路距离为3的邻域内.SOM神经网络的自学习能力通过使用特征向量对SOM进行训练实现,训练误差为数量为h的向量Re,该向量数h反映预测水平的高低,并且每个矢量表示预测步骤中相关的误差.为了提高网络的预测精度,将包含n个时间序列数据的样本集划分成两组:训练集及测试数据集.
如下用示例说明,在SOM的自学习过程中,对样本数据进行分类的显示示例.假设其下一个4个期望值是y={1,1,1,1}的时间序列,即h=4.假设这个时间序列的唯一可能的值是0或1,有16种可能的估计.我们也可以假设有16种预测模型,每个预测模型产生这些估计之一Yi,i={1,2,…,16}.例如,特定模型A的预测是具有最好可能精度为输入的特征矢量与权重矢量相同,此时神经元具有最大输出值a={1,1,1,1}.如图4所示,训练了具有4行和4列的SOM,并用所有可能的代表性误差训练1000迭代次数,导致训练集中的每个代表性误差聚集在不同的神经元中.图中每个神经元被标记为识别号和在括号中写入的代表性误差.神经元颜色对应于神经元中的代表性误差.字母A标记的神经元具有最好的形状,字母W的神经元具有最坏的预测.字母A的神经元的一个邻接邻域用粗体线包围.这个例子中通过颜色可以清楚地看到,误差训练较小时,两类是属于同类的或比较近似的类,反之,误差训练较大时,表明两个类之间的距离是比较远的.
图3 具有不同链路距离的SOM 邻域示意图Fig.3 Neighborhood diagram for SOM with different link distance
图4 SOM预定义代表性误差示意图Fig.4 Pre-defined representative errors diagram for SOM
3.3 ARMA算法原理
ARMA 模型也称为线性回归预测模型,该模型由自回归模型与滑动平均模型组合而成.对于n 阶自回归模型,记为 AR(n),该模型适用于均值为零的标准正态随机信号的处理,设{Xt}为所采集的时间序列,并且该时间序列与历史序列间存在线性相关性.但如果所处理的信号不是标准的平稳随机信号,混入系统的噪声信号,以上AR(n)就无能为力了,就需要采用滑动平均模型进行信号的噪声过滤处理,对于m 阶滑动平均模型,记为MA(m):
xt=at-θ1at-1-θ2at-2-…-θmat-m
(2)
若{xt}不仅受之前n步的各个取值{xt-1},{xt-2},…{xt-n}的影响,而且还与前m步的干扰{at-1},{at-2},…{at-n}相关,利用时间序列的多元线性回归及自相关处理,可得到通用的ARMA模型:
xt=φ1xt-1+φ2xt-2+…+φnxt-n-θ1at-1-θ2at-2-…-θmat-m+at
(3)
4 基于SOM和ARMA算法的滚动轴承健康预警设计
滚动轴承故障诊断和预警为结合滚动轴承运行历史信息、故障库所提供的信息等已知信息,针对当前设备的故障特征,进行性能退化程度的判断及故障预测.该部分的关键技术包括:信号特征挖掘及故障状态的模式识别、故障诊断处理、故障预警处理等.
4.1 基于自组织特征映射网络的故障诊断算法设计
针对设备的故障诊断方法,目前国内外研究提出的方法主要包括支撑向量机(SVM)、贝叶斯信念网络(BBN)、隐式马尔可夫模型(HMM)分层聚类法,人工神经网络(ANN)等.根据各方法特点,满足不同的使用要求.本文通过对以上方法优缺点的比较,提出了采用自组织特征映射网络进行滚动轴承的故障诊断.如图5所示,为该设计方案的信号采集及处理流程.
图5 滚动轴承信号采集及处理流程Fig.5 Signal acquisition and process control of rolling bearing
SOM网络具有较强的自学习能力,实现获胜神经元及邻域内神经元一起进行权值更新,根据自动识别出的输入数据之间的近似度,利用“就近原则”,将近似的输入就近配置在网络单元上,因此该网络可以实现对不同的输入数据有选择地进行反应的能力,SOM学习算法的步骤如下:
1) SOM网络的初始化
首先,进行输入层与映射层之间的连接权值的初始化.由于算法的自学习特性,原则上可以初始化为随机数,但考虑到算法的计算效率,通常设定为较小的权值.然后,进行神经元邻域的初始化,以神经元j为例,其邻域记为Sj;领域的大小可以动态调整,初始值Sj(0)表示t=0的时刻邻域的神经元集合,Sj(t)表示t时刻邻接神经元的集合,并且邻域的大小,当时间增长时范围不断缩小,可以采用模拟退火算法实现该变化特点.
2) SOM神经网络的向量输入
将输入向量X=(x1,x2,x3,…,xm)T按照对应的维度,赋值给各个输入神经元.
3) 确定输入向量与权值向量间的广义距离
距离的计算采用欧式距离的表示形式,以映射层的第j个神经元的计算为例,其与输入向量间的距离,计算如下:
(4)
4) 权值的学习
调整(3)中所确定的输出神经元j*及其邻接神经元的权值:
Δwij=wij(t+1)-wij(t)=η(t)(xi(t)-wij(t))
式中,η为常数,其值大于0小于1,并且随着时间变化η衰减为0.
5) 输出ok的确定
(5)
式中,f(*)为输出函数,其输出值为0~1,并且f(*)可以选择为其他的非线性函数.
6) 判断是否满足预设的要求
如果满足设定的要求,算法结束;否则,返回步骤(2),继续下一轮学习.
4.2 基于差分变换的 ARMA 故障预警改进算法
目前,国内外学者围绕设备的故障预警开展了大量的研究,许多研究成果已取得良好的应用效果,提出了包括Elman递归神经网络、模糊逻辑、匹配矩阵、轨迹相似性匹配、随机滤波等预警方法.由于每种方法都有各自的优缺点及适用范围,不存在通用的预警方法,本文结合滚动轴承的特点,采用计算效率高的自适应 ARMA 算法进行故障预警.
根据ARMA 模型的特点,要求系统的输入输出信息为平稳随机序列.而在实际应用中,随机序列大多为非平稳随机序列,应首先分析出其变化趋势,然后采用采用时间序列方法进行拟合,满足该方法预测功能.
通常的拟合方法为将序列根据:yt=xt-xt-1差分,得到差分后的序列作为新的序列,如果差分后仍存在非平稳随机成分,可采用多次差分计算,最终得到平稳的序列为止.对于满足指数分布,余弦分布等的处理方法,与以上方法相同.
在自适应定阶阶段,采用 AIC 信息准则判定方法,即,利用最大似然函数估计值原则对模型的参数进行估计,由于ARMA模型的阶数估计与参数估计互为条件,因此需要首先将ARMA(p,q)模型的一组阶数取为固定值,然后利用ARMA(p,q)模型的自回归逼近法确定白噪声的估计方差,最后利用 AIC 价值函数进行计算:
AIC(k,j)=In(σ2(k,j))+2(k+j)/N
(6)
其中k为自回归模型阶数,j为滑动平均模型阶数,σ2(k,j)为拟合残差平方和,如式(6)所示.当模型阶数较小时,拟合残差平方和变化幅度较大,对价值函数的计算结果影响较大,当模型阶数满足一定的范围要求时,拟合残差平方和变化幅度较小,则对模型阶数的取值影响较大.设定 ARMA 模型的阶数最大值为 logN,则根据下式确定对应的模型阶数:
(7)
5 实验与结果分析
为测试算法的有效性,本文选择the Center for Intelligent Maintenance Systems(IMS),University of Cincinnati.提供的NASA Bearing Data Set 进行测试.该数据由三组不同数据集构成,数据由 NI DAQ Card 6062E 采集,该数据集表示三次测试过程,每次实验采集不同滚动轴承从开始测试到轴承失效的整个退化过程.各数据集的每条记录为时间长度 1 秒振动信号,每条记录对应的采集频率为20千赫,每个样本空间包含 的样本数量为20480.每间隔10分钟测试一条记录.
如图6所示,为表示方便,将三次实验过程分别标记为1#,2#,3#,此外,Bearing1,Bearing2,Bearing3,Bearing4分别对应被测试的四个滚动轴承.如下采用测试1#与测试2#中的数据进行分析.
图6 轴承实验环境Fig.6 Experimental environment of bearing
测试1#中,共有 2156 组样本数据,测试 2# 中,共有 984 组样本数据.为便于测试,将以上样本数据进行状态标识,该标识将状态划分为退化态与稳定态两类,该实验中由于已知测试结束为滚动轴承的失效状态,本文设定阈值10%用于区分两个状态类.
5.1 基于SOM的故障分类测试
由于滚动轴承性能退化过程较为复杂,且具有一定非线性、非平稳性特点,为了全面体现故障特征,本文综合考虑时域或频域中多个特征参数.所提取的时域特征参数包括:均值、均方根值、峰峰值、峰值、峰值因子、峭度、偏度、裕度;频域特征参数包括:均方根值、峰值、峰值因子;时频域特征参数包括:小波包节点能量.然后,采用主成分分析将线性相关的特征信息去除,最后,选择均值、均方根值、峰峰值、峰值、频率均方根值、小波包节点能量等六个特征参数进行故障类型的分类,输出SOM进行训练.轴承工作状态分为4种:正常状态、内圈故障、外圈故障、滚珠磨损故障等.本文采用的测试样本数为35,如表1所示,经样本训练后,SOM的训练结果如图7所示,图中将测试结果划分为4类,并显示出各类的结果样本数,与测试样本的比较结果如表1所示,测试结果表明训练样本数与测试样本数量一致.
表1 训练结果与测试样本数量一致性比较
Table 1 Consistency comparison between the training results and the number of test samples
类1类2类3类4测试样本数69812训练结果数4+1+11+1+2+2+2+15+2+18+4
SOM神经网络算法的诊断结果如图8所示,图中颜色的深浅代表各故障类型间误差距离的大小,可以用来区分不同的故障类型.各类之间的颜色较深,类内部各样本间颜色较浅,根据实际测试结果,测试1#时,Bearing3 与 Bearing4 的失效模式分别为内圈故障与滚珠磨损.测试2#时,Bearing1 的失效模式为外圈故障,该结果与SOM神经网络算法的诊断结果一致,说明采用SOM进行滚动轴承故障诊断是有效的.
图7 SOM 训练结果示意图Fig.7 Training results diagram for SOM图8 采用SOM的故障诊断图Fig.8 Fault diagnosis diagram with SOM
5.2 基于ARMA的故障预警测试
采用基于自适应 ARMA 的故障预警算法确定每采样时的状态与正常状态间的距离偏离值及距离变化值,根据数值确定被测试轴承的退化值,如图9所示为退化值的测试结果.
由图 9(a)可以看出,对于2#Bearing1退化趋势的测试结果为,当采样值取前500组时,轴承的退化值在0.1以下且变化不大,采样值取大于500组时,退化值出现平稳增大,在730组附近达到极值点,大于730组时,退化值先有小幅的降低然后快速增加,大于980组时,退化值的增加幅度更大直至轴承处于失效状态.
由图 9(b)可以看出,对于1#Bearing3 的退化趋势测试结果为,当采样值低于150 组时,退化值在0.05以下且变化幅度较小,150 组附近退化值发生突变,突变到稳定值后并随后保持,直到采样组数取为1800附近,从1800组附近退化值产生第二次突变,随后产生大幅波动直到轴承处于失效为止.
为验证测试结果的合理性,以Bearing1、Bearing4为例,两者所处的功能位置相同,此外,Bearing2、Bearing3 也处于同样功能位置,根据日常经验判断,处于相同故障位置的两轴承的故障模式应该存在相似性.从图 9(a)与(d)可以看出两者的退化曲线具有相似性,Bearing4 的故障时间延后,失效点时间位于984点后.从图9(b)与(e)看出Bearing2、Bearing3之间的相似性,两者同样在150组附近出现退化值的突变,区别在于Bearing2 直到测试结束,没有故障产生的趋势,一直处于稳定运行状态.图9(c)与(f)为采用不同方向传感器所采集的数据对Bearing4上的的退化值进行评估,结果表明两者的退化曲线比较相似.
图9 测试轴承故障预警曲线Fig.9 Test curve of fault early warning for bearing
基于以上分析,该测试结果验证了自适应 ARMA 故障预警算法,得到的退化评估结果与实际的轴承退化过程一致.
5 结 语
滚动轴承的故障预警及故障诊断是当前国内外的研究热点之一,实现对其可靠的故障诊断及预警,对减少生产上不必要的损失,进而提高装备制造业的智能化水平具有重要的意义.本文基于状态维修的策略,设计了滚动轴承故障诊断和预警的方案;利用自组织特征映射网络实现滚动轴承的故障诊断,由于该算法所具有的自学习功能,从而提高了故障诊断的智能化水平.利用自适应 ARMA算法实现滚动轴承的故障预警,通过采用差分变换的方法,将 ARMA 算法应用于非平稳随机序列,从而扩展了算法的应用范围.最后,实验结果表明以上算法对于实现可靠的滚动轴承故障诊断及预警具有良好的应用效果.