基于深度支持证据统计的轴承运行可靠性评估
2022-03-18肖文荣陈法法陈保家
肖文荣, 陈法法, 陈保家
(1.三峡大学 水电机械设备设计与维护湖北省重点实验室,湖北 宜昌 443002;2.西安交通大学 陕西省机械产品保障与诊断重点实验室,西安 710049)
可靠性被定义为产品在规定的条件下,规定的时间内,完成规定功能的能力,它的概率度量被称为可靠度。实践层面上,可靠度的准确计算是以大量的失效样本作为基础的,是一个从一般(总体)到特殊(个体)的映射过程,它往往更强调产品的“共性”。这使得现有的机械可靠性评估方式在强调“共性”的场合,如产品的设计和制造阶段,总能取得相当好的应用效果,而在一些需要强调产“个性”的场合,如产品的使用阶段,由于工作环境与工作状况千差万别,其结果常常难以达到令人满意的效果。产品的设计与制造者,通常面对的是大批的产品;而产品使用者面对的总是某台具体而微的设备。现有的可靠性指标体系,还不能很好地服务于产品从设计到运行的整个寿命周期,特别是在产品的运行阶段还需要有所创新[1]。对一些如轴承等长寿命机械产品,其失效样本数据更加难以获取或获取成本高昂,则其寿命概率分布模型也难以准确获得。这迫使人们不得不转换思路,更多的从设备的运行数据上着手,冀望更加准确的评估设备的运行可靠性。
郑龙等[2]综合利用长寿命、高可靠性产品的性能退化数据和marker数据对产品可靠性进行建模,并给出了模型参数的估计方法。张云等[3]针对数控转台可靠性高、寿命长、失效样本数据少的情况,通过测量转台不同角度回转精度的性能退化,采用虚拟增广原理扩展试验数据得到数控转台的伪失效寿命,开展了数控转台的可靠度评估。王新刚等[4]通过将刚度累积损伤理论引入振动微分方程,结合随机有限元法和可靠性基本理论,推导出在考虑刚度退化下具有随机参数的振动传递路径系统的传递可靠度和可靠性灵敏度数学模型。于繁华等[5]运用利用稳健设计理论,建立了机械零部件动态可靠性稳健优化设计的多目标优化模型,为机械零部件的动态可靠性稳健优化设计提供了理论依据。贾庆轩等[6]面向空间机械臂在轨操作任务的高可靠性需求,基于运动可靠性影响因素多层映射模型开展灵敏度分析,为空间机械臂任务规划和控制决策制定提供理论依据。秦荦晟等[7]综合考虑不同失效模式对轴承可靠性的影响,针对轴承试验中完全失效的数据,利用Bootstrap法构造轴承寿命分布参数的先验分布,依据Bayes法估计出相应的后验分布,并对后验期望修偏即可获得轴承寿命分布参数,该方法有助于寻找轴承设计过程中存在的缺陷,提高轴承的可靠度。Dai等[8]利用机械加工过程的信号特征代替传统的时间数据,拟合设备退化模型,根据失效阈值和由伪故障特征分布模型得到的可靠性曲线,建立了一种有效的可靠性评估方法。何正嘉曾在《机械设备运行可靠性评估的发展与思考》[9]一文中指出:“基于大样本条件并依赖概率统计数据得到的平均可靠性难以满足个体设备的运行可靠性评估需求。”设备的故障既是状态也是过程。而设备的运行信息便是这个状态与过程的时实反应,特别是旋转设备的振动响应信息更是具有获取方便、数据量大且丰富的特点,这些都为运行可靠性的个性化度量提供了数据来源和数据保障。
1 支持证据统计
1.1 理想证据空间
在科学研究中,证据通常用来支持或者否定一个假设,证据的收集一般是通过对自然现象或试验的观察来获取的[10-11]。一台设备的运行状态是否正常,通常是通过检验设备的运行性能参数来确认的,这些运行参数在此即充当了证据的功能。
设某机械设备的运行状态可以由k个运行参数h1,h2,…,hk描述,则可得到证据向量x=(h1,h2,…,hk)T(在不致引起歧义的情况下,下文中仍简称其为证据)。
考察上述设备的任一过程状态,如果该过程证据集内的所有证据向量都包含于上述超球内,说明此设备在该时刻处于正常运行状态,即设备在该时刻是可靠的;反之,如果所有证据向量都不在上述超球内,则说明此设备在该时刻处于非正常运行状态,即设备在该时刻是不可靠的。综上论述,在理想状态下,设备的可靠性处于一种简单的“0,1”二值逻辑状态。
1.2 支持证据空间
考虑设备的实际运行环境和检测方法,证据的效力不免会存在一定程度的污染和检测误差。证据受干扰小、提取精度高,证据的证据力就较强;证据受干扰严重、提取精度低,证据的证据力也就较弱。证明力强的,将其定义为有效证据,应该极力的保存;证明力弱的,定义为无效证据,则应该尽量剔除。如何去伪存真,最大可能地保留有效证据,而去除无效证据,这将是下面将要讨论的问题。
(1)
式(1)是一个二次优化问题,可以用拉格朗日乘数法求极值,如式(2)
(2)
式中,αi为拉格朗日乘子。
为了更好地区分证据的有效性,下面将证据映射到一个高维的证据空间,在该空间内实现证据的区分与选择。引入核函数K(xi,xj),则式(2)可以改定为
(3)
通过对式(3)求偏导,可以得到拉格朗日乘子αi的值,进而可以得到最小超球的圆心
(4)
(5)
凡是满足式(6),即在这个超球表面或以内的证据,称之为有效证据;反之,则称之为无效证据。同时,得到的这个超球体称之为支持证据空间。为了更形象地了解支持证据空间的形成,可参见图1。
(6)
1.3 支持证据统计
设备经调试、检验并确认其各项运行参数指标都符合质量技术要求后,采集得到的证据称之为标定证据,这些证据都是设备正常运行的有力支撑。若在设备的任一运行时段提取证据,在此时段设备的运行状态未知,称提取的证据为过程证据。
图1 支持证据空间示意图
(1)Ωt⊆Ωc
如图2(a)所示,过程证据空间完全包含于标定证据空间内,即所有证据都表明该设备在该过程时刻的运行状态没有发生变化,设备的运行可靠性Rt=1。
(2)Ωt∩Ωc=φ
如图2(b)所示,过程证据空间与标定证据空间完全没交集,即所有证据都表明设备在该过程时刻的运行状态发生了根本性的变化,设备的运行可靠性Rt=0。
(3)φ<ΩI=Ωt∩Ωc<Ωt
如图2(c)所示,过程证据空间与标定证据空间相交,设ΩI是Ωt与Ωc的交集,VI与Vt分别是ΩI与Ωt的体积,则表明有Rt=VI/Vt×100%的证据显示设备在该过程时刻的运行状态发生了变化,相应的,称Rt为设备此时的运行可靠性,式中空间体积VI与Vt可以根据空间几何知识求解,在此不予赘述。
图2 支持证据统计原理图
综上,设备的在任意时刻t的运行可靠性Rt以分段函数的形式表示为
(7)
式中,tcf表示设备完全失效的时间。
上述分析过程实质上是一个建立在支持证据空间上的统计过程,故称这种运行可靠性评估方法称为支持证据统计(support evidence statistics, SES)。
2 深度卷积稀疏自编码原理简介
从监测信号中提取证据或特征以往更多地依赖人工与经验,受人为因素影响较大。深度自编码器由多个自编码器堆叠而成,是一种无监督学习技术[15-16],也是一种基于大数据的特征自动提取技术,能更好地减少证据提取受人为因素的影响。
2.1 自编码器
标准的自编码器是一个三层的全连接神经网络,包含输入层、隐藏层和输出层,结构如图3所示。
图3 自编码器结构图
误差函数J0定义为输入与输出的二范数,即:
(8)
2.2 卷积自编码器
标准自编码器中隐藏层的编码过程和解码过程一般由对称的若干全连接层组成。而卷积自编码器的隐藏层在上述的编码和解码过程中可以加入了卷积层和池化层[17],其加入方法可以是对称的,也可以是非对称的。
卷积层使用的是相同的卷积核,其参数共享(或称权值共享),因此只需要存储一组卷积参数。单一卷积核对特征的提取有限, 故在卷积层一般使用多卷积核以获取不同的特征。由于卷积核权值共享,卷积网络与全连接网络相比,参数大为减少,模型规模也相应缩小。卷积运算也可以使振动信号的特征增强,使卷积网络具有更好的抗噪特性。
2.3 卷积稀疏自编码器
对卷积自编码器的隐藏层神经元激活函数添加L1正则约束,促使隐藏层神经元处于激活状态,从而增强隐藏层的特征学习;对隐藏层神经元激活函数添加L2正则约束,可以防止模型过拟合,则式(8)可以改写为
(9)
式中:λ为惩罚项权重;m为中间层神经元个数;β为正则项权重;w为权重向量,即权重矩阵W和W′中的行向量;all表示对权重向量。以上便形成了所谓的深度卷积稀疏自编码(deep convolution sparse auto-encoder,DCSAE)。
DCSAE是在标准自编码器基础上,为了更好地从振动信号中提取信号特征,防止过拟合而发展出来的,它与深度自编码器有相似的结构和相似的使用方法。
3 基于深度支持证据统计的运行可靠性
机械设备工作环境复杂,轴承时域振动信号易受噪声影响。DCSAE以含噪时域振动信号为输入重建时,隐藏层会学习噪声信息,为降低噪声影响,对每组采集的时域振动信号,加以不同强度的高斯白噪声信号作为模型输入,对DCSAE模型进行训练,提取证据特征。DCSAE提取特征结合支持证据统计称为深度支持证据统计方法(deep support evidence statistics, DSES),其轴承运行可靠性评估方法流程,如图4所示。
图4 基于DSES的轴承运行可靠性评估流程图
基于DSES的轴承运行可靠性评估过程结构图,主要包括以下几个步骤。
(1) 标定原始信号采集:采集运行滚动轴承时域振动信号,并进行归一化处理后,得到标定原始信号;
(2) 标定信号加噪:对标定原始信号加若干组(例如:5组)随机强度的高斯白噪声,从而得到若干组(5组)标定加噪信号;
(3) DCSAE模型训练:以标定加噪信号为输入,以对应的原始信号为标记,对深度稀疏自编码器开展训练;
(4) 标定证据空间生成:以标定原始信号为已完成训练的DCSAE模型的输入和标记,得到特征数据,并组成标定证据集,以1.2节的方法构建标定证据空间;
(5) 过程信号采集:实时采集运行滚动轴承时域振动信号,并进行归一化处理后(此处除以与标定信号归一时相同的系数),得到标定信号;
(6) 过程证据空间生成:以过程信号为输入与标记,方法同步骤(4),构建过程证据空间;
(7) 运行可靠度计算:以1.3节的方法,通过标定证据空间Ωc与过程证据空间Ωt,计算设备在任意时刻t的运行可靠性Rt;
(8) 数据更新:生成并构建新的过程证据空间,得到新的运行可靠性;
(9) 模型更新:随着数据更新,经过判断,添加新的数据为标定信号,重复步骤(2)~(4),得到新的标定证据空间。
(10) 过程循环:重复步骤(5)~(7)。
4 案例分析
4.1 航空轴承寿命试验
数据来源于美国辛辛那提大学智能维护中心(NSF I/UCR Center on Intelligent Maintenance Systems(IMS))的航空发动机转子轴承疲劳寿命试验,一共包含三组,分别为data1、data2和data3。试验装置外形和结构可参考文献[18]。试验台由交流电机驱动,利用带传动将动力传到试验台主轴上,可以对四个主轴承进行疲劳寿命试验。轴承径向载荷利用弹性装置加载,大小为60 001 bs;轴向载荷为0;轴的转速为2 000 r/min。利用PCB 353B33振动加速度传感器采集每个轴承水平和竖直两个方向的振动加速度信号,采样频率为20 kHz,采样点数为20 480。试验每20 min数据记录一次,试验结束后,3#轴承出现内圈失效,4#轴承出现外圈和滚动体复合故障。
4.2 数据分析
4.2.1 初步分析
试验数据data3共采集2 156个记录,计718.7 h。分析过程中,将每个记录平分为10份,共得21 560组数据,每组数据采样点数为2 048。考虑到实时更新,以前期500组(即16.7小时)的数据为样本分别训练DCSAE(结构如表1)。每小组数据皆混加高斯白噪声,加噪强度随机,但不超过最高幅值的50%;共加5组,则训练样本数都扩充为原始数据的5倍。
表1 DCSAE结构表
再将前期500组原始数据输入已训练的深度卷积稀疏自编码器模型,提取其特征层为证据以构建标定证据空间;再以50组数据为输入,实时动态采集并输入上述已训练模型,提取其特征层为证据以构建过程证据空间。核函数采用高斯核函数。此时,标定证据空间的半径为0.584 1,中心坐标为(0.275 3,0.724 7,0.275 4);过程证据空间的半径变化曲线和两空间中心距变化曲线图分别如图5(a)、(b)所示,同时也可以得到轴承的运行可靠性变化曲线,如图5(c)所示。
(a) 过程证据空间半径全寿命变化曲线
4.2.2 数据更新
随着轴承的运行,数据随之更新,意味着标定证据集可以随之扩充。若将运行可靠度为1的采集点重新加入训练深度卷积稀疏自编码器,并组成标定证据集,则可形成新的标定证据空间。相应地,标定证据集扩充到1 000组(即前33.3 h的数据)时,轴承的运行可靠性变化曲线如图6所示。
图6 标定证据数为1 000时的全寿命运行可靠度
4.2.3 结果分析
参考帕累托法则,将80%定义为运行可靠度的阈值。观察图5(c),时序到达采集点1 405点(即运行到468.3 h)时,运行可靠度下降到72.1%,其后出现间隔冲击振荡,在1 657)点(552.2 h,再次突破80%,直至1 818点(606 h)后,运行可靠度快速振荡下降,直到为零。观察图6,以1 858点(619.3 h)为界,前期运行可靠度评估值较为稳定,其后冲破80%,并快速失去直至为零。
比较图5(c)和图6,标定证据集的大小对运行可靠性评估有较为显著的影响。当标定证据集较大时,评估结果比较稳定,不易出现误判,但对故障的出现与发展不够敏感。
本方法运行可靠度的意义与传统可靠度有明显的区别。传统可靠性中对可靠度的定义,其实质是可靠性评估对象与该对象样本的总体特性进行横向对比得到的,而本方法中的可靠性,其实质是待评估对象标定证据与过程证据之间的实时纵向对比。以本案例来说,轴承在606 h的可靠度是76.46%;对传统可靠性而言,意味着该轴承运行到606 h时,该类轴承样本里仍有76.46%的轴承仍能正常运行,它的结果是间接的,从哲学的角度来说,是特殊向一般的映射;而对本方法的运行可靠性而言,该轴承运行到606 h,仅有76.46%的证据与标定证据相同,它的结果更为直接,是从特殊到特殊的映射关系。
在本案例的分析中,也尝试运用标准稀疏自编码器提取证据,并考虑了网络层数变化和不同的损失函数(包括交叉熵损失函数、平方损失函数和KL散度损失函数等),均不能很好的提取证据并开展运行可靠性评估。也尝试了多种不同的DCSAE的网络结构,均能较好的提取出证据特征,并完成运行可靠性评估,说明DCSAE除了能减少人为干预,也具有较好的稳健性。
另外,需特别说明,(1)由于本试验数据采样间隔过大(每20 min设置一个采集点),对运行可靠性的评估精度有较大的影响,如果减少数据采集间隔,提高每次采集的采样点数量,相信能显著地提高运行可靠性的评估精度。(2)目前似乎尚难以找到有力的证据支撑本方法对早期微弱故障的发现有指导意义;试验轴承拆卸后发现是内圈故障,由公式计算,该轴承内圈故障特征频率为297 Hz,用二代小波[19]做4层分解后计算该轴承在295~300 Hz处幅值的全寿命变化曲线,如图7;仅可分辨出轴承在运行到采集点1 927(即642.3 h)后,该轴承故障频率处的幅值总体上确有开始上升的趋势。
图7 轴承内圈故障特征频率幅值全寿命变化曲线
5 结 论
本文提出基于DSES的轴承运行可靠性评估,以原始振动数据作为输入,不需要采用复杂的信号处理方法,预处理过程简单,其评估过程中人工干预较少,其评估结果能更好地反映轴承状态变化的“个性”并有较好的可视性,将有助于提高运行可靠性评估的智能化水平。