基于稀疏自编码神经网络的产品再设计模块识别方法
2019-08-07马斌彬马红占褚学宁李玉鹏
马斌彬, 马红占, 褚学宁, 李玉鹏
(1. 上海交通大学 机械与动力工程学院, 上海 200240; 2. 中国矿业大学 矿业工程学院, 江苏 徐州 221116)
随着运行时间的增长,产品功能模块的性能逐渐退化,而产品的薄弱环节通常是退化严重、对产品的安全性和可靠性产生重大不利影响的功能模块[1],因此,设计人员往往采用再设计的方法对产品的薄弱环节进行重新设计.其中,再设计功能模块识别方法是通过找出产品的薄弱环节并对其重新展开设计,从而进一步提高产品的可靠性和服务水平.目前,国内外学者基于产品的故障数据和运行数据对再设计功能模块识别方法进行了研究.例如:Francesco等[2]提出了改进的产品失效模式、影响和危害性分析(FMECA)方法;全睿等[3]通过建立模糊故障树来识别影响燃料电池发动机安全性的薄弱环节.但是,由于船舶、起重机等复杂机械产品具有可靠性高、寿命长的特点,偶发的故障数据不能真实反映产品在一段时间内的连续状态变化情况,所以基于故障数据的产品再设计模块识别的结果不能很好地反映功能模块间退化水平的差异.随着传感器和无线技术的发展,获取产品运行状态的实时数据变得可行[4].Shin等[5]基于产品性能时变数据,利用聚类方法分析了产品的失效情况,通过建立性能参数与设计参数之间的关联矩阵来对产品再设计进行改进,但利用聚类方法进行失效分析需要预先设定运行工况的个数,而产品的运行工况具有复杂性和多变性,因此,很难预先确定运行工况的个数;Ma等[6]以履带起重机的功能模块的性能参数为输入,通过建立混合高斯模型来拟合性能参数的取值区间,以用于产品再设计模块的识别.但是,混合高斯模型需要在每个状态点更新退化模型,其计算过程复杂,不利于实时处理.而神经网络模型可用于处理具有多状态(非线性)的性能特征参数,适用于描述运行工况复杂的产品退化状态[7],因此,本文利用产品在健康状态下的性能时变数据构建稀疏自编码神经网络(SAENN)模型,以用于产品功能模块退化程度的评估,并通过对比模块功能间的退化差异来识别需要再设计的功能模块.
1 基于SAENN的产品功能退化建模
1.1 稀疏自编码神经网络
在产品运行过程中,传感器采集到的各种性能特征参数在一定程度上反映了产品功能退化的程度,这些状态信息对产品再设计具有重要的价值.然而,产品的退化过程复杂,其功能退化的规律与性能特征参数之间存在着复杂的非线性时变关系,难以利用确定的解析模型来评估,而神经网络模型可以表征产品性能参数之间的非线性关系,因此,它可用于评估产品功能的退化程度,进而比较不同功能模块间的退化差异.
自编码神经网络(AENN)模型是一种无监督的神经网络模型,包括输入层、隐含层和输出层,其主要通过编码-重构过程来表征输入样本的数据特性[8].通过建立AENN模型、训练产品在健康状态下各功能模块的性能特征数据,能够提取在健康状态下产品性能参数之间的抽象特征.当产品功能发生退化时,这些性能参数的特征与健康状态下的具有明显差异,通过分析其差异即可评估各功能模块的退化程度.而SAENN模型是在AENN模型的基础上在隐含层神经元引入了稀疏性限制条件,从而增强了模型的泛化能力(模型对于健康状态下性能特征的识别能力).稀疏性限制条件能够使AENN模型的隐含层通过特征选择来找出高维数据中重要的若干维,从而学习相对稀疏、简明的数据特征,以更好地表达输入数据,它克服了AENN模型泛化能力较差、不能提取数据内在特征的缺点.
1.2 产品功能退化评估模型的建立
以下为建立产品功能退化评估模型的步骤.
(1) 构建产品功能退化评估模型.首先,划分功能模块.对于机械产品来说,功能模块可以按照实现功能的不同划分为机、电、液等系统,每个系统均采用对应的性能特征参数来表征其功能模块的退化程度.假设产品由N个功能组成,第n个功能表示为Fn(n=1,2,…,N),功能Fn有M个性能特征,则功能Fn的性能时变特征可用矩阵形式表示为
(1)
qi=sf(Wpi+b1)
(2)
式中:sf为从输入层到隐含层的激活函数,也就是Sigmoid函数f(x)=1/(1+e-x);W∈Rd×M,为隐含层的权重矩阵;b1∈Rd×1,为隐含层的偏置向量.从隐含层到输出层进行特征重构,将qi经过计算后所得与pi具有相同维度的性能特征向量为
(3)
图1 功能退化的评估模型Fig.1 Assessment model of function degradation
(4)
(2) 增加稀疏性限制条件.在重构误差C的基础上增加稀疏性限制条件.对于PM×t中M个输入性能特征向量,假设隐含层中第k(k=1,2,…,d)个神经元的平均活跃度为
(5)
稀疏性限制条件可以表示为
(6)
(7)
因此,加入稀疏性限制条件后的重构误差可以表示为
(8)
式中:β为稀疏性惩罚因子的权重,决定了对稀疏性限制条件的重视程度.
2 产品再设计功能模块识别
2.1 功能退化程度的评估
(9)
将评估矩阵中的性能时变特征向量逐次作为模型输入,计算每一时刻的劣化指数DI,从而得到Fn的退化趋势.
2.2 性能特征重要度的分配
性能特征重要度是性能参数对功能退化的影响程度.对于功能Fn的M个性能特征,其数值与正常的性能特征范围的偏差对Fn层次的功能退化的影响程度有所不同.例如,液压系统失压比油温偏高对功能造成的影响更严重,因此,在计算DI时,需给油压分配更大的权重,以便于合理描述功能退化的程度.在实际应用中,对于性能特征重要度的分配,主要依靠工程人员的知识和经验确定.假设性能特征重要度的权重向量为V,第j个性能特征的权重为vj,则
(10)
考虑到性能特征重要度权重的影响,修正后的劣化指数为
(11)
2.3 再设计功能模块的识别
首先,对产品的N个功能模块分别建立功能退化评估模型,以分析功能退化趋势与性能时变特征的关系;然后,采用修正后的劣化指数DI表征其退化程度.在对产品的薄弱功能模块进行识别时,应比较相同时间内不同功能模块的DI的变化趋势.DI值越大,说明退化越严重,该模块再设计的必要性越高,在再设计过程中需要格外关注.
3 案例分析
本文以国内某大型工程机械制造企业的水平定向钻产品为例进行案例分析.该企业的水平定向钻产品包括小型机系列、中型机系列以及重型机系列,主要型号有SDD100型、SDD330型、SDD3000型等,本文的研究对象为重型机产品.
3.1 产品功能模块的划分
表1 功能模块的性能特征及重要度Tab.1 Performance feature and importance rate of the function module
3.2 功能退化评估与再设计的必要性
首先,定义水平定向钻在未出厂时的调试过程采集的性能时变数据为健康状态下的产品性能特征,用该时段的数据训练退化评估模型;然后,对水平定向钻出厂后投入运行3 a内各功能退化的程度进行评估.每隔30 min采集一次各功能模块的性能特征.其中,主轴时域信号采用振动信号的方均根(RMS)作为特征参数.对于每个功能模块,将采集的 1 620 组健康状态下的性能特征数据作为训练集数据,随机抽取其中 1 296 组数据用于模型训练,324组数据用于模型验证;将产品运行过程中的 6 000 组性能时变数据作为测试集数据,以评估功能模块的退化程度.评估过程分为3个步骤:
(1) 数据预处理.由于产品功能模块的性能时变数据的量纲和数值区间不同,直接进行训练会导致数值区间大的性能特征过分支配数值区间小的性能特征,所以需要采用数据标准化的方法将其统一变换为无单位数据.本文采用0-1标准化方法[10]对训练集数据进行缩放,并将缩放比例应用于测试集数据.
(3) 评估功能退化程度.获取不同性能特征重要度的权重(见表1).采用步骤(2)中训练好的退化模型评估测试集数据,计算得到修正后的劣化指数DI.所得3 a内不同功能模块的劣化指数的变化趋势如图2所示.由图2可见,随着运行时间增加,各功能劣化指数均逐渐增大.而劣化指数越大,说明功能退化越严重.
图2 不同功能模块劣化指数的变化趋势Fig.2 Degradation tendency of each function module
由图2还可以看出,液压系统F1的功能劣化指数随时间变化而迅速增长,其变化幅度远超过其他功能;而机械系统F2相比初始时刻也有较明显的增长趋势.通过比较各功能模块的劣化指数的最大值和变化趋势发现,液压系统的功能退化最严重.
另外,由企业调研中与产品设计师和相关技术人员的访谈可知,液压系统中子系统众多,但由于缺乏足够的设计和工艺操作经验的积累,所以液压系统的性能指标和可靠性与国外同行业的先进水平还存在差距,提升该功能模块的可靠性对于提升产品整体服务水平有着重要作用,因此,从实际工程的角度也说明液压系统功能模块再设计的必要性最高.
3.3 结果分析
为了验证SAENN模型的精度,采用3.2节中F1的 1 620 组训练集数据及AENN和SAENN模型对于产品在健康状态下的性能特征提取效果进行对比,其结果见表2.由表2可以看出:SAENN模型训练数据的平均重构误差略大于AENN模型,这是由于增加稀疏性限制条件的正则项的缘故,但其对模型精度的影响很小,且验证数据的平均重构误差小于AENN模型,说明SAENN模型的泛化能力更强.因此,在训练数据重构误差差距不大的情况下,增加稀疏性限制条件能够提高模型的泛化能力,减少训练过程中的过拟合现象.
表2 不同模型的重构误差Tab.2 Reconstruction error of each model
为进一步验证SAENN模型的应用效果,本文采用改进FMECA方法[2]、聚类方法[5]和混合高斯模型(GMM)方法[6]识别薄弱功能模块(液压系统),所得功能模块的再设计必要性见表3.其中,根据方法的不同,模块之间再设计必要性的高低有所区别.改进FMECA方法是通过分析不同功能模块发生的故障模式及其可能造成的影响,按照故障的严重性、难检度和发生频次进行归纳,对各功能模块的再设计必要性进行排序;聚类方法是通过预先设定健康状态类别数,根据时变性能特征向量与聚类中心的距离计算功能模块的退化程度,进而比较功能模块间的退化差异;GMM方法是通过建立混合高斯模型,将健康衰退指数作为功能模块退化程度的评估指标,以确定各功能模块再设计的必要性.由表3可见,利用产品故障数据进行识别时,无法确定功能模块F2和F3的再设计必要性,其原因是产品故障数据来源于水平定向钻的返厂维修记录和用户反馈信息,而水平定向钻出厂投入运行3 a后只有2次返厂维修记录,分别为液压系统故障(表现为液压管颤抖)以及液压泵声音异常和泥浆系统故障(表现为管路堵塞).因此,仅靠维修记录无法评估F2和F3的再设计必要性.考虑性能时变数据后,采用聚类方法所得结果与GMM、SAENN方法的结果不同,其原因是聚类方法需预先确定工况个数,产品运行环境的多变性影响了产品退化趋势的评估;采用GMM模型与SAENN模型的结果一致,但GMM模型训练和评估的耗时较多,因此,采用SAENN模型进行再设计功能模块识别的整体性能最优.
表3 不同方法识别的再设计功能模块的必要性Tab.3 Different identified functions using different methods
4 结语
本文将产品在健康状态下的性能时变数据应用于产品功能退化评估,提出了利用性能时变数据来指导产品再设计的思路,并将SAENN模型用于产品功能退化程度的评估,提高了再设计功能模块识别方法的准确性和客观性.具体方法:将产品在健康状态下的性能数据作为训练数据,通过训练神经网络来学习性能参数深层次的特征,并引入稀疏性限制条件,以增强模型的泛化能力;利用产品运行阶段的性能时变数据评估产品功能退化的趋势;对比各功能模块间性能退化的差异,以识别需要改进的功能模块.所得识别结果可作为产品再设计的依据,对提高产品可靠性具有重要意义.
然而,文中采用专家打分法对性能特征重要度进行评估,其主观性较强,下一步将考虑依据性能特征对产品在健康状态下的敏感性和产品性能的退化程度来确定性能特征重要度.