基于深度学习的机械设备使用寿命预测方法研究
2023-10-30冯建智林艺斌
冯建智 林艺斌
(1.漳州理工职业学院,福建 漳州 363007;2.厦门中软卓越教育科技有限公司,福建 厦门 361024)
进入新世纪以来,随着科学技术的不断发展,人们对产品的制造精度和质量也有了更高要求,这就导致了机械设备逐渐向着复杂化、精密化的方向发展。这种发展模式虽然在很大程度上提升了产品制造的品质和效率,但同时也带来了成本投入过高、资源浪费等问题,尤其是在机械设备长期运行过程中,随着设备性能的退化,导致出现停机或者故障的概率有较大增加,为企业的正常运行带来了较大风险。为了有效应对机械设备因长期运转而出现的该问题,我国提出了“中国制造2025”发展规划,德国也提出了“工业4.0 战略”。在这种大的发展背景下,针对机械设备预测性维护的研究逐渐增多。
设备预测与健康管理(PHM)作为目前出现的一种机械设备综合评价技术手段,不仅能够实现对设备运行的精准监控,同时还能够为机械设备的保养维护提供科学的数据支撑,进而降低设备的运行维护成本,提升企业生产效益。而剩余使用寿命(RUL)则是一种对设备运行数据进行采集、分析来预测剩余寿命的技术,精准的RUL 可以有效降低机械设备的停机时间,因此被广泛应用于各个行业的设备使用寿命预测。例如在对飞机涡轮发动机进行维护保养的过程中引入了RUL 检测技术,并根据检测结果来对发动机进行有针对性的维护,如此可以有效确保飞行器的飞行安全。由此可以看出,针对RUL 预测进行研究对降低设备运行成本、确保机械设备的安全运行具有十分重要的现实意义。
1 深度学习算法概述
在机械设备剩余使用寿命预测研究方面,卷积神经网络因其具有强大的特征提取功能而成了一个常用的处理方法。而对机械设备数据进行建模时,得益于强大的时间序列建模能力,目前长短期记忆网络被广泛应用于机械设备剩余寿命的研究中。
1.1 卷积神经网络
卷积神经网络(CNN)是一种机器学习领域内的重要算法,其主要由多个模拟人类神经结构的神经元组成。一般情况下,卷积神经网络主要分为输入层、隐藏层以及输出层3 个部分,其中隐藏层由包括卷积层、池化层以及全连接层[1]。卷积神经网络的结构如图1所示。
图1 卷积神经网络结构
由图1 可以看出,输入层主要负责将数据信息传送至隐藏层中,而隐藏层则会通过一系列计算来提取数据中的特征信息,并在输出层中输出最终的计算结果。
在卷积神经网络中,输入机械设备的相关数据,在卷积层中,卷积核会对该数据进行计算,并提取出数据信息中所隐含的特征,该文将其称之为特征图,如公式(1)所示。
式中:x为输入的数据信息;w为卷积核;b为偏置;f为激活函数。
1.2 长短期记忆网络
长短期记忆网络(LSTM)是在循环神经网络模型算法的基础上发展而来的,是一种具有记忆功能的神经网络模型,不仅能够实现对数据短期和长期信息的选择保存,还能够对数据之间的关系分析,做出时间序列上的精准预测[2]。考虑对机械设备数据采集应用的是间隔式的机械传感器,其对数据信息的传送具有时序性,因此采用长短期记忆网络对机械设备剩余使用寿命进行预测所得结果的可靠性要优于循环神经网络算法和卷积神经网络算法。LSTM网络结构如图2所示。
图2 LSTM 网络结构
由图2 可以看出,长短期记忆网络是由若干个记忆神经元组成的,其网络结构中有输出门、输入门以及遗忘门3 个门控制单元,其中遗忘门主要负责对数据信息进行保留或者丢弃处理。
2 基于B-LSTM 的机械设备剩余寿命预测模型
通过上文的分析可以看出,在机械设备剩余寿命预测中,采用LSTM 具有更好的预测结果,但LSTM 网络在训练过程中也存在梯度消失的缺陷。而为了解决该问题,该文对LSTM 的注意力机制进行了改进,构建了一种注意力改进的双向长短期神经网络模型(B-LSTM),实现了对机械设备剩余使用寿命的精准预测[3]。该文构建的注意力机制改进的B-LSTM 模型的具体的结构如图3所示。
图3 B-LSTM 预测模型
由图3 可以看出,B-LSTM 预测模型主要是由特征提取模块、网络模块和预测模块3 个部分组成。其中,特征提取模块主要依靠卷积神经网络所具有的卷积和池化作用来对所输入的数据信息进行时间序列处理,提取隐藏在数据信息中的特征。而网络模块则会以时间为轴,在正向和反向2 个维度对输入的数据信息进行建模,构建一个双向的长短记忆网络,并得到输入数据信息之间的相互依赖关系。预测模块则主要是由全连接组成,其能够和构建起来的双向长短记忆网络进行回归处理,通过一系列计算来得到机械设备剩余使用寿命的预测结果,并利用误差函数的计算对网络参数进行迭代更新,从而确保网络模型时刻处于稳定状态。
3 模型求解
构建B-LSTM 网络模型之后,只有对所输入的机械设备数据进行算法求解,才能最终获得机械设备剩余使用寿命的计算值。其具体的求解流程如下。
3.1 提取数据特征
考虑输入至模型中的机械设备数据要远小于设备的生命周期数据,因此在对数据特征进行提取之前还应对其进行归一化处理,输入的机械设备数据集设定为S=[Sh1,Sh2,...,ShN],对其进行归一化处理,并得出对应的计算结果,归一化的数学表达式如公式(2)所示。
式中:Sij为第i次对信号数据进行采集获得的第j个数据;Simax为获取的数据信息最大值;Simin为获取的数据信息最小值。
在对所输入的设备数据信息进行归一化处理后,还需要对归一化值的特征进行提取,再将计算得到的卷积结果进行激励函数运算,输入至池化层中进行处理,得出机械设备数据的特征表示[4]。该文所使用的激励函数为ReLu函数,如公式(3)所示。
经过卷积神经网络特征提取后,所输入模型中的设备数据特征数据集为X=[x1,x2,...,xN]∈RM·N。
3.2 机械设备剩余使用寿命预测
注意力网络模块接收到数据特征后,会对该数据集进行建模,并计算所有时刻对应的注意力值。然后在RUL 预测模块接收到来自网络模块的注意力值后,其会自动进行计算并预测注意力机制[5]。预测模块计算得到的注意力值会对应至全连接层中的输出值,如公式(4)所示。
式中:Oi为模型中全连接层的输出值;Θfc为模型全连接层中的参数;Wi为全连接层所对应的权值;bi则为全连接层所对应的偏置。
计算出注意力值所对应的全连接层输出值后,再对其进行线性回归,得出机械设备剩余寿命的预测数据,如公式(5)所示。
4 模型训练
针对模型进行训练的效率和该模型的神经元数量、隐藏层数量以及迭代次数等因素都有直接的关系,如果选择不合适的模型因素,不仅会降低模型训练的速度,还会降低模型机械设备寿命预测的精准度。因此,为了提升预测准确率,该文引入了adam optimizer 来对构建的B-LSTM 网络模型进行训练。
针对神经网络模型进行训练的学习策略主要分为固定学习率和自适应学习率2 种。通常为了更好地对网络进行训练,会采取提升网络训练速度或者模型预测精准度的方法来避免出现模型过拟合的问题[6]。结合该文构建的B-LSTM 模型,该文采用了自适应学习来对adam 算法进行优化,adam 优化算法如公式(6)所示。
将adam optimizer 算法引入构建的B-LSTM 神经网络模型中,可以有效避免因该网络层数过多而出现的过拟合问题,并能够提升网络模型训练的速度。采用adam 优化算法来对B-LMST 神经网络进行训练的流程如下。
步骤1。对输入的机械设备数据进行归一化处理。
步骤2。对双向长短期记忆神经网络的网络权值和偏置进行初始化。
步骤3。对机械设备剩余使用寿命预测模型进行训练。在此设定网络迭代次数为N,训练停止的误差值为a,训练次数为epochs,并设定网络训练的初始值为100,训练样本数为batch。设定外层循环在迭代次数高于训练次数或者网络损失函数值小于停止误差时终止。设定内层循环在运行完循环次数后停止。其中内层循环如下:将经过处理的数据输入卷积神经网络中,得到机械设备数据信息的输入特征,然后采用该特征来表示输入B-LSTM 神经网络中数据特征所对应的隐藏向量,利用注意力机制计算出隐藏向量所对应的注意力权值,再对注意力权值和隐藏向量进行加权并求出加权值,将其输入B-LSTM 神经网络模型中的全连接层。经过全连接层的计算得出最终的机械设备剩余使用寿命预测值[7]。在B-LSTM 网络中引入dropout,将其初始值设定为0.2,在进行网络训练过程中,通过修改dropout 来选出剩余寿命预测准确率最高的数据。对网络参数进行更新时,采用adam optimizer 优化算法来更新网络参数。
步骤4。通过上述的训练最终得出网络模型Model。
5 结语
综上所述,随着工业4.0 时代的到来,在现代化科学技术加持下的工业生产制造愈发精密和复杂,虽然这从整体上提升了工业生产的质量和效率,但在机械设备长时间运行过程中也较大地提升了出现故障的概率。为了能够降低对复杂机械设备进行维护的成本和出现故障的概率,设备的预测性维护和健康管理发挥了十分重要的作用。该文采用B-LSTM 神经网络构建起的机械设备剩余使用寿命预测模型,可以实现对机械设备使用寿命的精准预测,为设备的维护保养提供了科学的决策依据。