APP下载

一种基于神经网络的航空发动机剩余寿命预估方法

2021-07-21刘伟民胡忠志

航空发动机 2021年3期
关键词:卷积寿命预估

刘伟民,胡忠志

(1.中国航发控制系统研究所,江苏无锡214063;2.清华大学航空发动机研究院,北京100084)

0 引言

航空发动机健康管理技术是航空制造业、运输业和维修业共同关注的热点问题。从技术手段上提高航空发动机可靠性、可用性与安全性是各航空大国共同追求的目标[1]。美国、俄罗斯、英国等能够自主研制航空发动机的国家,都将发动机故障预测与健康管理系统(Prognostics and Health Management,PHM)放在重要位置。而剩余寿命预估作为航空发动机故障预测与健康管理系统的重要组成部分,是连接状态监视、故障诊断及预测、运维支持系统的重要桥梁[2],对降低发动机运维成本、维护其运行安全、减少部件无效替换次数等具有显著意义。

目前对航空发动机剩余寿命进行预估的方法大致可分为基于模型、经验、数据3类[2]。在基于模型的方法中,An 等[3]采用贝叶斯推理、Wei 等[4]采用扩展卡尔曼滤波、Zio 等[5]采用粒子滤波的方法,基于发动机退化模型与部分传感器数据对发动机剩余寿命进行预估,但是由于发动机各部件之间退化存在耦合,且退化模型建立困难,所以基于模型的方法具有较大的局限性。在基于经验的方法中,戎翔[6]基于可靠性统计的方法建立威布尔模型,得到研究对象当前运行时间下剩余寿命的分布函数;Bai 等[7]根据性能可靠性建模理论,建立研究对象的威布尔分布的性能可靠性模型,从而进行寿命预估。基于经验的寿命预估方法易于实现,但是其预测精度普遍较低。在基于数据的方法中,Yan 等[8]、Liu 等[9]利用自回归滑动平均模型对研究对象剩余寿命进行预估,具有较高精度,但是存在对数据噪声敏感、只能对单一变量进行时序预测等缺点;Widodo 等[10]、Qu 等[11]利用支持向量机对研究对象故障时间进行预测,仅需少量历史数据即可收敛,但没有使用研究对象的时序信息,预测精度不佳;Tian 等[12]、Liu 等[13]分别利用全连接与递归全连接神经网络对研究对象剩余寿命进行预测,但是由于全连接神经网络无法利用研究对象的时序信息,精度较低,同时由于计算资源与算法的局限性,当时发展的神经网络深度与规模都比较小,限制了航空发动机剩余寿命预测的能力。

目前在较强的计算能力与海量数据的支持下,深度学习算法得到了快速发展,在一些领域已经具有较高的实际应用价值。本文提出一种基于卷积神经网络与长短期记忆神经网络的航空发动机剩余寿命预估方法,对航空发动机剩余寿命进行预测,并在NASA 的C-MAPSS 中的涡扇发动机退化数据集上进行验证。

1 航空发动机剩余寿命预估简介

航空发动机的寿命是其竞争力和持久性的重要特性之一,现代航空发动机的高可靠性与安全性很大程度上是材料的改进、寿命预估能力的提高、保守设计和维修思想的共同作用[14]。

常见的航空发动机寿命预估方法对压气机盘、涡轮盘、叶片、转子主轴和转子轴承等关键部件的寿命损耗进行评估,并以此对剩余寿命进行预估。通常,寿命预估系统由机载系统与地面系统2 部分组成,机载系统的任务是监测并采集航空发动机各部件的原始数据,对各部件的使用与损伤状况进行跟踪;地面系统则主要根据机载系统采集到的数据,结合基于模型、经验或数据的算法,对发动机各部件的剩余寿命进行预估。

航空发动机健康管理系统的主要功能单元如图1所示。

图1 民用航空发动机健康管理系统主要功能

在传统的航空发动机剩余寿命预估方法中,通常仅利用发动机工作时间或飞行循环数来表达部件的寿命损耗,但是由于每台发动机所执行的飞行任务、工作环境和载荷大小不尽相同,且同一批次的发动机个体之间通常也存在不小的差异,若仅采用工作时间或飞行循环数作为制定维护方案的惟一依据,发动机的寿命将得不到充分利用,这不仅会导致资源的浪费,更是给维修保障工作增加了负担[6,15]。

本文提出一种算法,借助传感器技术和计算机计算能力的发展,首先获取每台发动机的工况参数和发动机各部件实际运行数据,然后利用卷积神经网络(Convolutional Neural Network,CNN)提取数据特征,并使用长短期记忆神经网络(Long Short-Term Memo⁃ry,LSTM)进行时间序列预测,从而做出更精准的寿命损耗评估与剩余寿命预测,在确保飞行安全的同时,避免发动机各部件剩余寿命的浪费,从而提高发动机的经济性。

2 用于航空发动机剩余寿命预估的神经网络架构

2.1 卷积神经网络

卷积神经网络是多层感知器的变种,基于生物学家Hubel 与Wiesel 关于猫的视觉皮层的研究发展而来[16],最初被广泛应用于图像识别领域。由于卷积神经网络可以高效地将低层特征组合成高层的抽象特征,目前已经成为众多学科领域的研究热点之一。

卷积神经网络由卷积层、池化层与全连接层组成,其架构如图2所示。

图2 卷积神经网络架构

卷积层通过局域感受野的方法提取数据的局部特征,同时利用权值共享的方法减少卷积神经网络的参数数量;池化层通过次抽样的方法有效地缩减数据的尺寸,可以达到加快计算速度与防止过拟合的效果;全连接层利用卷积层与池化层提取出的特征完成回归或分类任务。

卷积层每个节点的输入只是上一层神经网络的一小块,通过卷积核将当前神经网络上的1 个子节点矩阵转化为下一层神经网络上1 个深度不限的单位节点矩阵。通常卷积层通过边缘补零的方式保持输入数据矩阵长与宽不变,从而仅改变输入数据的深度。例如,卷积核将m1×n1×k1个的节点矩阵转化为1×1×k2的任意深度的单位节点矩阵,其转化方法为

式中:g(i)为单位矩阵中第i个节点的取值;ax,y,z为输入矩阵中节点(x,y,z)的取值为对于输出单位节点矩阵中的第i个深度的节点的卷积核权重;bi为对于输出单位节点矩阵中的第i个深度的节点的偏置项参数;f为激活函数。

本文使用缩放指数型线性单元(Scaled Exponen⁃tial Linear Units,SELU)作为激活函数,可以使数据自归一化,保证在训练过程中梯度不会爆炸或消失[17]。其表达形式为

式中:z为激活函数输入值;λ与α为常数,λ≈1.051,α≈1.673。

池化层的前向传播过程与卷积层类似,即通过滑动1 个池化核的结构完成。池化层与卷积层不同的是,池化层改变输入数据矩阵的长与宽,并不改变数据矩阵的深度。由于池化核的作用在于对数据特征进行采样,所以其计算不是节点的加权和,而是采用最大值或平均值运算。例如:池化核将1 个m1×n1×k1的节点矩阵转化为1×1×k2的相同深度的单位节点矩阵,其转化方法为

式中:P(i)为输出矩阵中第i个深度上的取值;ax,y,i为输入矩阵中第i个深度上池化核中的数据。

池化层可以在不改变输入数据特征的前提下减小输入数据的维度,从而达到加快计算速度与防止过拟合的效果。

经过多个卷积层与池化层的交替传递,原始数据中的信息将被抽象为信息含量更高的特征,此时卷积神经网络还需要通过全连接网络完成分类或回归任务。

虽然卷积神经网络可以较好地提取输入数据的特征,但是当卷积神经网络层数较多时,其学习所需要的数据量与计算次数均会增加。为此,Szegedy[18]等提出了一种起始模组(Inception Module),如图3 所示。该模块通过优化网络结构来降低网络的复杂度。

图3 起始模组

起始模组由多个不同尺寸的卷积核组成,可以在减小网络复杂度的同时,对输入数据不同类型的特征进行较好的提取。试验表明,使用起始模组的GoogleLeNet 的训练参数数量只有 AlexNet 的 1/12,但是在ImageNet上的分类准确度比在AlexNet上的高约10%。

2.2 长短期记忆神经网络

循环神经网络是一种可以处理序列数据的神经网络,可以保留序列数据的前后关系,但是当序列长度较长时,会产生梯度消失的问题[19]。

长短期记忆神经网络最早由Hochreiter 和Schmidhuber 提出[20],用以解决循环神经网络中梯度消失的问题。经过数年的发展,LSTM 逐渐在语音识别、机器翻译和时序预测等领域取得了成功和突破。LSTM的结构如图4所示。

图4 LSTM结构

图中粉色圈为向量操作,其中⊗为向量点乘,⊕为向量加和;黄色矩形为激活函数,其中σ为sigmoid函数,tanh 为tanh 函数;黑线为从1 个节点的向量输出到其他节点的向量输入,2 条黑线交汇为向量的拼接,黑线分叉为向量被复制。

LSTM 的核心思想可以概括为:通过使用被称为门(Gates)的结构,选择性地允许信息通过。LSTM 中有遗忘门、输入门、输出门。遗忘门的作用是决定当前时刻从LSTM 神经元丢弃什么信息;输入门的作用是决定让多少当前时刻信息加入到神经元中;输出门的作用是计算当前时刻神经元输出值和状态值。从图中可见,每个LSTM 神经元在某时刻接收采样输入xt、上一时刻神经元输出和神经元状态量作为当前时刻输入;经过遗忘门、输入门、输出门的计算后,LSTM神经元输出当前时刻计算值和神经元的状态值。正是由于遗忘门、输入门、输出门的这种层级递归的结构,LSTM神经网络才可以处理各类复杂的序列数据。

2.3 用于航空发动机剩余寿命预估的神经网络架构

用于航空发动机剩余寿命预估的神经网络架构如图5所示。

图5 航空发动机剩余寿命预估的神经网络架构

从图中可见,航空发动机传感器数据经过适当的预处理后,输入至CNN中;由于CNN 具有强大的提取数据特征的能力,发动机的抽象特征将被提取出来,并形成时间序列,输入至LSTM 中;LSTM 通过学习时间序列的特征,对航空发动机剩余寿命进行预测;通过全连接层输出航空发动机剩余寿命。

3 试验数据介绍

使用NASA 的C-MAPSS 提供的涡扇发动机退化仿真数据集对提出的航空发动机剩余寿命神经网络架构进行测试[21]。该数据集共有4 个子集,每个子集的运行环境与故障模式略有不同,详情见表1。

表1 涡扇发动机退化仿真数据集说明

每个数据集可以进一步分为训练集和测试集。训练集和测试集均由多个多变量时间序列组成,且每一时刻数据维度均为26 维,其中21 维为发动机各部件传感器测得的数据,3 维为会对发动机性能产生重大影响的环境数据,2 维为发动机编号与运行次数。在训练集中,发动机部件持续退化至发动机发生致命故障;在测试集中,时间序列在发动机致命故障前的某个时刻终止。

由于不同数据集中航空发动机运行环境不同,所以在进行剩余寿命预估前需要对传感器数据进行归一化,其方法为

式中:c为发动机运行环境;f为21 个传感器;x为传感器采集到的实际数值;μc,f为平均值;σc,f为标准差。

为了充分提取传感器信号之间的相关特性,考虑到卷积神经网络局域感受野的特点,在使用CNN 与LSTM 对发动机进行剩余寿命预估时,首先应对发动机传感器数据进行重构,使其数据尺寸由1×n重构为n×n。本文使用滑动重构的方法,其具体操作如图6所示。

图6 传感器数据重组

图中数字1~8 表示传感器编号。首先将发动机采集到的1 维数据拓充成2 维数据,然后对第n行数据左滑位。从图6 中可见,在数据重构之前,3 号传感器数据只与2 号和4 号传感器相邻,此时由于卷积神经网络受其局域感受野的限制,3 号传感器与距离较远的8 号传感器之间的相关特性将无法被有效提取。当使用如图5 所示的数据重新组合的方法后,3 号传感器在矩阵中的位置与其他所有传感器均相邻,此时可以通过卷积层提取3 号传感器与其他所有传感器之间的相关特性。

神经网路具体参数如图7 所示。从图中可见,传感器采集航空发动机的数据,经滑动重构后,输入至CNN 与 LSTM 神经网络架构中;CNN 与 LSTM 神经网络架构采用“离线训练、在线诊断”的工作方式,即离线训练好神经网络中各参数,这些参数在进行航空发动机剩余寿命预估时不再更新;CNN 与LSTM 神经网络架构最终的输出为航空发动机剩余寿命预估结果。

图7 神经网路具体参数

值得注意的是,图7 中卷积神经网络架构利用起始模组的思想,网络前半部有3个分支:中间分支由2个卷积层、2 个池化层组成,作用是提取输入信息特征;上分支由1 个卷积层组成,受Hebbian 原理的启发,其卷积核尺寸为1×1,该分支的作用是抑制相邻传感器之间的相互影响;下分支同样由1 个卷积层组成,其卷积核的尺寸与输入数据的尺寸相同,该分支的作用是从各传感器在当前时刻采集的数据中提取航空发动机当前时刻工作状态特征。

4 试验研究

4.1 神经网络训练过程

在 Ubuntu 18.0 系统中 Python3.6 / Tensorflow 1.10.0 仿真环境下搭建如图7 所示的神经网络构架,采用Adam 优化算法,步长设置为1×10-4,训练过程如图8所示。

图8 神经网络训练过程

从训练过程可见,通过使用传感器数据滑动重组、起始模组与SELU 激活函数的方法,可以显著提高航空发动机剩余寿命预估构架的预估准确性。其中传感器数据滑动重组对预估准确性影响最大,起始模组与SELU对预估准确性的影响不相上下。

在4 个测试集中发动机剩余寿命预测误差的分布如图9所示。

图9 预测误差范围分布

从图中可见,本文提出的基于CNN 与LSTM 的航空发动机剩余寿命预估架构经过训练后,可以准确地对发动机剩余寿命进行预估,具体的分析结果将在下一节中陈述。

4.2 航空发动机剩余寿命预估结果分析

对于NASA 的C-MAPSS 提供的涡扇发动机退化仿真数据集,目前有2 个常用的算法性能评估指标,即JScore和JRMSE[21-22],JScore为非对称指标,对剩余寿命高估的行为惩罚较大;JRMSE为对称指标,可以避免通过低估剩余寿命而使JScore指标数值过小的行为发生。JScore和JRMSE的具体计算方法为

式中:hi为第i个样本剩余寿命的预测值与实际值的差值;Rest,i为第i个样本剩余寿命的预测值;Ract,i为第i个样本剩余寿命的实际值。

JRMSE与JScore评估指标对比如图10 所示。综合使用JRMSE与JScore评估指标可以对算法性能进行评价。

图10 JRMSE与JScore评估指标对比

将本文提出的CNNLSTM 方法与多层感知机(Multi-Layer Perceptron,MLP)、支持向量机(Support Vector Machines,SVM)、相关向量回归(Relevance Vector Regression,RVR)、卷积神经网络 CNN[22]和卷积门控循环神经网络(CNN Gate Recurrent Unit,CNNGRU)[23]等方法进行对比,结果见表2、3。

表2 JRMSE指标对比

表3 JScore指标对比

从表中可见,本文提出的CNNLSTM 方法在JRMSE指标上优于其他大部分方法,且在JScore指标上优于其他所有方法。从仿真结果和指标对比可知,本文提出的方法可以在保证预测精度的前提下,对航空发动机剩余寿命进行较为保守的预估,在保证资源不被浪费的情况下,尽可能提前发出故障预警信号,从而提高飞行的安全性。

为了更直观地观察CNN 与LSTM 的方法对航空发动机剩余寿命的预估情况,在4 个数据集中分别随机取出1 组数据,并以该组数据前半部分数据点作为依据,对健康指数的趋势进行预估,剩余寿命预估结果如图11所示。

从图中可见,CNNLSTM 在航空发动机性能退化时对剩余寿命的预估结果与真实值较为接近,震荡较小,当失效阈值选取恰当时,可以较好地对航空发动机剩余寿命进行预估。

5 结论

本文提出了一种基于卷积神经网络与长短期记忆神经网络的航空发动机剩余寿命预估方法,并对其应用效果进行了验证,得到如下结论:

(1)该方法通过利用CNN 提取传感器数据中的特征,避免了传统算法中繁琐的手工提取数据特征的操作;同时利用LSTM 对CNN 提取出的特征进行了时序预测;在特征的时序预测基础上,该方法使用全连接层输出航空发动机剩余寿命。

(2)在NASA 的C-MAPSS 提供的涡扇发动机退化数据集上对该方法进行了验证,结果表明,采用该方法可以显著提高航空发动机剩余寿命预估的准确性,且该方法在JScore指标上的表现较前人的研究提升明显,可以在保证预测精度的前提下,对航空发动机剩余寿命进行较为保守的预估,在保证资源不被浪费的情况下,尽可能提前发出故障预警信号,从而提高飞行的安全性。

由于利用该方法对航空发动机剩余寿命进行预估时没有利用航空发动机退化模型,因此可以预计该方法在解决其他时序预测问题时也会有较好的表现。

猜你喜欢

卷积寿命预估
基于全卷积神经网络的猪背膘厚快速准确测定
基于图像处理与卷积神经网络的零件识别
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
仓鼠的寿命知多少
马烈光养生之悟 自静其心延寿命
恐龙的寿命有多长?
你的寿命自测