APP下载

基于XGBoost-DCNN的航空发动机剩余寿命预测*

2023-12-11刘国建邢苗英

舰船电子工程 2023年9期
关键词:寿命卷积神经网络

刘国建 杜 冬 邢苗英

(中国民用航空飞行学院 广汉 618300)

1 引言

航空发动机作为飞机的核心部件,内部结构复杂,对飞行安全性至关重要,安全是民航圈内始终不变的话题,即是第一位的也是最重要的,2020年国家“十四五”规划中也明确指出,未来五年要发展国家战略性新兴产业,推动互联网、大数据、人工智能与航空航天产业的深度融合。在故障预测部分,PHM 首先借助传感器采集关键零部件的运行状态数据,如振动信号、温度图像、电流电压信号、声音信号及油液分析等,提取设备的运行监测指标,进而实现对设备关键零部件运行状态的早期识别[1]。基于近年来的研究,剩余寿命预测方法可以分为两类,分别是基于物理模型的方法和基于数据驱动的方法[2]。基于数据驱动的方法是机器学习,其建模相对简单,通用性也较好,并且当通过仿真或者实际运行积累了大量的设备运行到失效的数据时,该方法能取得较理想的预测精度。

本文采用NASA 提供的CMAPSS 航空发动机数据集,采用相关系数法筛选与航空发动机剩余寿命强相关的传感器数据,再利用XGBoost 算法剔除异常数据,建立航空发动机剩余寿命模型数据集;最后,将数据Z-Score 标准化构建时间序列数据作为DCNN 模型输入构建航空发动机剩余寿命预测模型。

2 时间窗口

本文通过添加时间窗口[4]将训练集和测试样本集数据重构,先对训练集测试集中的特征值进行Z-score 标准化,然后XGBoost 异常值剔除,重构二维数据,利用卷积(conv2d)进行预测。本文FD001、FD003 时间窗口长度设置的为30,FD002、FD004 时间窗口长度设置的为20。数据集Z-Score标准化公式可表示为

式中,X'为传感器标准化后的值;Xi为传感器值;Xstds为传感器标准差。

3 XGBoost异常检测

3.1 XGBoost算法

XGBoost 算法由华盛顿大学陈天奇[5]在2016年率先提出的基于集成学习高效并行的机器学习算法,通过增强梯度,从而提升性能。由于单个回归树的准确性不足,以及有限使用场景的应用背景,XGBoost 是在分类回归树算法的基础上对提升树算法的改进。XGBoost的树模型可以表示为

迭代前XGBoost的目标函数为

目标函数有两部分组成:l为损失函数,真实值与预测值的残差;Ω为正则化项,防止过拟合。

它的基本思想是引入二阶泰勒展开式,最小化目标函数,即损失函数,它的算法策略是贪心算法,利用函数的一阶导数信息和二阶导数信息来训练树模型,XGBoost 主要优势是将正则项加入到模型训练复杂度中,保证迭代过程中对模型复杂度进行对冲,提高学习到的模型泛化能力,同时提高了模型计算效率[6]。

3.2 XGBoost异常检测模型建立

使用XGBoost异常检测流程如图1所示。

4 DCNN预测模型

深度卷积神经网络通过多层感知机的非线性变换,能够拟合非线性的复杂映射关系[8]。本文采用的深度卷积神经网络有四个部分,通过卷积层替换卷积神经网络中的池化层,避免信息的过多丢失,多层卷积部分(conv2d)、辍学层(Dropout)、平滑层(Flatten)和全连接层(Dense)部分,通过四层卷积层提取输入数据特征,再通过小的滤波器和(3,1)的小卷积层降低模型复杂度和提取细微特征,在卷积过程中加入辍学层,避免模型过拟合,再通过平滑层将多维数据转化为一维数据形式,再使用全连接层调节模型,深度卷积神经网络结构如图2所示。

图2 DCNN神经网络

先预处理原始数据集,构建时间序列二维数据,将训练集中数据基于XGBoost 模型将异常值剔除,将训练集数据带入DCNN 模型进行训练,将测试集带入DCNN 模型得到预测结果,XGBoost-DCNN网络预测模型整体流程如图3所示。

图3 XGBoost-DCNN流程图

5 实验研究与结果讨论

5.1 数据集介绍

本文选取NASA 商用模块化航空推进系统仿真(C-MAPSS)软件生成的数据集作为示例数据集,对当前的RUL 方法和面临的挑战进行研究。该数据共有4 个数据集,每个数据集分为训练集与测试集,每个数据集运行工况也不同,每个数据集具体信息包括:发动机编号、运行时间、有三个操作设置以及21个传感器信号,将其标号为是S1~S21,数据集是由709组发动机训练数据与707组发动机测试数据构成的多维时间序列,目的是预测发动机的剩余寿命。每个发动机都以随机的健康状态启动,在一段时间后开始退化,因此发动机的寿命不同,发动机会受制造变化的影响,因此同一工况下的发动机之间表现也会表现出略微不同的特性,每台发动机都被认为在每个时间段内是正常工作,并在时间段里的某个节点突然发生故障。表1 展示了发动机传感器名称。

表1 21个传感器名称

5.2 数据预处理

本文通过相关系数选了S2,S3,S4,S6,S7,S8,S9,S11,S12,S13,S14,S15,S17,S20,S21。

剩余寿命标签值对结果有影响,由于发动机前期运行,各部件运行情况良好,这个阶段性能退化可以不考虑,所以将剩余寿命阈值设置为125。当其大于或等于临界值时,RUL 为常数值;当小于阈值时,RUL 随周期线性减小,线性退化模式如图4所示。

将训练集带入XGBoost 异常值模型,剔除异常数据。图5是FD004异常数据分类图。

5.3 评分指标

本文采用目前航空发动机剩余寿命最常用的两个性能指标均方误差(RMSE)和评分函数(Score)[9]。指标均方根误差公式如下:

式中,d 为航空发动机剩余预测值与真实值误差;n为测试集发动机总数。评分函数公式如下:

两个评分指标关系的图像如图6所示。

图6 评分指标

5.4 预测结果

XGBoost-DCNN 模型是在R7-5800,16-GB RAM,nvidia RTX3070 8G GPU 环境下搭建的结构,对测试集的RUL结果如图7所示。

图7 航空发动机剩余寿命预测结果

测试集FD001 与FD003 寿命预测曲线与真实曲线基本吻合,FD002 和FD004 寿命预测曲线与真实曲线吻合度差。

从测试集FD001、FD002、FD003 和FD004 中分别随机取34、41、3和12号发动机测试样本,得到的剩余寿命预测退化曲线如图8所示。

图8 发动机测试样本退化曲线图

预测曲线表明,在误差允许范围内,采用分段线性退化模型是合理的,FD002 和FD004 的线性拟合度较差,多故障和多操作模式下剩余寿命预测规律较难掌握。

5.5 同其他方法对比

目前剩余寿命预测方法使用C-MAPSS数据验证模型效果,验证数据集的有效性。将本文方法与剩余寿命预测一些方法进行比较,验证模型的有效性,神经网络模型具有一定随机性,本文采用Score和RMSE多次实验的平均值。表2是不同算法对比。

表2 不同算法对比

由表2 可以看出同其他方法相比,本文方法整体获得的效果不错。本文提出的DCNN 网络与文献[4]改进神经网络相比,Socre 和RMSE 都有很大的提升,证明了卷积层代替池化层,更能有效地避免数据特征信息的丢失。

由于FD001、FD003 数据集是在一种操作模式下的采集数据,异常值少,XGBoost 异常值剔除数据对整体数据影响不大,对精度提升不大,甚至在FD003 数据集中异常值剔除后,Score 得分下降,但均方根误差值得到了有效提升,从测试集整体的预测结果来看FD002、FD004 的预测效果不佳,远不如FD001、FD003 数据集的预测效果,这是由于FD002、FD004 数据集是在多种操作下采集到的数据,受工作环境的变化影响,传感器采集到的数据里面加入了环境干扰噪声,从而使得预测效果差,而且相比于单一的DCNN,XGBoost 异常值剔除效果明显,XGBoost-CNN 模型在多故障多操作环境下预测效果更好。此外多种故障模式之间紧密耦合,相比一种故障模式下的FD001、FD002 的预测结果,在两种故障模式下的FD003、FD004 的预测结果效果相对较差。由于航空发动机运行环境复杂,在多种操作模式变化与多种失效故障模式下产生的数据,数据失效规律难以掌握;而单一运行条件数据规律容易挖掘,XGBoost-DCNN 模型预测结果与实际相符。

6 结语

1)本文提出了一种XGBoost-DCNN 混合模型,在加入时间维度的数据集基于3sigma 原理的XGBoost 模型将小概率发生数据视为异常数据,防止过拟合,通过对比DCNN 单一神经网络,在多故障和多操作环境下,XGBoost-DCNN 模型对数据精度贡献很大。

2)本文搭建的DCNN 模型,通过卷积层代替卷积神经网络中的池化层,避免信息过多损失,在时间维度上对各维度特征参数进行了深度卷积运算,通过算法对比,验证了XGBoost-DCNN模型有效性。

3)本文预测方法的预测结果与RF、GB、LSTM、CNN 以及其他CNN 组合预测模型进行对比,本文提出的XGBoost-DCNN 模型总体的均方根误差与得分皆优于其他几种模型。

猜你喜欢

寿命卷积神经网络
人类寿命极限应在120~150岁之间
基于3D-Winograd的快速卷积算法设计及FPGA实现
仓鼠的寿命知多少
神经网络抑制无线通信干扰探究
从滤波器理解卷积
马烈光养生之悟 自静其心延寿命
基于傅里叶域卷积表示的目标跟踪算法
人类正常寿命为175岁
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用