基于多源数据的液体火箭发动机智能异常检测
2022-07-07刘子俊陈景龙张志伟
刘子俊,冯 勇,陈景龙,王 珺,张志伟
(1.西安航天动力研究所,陕西 西安 710100;2.西安交通大学 制造与系统工程国家重点实验室,陕西 西安 710049)
0 引言
21世纪以来,世界各国对太空资源愈加重视,使得航天技术发展迅猛,该技术甚至在一定程度上代表了国家的军事、科技、经济等发展水平,近年来众多民营企业的涌现更是促进了航天领域的商业化发展。航天发射任务愈加频繁,各类航天事故的发生不可避免,促使人们对火箭系统及关键部件开展状态监测、异常检测、故障诊断等进行研究。发动机作为液体火箭的动力核心,对其进行异常检测方法的研究对于保证火箭系统运行的可靠性和安全性具有重要意义。
液体火箭发动机(liquid rocket engine, LRE)的异常检测是指对传感器测量的发动机运行数据进行特征提取后,做出二元决策,即判断该发动机工作是否发生异常。由于航天发动机结构复杂,且具有机械—流体—燃烧等过程耦合的特点,仅依靠单路传感器所测数据无法准确地判断发动机健康状态,因此常采用多传感器采集的多源数据进行LRE异常检测。
目前的液体火箭发动机异常检测方法大致可分为以下3种:基于模型驱动的方法、基于数据驱动的方法、基于人工智能的方法。其中,基于模型驱动的方法具有完备的理论,但该方法的分析结果依赖于建模的精确程度,而由于航天发动机系统的复杂性和工况的复杂性(高温、高压、强振动等),建立各种工况下的模型比较困难,限制了该方法在实际中的应用。基于数据驱动的方法主要是根据发动机的输出与故障之间的对应关系,通过主成分分析、小波分析、聚类方法等对测量信号进行分析处理,根据安全阈值判断发动机的健康状态或故障类型,但该方法对所获取的数据质量要求较高。
随着机器学习方法的发展与应用,具有自组织和自学习能力的人工神经网络以及深层神经网络被应用于航天发动机故障诊断和异常检测等领域中。聂侥利用过程神经网络对某大型氢氧火箭发动机的故障进行预测并实现部件级别的故障隔离,提高了火箭发动机异常检测效率。孙成志等提出了基于BP神经网络、证据理论和滚动时域估计算法的火箭发动机异常检测模型,以解决火箭动力系统故障的复杂特性带来的异常检测效率低的问题。彭军等利用深度置信网络对同样具有高温、高转速、大应力等恶劣工况的航空发动机进行异常检测,克服了浅层神经网络的不足,大大提高了检测精度。An等提出利用自动编码器(deep autoencoder, DAE)的重构损失来进行异常检测的方法。近年来,由Goodfellow等提出的生成对抗网络(generative adversarial networks, GAN)被广泛应用于图像分类、语音识别、故障诊断等领域中,由于GAN具有对数据的强大生成和鉴别能力,研究人员也将其应用于异常检测中。Sabokrou等将GAN与DAE结合,设计出具有端到端训练的异常检测模型(adversarially learned one-class classifier, ALOCC)。Schlegl等提出无监督训练的快速异常检测模型f-AnoGAN,有效提高了医学图像中的病灶检测效率。国内研究中,基于人工智能尤其是深度学习的火箭发动机异常检测方法研究较少。张克明等提出基于生成对抗网络的异常检测模型,无需标注数据,仅利用系统运作时的正常数据训练该模型,实现对航天异常事件的有效检测。但该方法未在真实航天数据上进行验证,且仅研究了基于单个传感器数据的异常检测,检测结果的不确定性较大。
鉴于液体火箭发动机异常检测方法的准确性和通用性需求,本文在仅有发动机健康数据可用的条件下对液体火箭发动机异常检测进行了深入研究,提出了基于深度学习的自编码式—生成对抗网络(autoencoding generative adversarial network, AEGAN)以融合多源信息,根据输入数据的重构损失和鉴别分数,通过无参数的核密度估计完成二元决策。实验结果表明,该方法能有效地实现液体火箭发动机的异常检测。
1 自编码式—生成对抗网络
本研究提出的AEGAN,结构上由3部分组成:编码器E、生成器G、鉴别器D。功能上,编码器—生成器(E-G)构成深度自编码器,生成器—鉴别器(G-D)构成相对生成对抗网络(relativistic generative adversarial network, RGAN)。
1.1 深度自编码器
(1)
反向传播中采用梯度下降法进行网络权值更新,其优化目标为
(2)
式中为求平均操作。
在实际的操作中,使DAE仅具备复制输入的功能是不够的,通过加入噪声以损坏输入,再由自编码器进行恢复。因此DAE不仅需要去除噪声损坏,还需要还原至最初的输入,迫使自编码器具有更强的特征提取能力。式(1)变为
(3)
式中~(0,01)为高斯噪声。
1.2 相对生成对抗网络
一般地,GAN由生成伪数据的生成器和鉴别数据真伪性的鉴别器组成,其优化目标为
(4)
式中~(0,1)为一维高斯噪声。通过提高鉴别器的“鉴伪”能力和生成器的“造假”能力,可以生成高质量的正常数据和低质量的异常数据,并通过鉴别器成功鉴别发动机的正常/异常状态。
相较于标准GAN而言,RGAN针对的不是增大鉴别器对真实数据的输出概率,而是增大真实数据相对于重构数据的真实程度,优化目标为
(5)
(6)
2 基于自编码式—生成对抗网络的LRE异常检测
本研究提出自编码式—生成对抗网络AEGAN进行液体火箭发动机的异常检测,如图1所示。
图1 AEGAN异常检测流程Fig.1 Flowchart of AEGAN anomaly detection
AEGAN异常检测具体实施步骤如下:
1)使用多个传感器采集LRE运行状态下的原始信号作为多源数据,以固定长度截取时间序列得到数据样本集,并对各样本进行预处理,将一维多通道数据转换为二维多通道图像;
2)将获取的图像样本分类标签化,划分样本数据为训练集和测试集;
3)构建相对生成对抗网络作为异常检测模型,使用步骤2)中的训练集进行RGAN和DAE的训练,最终得到3个对LRE健康状态具有良好识别能力的子网络;
4)使用步骤3)中训练的模型对步骤2)中的训练集样本进行状态评估,对得到的评估分数()进行核密度估计,计算LRE正常样本的分数阈值;
5)使用步骤3)中训练的模型对步骤2)中的测试集样本进行状态评估,对每个样本进行邻域信息聚合,根据步骤4)中的分数阈值进行异常检测。
2.1 数据预处理
首先,对每个传感器通道采集的每个时间序列样本∈进行归一化,得出
(7)
(8)
式中表示信号通道数目。某型LRE地面热试车数据加速度通道一维振动信号及预处理后的二维图像如图2所示。
图2 数据预处理Fig.2 Data preprocessing
2.2 核密度估计
因为训练集仅包含LRE健康状态数据,根据该部分数据重建LRE健康状态下的数据分布对于安全阈值的确定非常重要。核密度估计是一种用于估计给定样本概率密度分布的非参数方法,如果给定样本为=[,…,],则点=处的概率密度估计定义为
(9)
式中:=106()-02;表示高斯核函数。
2.3 异常检测
模型训练完成后,对训练集中所有正常样本(正样本)进行状态评估,评估分数由两部分组成,如图3所示,测量信号转换为多通道图像后,将其输入到E-G构成的自编码器中得到重构图像,与原图像对比得到重构损失;将其输入鉴别器中对其状态为正常进行估计,得到鉴别分数,则最后的检测分数为
图3 AEGAN异常检测模型Fig.3 AEGAN anomaly detection model
()=sigmoid[()]-{[()-]}+
(10)
式中为大于0的常数。
(11)
式中:为置信度;(·)表示标准正态分布(0, 1) 的上侧分位数。
为增强方法的检测准确率及其鲁棒性,在测试中聚合邻近信息得到最终检测分数为
(12)
3 实验验证
3.1 试车数据介绍
笔者验证实验所用数据来自于某型号的液体火箭发动机地面热试车数据,实验装置结构及原理如图4所示。其结构主要包括涡轮、氧泵、燃料泵、燃烧室、燃气发生器等。发动机氧化剂经过氧主泵加压后部分进入喷注器,其余进入发生器进行燃烧产生高温和富氧燃气,并在对主涡轮做功后经燃气导管到达喷注器的气喷嘴入口,最后由气喷嘴进入燃烧室;发动机燃料经过燃料一级泵增压后主要分为两路,其中大部分通过推力室冷却通道进入燃烧室,另一部分由燃料二级泵增压后进入燃气发生器和推力室燃料入口路。燃料由燃烧室头部喷注器混合雾化,形成细小液滴,被火焰加热气化并剧烈燃烧,产生高温高压燃气高速喷出,进而产生推力。
图4 某型液体火箭发动机原理图Fig.4 Schematic diagram of a LRE
热试车实验中,选取该发动机10个关键位置作为测点,采集的多通道信号主要包括推力室振动信号、燃气发生器振动信号、氧泵振动及氧化剂管路流体压力信号、燃料泵振动信号及燃料管路流体压力信号等。
在25.6 kHz的采样频率下获取LRE运行数据,以1 024数据点即0.04 s所采数据为一个单通道样本,以18个通道所测信号作为多源数据样本。验证实验中,选取该型号发动机健康状态下的1 500个正样本以及异常状态下的1 000个负样本,以500个正样本作为训练集训练异常检测模型,以1 000个正样本和负样本作为测试集测试模型。
3.2 性能评价指标介绍
用于液体火箭发动机异常检测结果及检测方法的性能指标主要有精确率、召回率、准确率、灵敏度、特异度、受试者工作特性曲线(receiver operating characteristic, ROC)及曲线下面积(area under curve, AUC)、F1—分数等。如表1所示的混淆矩阵,若以P、N表示样本的正负,以T、F分别表示预测的真假,则上述指标可解释如下。
表1 异常检测结果混淆矩阵Tab.1 Confusion matrix of anomaly detection results
1) 精确率与召回率。精确率描述的是预测为正的样本中实际为正的比例,即=/(+);召回率描述的是预测为正的样本占所有正样本的比例,即=/(+)。
2)准确率。准确率描述的是预测为正确的样本占所有样本数的比例,即(+)/(+++)。
3)灵敏度与特异度。灵敏度即为召回率,特异度描述所有真实的负样本中预测正确的比例,即/(+)。
4) ROC与AUC。以假正率(false positive rate, FPR)即1—特异度为横坐标,以真正率(true positive rate, TPR)即灵敏度为纵坐标,可绘制受试者工作特性曲线,曲线下面积反映检测模型的分类能力,面积越接近于1,性能越好。
5)F1—分数。精确流程与召回率相互制约,为综合评价二元分类结果,使用F1—分数同时考虑精确率与召回率,即2/(+)。
3.3 数据分析
笔者使用Python编程语言实现文中所提出的AEGAN异常检测模型,所用版本为Python 3.8,深度学习框架采用PyTorch 1.6.0,GPU加速训练使用容量为6 GB的GeForce GTX 1 660。
为验证检测模型的有效性及优越性,笔者选取与本文方法相关且具有代表性的3个异常智能检测模型——自编码器DAE、ALOCC、D作为对比方法,在相同训练和测试条件下进行LRE异常检测。其中,D表示使用RGAN的鉴别器进行异常检测。
某型液体火箭发动机异常检测结果见表2,本文所提出检测方法AEGAN能达到96.55%的准确率,尤其是对于1 000个异常事件(负样本)的检测率达到98.90%,模型的AUC值也达到0.991 5,表明在实际异常检测中,对于不同置信度下的检测结果,AEGAN的性能更好。
表2 某型液体火箭发动机异常检测结果Tab.2 Anomaly detection results of a LRE
为更加直观地描述异常检测结果,绘制检测结果分数的分布如图5所示,该图展示了模型对于异常与正常样本的区分情况,分布曲线越高、越窄,两个分布的中心距离越远,代表检测模型性能越好;绘制ROC曲线如图6所示,曲线下面积越大、曲线越靠近左上方,代表模型性能愈佳。
图5 某型液体火箭发动机异常检测结果分布图Fig.5 Distribution of a LRE anomaly detection results
图6 某型液体火箭发动机异常检测结果ROC曲线图Fig.6 ROC graph of anomaly detection results for a LRE
图5和图6所展示的结果分布与模型分类性能均能表明,相比于其他异常检测模型,AEGAN在LRE异常检测中更为有效。
为提升模型在实际异常检测中所获结果的可靠性、增加检测模型的鲁棒性,笔者提出融合检测时刻的前{1, 2, 3, 4}个样本的检测结果,综合判断该时刻的健康状态,如式(12)所示。选取时间上连续的1 000个正样本和1 000个负样本进行异常检测,结果见表3,可视化结果如图7所示。
表3 邻域信息聚合的某型液体火箭发动机异常检测结果Tab.3 Anomaly detection results of a LRE based on neighborhood information aggregation
图7 不同数量的邻域信息聚合后的异常检测结果Fig.7 Anomaly detection results after neighborhood information aggregation with different amounts
表3中模型的检测结果随着邻域信息的增加而向好。从图7中可以看到,聚合邻域信息使得模型对LRE健康状态的检测更加准确,在该实验中准确率最高可达100%,对于模型检测性能的提升效果显著。值得注意的是,离线时已经训练好的检测模型,在线测试时融合邻域信息只需要在决策级进行结果的融合,不会显著增加时间成本从而影响检测效率。
4 结语
本研究提出的自编码式-生成对抗网络,仅依靠正常数据进行训练,在特征级融合多源数据,根据输入数据的重构损失和鉴别分数,通过核密度估计确定阈值完成二元决策,实现对液体火箭发动机的智能异常检测。某型液体火箭发动机地面热试车数据分析结果表明,该方法能进行准确且可靠的LRE异常检测。
在下一阶段,本研究将继续完善该方法以提升训练稳定性和训练速度,并开展实验进一步验证其在工程应用中的适用性。