APP下载

液体火箭发动机健康监控技术研究进展

2024-03-14杨述明谢昌霖程玉强宋立军

火箭推进 2024年1期
关键词:故障诊断发动机监控

杨述明,谢昌霖,程玉强,宋立军

(国防科技大学 空天科学学院,湖南 长沙 410073)

0 引言

液体火箭发动机(Liquid Rocket Engine,LRE)作为进入空间至关重要的航天动力装置,是衡量一个国家科技水平和综合国力的重要标志,其成功发射与安全运行不仅具有巨大的经济和军事意义,更具有极其重要的政治和社会影响。当前,500 tf液氧/煤油火箭发动机整机试车宣告圆满成功[1],标志着我国航天液体动力技术又迈上了新的台阶,同时也为火箭发射的安全与可靠性带来了新的挑战。新一代大推力液体火箭发动机不仅动力更强,结构更复杂,工作条件也更加极端,一旦发生事故,往往造成严重的经济损失与人员伤亡[2]。

为有效降低发动机故障带来的危害,在20世纪90年代初,部分高校和科研院所便开展了关于液体火箭发动机健康监控技术的系统研究,其主要技术内涵包括故障检测与诊断(Fault Detection and Diagnosis,FDD)、容错控制、健康监控系统研制等内容[3]。故障检测指异常检测,通过测量或回放的信号进行二元决策,以判断发动机是否处于异常状态。故障诊断包括故障定位与故障辨识,即利用已掌握的故障信息来确定故障部位、故障类型和故障程度。容错控制则是根据故障诊断结果,采取调整发动机参数、紧急关机等措施来降低损失,避免严重事故。

事实上,发展健康监控技术的最终目的是为了研制可以工程化应用的健康监控系统,通常来说,LRE健康监控系统的发展可分为3个阶段[4],即从单一故障检测到多元融合决策再到集成智能化的过程。近年来,人工智能与机器学习等领域取得了众多突破性进展,以深度卷积神经网络[5]、生成对抗网络[6]为代表的智能故障诊断技术正在为LRE的发展提供新的思路与技术手段。

本文综述了LRE的FDD技术、容错控制技术、健康监控系统研制的研究现状与发展趋势;分析了可测性建模、数字孪生和可解释性人工智能应用到LRE健康监控的技术路线,以为该领域未来发展提供参考。

1 故障检测与诊断技术研究现状

目前关于FDD的分类方法很多,但从文献调研来看,存在以下几点共识[7-8]。

1)基于模型的方法常被划作单独分类。

2)专家系统和机器学习属于人工智能领域,其中机器学习是数据驱动的。

基于此,将FDD方法分为基于模型、基于知识和数据驱动3大类,如图1所示。

从图1中可以看出,机器学习是数据驱动的,专家系统主要基于领域专家的经验和知识进行故障诊断,是早期人工智能的典型应用。当然,实际工程中为了达到更好的FDD效果,学者们提出了很多组合方法,本文对此不再赘述。

1.1 基于模型的方法

模型驱动的方法可以依据发动机运行内部规律建立模型和系统观测参数之间的解析关系,比较观测值与实际测量值的差异来实现FDD[9]。图2为基于模型驱动的故障诊断基本过程。

图2 基于模型驱动的故障诊断基本过程Fig.2 Basic process of model-driven fault diagnosis

1.1.1 基于解析模型的方法

基于解析模型的方法的核心思想是用解析冗余取代硬件冗余,利用系统数学模型实现故障辨识,分为基于静态模型与基于动态模型的方法。在静态模型中,NASA Lewis研究中心利用功率平衡方程进行多工况下主阀与传感器的故障检测与隔离[10];马歇尔航天中心利用静态模型实时更新红线阈值带的方法实现了发动机异常检测[11];Cha等基于航天主发动机静态特性模型,采用多元线性回归算法进行故障检测与诊断[12]。可以看出,使用静态模型主要是为了得到发动机静态特性,以便用于发动机结构设计与参数调整,故该方法适用于发动机的稳态阶段。

在动态模型中,通过对比预测输出与实际输出的残差来实现发动机故障检测,如基于状态观测器的方法[13]、基于参数辨识的方法等[14]。随着控制理论认识的深入,也有学者设计高阶状态观测器进行发动机故障诊断。如文献[15]利用非线性卡尔曼滤波器,采用多模型方法进行LRE故障检测与诊断;文献[16]设计了一组全阶未知输入观测器来检测、分离和估计传感器参数,用于检测和诊断非线性系统的故障。高阶状态观测器势必会增加系统复杂度,虽然基于奉献观测器思想[17]的方法可以取得较好的故障隔离效果,但面对未知故障时,实时性与准确性难以满足检测需求。基于模型的方法与其他方法相结合也是FDD技术的发展方向,如专家系统[18]、神经网络技术[19]、聚类分析[20]等。

1.1.2 基于定性模型的方法

基于定性模型的方法可分为因果图法、故障树法和定性物理法,根据系统元件间的连接关系或参数间依赖关系的建立诊断系统结构、功能与行为的模型;以定性推理的手段推导发动机预期行为,并与系统实际行为进行比较;搜索求解异常征兆出现的故障源,以此确定故障产生的部件。

基于定性模型的方法可以从更宏观的角度解释系统行为,但纯定性推理会产生大量虚假解,导致故障检测的可信度不高。为此,定性模型与定量知识结合的故障诊断方法成为一种有效手段,主要包括两方面:①测量信息中引入定量方法,即测量信息在定量值转化为定性值的过程中,通过小波分析、主元分析等定量分析确定转化状态的临界值;②系统模型支路定量化方法,即将支路间的传递关系、时间信息等定量知识集成到定性模型中,如晏政通过引入组件参数间的定量约束关系,建立集成定量信息的航天器动态符号有向图模型,可以确定唯一故障源,有效提高了故障检测可信度[21]。

然而,如何建立精确的系统模型一直是该方法面临的重难点问题,同时考虑到大多数LRE物理模型都是对象相关的,不同发动机型号间的检测适应性和泛化能力较差,尤其是对于新型大推力液体火箭发动机来说,工作环境更极致,部件耦合更紧密,工况变化更复杂。当前,LRE建模分析仍然是健康监控领域不可或缺的技术手段,主要原因如下。

1)发动机故障样本稀少,进行大量试验受到人力、物力、财力的限制;开展故障仿真研究不仅经济方便,也能获得丰富的故障样本。

2)基于模型的方法理论完备,故障和故障模式可以追溯到物理意义上的信息,且能检测未知故障,易于得到发动机故障的机理性、因果性解释,有利于发动机后期的维修决策。

1.2 基于知识的方法

基于知识的故障诊断主要指专家系统,该类方法不依赖于发动机数学模型,利用专家的经验和发动机知识,通过推理的形式实现LRE的FDD,具有较好的故障解释能力。发动机诊断专家系统由知识库、全局数据库、推理机、解释子系统、知识获取子系统和人机接口等组成,如图3所示。

图3 发动机诊断专家系统组成Fig.3 Composition of engine diagnosis expert system

早期的诊断专家系统如SSME数据分析专家系统[22]、融合多信息的Titan系统[23]、氧化剂涡轮泵泄漏诊断系统[24]等,此类专家系统表达方式较为直观,在应对复杂系统获取知识规则方面存在一定难度。也有学者将优化算法融入推理机制,从而获得更好的自主性与学习性。如Xie等采用粒子群算法调整模型参数,通过模糊推理形成专家知识库,建立故障预测与健康管理系统[25];李恺钦利用遗传算法提取发动机故障特征,通过知识库对比推理,以提高故障诊断精准度[26]。

知识库的获取困难、更新与自主学习能力不够是限制诊断专家系统发展的主要因素。如何利用AI智能技术解决知识获取不足的问题,建立高效的学习推理与诊断模型是这类方法未来发展的方向。

1.3 数据驱动的方法

数据驱动的方法根据系统正常状态与故障的对应关系,对发动机的测量数据进行分析处理,得到相关故障信息。从数据分析方法来看,包括统计分析、主成分分析、独立分量分析、小波分析等方法;从数据类型来看,包括压力、流量、转速等缓变信号和机械振动、流体压力脉动等速变信号。

1.3.1 基于信号处理的方法

1.3.1.1 缓变信号的处理方法

缓变信号在时序变化上存在连续性,仅在发动机启动、变工况、关机等阶段才会出现明显的数据波动,因此检测阈值设定至关重要。红线关机算法是应用较早的故障检测方法,主要通过确定压力、流量、转速等参数的上下阈值来实现发动机的异常检测[27]。我国LRE试车台也普遍使用红线关机算法,为提升算法的性能,国内外学者对其进行了改进。如NASA针对航天发动机提出的加权红线算法[28];朱恒伟等提出自适应阈值算法(Adaptive Threshold Algorithm,ATA),可以实现多工况的故障检测,并通过历史试车数据进行验证[29];李艳军利用改进的自适应阈值算法实时更新阈值带,进一步提高了故障检测性能[30]。此外,以自适应相关算法(Adaptive Correlation Algorithm,ACA)、主成分分析、独立分量分析为代表的多元统计方法也是较为常见的检测与诊断方法,如Feng等采用主成分分析(Principal Component Analysis,PCA)与自组织映射相结合的方法进行故障诊断,利用PCA对缓变信号进行降维去噪,再通过自组织映射训练处理后的数据[31],结果表明由PCA处理后的数据可以有效提高故障辨识率。高鸣等通过小波去噪与独立分量法处理试车压力信号,有效提高了数据的信噪比,为LRE的FDD提供可靠信息源[32]。

1.3.1.2 速变信号的处理方法

速变信号具有非平稳与瞬态性的特点,必须先对数据进行预处理,一般采取时频分析、小波分析等方法进行线性变换,提取数据的隐含特征。针对涡轮泵振动信号的数据处理,Hu等利用均方根值、峭度因子、峰值因子等统计特征和自适应高斯阈值模型,在线监测涡轮泵振动信号[33];Aiswarya等以快速傅里叶变换在线处理振动信号,提取均方根值等时域特征构建特征向量,并结合支持向量机进行涡轮泵故障诊断[34];杨懿等通过对本征模态函数进行Hilbert变换,得到振动信号能量分布频谱图,实现LRE涡轮泵故障的精准定位[35]。针对推力室燃烧故障,杨懿等又利用傅里叶变换和小波包分解分析推力室脉动压力,基于信号在频域吻合特征判断推力室是否产生不稳定燃烧[36]。

1.3.1.3 多源信号融合的处理方法

目前针对LRE不同信号类型的数据处理方法大多较为独立,各类信息缺乏交互,很难真实有效地表征发动机系统健康状态。为解决此问题,一些学者提出了基于多物理特性、变化速率及采样频率的多源信号融合处理方法,利用先进测量装置将声、光、电等信号进行融合处理,可以更准确地反映系统健康状态,提高故障诊断精度,具有广泛应用前景。如王建波等将点式和红外传感器采集的图像以像素级、特征级、决策级融合的方式建立发动机泄漏故障信息模型[37];Zhang等设计了红外传感器与放电传感器结合的模糊诊断模型,发展了包含传感器信任函数与最大模型值的信息融合算法[38];Liu等融合加速度传感器、电涡流传感器、激光测振仪和声矢量传感等信息,利用改进DS证据理论进行LRE涡轮泵转子-轴承故障诊断,得到了更准确的诊断结果[39]。陈禛怡等以速变信号的频率作为细节特征,缓变信号与速变信号时域指标作为整体特征,通过构造动态时间跟踪函数实现发动机多源信号特征级融合[40]。信号融合处理涉及来自多个不同来源的完整或部分信息,从而构建有关系统的全面和特定信息,实现更好的故障检测与诊断效果,图4为典型的多源信号融合处理策略。

图4 多源信号融合处理策略Fig.4 Multi-source signal fusion processing strategy

基于数据驱动的方法的实时性较好,其中以统计分析为代表的缓变信号数据处理方法和以时频分析为代表的速变信号数据处理方法均在LRE健康监控领域取得了成功应用。然而,由于该方法尚缺乏足够的故障样本数据,大部分只能用于LRE故障检测阶段,要实现故障模式辨识还需与基于人工智能的方法相结合。

1.3.2 基于传统机器学习的方法

基于常规机器学习的方法主要在特征提取/选择和故障检测与诊断方面体现智能特性,通常包括数据获取、数据预处理、特征提取、特征选择和模型训练等步骤,如图5所示。

图5 基于传统机器学习方法的LRE故障诊断步骤Fig.5 LRE fault diagnosis steps based on traditional machine learning methods

1.3.2.1 人工神经网络

基于ANN的方法应用比较广泛,其中针对LRE的故障诊断主要表现为以下方面。

1)基于无监督学习的故障检测是一种不需要系统结构知识,仅靠监测信息就能完成发动机故障检测的方法。如Wheeler等利用SSME的传感器参数,建立了基于径向基函数(Radial Basic Function,RBF)神经网络故障检测模型[41]。考虑到人工神经网络在权重选择与阈值确定方面的不足,部分学者将此类模型进行了优化,以提高故障检测的实时性与准确性,如Xu等提出的改进遗传-神经网络算法[42],Singh等建立的贝叶斯神经网络模型[43]。

2)残差生成与评估即通过测量信号与神经网络估计信号进行比较,生成残差以评估发动机状态。黄敏超等基于建立的动态神经网络辨识系统,并结合传感器测量信息形成残差,实现LRE故障监测与分离[44]。

3)故障识别与分类利用神经网络自学习的特点,建立发动机故障模式与特征参数间的对应关系,从而实现发动机故障分离。如Whitehead等将SSME传感器数据到故障的关系分解成3个更简单的映射,实现对已训练故障的识别,并能检测未训练的故障[45];孙成志等综合神经网络与DS证据理论,建立LRE神经网络故障诊断模型,实现发动机推力下降与卡死故障的辨识[46]。

1.3.2.2 聚类分析

聚类分析是一种无监督分类算法,将数据分成多个类或簇,每一类具有相似的内容和特征,而不同类之间的差异比较大。聚类分析可以有效生成数据分类模型,如Schwabacher等介绍了归纳监控系统(Inductive Monitoring System,IMS)中基于聚类的数据挖掘技术,通过训练学习试车数据,再以最近聚类的距离作为异常判定标准,实现LRE故障的更快检测[47]。

1.3.2.3 支持向量机

SVM作为有监督学习的分类方法,在应对非线性复杂系统、高维模式识别问题中有一定优势。目前应用较多的是将特征提取后的数据输入SVM进行故障诊断,如王仲生等利用随机共振原理放大转子系统早期故障特征,经小波包多分辨率分析后,将其作为SVM输入实现故障辨识[48];Aiswarya等提取涡轮泵旋转部件的标准差、均方根等时域特征,通过SVM分类器完成故障诊断[34]。

其他传统机器学习方法还有RVM、随机森林、决策树等。传统机器学习方法主要以感知智能学习机制为主,针对发动机特定故障模型,采用分类、聚类等形式进行故障诊断,缺乏与外部环境的反馈交互,难以实现发动机故障的自主决策与规划。另外,该方法在很大程度上依赖于特征提取的质量,只有当提取的特征可以较好地表示故障特征时,基于传统机器学习模型才能与LRE健康状态间建立良好的映射关系。然而,随着发动机结构复杂化、监测数据庞大化,基于浅层结构式的学习模式无法获取高维的数据特征,很难建立发动机输入-输出间的复杂非线性关系。

1.3.3 基于深度学习的方法

自2006年深度学习(Deep Learning,DL)的概念提出以来,便得到学者们广泛探讨与研究,并取得了许多代表性的成果[49]。故障诊断领域的深度学习方法包括自编码、受限玻尔兹曼机、循环神经网络与卷积神经网络等方法,本文重点介绍CNN(Convolutional Neural Network,CNN)与生成对抗网络(Generative Adversarial Network,GAN)在LRE故障检测与诊断领域的应用与发展。

1.3.3.1 基于卷积神经网络的方法

CNN是DL中应用最多的方法之一,结构组成包括卷积层、池化层和全连接层。基于CNN的FDD方法步骤为:将处理后的数据输入CNN模型,通过交替分布的卷积层与池化层逐级提取数据特征并学习,再经全连接层完成特征的融合、降维,最终实现故障识别与分类,如图6所示。该方法在故障特征提取、检测与分类方面具有一定优势,Zhu等基于CNN方法提取并识别超燃冲压发动机燃烧数据,结果表明CNN的辨识准确率要高于传统机器学习方法[50]。

图6 基于CNN故障检测与诊断方法Fig.6 FDD method based on CNN

CNN的模型结构一直在优化改进中,近年来,也有学者融合更多方法拓展了故障诊断的思路。如Zhu等结合卷积自编码器与单类SVM,实现了LRE故障的异常检测与诊断[51];Park等利用长短期记忆网络(Long Short-Term Memory,LSTM)训练LRE启动数据,再结合CNN完成故障诊断[52]。李泽东等针对发动机轴承故障提出注意力增强CNN方法,通过将注意力机制融入卷积层,以增强全局信息的提取,提高诊断精度[53]。

1.3.3.2 基于生成对抗网络的方法

GAN具有强大的生成能力,不依赖于任何先验假设,可以用来实现数据增强和数据集扩展,以弥补故障数据样本不足的缺点。GAN应用于LRE的FDD中有着明显的优势,图7为基于WGAN-MLP(Wasserstein GAN-multilayer Perceptron)的故障诊断流程。其中,GAN由生成器和判别器两部分组成,训练过程如下:向生成器输入随机样本,输出生成样本,向判别器输入生成样本和真实样本,输出判别结果,计算误差,更新生成器与判别器的网络权值。两者交替进行,达到设定训练轮数或一定条件时,训练完成。计算结果表明,WGAN可以有效生成故障样本,并能检测出未知故障[54]。

图7 基于WGAN-MLP故障诊断流程Fig.7 WGAN-MLP fault diagnosis process

为提高训练稳定性与样本多样性,研究人员对GAN结构做了进一步优化改进,如Liang等利用小波变换将一维振动信号转为二维时频图像,输入半监督对抗学习模型,实现了齿轮箱单故障诊断和多故障的同时诊断[55];袁烨等结合门控循环单元(Gate Recurrent Unit,GRU)的预测能力,提出基于特征注意力机制的GAN-GRU融合模型,有效解决了数据训练不充分的问题[56];张晟斐等利用CNN对缺失数据进行填充,基于非参数检验思想优化GAN训练环境,提升了设备寿命预测的鲁棒性[57]。

基于深度学习的方法以认知智能为主,在FDD过程中加入外部环境的反馈交互,并能在交互过程中不断学习,实现特定任务推理、决策和规划。基于深度学习的方法为LRE故障诊断增添了新动力,但也存在几个主要问题。

1)黑箱问题。LRE的安全性要求极高,考虑到该方法训练过程与训练结果存在不可解释性,目前很难得到有效应用。

2)数据问题。基于监督式或半监督式的深度网络方法需要大量标签数据的支撑,然而LRE故障数据样本稀少。

当前,LRE的FDD方法仍处于对已知故障的诊断、未知故障的异常检测阶段,且不同层次领域、不同方法的“集成式”“融合式”FDD已经成为必然趋势。

2 容错控制技术研究现状

容错控制(Fault Tolerant Control,FTC)技术能有效补偿故障损失,维持系统稳定,是一种可以提高可靠性的技术。从实现技术手段视角,FTC可以粗略地划分成任务重构和姿态重构。对于任务重构问题,He等提出了基于深度神经网络的自适应分配方法,用于推力下降故障下任务重构[58];Wei等基于加速Landweber迭代和重分配机制提出了一种新颖任务重构方法用于某型可重复适应运载火箭[59];Song等研究了典型推进系统故障下运载火箭升空自主任务重构技术[60]。在姿态重构方面,Li等基于故障检测与诊断方法,通过重构控制命令来保持系统稳定性[61];程堂明等基于力矩补偿思想实现多故障模式下的姿态重构[62]。从技术发展历程视角,LRE容错控制技术的发展可以分为3个阶段。

1)早期的FTC基于硬件冗余,根据故障检测结果,以切换硬件冗余的方式调整发动机工作状态,控制决策包括报警、启动硬件备份、紧急关机等。虽然硬件冗余结构原理简单,但太多的冗余大大增加了系统复杂性,影响研究人员的判断。

2)20世纪80年代基于解析冗余的FTC技术逐渐发展起来,一般是采取主动容错控制的方式,通过比较观测器输出得到故障信息。如Shen等基于多模型方法设计无迹卡尔曼滤波器对姿态控制系统进行精确估计,并结合PD控制器实现主动容错控制[63];Gao等利用故障观测信息,结合反步法与自适应技术设计主动容错控制器[64];Tang等构造了自适应故障观测器,并在此基础上设计滑膜容错控制器,有效提高了火箭姿态跟踪精度[65]。然而,基于解析冗余的方法过于依赖模型的精度且箭上算力有限,如何合理利用箭上资源且能保证诊断信息准确可靠是目前需要解决的问题。

3)21世纪初基于解析冗余的FTC技术发展趋于成熟并向智能化发展。一部分学者将神经网络、深度学习等技术用于获取故障信息、设计智能控制器等方面,如朱海洋等利用神经网络在线辨识模型分析故障参数与干扰项,基于自适应容错控制器实现火箭推力下降等故障的补偿[66];梁小辉等提出了一种智能容错控制策略,通过自适应动态规划的在线学习功能,保证火箭姿态的跟踪精度[67];Cao等通过设计自适应学习观测器,基于反推控制器实现了航天器姿态的有效跟踪[68]。

主动容错控制技术具有一定的自主性,通过FDD模块提供故障信息,充分利用解析冗余,能够合理借助系统软硬件的优势保证系统发生已知或未知故障下的稳定性,实现了较为理想的工程应用。2012年猎鹰9火箭在首次国际空间站任务中便是利用故障诊断与在线重规划技术顺利完成了一台发动机推力故障下的发射任务;德尔塔四号运载火箭在发生故障导致箭体推力下降时,也通过控制系统完成推力补偿,实现火箭的平稳飞行。

中国新一代运载火箭CZ-5也使用了发动机控制力动态分配技术,成功实现了助推发动机关机时的姿态稳定控制[69]。以发动机执行机构故障为例,图8为典型故障下的火箭容错控制技术路线图。其中控制输入u为执行机构摆角大小,测量信号y为火箭实际姿态角大小。

图8 典型故障下的运载火箭容错控制技术路线图Fig.8 FTC technology roadmap of launch vehicle under typical faults

对于第i个执行机构故障,其真实摆角可表示为

(1)

通过控制分配律将发动机摆角重新分配,使重新分配后的控制力矩与期望产生的控制力矩相等,实现运载故障下的容错控制,其数学表达式为[70]

M=Bu

(2)

式中:M为期望力矩;B为控制分配矩阵。

当发动机执行机构发生故障时,采用基于多模型的方法隔离出第i个执行机构的故障特征[62],并将该故障信息导入火箭姿态控制系统中。此时,考虑执行机构故障时的控制分配矩阵为

(3)

式中:Bi为与第i个执行机构对应的控制分配矩阵的列向量;Bremain、uremain分别为控制分配矩阵的剩余列、执行机构的剩余行。由此,反解出第i个执行机构故障发生时,经控制分配律重新分配后的剩余摆角大小,即

u′=(B*)-1M

(4)

基于上述方法,实现了发动机执行机构故障下的火箭容错控制。

目前,针对LRE的FTC研究目前还处于“+智能”的阶段,即人工智能已运用到控制系统,但工程应用的案例较少。随着FDD的发展,智能方法与控制技术深度融合的“智能+”有望给健康监控技术带来新的突破[71]。

3 LRE健康监控系统发展应用

健康监控系统的发展一般可分为3个阶段:简单健康监控系统、集成健康监控系统与先进健康管理系统[72]。简单健康监控系统使用的方法较为单一,功能简单,很难检测到发动机早期故障与缓变故障,诊断结果缺乏可靠性。如早期的红线关机系统、SSME数据分析专家系统等。

20世纪90年代后,随着FDD方法的发展,研究人员开始将多个算法集成到健康监控系统中,发挥不同算法的优势,以提高故障覆盖率与鲁棒性等。如美国联合技术研究中心研制的健康管理系统,融合了时间序列分析、聚类分析等算法,可以用于全工况异常检测,同时提高了对传感器失效的鲁棒性。国防科技大学研制的LRE故障监控系统(如图9所示),集成红线算法、ATA算法、ACA算法、RBF算法等多种方法,以红线关机算法作为系统报警的底线,融合其他算法进行并行决策。该系统经过多次试车搭载试验,在实时性、准确性、故障覆盖率等方面均满足工程需求。

图9 LRE故障监控系统Fig.9 LRE fault monitoring system

典型的先进健康管理系统例如波音公司与NASA联合研制的先进管理系统,其特点是先进传感器测量与诊断技术的集成。该系统由先进实时振动监控、光学羽流异常检测和线性发动机模型3个子系统组成,提升了航天器发射与升空的安全性。然而,由于故障样本不充分、故障特征不完备、模型系数不确定等问题,该系统仍然缺乏对发动机重要故障模式的辨识与定位能力。此外,还包括智能控制系统[73]、综合健康管理系统等[74]。

随着智能化的发展需求,目前的LRE健康管理系统涵盖了实时状态监测、故障诊断、寿命评估、故障控制等多个功能。图10为发动机健康管理系统功能原理图,分为机载和地面部分。机载部分利用优化选取后的传感器测量参数进行实时状态监测,考虑箭上算力有限,仍以红线关机算法、自适应阈值算法为主,实现发动机在线异常检测。同时,通过控制器采取调节控制律、紧急关机等措施降低故障影响。地面部分可以完成不同环节的诊断分析,对比发动机正常状态进行试后偏差分析,得到各部件性能趋势;建立故障损伤模型,完成故障预测和关键部件寿命评估;基于维修手册与专家经验,形成发动机故障处置库,最终实现LRE健康管理报告。

图10 LRE健康管理系统功能原理图Fig.10 Functional schematic diagram of LRE health management system

研究FDD方法的最终目的是在LRE健康监控系统中能实际应用。然而,目前研究工作仅处于利用理论知识、策略与算法,结合具体发动机型号进行数值仿真和试车数据验证的阶段,研制用于发动机地面试验与机上运行的故障检测与诊断系统很少。并且由于LRE对故障检测与诊断在高效、可靠、安全方面要求极高,在发动机试验和运行中实际应用FDD方法的情况是改进型红线报警系统用于在线实时检测,故障诊断在试后离线系统进行。

计算机、自动控制、人工智能、传感器等技术的快速发展和应用很大程度上推动了LRE健康监控系统的进步。当前,除了关注FDD理论方法的研究探索外,还应依靠比较成熟的FDD方法和技术实施工程化研究,使其能应用到液体火箭发动机的研制试验和实际运行中,适应火箭发动机健康监控需求。

4 健康监控关键技术分析

可重复使用LRE的试车成功及空天飞机、组合动力等概念的提出使健康监控技术应用在箭上的需求更加迫切[75],其中重复使用航天器动力系统健康状态快速评估技术更是被列为2023年宇航领域科学问题和技术难题之一[76]。本节针对健康监控领域面对的重难点问题梳理了以下关键技术,并结合课题组最近工作提出了相应的技术方案。

4.1 基于测试性建模的在线检测与诊断技术

故障在线检测与诊断是大推力可复用LRE健康监控技术的核心和基础,对于提高发动机可靠性与维修保障效率,减少发动机全寿命周期费用具有十分重要的意义。基于测试性分析的方法可以解决可测性参数选择与可测性指标确定的问题,通过相关性模型、多信号流图模型等方式描述测点与系统故障间的逻辑关系,在复杂装备的故障诊断、健康评估等方面取得了较成熟的应用[77]。

为此,考虑重复使用LRE故障演化、故障严重程度与故障征兆及相应测试间关联关系的核心要求,开展发动机故障模式分析、测试性建模和实时推理与诊断。图11为LRE测试性建模分析与故障诊断应用总体方案。首先,进行传感器测点状态、故障模式等信息的分析收集;其次,采用多信号流图建模方法,按照“系统→分系统→组件→单机”的层次化功能结构,依据信号流向及传播过程,将不同层次的模块和故障模式及测点资源连接起来;最后,利用推理机(如贝叶斯网、SVM等)完成在线诊断推理。

图11 LRE测试性建模分析与故障诊断应用总体方案Fig.11 Overall plan of LRE testability modeling analysis and fault diagnosis application

以氢氧发动机分层为例,主要由推力室系统、燃气发生器系统、涡轮泵系统、管路系统等部件构成。发动机氢涡轮与氧涡轮以并联方式连接于燃气发生器,从燃气发生器出来的燃气分别推动氢涡轮和氧涡轮。发动机工作过程内部工质的流动过程如图12所示。液氢进入泵前阀由氢泵增压后一路流向燃气发生器,另一路流向推力室,此时泵后泄出阀已关闭,额定工作时无液氢外排。流向推力室的氢又分为两路,一路通过2个冷排汽蚀管限流对大喷管进行冷却,而后外排;另一路经冷却推力室身部后进入推力室氢头腔,然后大部分进入推力室燃烧。此外,从推力室氢头腔分别引出两支路作为伺服机构氢能源和为氢贮箱增压。液氧通过泵前阀经氧泵增压后一路流向燃气发生器,另一路流向推力室。额定工作过程泵后泄出阀已关闭,泵后引出一路液氧经换热器后用于氧贮箱增压。

图12 液氢/液氧发动机工作流向图Fig.12 Working flow diagram of liquid hydrogen and oxygen engine

图13为基于测试性分析的氢氧发动机故障诊断结果,通过故障注入的方式模拟系统故障,在1 000×1 000数据规模下的诊断推理时间可达到毫秒级。可以看出,该方法应用在LRE的FDD中具有更好的实时性,推理速度快,可用于大规模数据的实时在线诊断,并且可扩展性强,理论上只要测点足够,就可以完成发动机故障的全部隔离与覆盖,有利于解决LRE快速检测与评估、故障隔离定位和关键部组件维修维护等问题。

图13 基于测试性建模的氢氧发动机诊断结果Fig.13 Diagnosis results of hydrogen oxygen engine based on testability modeling

4.2 基于数字孪生的虚拟建模技术

数字孪生技术可充分利用数据与模型,集成多学科知识,面向系统的全寿命周期,发挥连接虚拟与现实世界的桥梁作用[78]。NASA在2010年提出了数字孪生应用于航空航天的典型场景,其中包括飞行前的异常检测、飞行中实时状态监测、故障后的诊断评估等功能[79]。进一步地,《2016中国航天白皮书》中也强调了加快航天领域的深度信息化融合,推动数字化、智能化制造的重要性。

图14为基于数字孪生的LRE功能分析图,面向LRE数字孪生仿真建模技术可分为基础支撑层、虚实交互层与分析决策层[80]。其中基础支撑层主要用于支持数据存储、信息安全防护、高性能并行计算等功能;虚实交互层利用复杂仿真模型与采集的实时数据,结合模型数据融合技术,进行虚拟现实交互;分析决策层基于虚实交互结果,实现故障预测、可视化监测、智能控制等功能。

图14 基于数字孪生的LRE功能分析图Fig.14 LRE functional analysis based on digital twins

根据LRE健康管理功能需求建立数字孪生技术框架,如图15所示。

图15 基于数字孪生的LRE技术路线图Fig.15 LRE technology roadmap based on digital twin

图15中物理实体指的是利用传感器测量的各类数据,包括振动、压力、流量等;虚拟模型主要包括通用仿真模型、个性表征模型与动态演化模型[81]。

1)通用仿真模型用来描述LRE理想工作状态,利用三维建模、有限元分析、动力学分析等方法,旨在体现LRE一般运行规律。

2)个性表征模型可以描述系统运行间的差异性,将发动机试车工况变化、重复使用部件累计损伤、燃料燃烧等不确定因素以状态方程的形式表现出来,通过观测方程描述系统真实状态和观测量之间的映射关系。

3)动态演化模型可以利用LRE试车数据实时更新个性表征模型中的状态空间参数,以达到虚实交互的目的。其中,动态贝叶斯网络由于可以较好地融合先验信息,并进行后验信息推理,较适合用于数字孪生模型的更新[82]。

通过分析可知,基于数字孪生的虚拟建模技术在LRE健康监控领域的优势表现为:数字孪生可以创造包括所有知识的数学模型,通过多元信息融合的动态演示能够更精准地描述发动机各项行为,及时发现并预测故障,更好地指导系统控制与决策。

4.3 基于类脑知识的诊断可解释性分析

以DL为代表的新型LRE故障诊断方法在特征提取、样本生成方面具有巨大优势,然而,诊断可解释问题严重降低了研究人员对诊断结果的信任度,尤其面对LRE这种安全攸关的系统。可解释人工智能(Explainable Artificial Intelligence,EAI)在近年被广泛关注,中国科协在2022年度已将“实现可信可靠可解释的人工智能技术路线与方案”列为十大前沿科学问题[83]。

解决EAI问题应关注特征生成与认知推理两方面问题。在特征生成方面,为了从原始多维时序数据中获得更多可解释信息,Zhang等将电机时序数据转换成包含更多细节的多维视觉知识,提升了状态信息直观性和可解释性[84];Brito等利用Shapley值计算单个特征输出贡献度,以模型可解释性得到特征重要性排序,实现旋转机械故障诊断[85]。在认知推理方面,文献[86]将诊断模型本身设计成具有可解释性的自明模型,如决策树、基于规则的模型、线性模型等,依赖逻辑关系达到可解释性的目的;文献[87]提出的“认知放大器”与“守护天使”两个概念值得借鉴,通过认知放大处理关键目标问题,守护天使则代为处理没有时间或精力解决的问题,形成可以模拟专家思维模式的粗细两级诊断模型。

本文提出基于类脑知识的诊断可解释性分析技术方案(见图16)路线如下:将反应发动机健康信息的数据和知识通过时频分析法、对称点模式等转化成二维图像特征,并通过图像多通道融合技术增强二维图像特征的泛化能力,实现模型前可解释性;在故障特征和故障诊断结果之间通过特征重要度排序计算单个特征对诊断结果的贡献度,即将具体诊断结果归因到某个特定特征,实现模型后可解释。

图16 基于类脑知识的诊断可解释性技术路线Fig.16 Diagnostic interpretability technology roadmap based on brain-like knowledge

5 结论

深空探测、天际往返等名词的出现给人类航空航天事业的发展构造了宏伟蓝图,中国航天的发展也正在经历由航天大国向航天强国转变。相较于日本、印度等航天国家,我国火箭发射具有高可靠性,尤其是故障检测理论方法与专家会诊流程非常成熟。但对标SpaceX却是“大而不强、大而不优”,从健康监控技术领域来看,如何评估发动机重复使用次数与使用寿命评估等主要性能指标,如何准确快速地判定发动机能否继续工作、如何有效判定故障部位并采取相应控制措施,成为目前亟需解决的问题。然而,“星舰”多次发射失利也给人们带来启示:航天事业的发展既不可固步自封也不能操之过急,应该抓住安全性、可靠性等主要矛盾,在现有技术基础上稳步推进与创新。为此,针对LRE健康监控技术研究发展,本文提出以下建议。

1)大力提倡健康监控顶层规划设计。从政策层面推动顶层规划设计,进一步推广LRE健康监控技术的地位与重要性。纠正之前健康监控用于“事后补救措施”的思路,系统分析LRE框架与路线,将健康监控纳入LRE整机设计研制,从而实现两者间的“共生”。

2)发展先进传感器技术,完善故障数据库。研制各种高可靠的传感器,搜集丰富的发动机试车数据;继续开展故障仿真研究,系统分析故障模式、故障原因和故障影响,形成以专家经验为主的故障处置库,制定合适控制策略。

3)持续优化现有算法,尽快实现工程应用。结合工程实际优化已有的算法,对有特色、较成熟的算法加以改进和创新,不断提高技术成熟度;发展诸如智能可测性等分析检测技术,为重复使用发动机使用返回后的快速评估与维护提供技术支持。

4)深入拓展智能健康监控技术研究。强大的学习能力与适应能力是人工智能技术的主要特征。基于CNN、GAN甚至深度强化学习等智能技术,挖掘更深层故障信息,突破和解决发动机早期异常检测,实现故障预测;基于迁移学习提高模型的泛化性能和利用率,实现诊断系统局部的通用化。此外,数字孪生可解释人工智能等技术在LRE故障预测与寿命评估、智能控制与维护等方面的应用,可以有力提高系统安全与可靠性。

LRE健康监控技术作为多学科交叉的高新技术,其进步依赖于人工智能、自动控制、计算机科学、传感器测量等技术的发展,其研究应用注定是一个漫长前进的过程,也期待更先进的健康监控技术应用在LRE试车与飞行中。

猜你喜欢

故障诊断发动机监控
The Great Barrier Reef shows coral comeback
发动机空中起动包线扩展试飞组织与实施
你被监控了吗?
Zabbix在ATS系统集中监控中的应用
因果图定性分析法及其在故障诊断中的应用
PDCA循环法在多重耐药菌感染监控中的应用
新一代MTU2000发动机系列
基于LCD和排列熵的滚动轴承故障诊断
基于WPD-HHT的滚动轴承故障诊断
高速泵的故障诊断