大推力氢氧发动机全寿命周期健康管理研究进展
2022-08-26乔夏君
乔夏君,薛 薇
(1.中国运载火箭技术研究院,北京 100076; 2.北京航天动力研究所,北京 100076)
0 引言
液体火箭发动机是一种复杂的、高阶、非线性、流体-机械-热动力系统,运行条件恶劣且运行时间短。大推力氢氧发动机是未来10~20年我国最大推力高性能氢氧发动机,将承担我国载人登月等重大任务,具有流量大、推力大、涡轮泵转速更高、燃烧室压力更高、混合比可调节、工况可变化等特点。因此,针对新一代大推力氢氧发动机开展其故障诊断技术的研究,己成为提高我国未来航天发射任务可靠性与安全性的重要任务[1-5]。
发动机是运载火箭的心脏,其工作的可靠性直接影响全箭的工作。发动机健康监控系统可对发动机运行状态进行监视与诊断,在发生故障征兆时给出预警,及时采取保护措施,避免由于故障而引起的灾难性事故,保护运载器与有效载荷安全,提高飞行任务可靠性[6-12]。无论从型号需求还是发动机自身技术发展,开展发动机健康管理系统研究与应用十分必要[13-18]。
如何保障发动机安全可靠运行一直是运载火箭推进系统的研究重点,也是各航天强国的关注特点[19-22]。保证发动机安全运行的主要手段有:1)在设计制造阶段,优化设计方案、采用新技术新材料新工艺、加强元器件和部组件检测与质量控制,以提高产品质量和可靠性[23-24];2)在地面测试阶段,尽可能地发现故障,改进设计方案,消除安全隐患;3)采用健康监控系统,在运行阶段实时监测发动机工作状态,发生故障时采取相应的控制手段,以确保发动机能够继续完成任务或将故障造成的破坏减小到最小[25-28]。
1 研究现状分析
1.1 国外研究现状
国外从20世纪70年代开始研究液体火箭发动机的健康监控系统,陆续提出和开发了很多实用有效的健康诊断系统方法。最早使用在液体火箭发动机上的性能监测、故障诊断系统的目的仅仅是是实现安全监测,这一原始的简单系统为红线报警系统。为了航天员及和设备安全,红线报警系统主要监控发动机运行的关键参数,如果这些参数超过预设的红线值,发动机将立即关闭以防止发生灾难性故障。对于可能发生的传感器故障,通过传感器验证及故障调节检查传感器是否存在错误输出,对于被检测到发生输出错误的传感器,将会从控制逻辑中移除该传感器的输出,使用冗余传感器数据或分析冗余取代传感器的输出。此外,红线系统可以根据发动机的操作阶段而改变相关的红线值,通过监控计算机根据发动机条件设置红线值,控制计算机使用红线值作为判断标准。如果发动机发生故障,推进系统中的其余发动机必须增加推力或关闭以维持飞行器的推力平衡,这需要液体火箭发动机具有同步紧急关闭和其余发动机的同步节流能力。
在红线报警系统的基础上,诊断监控、状态评估等功能相继实现。诊断监控是对发动机性能的实时监控,以检测非标称性能并可能调整控制以确保发动机完成任务,这需要实时检测识别发动机的故障和退化,并且具有响应这些故障和相应的控制功能。状况评估在液体火箭发动机发射、飞行后,状态评估过程使用已收集发动机数据进行分析,得到以发动机性能退化、性能异常情况,并可能估计发动机的剩余寿命。
美国在此方面的研究比较成熟,其过程也是由简单到复杂,这其中以SSME的故障诊断研制最为突出。
SSME是复杂的大系统,其故障的表现也呈现复杂性,这种复杂性体现为环境干扰的多样性,故障特征的多样性,故障的多样性以及内部的多耦合表现出的强非线性。
故障模式是指故障的具体表现形式。故障模式分析是故障检测、诊断和控制的重要前提和基础。发动机的故障模式分析对提高发动机及其健康监控系统可靠性具有重要意义,对于确定重点监控部件、选择关键监控参数以及制定故障检测和诊断准则等具有重要的指导意义。
SSME虽然已经可靠、安全地进行了超过30次的航天飞机任务,并进行了超过411 000秒的地面测试。但是,SSME在发射或尝试发射中发生了4次轻微故障,所有这些性质上都是相对较小的。计划和执行SSME的地面测试是为了确保发动机的可靠安全的飞行运行。超过1 200个SSME静态点火,累计发动机运行时间超过了270 000秒,在开发和运行期间的地面测试中经历了40次过早关机,其中有27次足够严重称为“重大事故”的地面试验失败,导致了大量的发动机硬件损坏。在地面测试期间,SSME的故障非常严重,无论是对于硬件损失,还是给定发动机或部件上累积的测试时间。SSME在飞行过程中的重大故障威胁着飞行人员和设备财产的安全,还可能会造成巨大经济损失,导致灾难性事故。
NASA 马歇尔太空飞行中心根据故障调查委员会报告、承包商故障报告、原始记录数据以及与故障相关的工程说明、数据库和演示文稿在内的各种资源,进行了SSME故障审查。已经确定了约900个关键性故障模式,大多数SSME故障是由于环境知识不足和对部件施加的负担造成的;特别是动态负载。一些故障模式与几个测试周期后消除的设计问题或材料缺陷相关。高周期疲劳是导致故障的最常见机制。27次SSME地面试验故障中有18次发生在恒定功率水平的主级运行期间。分析得到了故障模式与影响分析结果,建立了危害性项目表。在已经有的故障模式中,对故障产生的原因、效应和发生概率等都作了说明。
美国于1987年公布了SSME故障模式与效应分析以及关键项目表,确立了SSME有14种故障模式为关键故障,如表1所示。
表1 SSME故障模式与效应分析以及关键项目表
从表1中的14种SSME关键故障模式中,按经验准则,划分了故障等级,确定了5个发生次数较多的故障,主要分布于高压氧化剂涡轮泵、 燃烧室喷注器和高压燃料涡轮泵中,即高压氧化剂涡轮叶片损坏,高压氧化剂涡轮泵密封泄漏,高压燃料涡轮叶片损坏,高压燃料涡轮泵密封泄漏,燃烧室喷注器损坏。
SSME 发动机健康监控系统发展的“3个阶段”为:
1)20世纪 70 年代研制的“红线阈值检测与报警系统(Redline)”,也称为红线关机系统,是传感器密集型的红线阈值故障检测方法,这种方法主要针对发动机稳态工作过程,不能对起动、关机、推力改变等瞬态过程进行有效的监控[4-5]。
红线关机系统可以对 SSME 高压涡轮泵的五个参数(高压燃料涡轮出口温度、高压氧化剂涡轮出口温度、高压燃料涡轮泵冷却剂入口压力、高压氧化剂涡轮泵介质密封吹除压力和高压氧化剂涡轮泵二级涡轮密封压力)进行实时监控。
在地面试车时还增加了9个监测参数。为了避免误报,对红线关机进行了传感器冗余设计和逻辑表决,即只有某个传感器在3个或3个以上采样周期里参数超限时才能为关机决策投一票,关机决策由测量该参数的所有传感器投票加权表决。尽管如此,这种简单监测系统的漏报率和误报率仍然较高,据统计在SSME发动机早期试车中,故障检测参数的漏报率高达60.5%,这主要是由门限值界定办法本身的缺陷等原因所致。
红线关机系统采用固定阈值进行判断,无需数学模型,算法简单,实时性强,计算量小,可以修改这些红线以考虑硬件更改或新故障发生,能很好应用于地面试车和飞行试验系统中;但该系统对传感器的要求较高,对缓变故障和早期故障难以及时检测,容易误检和漏检故障,而且故障覆盖面有限、鲁棒性差、可靠性低、功能单一。
2)为了提高检测的效果,NASA在红线阈值故障检测方法上发展的一种改进方法,异常和故障检测系统[7](SAFD, system for anomaly and failure detection)。SAFD可以视为改进红线方法的第一步,是一种实时故障检测算法,用于在地面测试期间检测SSME稳态运行中的异常,它采用统计置信区间、窗口移动、滑动平均的方法对测量参数进行检验,检测逻辑包括计算在一定的时间窗口内传感器测量信号的平均值。
该系统通过监测、测量SSME部件的压差、压力、温度、转速和阀门位置等23路参数,能诊断发动机发生的三类故障。另外系统在运行时可以进行多种算法的并行运算,同时采用冗余设计和表决报警技术,提高了故障检测可靠性。为了节约时间和防止不必要的浪费和事故发生,SAFD系统一旦检测到故障,即立即关机,而不判断故障类型。SAFD比较简单实用,但是对故障的覆盖率、敏感性以及传感器对故障的承受能力仍然满足不了发动机状态的监控要求。比红线系统能更早检测出故障,可靠性有所提高,但它只适用于稳态过程的监控,而且对故障的覆盖率和敏感度较低。
3)高级阶段: 美国针对 SSME研制了不同需求的健康管理系统:健康监测系统[13](HMS,health monitoring system)、智能控制系统[6](ICS,intelligent control system)、综合健康管理系统[8](ISHM,integrated systems health management)和先进健康管理系统[11](AHMS, advanced health management system)等。
2004 年,为提高空间运输系统发射的成功率,波音-加州诺加帕克公司联合马歇尔航天飞行中心研制了用于SSME 的先进健康管理系统AHMS。AHMS是一种可扩展、灵活升级的系统,可以通过改变输入数据轻松适应其他发动机配置;通过降低航天飞机任务的动力上升阶段发动机发生灾难性故障的概率来改善航天飞机的安全性和可靠性。该系统包括3个实时故障检测子系统,即先进实时振动监控系统、光学羽流异常检测系统和线性发动机模型系统,并通过箭载健康管理计算机进行集成,降低航天飞机上升阶段发动机发生灾难性故障的概率,提高了航天运载器在发射和升空阶段的可靠性和安全性,从而提高航天任务的成功概率。研究表明,AHMS 在降低航天飞机升空损失概率方面的效果甚至优于型号本身改进的效果。
2017年7月26日,NASA对RS-25发动机进行了长达500 s的试车,目的是为了验证发动机控制及健康管理系统,在发射和飞行过程中与飞行控制器进行通讯,接收并反馈发动机健康状态和数据。
与美国早期的在液体火箭故障诊断及健康管理领域展开的相关技术研究及开发应用类似,其它国家也进行了一些类似的研究。除美国外,其他各国对发动机健康管理系统的研究也由来已久[29-33]。同时,欧洲及日本等国家也一直比较重视发动机状态监测、故障诊断、寿命预测方面的研究工作[24-37]。
1.2 国内研究现状
国内关于液体火箭发动机健康管理系统的研究主要由高校和相关研究院所展开。从20世纪90年代末开始不同高校及研究所陆续研制了多个性能监视、故障诊断系统,并且对试车数据进行整理集成建立了液体火箭发动机故障数据库[14-16]。
YF-77发动机目前在地面试车使用的故障诊断方案主要是红线判断,对关键参数进行阈值判定,从而判定是否紧急关机。
北京航天动力研究所也开发了一套基于振动数据试后分析的软件,能够进行振动分析和故障诊断,通过时域、幅域、频域以及时频域的振动分析,判定在各个时刻发动机的运行状态是否正常,并在发动机的运行状态不正常时,根据现有的故障特征库,判断出故障类别,输出故障分析报告。该软件是试后分析软件,能够在试车后第一时间对振动数据进行快速分析,从而判定发动机涡轮泵的状态。
国内氢氧发动机健康管理技术研究,目前正处于研究应用阶段。
1.3 故障诊断算法研究
在缺乏试验数据时,就需要有发动机的仿真模型。SSME已经具备完善的功率平衡模型和数字瞬变模型。这些模型可以预计SSME的稳态和瞬态性能。基于模型的故障诊断算法通过处理传感器的测量数据和利用发动机数学模型来跟踪发动机的正常工作。当发动机正常工作时, 传感器输出在预定的轨迹或者是规定的精度范围内变化,如果传感器的测量偏离模型预计值就表示出现故障。经过对比试验发现SSME的模型不能精确地考虑正常工作中的漂移和偏移。基于模型的故障诊断算法需要精确的发动机数学模型。这些模型大部分是线性和时不变的。模型的误差和系统非线性在一定程度上会影响算法的鲁棒性和检测灵敏度。基于模型驱动的故障预测方法在理论上是完备的,但是其故障预测的准确性与可靠性取决于系统数学模型的精度。对于工变化大,组件众多的发动机来说,建立其工作过程精确数学模型十分困难,特别是其故障机理复杂,很难建立能够描述发动机故障发展变化的数学物理模型[38-40]。
在实际工程中,建立复杂系统的精确数学模型往往比较困难或者计算成本巨大难以实现。此时,在系统试验、使用和维护等阶段的测量数据就成为分析系统故障的主要依据[41-42]。SSME已经进行了大量的试验, 并且已经有大量的正常工作和故障模式的试验数据库。通过信号处理、特征提取和分类等技术训练数据组鉴别系统的工作是否正常。然后利用这种能力来把实验数据分为正常和故障两类。
在缺乏精确的数学模型和实验数据时,人工智能技术利用专家知识建立定性模型, 并完成有关故障状态的定性推理。该技术是利用定性模型的自动决策过程。自动决策过程依靠以知识为基础的规则或从传统的物理概念推出定性关系,并完成系统分析,以提供有智能的建议[40-44]。
2 我国氢氧发动机健康管理研究及关键技术
2.1 我国氢氧发动机健康管理技术
由于运载火箭对发动机系统的智能化要求,我国氢氧发动机健康管理技术也逐步开展起来了。发动机状态监测、故障诊断/隔离与寿命预测是重要组成部分[1-3]。图1为系统的功能示意图。
图1 发动机健康管理系统功能示意图
北京航天动力研究所针对氢氧发动机开发了一系列的诊断算法[17-18],形成了一套完整的健康管理系统。该系统整体构架如图2所示,最底层是传感器测量层,通过发动机整机及不同部件的试验采集关键参数的信号。由下往上,第二层是数据层,通过采集得到的数据进行数据的整理和归档,同时通过这些数据进行建模,根据需要构建出无故障的发动机模型和不同故障情况下的发动机模型。第三层是诊断层,通过设计不同应用场合的诊断算法结合试车数据或者仿真模型开展故障诊断研究,多种故障诊断算法交叉诊断并确定故障类型。第四层是决策层,通过诊断结果进行专家系统的判断。最高层是执行层,经过一系列的诊断分析后,给出一个弥补的措施,常见的有紧急关机、启动备份等。
图2 健康管理各级功能示意图
结合研究对象,综合考虑设计依据的需要,氢氧发动机健康管理分为机载和地面部分,发动机健康管理系统原理如图3所示。
图3 发动机健康管理系统原理图
机载部分:传感器部分主要测量发动机的温度、压力、转速及位置信息,健康管理部分通过测量得到的传感器信号估算出不可测量参数,综合可测及不可测量参数进行发动机实时状态分析,在故障诊断的过程中是分别按照发动机启动-主级-关机3个不同过程采用不同方法进行诊断,最后给发动机控制器诊断结果及应对措施,保存发动机的部分数据,保证发动机安全、可靠、高效的工作。控制部分主要包括发动机控制规律、控制算法、紧急关机等功能。
地面部分:发动机每完成一次飞行完毕后在地面需要进行一次全面检查,将发动机历史数据及与飞行过程中的数据进行分析,分别通过离线状态分析得到发动机部件状态趋势;通过故障模式的对比分析得到发动机部件预警结果。通过维修计划分析进行发动机返厂维修,最终实现健康管理综合报告。
2.2 关键技术
2.2.1 基于最优理论的发动机测点优化及不可测参数估计算法研究
纵观国外的各类测点布置方法研究,它们具有基本的组合优化问题求解模式。由于实际工程中测点布置与选择方法涉及的系统状态参数多、系统机理复杂等原因,无法简单的确定目标函数。
测点布置问题的前提是要根据工程需求,所关注的各类顶层需求包括:1)故障检测有效性,包含故障检测准确度和故障检测速度;2)故障检测的可靠性;3)故障检测的鲁棒性;4)故障定位(辨识)的准确性;5)系统状态参数的可观测性;6)资源限制。其中资源限制是最模糊的需求定义,在不同的应用场景下有不同的定义,如测点数量限制、安装空间限制、成本限制等。
发动机状态监测包括对发动机的性能、寿命、振动等进行监测,记录发动机的工作状态及工作时间。结合发动机工作特点及总体需求确定需要监测的参数。目的就是通过传感器测量发动机的气动性能监视热力参数、性能参数、可调部件的位置参数来判断发动机状况。由于发动机的工作性质有些关键的参数不可测量,如混合比、推力等,这就需要对发动机不可测的关键参数进行估计,因此通过可测的参数来估计不可测参数。
国外的测点布置和选择方法具有明显的求解组合优化问题的共同特征,呈现出一个相对成熟的系统。测点布置研究的工程需求呈现出多样性,不仅仅局限于故障检测的有效性,同时对于需求的可实现性做出理论分析。各个研究之间最大的不同体现在系统模型、评价因子和优化技术的差异上,这同样导致研究中使用的术语有一定差异性,但具有相似的内核。这些特征使国外的相关研究具有理论框架融合同一,实际应用各具特异性的发展特点。
国内测点参数布置与选择的方法研究较少。早期选择测点的方法仅通过简单的稳态或动态故障仿真来观察测点参数的变化特征,通过经验分析选择测点;近年来仅有的两个案例对于测点选择的需求仅关注了故障检测的有效性,且使用的是多准则决策算法,缺乏组合优化方法的严谨性。综合来看,国内还没有形成全面化系统化的发动机测点布置方法研究体系。
2.2.2 基于多数据融合的实时故障诊断算法设计
发动机主级工况下各个参数相对比较平稳,同时工作时间最长,这个阶段重点关注的参数比较多。发动机主级工作阶段主要受供应系统的流体和机械运动以及燃烧室、发生器的能量转换过程的控制。一般来说,发动机主级工作阶段主要有两种不同类型的工作模式,一种是发动机在整个主级工作阶段工况唯一,只处于稳定的额定工况;另一种是发动机在整个主级工作阶段除额定工况外,还存在多个工况的转变过程。液体火箭发动机系统结构复杂和耦合性强,物理关系模糊,在发动机工作阶段过程复杂,缺乏先验知识;算法本身存在如实时性、鲁棒性等局限。因此需要采用多数据融合的方式进行诊断。
2.2.3 发动机健康管理器工作过程中复杂环境寿命仿真分析
发动机的工作环境比较恶劣,对于由电子元器件组成的健康管理器来说,如何在设计过程中充分考虑恶劣环境的影响是保证健康管理器性能的关键。在实际工作过程中,健康管理器通过采集发动机系统各传感器输出信号,监测发动机关键状态参数并据此运行故障诊断算法,最后将发动机健康诊断结果分别发送给箭体及发动机控制器。
2.2.4 先进测量技术在发动机健康监视系统中应用
在健康管理系统中,对于智能传感器的智能特征要求为:实现自主校准、检查、比例缩放等功能,进行自身健康评价、异常检测,具有分布式通信功能。智能传感器要实现的功能:使用适当算法处理来自传感器的数据,提取有用的工程单位,并估计传感器和数据的健康状态。
智能传感器必须为健康管理系统提供高度整合的数据。除了对数据进行采集及前期处理外,还具备对数据和元数据进行操作,产生对数据完整性和健康状态的评估。用于健康评估的算法可以是原始的简单限制或阈值函数,也可以是复杂的基于复杂模型再综合其它智能单元的处理结果进行处理。
分布式健康管理架构的关键是参与节点之间的通信,所选择的网络拓扑必须能够满足数据吞吐量、功率和可靠性等要求。其他重要的考虑因素包括传感器阵列进行数据传输所需的带宽,除了考虑测量数据时的采样率,传输数据的总量还需要包括智能传感器提供的有关健康的信息。原始数据和健康信息的总吞吐量必须符合可用带宽。在智能元件之间建立某种形式的有效同步也与通信密切相关,精确的同步使从不同传感器获得的测量及处理结果以某个时间为基准,为上层系统进一步使用处理分析数据提供有效支持。
3 结束语
本文主要梳理了国外液体火箭发动健康管理的研究现状及发展趋势,并对国内液体火箭发动机性能监测及故障诊断现状进行了简单介绍。
我国关于液体火箭发动机健康管理方面开展了大量研究,本文也给出了一些研究的关键技术,总体来说在故障诊断系统的框架设计及实现等方面也有一定的成果,具备了以下能力。
1)具备实时监控能力。实时监控系统主要包含点火前、启动过程、主级工况3个主要的阶段。点火启动前需进行状态确认。发动机测试过程中,推进剂加注前,发动机预冷过程中,通过测量数据,如流体压力、温度、阀门开度等,分阶段对发动机健康状态进行确认,排除可能存在的故障隐患。发动机地面试验或飞行过程中,通过测量数据、故障模型、诊断算法对发动机工作状态进行检测、诊断。
2)具备离线评估能力,发动机离线状态评估数据包括稳态压力、温度、振动参数。具备发动机健康状态评估能力。根据测量数据,对发动机工作状态进行评估,对工作过程中发生的故障进行分析、判定、定位和评估。具备寿命监控能力。基于测量参数,开关状态,记录并管理发动机整机、涡轮泵、燃烧装置、阀门工作次数、寿命裕度,为组件检测、维修、更换提供依据。
3)采用理论方法研究与系统的工程试验验证相结合的方法,建立起一套适用于发动机全寿命周期健康管理系统体系。构建氢氧发动机故障模型,获得故障数据,建立相应的故障诊断算法;可取得的故障诊断中敏感参数对各个部件故障诊断的影响规律。
综上所述,发动机健康管理系统是一个多学科交叉融合的技术,也是一个长期的建设项目。在发动机设计初期就必须开展健康管理系统设计工作,并且贯穿与整个的发动机研制及试验过程。