民用航空发动机故障诊断与健康管理现状、挑战与机遇Ⅱ:地面综合诊断、寿命管理和智能维护维修决策
2022-10-12曹明王鹏左洪福曾海军孙见忠杨卫东魏芳陈雪峰
曹明,王鹏,左洪福,曾海军,孙见忠,杨卫东,魏芳,陈雪峰
1.中国航发商用航空发动机有限责任公司,上海 201109 2.上海交通大学 航空航天学院,上海 200240 3.南京航空航天大学 能源与动力学院,南京 210016 4.复旦大学 航空航天数据研究中心, 上海 200433 5.西安交通大学 机械工程学院,西安 710049
本文是“民用航空发动机故障诊断与健康管理现状、挑战与机遇”系列综述的第2篇。力求以需求分析和文献综述为基础,全面阐述行业需求和民用航空发动机故障诊断与健康管理发展现状及未来热点研发方向。
EHM (Engine Health Management)系统的功能始于故障诊断、预测,结束于基于视情的维护维修决策(图1)。EHM 3个主要的故障诊断模块(“上游”模块)为:发动机气路性能退化、机械故障诊断和全权限数字式发动机控制 (Full Authority Digital Engine Control,FADEC)系统故障诊断;对于民用航空发动机,这3个子系统的故障诊断功能分两个层级完成:在机载系统上完成快速诊断,在地面综合诊断系统上完成更详细、准确的故障诊断和预测。和发动机气路性能退化、机械故障诊断及FADEC3个“上游”模块相比,图1中地面综合诊断、关键限寿件寿命估计、智能视情维护和维修3个模块被认为是“下游”模块。本文将重点讨论这3个 “下游”模块的需求、国内外现状与差距及解决方案和未来的研发方向。
图1 EHM全流程Fig.1 EHM full process
地面综合诊断系统是地面系统的一部分;它的主要功能是:① 完成机载系统由于计算资源限制无法完成的数据融合及精细诊断功能;② 提供顾客要求的定制分析平台;③ 实现基于多源信息融合的发动机故障诊断,提高诊断准确率;航空发动机是一个复杂的耦合系统,故障不仅导致故障零部件或子系统功能或性能丧失、变弱,还会引发其他相关联零部件、子系统的状态变化,导致多种故障状态指示,基于数据融合的故障诊断可以提高诊断准确率;④ 提供基于深度学习、知识图谱等智能算法的故障诊断和预测平台,从而实现基于数据的快速故障特征提取及诊断方法、流程的建立;⑤ 建立所监测系统的数字双胞胎,进而实现基于数字孪生模型的故障诊断;⑥ 故障状态指示 (Condition Indicator,CI)、健康指示 (Health Indicator,HI) 阈值管理。除了故障诊断和预测功能,对于民用航空发动机,关重件的寿命预测也主要在地面综合诊断系统里完成;从功能上将寿命管理作为一个单独的模块来对待。地面综合诊断模块和寿命管理模块的输出则为智能视情维护维修决策提供了输入 (图1(b)),从而完成从故障诊断、预测到维护维修决策的流程闭环。
民用航空发动机市场竞争激烈,必须在保障安全运行、遵守适航规章的基础上,通过科学有效的寿命管理实现发动机全寿命期维修使用成本的最优化。因此,及时准确的寿命预测、科学合理的寿命管理是实现以上目标的重要保证。发动机EHM框架内的寿命管理主要包括:发动机关键部件的使用寿命监控、寿命消耗计算、剩余寿命预测、延寿控制等,其目的是保障发动机在复杂环境和使用条件下能够安全运行。寿命管理子系统已经成为现代航空发动机健康管理系统的一个重要功能模块。寿命管理子系统根据发动机关键部件寿命消耗、健康监测、运行状态参数等数据信息预测发动机在翼剩余可用寿命,为发动机寿命管理和维修决策提供依据,消除潜在安全隐患和避免事故发生。
发动机寿命管理技术包含整机和部件两个层级。部件级寿命管理包括关键部件的使用寿命监控和安全使用寿命预测;整机级寿命管理则涵盖发动机在翼使用寿命监控和寿命预测。关键部件主要包括高能转动件和承压件。这些发生非包容失效时可能导致危害性,甚至是灾难性的后果;同时,这些部件使用了昂贵的原材料、经历了复杂的设计过程、采用了先进的制造工艺、承受了严格的质量控制,制造成本高昂。因此,民用航空发动机寿命管理必须考虑如何在保证安全的前提下,最大限度地使用关键零部件的有效使用寿命,降低产品全寿命周期成本。
智能维护维修决策系统是基于视情维护维修模式的顶层规划设计。通过发动机全寿命周期维修决策优化,智能维护维修决策系统首先构建发动机全寿命周期数据模型,并在此基础上针对不同部件、不同维修策略建立维修间隔确定方法,解决航空发动机机队送修时机优化、维修工作范围优化。智能维护维修决策系统根据产品投入运行后状态和可靠性信息的反馈,从全寿命周期角度优化发动机在翼维修、离翼大修时间间隔和工作范围,建立基于健康管理的使用维护策略和决策支持模型及方法。发动机智能维护维修决策系统根据发动机健康状态及保障资源信息、飞行任务和目标综合决策,最大限度地发挥了系统效能、降低寿命周期成本,是航空公司面向全寿命、全机队和全成本的决策优化系统。
本文将顺序展开论述民用航空发动机地面综合诊断、寿命管理、智能视情维护维修决策的需求、国内外现状与差距及解决方案和未来的研发方向。
1 地面综合诊断与预测
发动机地面综合诊断是发动机健康管理的重要组成部分,为此,发动机OEM (Original Equipment Manufacturer) 厂商及航空公司都在不断推动发动机地面综合诊断系统的构建和发展。以3大发动机OEM:GE (General Electron,也称通用电气)、RR(Rolls Royce,也称罗罗)、P&W (Pratt & Whitney,也称普惠) 为代表的发动机厂商已经实现发动机机载监视数据的空地实时传输和远程故障诊断,可支持全球发动机的健康管理,为运营商合理安排发动机飞行任务和维护维修提供服务支持。随着发动机数据采集、通信等技术的不断发展,可用于发动机综合诊断的数据类型及数据量正在经历质变性的增长。与此同时,大数据分析及工业互联网技术的发展为采用产生于发动机不同阶段、不同来源、不同类型的数据进行综合分析,在此基础上不断优化民航发动机服务和维护维修决策并发展新的服务模式提供了可能。
在此背景下,GE、RR、P&W等OEM厂商不断推进其发动机地面综合诊断系统的发展。GE公司推出了面向工业领域的基础性的工业互联网平台Predix,为发动机综合诊断提供了基于大数据分析的综合诊断平台,能够实现对几万甚至十几万台发动机的实时监测和诊断,支持发动机运行和燃油消耗的优化,并减少意外停机时间。RR公司使用微软公司的Azure云计算平台收集和汇总来自世界各地的发动机数据,并利用Cortana智能套件处理数据,支持基于大数据分析的发动机的综合诊断。P&W公司则通过与IBM在大数据分析领域的合作来推动其发动机数据分析业务,借助IBM的云服务能力实现对业务、工程和制造系统数据的云管理,并实现基于大数据分析的综合诊断。P&W在2015年公布了一系列旨在改善发动机性能并为客户提供更好服务的大数据分析项目,并于2016年公布了旨在加强发动机诊断维修服务的大数据项目。
1.1 地面综合诊断需求
在新技术和健康管理服务模式发展的推动下,发动机地面综合诊断系统面临以下几个亟待解决的需求:① 为不断创新发展的发动机健康管理服务模式提供支持。发动机健康管理服务正在从数据和应用服务向包修服务、飞行能力服务及定制化服务等多种形态的创新服务模式发展。不仅要求发动机地面综合诊断发展与之相匹配的业务模式,还要求发动机地面综合诊断系统架构在功能、技术、适应性、安全性、可扩展性等方面满足支撑其业务模式创新发展的需求。② 多源异构数据采集及海量数据深度分析的需求。可用于发动机综合诊断的数据的第1个特点是来源众多,类型复杂,既包括以监测时序数据为代表的结构化数据,又包括以孔探图像为代表的非结构化数据;第2个特点是发动机综合诊断可用的数据量很大,如LEAP发动机单次飞行可生成1 TB的数据;第3个特点是数据关联性强,发动机各阶段数据、不同维度测量数据、发动机工作/性能退化/故障机理与状态参数之间均存在相互关联。发动机地面综合诊断涉及对上述数据的采集和深度分析处理,对系统数据架构提出了挑战。③ 满足全方位安全防护的需求。发动机地面综合诊断系统需要面向OEM厂商、航空公司、第三方服务商(包括算法服务商、应用服务商)等不同角色,不仅涉及来自上述各方的数据安全和业务隐私问题,甚至影响发动机的飞行安全。因此需要解决好用户认证、访问控制、数据安全、安全监测等方面的问题,做好全方位的安全防护。
EHM系统通过实时跟踪发动机健康状况,减少定期和不定期的地面维护时间,制定更加合理的维护计划方案等途径,提高发动机的可靠性与利用率,减少维护费用,保证飞行任务完成。
通过对国内外发动机地面综合诊断技术应用、研究差距的分析,分别在多信息融合的故障诊断技术、基于深度学习和智能算法的诊断预测技术、数字样机及系统诊断技术、基于知识图谱的发动机故障诊断等4个方面进行深入论证,以期最终实现以下目标:
1) 通过多源信息融合提高故障诊断置信度。
2) 采用智能技术提高诊断和预测的准确率及效率。
3) 构建发动机健康管理的知识图谱,采用非结构化数据和自然语言记录提高诊断及维护维修决策质量。
4) 建立航空发动机全寿命周期的数字孪生样机、实现基于数字孪生样机的航空发动机健康管理能力,包括状态监测与评估、故障诊断与寿命预测及相应维修维护等功能。
1.2 多信息融合航空发动机故障诊断技术
发动机健康管理系统通过在民航发动机的关键部位上安装传感器来测取相关数据并以此估算民航发动机相关状态性能。由于环境的改变和飞行员个人操作偏好,每次飞行的发动机运行状态存在比较明显的差异,所以还需要结合飞机上的其他数据,如推力设置、引气状态等数据进行发动机健康状态评估。这些经过传感器测取的参数再通过智能化处理后即能够体现出民航发动机健康状态。它们都使用ACMS (Aircraft Condition Monitoring System)来获取飞机健康数据,此监控系统获取的数据主要是如下几种:第1类为快照式报告,此系统自动采集飞机上指定传感器获取的数据,组织成报告。此操作从飞机起飞开始直至飞机降落结束。第2类报告是当遇到飞机及发动机处于异常状态时自动生成,如飞机起飞时发动机喘振或涡轮燃气温度 (Turbine Gas Temperature,TGT) 过高等。此类报告蕴含着这些异常状态时的飞机及发动机相关的关键数据,通过分析这些数据能够快速有效的进行故障排除。第3类报告为最终总结,在整个飞行过程结束时生成。该报告将呈现飞机及发动机在整个飞行过程中的极限状态数据,以及飞机在起飞和爬升期间的性能(推力等)信息。
民航发动机健康管理系统一般是使用飞机通信寻址报告系统(Aircraft Addressing and Reporting System,ACARS)将飞机上的数据传输到地面接收系统,首先通过无线电或卫星数据链路来传输报告,然后通过全球地面网络将民航发动机健康数据传输到预定目的地。经过民航发动机健康管理软件处理后的民航发动机健康数据,最终也会上传到这些民航发动机的官方指定网站,从而方便航空公司实时的查看它们发动机机队的健康状态来制定自己的机队维修策略。
1.2.1 多信息融合故障诊断技术背景
单一状态指示参数并不能总是完全反映实际发动机本身的故障程度,对发动机性能评估效率不高;这种情况下,采用基于来自多个传感器的多源信息融合进行诊断可以提高诊断精度。
航空发动机是一个复杂的耦合动力学系统,故障不仅导致本身所在子系统性能的变化和下降,也会影响关联、耦合子系统的状态变化,从而导致一个故障可以有多个不同的故障征兆。这方面的例子有,喘振可以在机匣振动频谱特性变化上体现,也可以通过分析类似频段压力脉动来监测;轴承或齿轮故障可以导致振动信号变化,也可以引起滑油金属屑末增加或在磁堵信号上有所体现。
多信息融合的故障诊断是基于多个不同类型或不同安装位置的传感器信息,辅以多参数以及历史与经验信息综合处理的过程,主要流程环节包括对来自多个信息源的数据或信息的监测 (Detection)、关联 (Correlation)、估计 (Estimation)和组合 (Combination)等处理。目的是充分利用已有的全部信息,提取出有价值的故障特征信息。和基于单一传感器信号的诊断方法相比,多信息融合的故障诊断技术能够降低虚警率和漏检率,提高诊断精度。
1.2.2 多信息融合故障诊断方法
故障融合层级划分主要取决于“起点”暨输入信息的层级:原始数据、从原始数据中提取出的特征、根据提取出的特征所做出的“局部”诊断决策(区别于融合后的“全局”诊断决策)。故障数据融合因而分为数据层融合、特征层融合和决策层融合3个层次:数据层融合是直接在原始数据层上进行融合,这也被视为最低层次的故障信号融合,其输入是多传感器测量的原始数据。该方法有几个局限性,第一,原始数据的融合要求各传感器信息来自同质传感器,非同质传感器此法不适用。第二,该融合方法输入了原始数据,严格来讲信息量远大于特征层融合和决策层融合,相应地算法处理上也更有灵活性;但是原始数据的信息质量却并不好,由于未经提取含有大量的无关信息和噪声,所以数据层融合的故障诊断抗干扰能力较差,决策质量并不好。第三,由于传感器原始数据量较大,数据层融合对于运算资源要求较高,实时处理较困难。
最高层级的故障融合策略是决策层融合,顾名思义其输入是基于多个同质或不同质传感器信号的“局部”故障诊断结果,也就是说输入不再是CI’s的值,而是基于各个CI’s的诊断结果 (“局部”故障决策,可以认为是“局部”HI), 其输出是全局故障决策 (“全局”HI)。决策层融合的主要优点是带宽要求低,对于运算处理资源要求最低;此外,该法鲁棒性较好;即便少数传感器通道给出不准确的诊断,通过融合也能纠错得到正确的全局诊断结论。决策层融合的理论基础是粗糙集理论,通过分类与约简获取优良的规则集合, 进而实现准确的决策。显然,决策层融合的最终诊断准确性和其输入决策的质量相关。相对于前述的数据层融合,决策层融合的灵活性降低了,因为其输入是已经“浓缩”的信息,无法再反映更底层信息的关联性。
特征层融合则介于数据层融合和决策层融合两者之间,是对原始信息处理后的故障特征进行综合分析和处理。其输入可以理解为是状态指示的值。对于故障诊断而言,其输入为故障特征,其输出通常是基于局部信息的局部故障结论或基于不同诊断方法的中间结论。该方法的主要优点在于实现了可观的信息压缩,有利于实时处理,并且由于所提取的特征直接与决策分析有关,因而融合结果能最大限度地给出决策分析所需要的特征信息。由于它是介于数据层与决策层之间的中间层,如果使用得当兼具数据层和决策层融合的优点:① 运算量适中、对于运算处理资源要求不高,可以满足实时诊断需求;② 其输入不是局部诊断结论,因而较决策层融合灵活,可以挖掘出新的关联性从而进一步提高诊断精度。
在信息融合领域使用的主要数学工具或方法有概率论、推理网络、模糊理论和神经网络等,其中使用较多的是贝叶斯方法、模糊理论、证据理论和神经网络。
1) 基于贝叶斯统计推理的信息融合
基于Bayes理论计算目标属性的融合概率可以表达为
(1)
式中:()是先验概率;()是模式为类故障的条件概率密度函数。贝叶斯推理是理论上较为完善的融合技术,但是,先验分布概率和条件概率密度函数需要较大量的故障数据才能总结出来,实际上很难操作;此外,如果不满足数据之间相互独立,或未知信息量大于已知信息量的时候融合过程就会呈现不稳定性。这些都限制了贝叶斯统计推理融合方法的使用。
2) 基于模糊理论的融合方法
模糊理论是将普通集合的绝对隶属关系灵活化,使元素对集合的隶属度从原来的只能取0和1扩充到[0,1] 区间中的任一数值,因此很适合对传感器信息的不确定性进行描述和处理。设系统中所有可能发生的故障原因集合为={,, …,}, 其中为故障原因种类的总数, 由这些故障原因所引起的各种特征集合为={,, …,}, 其中为故障特征种类的总数。当得到一征兆群样本为{,, …,},同时得到样本各分量对特征的隶属度为()时,就构成了故障特征模糊矢量:
={(),(),…,()}
(2a)
假设该征兆样本是由故障原因产生的,对各种原因的隶属度为
={(),(),…,()}
(2b)
因为故障原因和特征之间存在因果关系,所以根据模糊逻辑学原理可以得到和之间的关系为
=∘
(3)
式中:“∘”表示模糊逻辑操作;为模糊关系矩阵。基于模糊理论的故障融合方法操作简便,但其效果则取决于模糊逻辑操作的定义,需要迭代调节和实操经验才能得到满意的结果。
3) 基于Dempster-Shafer (D-S) 证据理论的融合方法
设,, …,是同一识别框架=[,,…,]上的组基本概率分配,即给定个证据体对幂 2的元素(不含空集)(=1, 2, …, 2-1)的概率赋值,则D-S规则为
()·()…(2-1),≠∅
(4a)
≠1
(4b)
D-S证据理论的缺陷是:① 从理论上来讲各个证据必须是相互独立的;② 证据合成规则缺乏完备理论基础,但这也是大部分融合方法共同面对的问题;③ 结果有可能违背直观常理(Zadeh悖论)。
4) 基于神经网络的信息融合方法
神经网络应用关于故障诊断的方式主要有系统辨识、模式识别、知识处理等方式。神经网络系统辨识采用神经网络模型拟合系统特性,特别适合非线性系统的系统辨识。将神经网络的输出与实际系统的输出相比得到残差,残差信息就是故障指示。
神经网络故障模式识别则采用神经网络作为分类器,利用其学习能力建设故障征兆与故障类型之间的映射关系—神经网络故障分类器模型;采用该模型可以直接由故障征兆得到故障类型。
神经网络知识处理是一种知识表达体系,信息处理通过大量称为节点的简单处理单元之间的相互作用进行。通过经验样本的学习,将专家知识以权值的形式储存在网络中,并利用网络的信息保持性来完成诊断推理,较好地模拟了专家凭借经验、直觉而不是复杂计算来推理。
在实际应用中,针对一个故障诊断问题,首先需要分析用神经网络方法求解问题的性质,然后根据故障诊断特点,构造网络模型和确定训练算法,最后通过网络仿真分析,确定是否合适。具体思想框架与证据理论有点类似,求出每一个传感器在某一症状下对故障集内的各故障的隶属度,作为神经网络的输入,网络的输出即为融合后该症状属于各类故障的隶属度值。以BP (Back Propagation) 神经网络为例,其输入一般是一个向量,也可以是一个矩阵或者3维或者高于3维的张量。如果是一个决策层融合问题,则输入为多个诊断局部决策值,可以为0或1,也可以是除以阈值归一化后显示故障程度的值,组成一个向量;对于一个特征层融合问题,则输入也可以是一个向量,其所含元素是各个特征量。对于上述情况,则融合结果可以表述为输入的函数(图2 中,针对多个故障是向量,输入为故障特征向量或局部故障决策向量,输出为全局故障决策向量):
={-1-1[-2-2[(…())]]}
(5)
式中:为该网络从输入层到输出层层数;(=1, 2,…,-1)是每一层输入到输出的权重矩阵;是该层的激活函数 (Activation Function)。
图2 基于BP网络的神经网络融合举例Fig.2 Datafusion using BP neural network
和其他神经网络应用类似,网络层数越多则训练越容易落入局部最小值陷阱从而导致训练困难。是向量,涵盖多个故障的诊断结果。神经络故障融合的主要问题是要求健康及故障特征空间全覆盖的大量训练数据;此外,神经网络无法预测到训练数据以外的行为,如果有新故障行为出现则需要重新训练。也就是说,神经网络模型 “外插”决策能力较差。
1.2.3 国内外研究现状
美国是将信息融合技术应用于航空发动机故障诊断起步和发展最快的国家。信息融合技术目前已成熟应用在航空发动机健康管理(EHM)系统中。NASA设计了两层融合对发动机故障进行研究,第1层获取特征信息并对发动机健康状况进行评估,第2层通过结合飞行员、地勤人员的观测数据和历史维修、飞行数据对发动机故障进行诊断,使用了GPA健康评价和AD异常监视相结合的方法。
Volponi在其2005年的经典论文里指出故障融合将提高飞行器和航空发动机的故障诊断精度,并给出了一个通用的航空发动机数据融合框架(图3)。Volponi的先驱性工作在系统层级完备地实现了航空发动机故障融合,对民用航空发动机故障融合的实施直到现在仍然具有指导意义。Volponi提出的故障融合框架中有4个主要功能模块:
1) 数据对齐模块(Data Alignment Module),其功能实际上是将高频和低频信号等时化,以便融合这两类信号来反映特定时刻系统状态。
2) 分析/模型模块(Analysis/Models Module),该模块处理100 Hz以下的气路信号和滑油屑末信号;需要指出,实际上结构和振动分析也具有相应的分析模块,在该框架里没有明确标出,而直接显示为两个在数据对齐模块上方的特征提取(Feature Extraction) 的功能框。
3) 顶层故障诊断特征信息融合模块 (High Level Diagnostic Feature Information Fusion Module),该模块的输入是基于结构传感器(应力、应变测量)和振动传感器信号的结构故障特征参数、转子机械故障特征参数、及气路和滑油系统故障特征参数,也就是各个子系统的状态指示(CI)值,该模块的输出是发动机的整体健康指示(HI)。
4)故障隔离推理机模块 (Fault Isolation Reasoner Module),这个模块已经不是单纯的“故障融合”模块,而是兼具“维护、维修决策模块”功能;该模块的输入除了发动机整体健康指示,还包括发动机维护、维修历史(Engine Maintenance History)及维护-维修人员和飞行机组观察 (Maintainer/Pilot Observation),模块的输出则是推荐的维护项 (Recommended Maintenance Action)。
图3所示框架基于特征层融合,如有必要未来民用航空发动机故障融合框架里可以采用包含原始数据层、决策层融合的混合融合框架;此外,维护维修历史数据及机组和维护维修人员观察输入除了作为故障隔离模块输入,还可以用作更上游的融合模块输入。
图3 航空发动机通用数据融合框架[17]Fig.3 A generic data fusion framework for aero engines [17]
Dempsey等成功地采用模糊理论构建了轴承故障融合诊断方法,融合经典的振动轴承故障诊断特征:在轴承内圈、外圈、保持架、及滚子故障特征频率处的幅值和滑油金属屑末检测结果来评估轴承故障状态。
国内已经开展了在实验室环境下运用信息融合对航空发动机故障诊断的研究。Chen等采用神经网络与粗糙集的方法成功地对磨损故障进行了诊断。陈恬等开发了结合神经网络与D-S(Dempster-Shafer)证据理论的发动机气路部件故障诊断方法;通过使用改良的D-S证据理论对基于自组织竞争网络和BP神经网络的两个诊断子系统的诊断结果进行决策融合降低了误诊率。蔡开龙等提出了一种基于T-S (Takagi-Sugeno) 模糊模型的故障诊断方法,在对模糊系统的参数优化的同时实现了系统结构的自适应最优化,并给出了阈值确定方法。鲁峰等开展了基于信息熵的发动机气路故障融合诊断;孙见忠和左洪福提出了一种基于贝叶斯网络的多源诊断机制,并应用于发动机气路故障诊断;李业波等提出了基于IDE-ELM与SVD-Kalman的航空发动机部件故障融合诊断技术。
1.2.4 航空发动机多信息融合故障诊断方法发展方向
综上国内外研究院所已经在实验室环境下开展了大量的故障融合理论、算法研究并应用于航空发动机气路和机械故障诊断。但是实际成功应用于航空发动机的例子还很少,航空发动机融合诊断理论、应用问题仍然有许多待解决的问题:
1) 优化数据融合方案
针对航空发动机多源数据源,选取最优化的融合方案。发动机的多源数据融合对象有多种搭配:同一个振动传感器经过不同的频域、时频域信号处理得到同源故障状态指示,这种同源状态指示融合的价值及其优化融合方案仍然是有待回答的问题。发动机机匣不同位置的振动传感器信号的故障特征融合方法,即不同源但同质信号故障特征的融合方法也需要详细研究、评估。需要指出,对于上述的同源同质、不同源同质信号,除了特征层、决策层融合,从理论上讲数据层融合也是可行的。通过融合基于振动传感器信号和基于气路压力脉动传感器的故障特征、局部故障决策可以提高气路故障诊断的精度,这是不同源但类似质融合的例子。针对不同源、类似质信号也可以施行数据层融合。通过融合基于振动传感器信号和基于金属屑末传感器信号的特征、局部故障决策融合可以提高发动机机械故障诊断的精度,这就是不同源、不同质融合。所有这些信息融合诊断方法的适用性和潜力都需要系统、细致的试验和理论分析来解决。需要论证、研发适用于不同异构数据组合的融合方法。
2) 探索混合层融合诊断
除了数据层、特征层和决策层融合诊断技术,混合层融合诊断及其在航空发动机故障诊断上的应用尚未被系统地评估。
3) 考虑使用及维护维修历史的综合状态评估
航空发动机故障状态的评估还没有考虑维护维修历史等因素;也就是说,目前的状态评估仅限于状态,而没有综合考虑“使用”“维护”“维修”因素。
4) 考虑传感器信号置信度的航空发动机多信息融合故障诊断
目前的航空发动机多信息融合故障诊断方法尚未明确考虑故障诊断与预测的终极信息源-传感器信号的置信度;这方面的例子有金属屑末传感器、振动传感器信号等。需要建立量化传感器置信度的信息融合算法。传感器置信度评估有两层意思:① 传感原理和制造工艺等导致的传感器设计置信度;② 随着服役时间的增加,传感器性能下降导致的置信度下降。以传统的线性权重融合算法为例,传感器的置信度由其相应的特征权重反映,而权重并未严格量化,尤其是由于传感器退化、老化导致的置信度下降未得到考虑,导致漏检、虚警等。
1.3 基于深度学习的故障诊断和预测技术
1.3.1 研究背景
2015年Hinton等在《Nature》上发表文章“Deep learning”,探讨了一种处理大数据的工具,即深度学习理论,开启了深度学习在学术界和工业界的浪潮。深度学习旨在通过模拟大脑的学习过程,构建深层次的模型,结合海量的训练数据,来学习数据中隐含的特征,从而刻画数据丰富的内在信息,最终提升分类或预测的精度。深度学习在图像识别、语音识别、工业机器人等领域都展现了前所未有的应用前景。在故障诊断与预测领域,基于深度学习技术的智能故障诊断预测方法也引起了广泛关注,学者们已经开展了大量的研究。目前国内外研发人员已经探索了一些深度学习方法例如自动编码器、卷积神经网络、循环神经网络、深度置信网络、残差神经网络等在智能故障诊断与预测中的应用。
故障诊断方法万变不离其宗,是采用故障特征(一般系参数形式)及特征参数的值来开展的,通过融合多个故障指示可以提高其诊断精度。传统的故障诊断方法其实也是通过学习得到的,只是这个学习主体是故障诊断研发人员。研发人员按照开发流程,尝试一些传感信号的特征提取方法,并依据统计方法设置阈值然后进行诊断方法验证。根据使用效果研究人员会对算法、阈值进行调整,以获取满意的漏检率、虚警率及诊断精度,这就是一个HIL (Human In Loop) 学习过程。但是这种传统的HIL诊断开发方法要求开发者具备专业知识,而且开发时间较长。如果诊断对象发生了改变,则需要重新开展研发活动来发展新的诊断算法系统,系统的成熟也需要时间,导致系统的时效性较差。此外,在一个新系统设计过程中,虽然开展了失效模式效果和严酷度分析(Failure Mode Effect Criticality Analysis,简写为FMECA或FMEA),在投放市场的初期不可避免地会碰到新的故障模式,这种情况下传统的故障诊断研发方法无法给出快速的故障诊断解决方案。基于深度学习的诊断、预测技术则可以快速的给出诊断方案,因为其学习的主体不再是研发人员,而是基于神经网络的人工智能,能够根据输入快速自动迭代找到最优解。
1.3.2 方法简介及国内外现状
表1总结了国内外最近基于深度学习的系统故障诊断及其在航空发动机和燃气轮机健康管理方面的应用工作。国外最近开展的工作包括:深度学习在飞机MRO (Maintenance,Repair,Overhaul)上的应用综述和总结,及基于MLP (Multilayer Perceptron)、RBF (Redial-basis Function)、DNM (Deep Belief Network)、TDNN (Time-delayed Neural Network)等类型的神经网络学习的故障诊断、分类方法及其在航空发动机EHM的应用。
表1 基于深度学习的故障诊断与预测研发工作[25-45]Table 1 Research and development on deep learning & its application on diagnostics and prognostics[25-45]
续表
国内最近在基于深度学习的健康管理和航空发动机应用方面的工作相比国外文章数量要更多一些,研究工作也更丰富。文成林和吕菲亚对于基于深度学习的故障诊断方法给出了比较完备的综述,该文介绍了深度学习常用的4种网络及各自的特点,并指出了基于深度学习故障诊断目前面临的主要问题:① 多传感器测量下样本的特征维数较高,且具有强关联性;② 海量数据中有价值/有效信息有限,因而干扰信息过多;③ 训练数据分布不均匀、样本数量过小,导致诊断空间覆盖不完备。沈涛等对于基于深度学习的旋转机械故障诊断进行了总结性回顾,除了SAE (Stacked Auto E)、DBN (Deep Belief Network)、CNN (Convolutional Neural Networks)、RNN (Recurrent Neural Network),还涵盖了生成对抗网络 (Generative Adversarial Network,GAN)。他们还提出了一些指导性的意见:① 深度学习和多种特征提取技术融合诊断相结合能进一步提高深度学习故障诊断的精度;② 过度去噪、去噪不足会使原始的信号失真,并降低故障诊断效率甚至准确度;③ 如果通过增加单一的深度学习模型深度来提高模型效果,会出现梯度消失问题,导致计算过于复杂并影响准确率。除了深度学习故障诊断方法方面的工作,Shen等提出了一种全卷积网络 (FCN) 的最新算法来识别和定位飞机发动机管道镜图像的损伤。成功地从内窥镜图像中识别出两种主要类型的损伤,即裂缝和烧伤,并在这些图像上高精度地提取出它们的损伤区域。
虽然深度学习网络DAE (Deep Auto Encoder)、 LSTM (Long Short-Term Memory)、CNNs、DBNs、BP等以及这些网络的混合模型在航空发动机诊断、预测上的应用已被广泛研究,但是成功的实际应用案例在文献上尚未见到。这方面实用性的工作在国内尤其匮乏。
1.3.3 基于深度学习的航空发动机故障诊断和预测研发方向
虽然国内外的研发人员已经在过去10年里取得了很多进展,深度学习理论和方法仍然在持续发展和成熟的过程中。基于深度学习的故障诊断仍然离实际应用有很大距离,未来的航空发动机基于深度学习的故障诊断与预测实用化主攻方向总结如下:
1) 利用航空公司现有运维数据开展基于深度学习的航空发动机故障诊断与预测研究
利用航空公司现有的已标注(数据带故障标签)运维数据进行基于深度学习的航空发动机故障诊断与预测研究。通过分析比较健康阶段、早期亚健康阶段、和故障阶段数据,甄别新的潜在关联故障、早期故障指示;采用深度学习建立相应的故障检测和故障隔离、分类模型。通过神经网络输入-输出敏感性排序选择关键亚健康、故障指示,并通过实际案例和基于物理原理的解释性确认其正确性。
2) 无监督算法批量样本标注方法研究及验证
现有的智能故障诊断方法是以有标签的样本为前提的,这些样本往往是通过人为标注的。目前基于人工诊断的样本标注技术效率较低,受主观因素影响较大,同时需要有大量的先验知识与数据处理技术,难以适应大数据的发展要求。未来发展方向之一是采用无监督学习算法,发现无标签样本内部的联系;通过综合各个聚类信息,对样本进行批量标注,为智能故障诊断方法提供前提条件,进而降低智能诊断预测技术应用难度。
3) 深度学习与物理原理结合从而提高深度学习模型可解释性和外插性能
就深度学习网络本身而言,限制其应用的瓶颈之一仍然是可解释性问题。研发人员多年前就意识到将已知的原理、机理反映在神经网络的输入和结构上不但能够提高建模效率、提高精度、并部分解决神经网络模型外插特性差的问题,还能够解决神经网络模型解释性。将已知的知识融入神经网络的输入及结构从而得到“可解释的”深度神经网络诊断模型将提高诊断和预测精度。
4) 高故障敏感特征提取方法研究及验证
现有的智能故障诊断方法,主要是提取有区分度特征进行诊断,但有区分度的特征具有一定随机性,不能完全保证是故障特征,这限制了模型的泛化能力。因为模型提取了其他带有区分性的特征(例如工况特征)时,往往会掩盖故障特征,导致诊断效果下降。未来可以通过综合各个故障的直接相关特点,基于稀疏特征提取思想,研究高故障敏感特征提取方法。再利用微弱故障实验以验证模型准确性。
5) 高效训练与诊断方法研究及验证
现有的基于深度学习的智能故障诊断预测方法为保证诊断精度,往往选取深层网络结构,网络加深带来的是网络优化参数规模变大,在采用大数据训练模型时占用大量的时间与存储资源,同时深层结构也导致诊断效率下降,难以应用于实时诊断中。需要通过开发先进的参数优化方法,在保证浅层结构下提高模型诊断能力,建立高效训练与诊断模型。现有的深度学习智能故障诊断预测方法研究是在大数据前提下开展的,但在实际中,大数据的前提是片面的,主要表现在样本的极不平衡上。训练集中的普遍状况是无故障样本占绝大多数,而故障样本极为稀有。这使得智能故障诊断模型在参数优化上发生整体偏移。可能的解决方案是通过调节训练参数权重以及数据增强的方式,建立样本不平衡智能诊断预测模型,再利用不平衡故障数据集以验证模型准确性。
6) 欠定情况下智能诊断方法研究及验证
现有基于盲源分离的智能故障诊断方法,大多数是基于适定或超定情况,即传感器数目等于或多于振动源信号的数目,其不适用于欠定情况。欠定情况使得机械设备振动源信号的分离难度大大增加,可能导致振动源信号的错分情况,进而导致故障源的错误判别。需要基于机械设备信号的稀疏性,建立欠定情况下智能诊断方法。
7) 时变工况智能诊断预测模型建立及验证
现有的故障诊断方法基本的工况前提是诊断过程中工况不变,但实际中,尤其是航空航天领域的机械设备,运行工况往往是时变的,这给智能故障诊断的应用带来了困难。因为各种工况因素相互叠加,导致信息的复杂度呈指数级上升,而基于数据驱动的深度学习算法是以数据为前提的,若要满足如此庞大复杂度的训练样本难度非常大。需要针对时变工况下难以采用基于深度学习的智能故障诊断预测方法的问题,基于信息降维思想,建立时变工况智能诊断预测模型。
1.4 数字孪生样机及系统诊断技术
1.4.1 数字孪生技术背景
数字孪生概念最早于2003年由Grieves在美国密歇根大学的产品全生命周期管理课程上明确提出,当时被称作“镜像空间模型”,后又被定义为“信息镜像模型”和“数字孪生”。严格从技术层面来讲,数字孪生并不是一个全新的领域,其理论基础早已存在,是最近这二十多年的计算机软硬件发展带来的指数级增长的算力让数字孪生建模变成了可能并快速发展。Grieves定义数字孪生模型为一整套虚拟信息能够完全地描述对象的所有特性和行为,在理想状况下所有通过测试、观察对象实体能够得到的信息都可以被数字孪生模型所反映。数字孪生模型被分为两类:数字孪生原型模型 (Digital Twin Prototype, DTP)、数字孪生实例模型 (Digital Twin Instance, DTI)。DTP包含了所有能够用来描述和制造该对象的通用性的信息:设计要求、3D模型及相应尺寸、材料特性、制造工艺、服务方案、和废品处理等;而DTI则描述了一个特定的对象,包括3D模型及相应尺寸和公差;目前和过去的材料特性,所有该对象经历过的正常操作和维护维修,当前模型测量和测试结果,更换过的零部件及更换时间,过去、现在的操作状态下测量记录和相应的未来预测;运行DTP、DTI的环境被称作DTE (Digital Twin Environment);其子系统、零部件的寿命预测精度。
Mussomeli等介绍了DT在制造过程中的应用。Domone指出DT技术将提高民用航空器及其子系统、零部件的寿命预测精度。西门子公司的Auweraer指出(图4)验证后的系统数字孪生模型大大加快了产品设计周期,要解决今天的产品设计和制造所面临的挑战就必须系统地采用数字孪生技术。该研究的结论有3点:① 数字孪生建模技术是现代产品设计和制造的基石,目前的主要挑战是多学科复杂系统的建模及各种建模工具的接口;② 数字孪生建模技术提供了所有位置的虚拟传感能力;③ 和完全物理模型相比,深度学习提供了一个有价值的高效建模选项。
图4 涡轮叶片气动、冷却、叶片受力、温度场和变形数字孪生模型[51]Fig.4 Digital twin model for turbine blade aerodynamics, cooling, blade stress, temperature and deformation[51]
近年来,国内针对数字孪生技术也展开了相关研究。刘大同等等对于数字孪生技术的技术体系和关键技术进行了论证,并指出了挑战和未来发展趋势。庄存波等总结了智能制造中产品数字孪生体的基本内涵,提出了产品数字孪生体的体系结构,并阐述了产品数字孪生体在产品设计阶段、制造阶段和服务阶段的实施途径。陶飞等从物理融合、模型融合、数据融合和服务融合4个维度上,分析了数字孪生车间信息物理融合的基础理论与关键技术基础。
波音信息服务(Boeing Information Services)副总裁Norén在2012年的全球飞机健康管理(Aircraft Health Management, AHM)峰会上题为“数字航空公司”(The Digital Airline)的报告中指出(图5),从波音777到波音787不到10年的时间里,每趟航班的数据量增加了超过30倍,全球航司的数据量在2010年为6.8 TB,2030年将达到至少1 000 TB;他明确提出波音的愿景:致力于为“数字航空公司”提供数字运维管理平台。汉莎航空技术公司也将数字孪生技术视为未来提高飞行器可用度的性能监控和预测维护的手段。摩天宇(MTU)的Ross给出了MTU的数字化路线图(图6),在该路线图上DT占据了显著位置,将被用来开展预测性分析和预测性维护等。罗罗正在开发基于云的数字孪生技术,利用发动机实时传感数据模拟每台发送机性能,进而减少不必要的维护和计划外停飞时间。罗罗在其最新的发动机机型上以几百甚至上千赫兹的高采样率采集建立整机性能模型所需要的数据,然后再将相关数据输入到Microsoft Azure数据云上预测关键的发动机系统动力学参数,并与发动机健康状态行为进行比较。在偏差大于设定阈值时报警,并发出相应的维护、维修提醒。截至目前,罗罗宣称其已经采用数字孪生技术避免了约5%的计划外停机。
图5 数字航空公司[55]Fig.5 Digital airline[55]
图6 MTU的数字化路线图[56]Fig.6 MTU’s digitalization road map[56]
王岭提出一种基于数字孪生的航空发动机低压涡轮单元体对接技术。刘婷等论述了数字孪生技术在航空发动机全寿命周期从设计阶段、试验阶段、制造装配阶段、到运行维修阶段的应用。吕延全研究了基于数字孪生的生产管控模式。崔一辉等通过应用实例验证了数字孪生技术在智能生产线上的实现途径。刘魁等简要论述了数字孪生技术的发展和主要驱动技术,阐述了在航空发动机运行维护中的重要意义。
总的来说,国内数字孪生技术在航空发动机故障诊断健康管理领域的应用仍在起步阶段,现阶段主要受限于一些相对简单的局部应用,在深度、广度上都还比较欠缺,系统性的工作尚未开展。
1.4.2 基于数字孪生建模的发动机诊断技术需求及未来发展方向
图7给出了采用数字孪生模型进行发动机故障诊断与预测、及维护维修决策的流程。除了尺寸及公差几何数据和材料特性等参数外,环境参数、运行工况参数都是数字孪生模型的输入。需要指出,每一台发动机都有一个自己特定的数字孪生,其几何尺寸精确反映公差值,而其环境、运行工况等也高度保真(完全吻合其真实经历的环境和工况),这样就确保了孪生模型有和发动机完全一样的输入。在全寿命周期的早期(这个阶段系统一般处于健康状态),通过反复迭代缩小孪生模型输出和物理模型输出的误差来确保孪生数字模型的精确性;在该环节,一般采用物理模型传感器信号作为系统输出。除了物理模型上安装的传感器外,数字孪生模型的任何位置都可以设置虚拟传感器。
图7 基于数字孪生的航空发动机健康管理Fig.7 Aeroengine EHM based on digital twin
如果数字孪生模型的输出和发动机产生超过指定阈值的误差时,就要怀疑是否有故障发生,而相应传感信号的差值向量(由多个传感器输出组成)则被用来决定故障类型及故障定位。故障诊断结果通过维护维修确认,故障诊断误差反馈信息则被用来对诊断方法进行修正。
数字孪生模型还可以被用来进行故障扩散机理研究,通过在维护维修过程中确认故障发生并观察故障特性(比方说裂纹的位置、走向、大小及深度等),可以在孪生模型里开展故障建模并模拟故障扩展、扩散的过程;通过与实际观察到的故障几何特性进行比较,可以完成故障的精确建模进而估计该系统、子系统、零部件的有效剩余寿命。
必须指出,孪生数字模型是一对多的,也就是说针对单台份发动机可以有多个孪生模型,每一个对应其特定的物理特性,例如可以有结构动力学模型、热管理模型等,热管理模型里又可以有空气系统和滑油系统模型。
孪生数字模型是全寿命周期模型,随着物理模型的退化一起演进;数字孪生模拟系统的健康状态,也能够反映系统的亚健康和故障状态,以及零部件更换等全部维护维修历史带来的系统特性变化。比较常见的数字孪生模型建模方法有有限单元法 (Finite Element Algorithm,FEA)、计算流体力学 (Computational Fluid Dynamics,CFD,也可以理解为流场有限单元法)、集中参数物理模型、卡尔曼滤波器和基于神经网络深度学习的建模方法。上述数字孪生模型建模方法中的FEA、CFD、集中参数物理模型是基于物理原理的建模;而深度学习则是基于输入-输出映射的纯数字模型,并不直接反映现象背后的物理原理;卡尔曼滤波器则介于物理原理模型和纯数字模型之间。
研发人员可以根据对于系统的理解程度选取相应的建模方法,对于了解很少又较复杂的系统,可以采用深度学习建模,对于原理非常清楚的系统则可以考虑采用集中参数的物理模型;对于理解程度、复杂程度居于上述两者之间的系统,可以混合神经网络和物理模型建模。当然,建模方法的选取也和输入输出测量有关系。
鉴于国内基于发动机数字孪生的故障诊断与预测基础性、系统性的工作还比较欠缺的局面,下面这几个方向应该是我们亟待努力的方向:
1) 发动机数字样机数据保障层的研究与构建
研究支撑发动机数字孪生技术的信号及数据输入,完成传感系统的架构搭建;研究先进智能的信号处理方法,实现从海量复杂的数据提取和构建系统特征的最重要信息,反映发动机各系统的实时物理特性;搭建快速可靠的数据传输网络,将这些数据快速传输给地面系统,实现数字孪生系统的实时跟踪。研究基于分布式云服务器的发动机全寿命周期数据的存储和管理技术,实现数据的高度读取和安全冗余备份,构建以安全私有云为核心的数据中心和数据管理体系。
2) 发动机数字样机建模计算层的研究与验证
研究发动机不同部件级的工作机理和特性,建立能够高度表征部件性能的数字模型或仿真模型,开展部件级试验进行模型验证与优化;研究多尺度多领域的融合建模,从不同领域视角对发动机系统或部件进行跨领域融合建模,实现不同系统接口基于机理层面的深度融合,研究能够同时体现不同长度、时间尺度以及耦合范围的多尺度建模方法,实现不同模型的有效连接。研究譬如深度机器学习和人工智能领域的技术方法等智能算法,实现发动机系统数据的深度特征提取和建模,研究多尺度多模型的方法对传感数据进行多层次多尺度的解析,挖掘和学习其中蕴含的相关关系、逻辑关系和主要特征,建立基于数据驱动的发动机模型。研究数据驱动与物理模型有效的融合方法,实现两者在原理层面的融合和互补,将高精度的传感数据统计特性与系统的机理模型合理、有效地结合起来,获得高精度的发动机数字孪生系统。
3) 发动机数字样机功能层的研究与验证:关键零部件数字孪生模型及其在故障诊断与预测中的应用
从EHM需求上来讲,整机数字孪生模型并非总是必要。有些零部件、子系统故障后果严重(例如发动机风扇叶片非包容事故),亟需基于数字孪生的零部件、子系统级故障诊断、预测解决方案。开展发动机关键部件和子系统的退化建模和寿命估计工作,建立性能退化和寿命预测高精度模型,为发动机健康状态的管理提供指导和评估依据,并开展相关性能退化和寿命试验进行零部件、子系统级的验证和优化。针对这类零部件、子系统着手开发数字孪生模型,不仅为后续的整机建模打下了基础,也提供了一个相对快速、简洁的故障诊断和预测工具。这样的从简至繁的发动机数字孪生模型开发流程从开发能力发展的角度也提供了阶梯式进步的途径。
4) 发动机数字样机功能层的研究与验证:整机级多学科数字孪生模型及其在故障诊断与预测中的应用
航空发动机是一个高度复杂的系统,涉及到气动热力和传热、机械系统(含滑油系统)、FADEC系统(含燃油系统)、短舱结构和管路、结构建模等。整机级数字孪生模型由上述相互耦合的子系统模型构成。各个子系统模型选用不同的建模方式:从传统的常微分偏微分方程、线性和非线性回归模型、线性和非线性卡尔曼滤波器、直到深度学习网络等智能建模工具,因而,整机数字孪生模型建模的难度大、复杂性高。此外,由于动力学时间尺度差异等原因,各个子系统的积分、时间步长迥异,甚至会有数量级的差异,给发动机整机级数字孪生模型求解带来挑战。针对发动机在使用过程中存在的故障和退化现象,研究其故障和退化机理,在功能层开展针对发动机整机故障建模分析、预测与诊断工作,建立发动机整机系统的故障导入高精度模型,开展基于发动机整机数字样机的仿真分析,建立发动机整机故障表征和诊断机制,并开展相关故障导入试验进行验证和优化。对于发动机中需要协同工作的复杂系统集群,开展协同执行任务的可执行性评估和个体自身状态感知,辅助集群任务的执行过程决策。在对系统集群中每个个体的状态深度感知的基础上,开展进一步依据系统健康状态实现基于集群的系统维护保障,实现发动机整机的视情维护保障。整机数字样机也提供了从发动机系统整体的角度评估故障融合策略及优化传感方案的平台。
1.5 基于知识图谱的发动机故障诊断
国内学者在应用欧美飞机发动机健康管理系统的基础上,对系统数据库的建构上取得一定成效。但是随着互联网在社会中越来越广泛的运用,面向用户的C/S (Client/Server) 结构数据库技术将不能满足当前飞机和发动机健康管理的要求,从而导致国内的民航飞机或发动机健康管理水平与国外先进技术的差距也将变得越来越大。
在飞机健康管理领域,中国民航机务维修水平跟国外发达国家有较大距离,民航机务维修的发展也相对缓慢,相对于国内机队数量及航空运营量的提升更是表现出了滞后性。这主要是由于我国目前没有独立自主研发和制造的民用航空发动机,缺少完全属于自己的EHM系统,从而难以掌握发动机运维的第一手数据,也无法及时了解到飞机的飞行情况。
反观国外,作为飞机发动机制造商的通用电气,罗罗等公司能时刻掌握到他们所卖出的飞机及发动机的运行数据,从而在飞机及发动机监控以及维修方面掌握着主动权。相对而言,作为飞机及发动机的拥有者,中国民航在这方面却处于天然的劣势,中国民航的飞机及发动机的健康管理系统还很不成熟,借助知识图谱、信息融合、深度学习、数字孪生等技术提升健康管理系统,实现对国外健康管理系统的追赶十分必要。
1.5.1 知识图谱及其关键技术
知识图谱是最近一二十年新出现的技术。以google为代表的国外互联网公司基于搜索引擎及互联网商务的需要构建了各领域的知识图谱(Knowledge Graph),我国的高校科研机构也同步在各个应用领域开展了知识图谱的构建及其应用探索。Ji等对知识图谱的基本概念、理论进展及其应用给出了一个详细的综述,并指出了未来的研究展望:① 复杂推理(Complex Reasoning);② 统一的知识表达和推理框架;③ 知识表达和注入的可解释性。Yan等对知识图谱的搭建方法进行了总结(图8),从概念提取 (Entity Extraction)、关系提取 (Relation Extraction)、知识图谱推理 (Knowledge Graph Reasoning and Inference)、知识图谱数据存储和管理 (Knowledge Graph Storage and Management)等角度展开论述了知识图谱的搭建方法。
图8 知识图谱的搭建举例[63]Fig.8 Example of knowledge graph construction[63]
知识图谱以结构化数据处理,运用三元体,点、线、面的方式表示本体之间的关系,利用关系来组织所有的对象(实体),形成有向图结构。所谓知识,指的是点或边对应的信息。知识图谱以语义分析技术为基础,以模型为核心,基于数据,利用深度神经网络、NLP (Natural Language Processing) 框架语义理解等智能处理技术对输入的字、词、篇章进行多层次、多维度的信息分析,提供可远程调用的实体抽取、关系抽取和属性抽取等算法服务接口能力。达到构建多领域知识图谱平台,服务不同行业和应用场景。
以航空发动机故障诊断和维护维修为例,其知识图谱可以通过以下步骤建立:
1) 获取大量的发动机正常或者有故障的电子履历本、发动机知识信息数据库、发动机电子化手册数据库以及其他各种发动机的故障数据源。
2) 采用机器学习方法抽取概念、关系。
3) 在专家系统里输入所有基于实际经验和机器学习方法挖掘出的发动机故障知识,构建发动机故障知识图谱。
4) 并形成基于知识图谱的推理功能。
构建完成的知识图谱就可以支撑故障诊断以及问答系统等,方便机务人员使用。
构建知识图谱的关键技术主要分为3部分:
1) 知识获取:在处理非结构化数据方面,首先要对用户的非结构化数据提取正文。当得到正文文本后,需要通过自然语言技术识别文章中的实体(也就是所谓的entity extraction),实体识别通常有两种方法,一种是用户本身有一个知识库则可以使用实体链接将文章中可能的候选实体链接到用户的知识库上。另一种是当用户没有知识库则需要使用命名实体识别技术识别文章中的实体。若正文文本中存在实体的别名或者简称还需要构建实体间的同义词表,这样可以使不同实体具有相同的描述。为了得到不同粒度的知识还可能需要提取文中的关键词,获取正文文本的潜在主题等。当用户获得实体后,则需要关注实体间的关系,我们称为实体关系识别(Relational Extraction),有些实体关系识别的方法会利用句法结构来帮助确定两个实体间的关系,因此在有些算法中会利用依存分析或者语义解析。如果用户不仅仅想获取实体间的关系,还想获取一个事件的详细内容,那么则需要确定事件的触发词并获取事件相应描述的句子,同时识别事件描述句子中实体对应事件的角色。除了非结构化数据,还会有半结构化数据方面;针对这类数据主要的工作是通过包装器学习半结构化数据的抽取规则。由于半结构化数据具有大量的重复性的结构,因此对数据进行少量的标注,可以让机器学出一定的规则进而在整个站点下使用规则对同类型或者符合某种关系的数据进行抽取。用户的数据一般存储在生产系统的数据库中,需要通过 ETL (Extract Transform Load) 工具对用户生产系统下的数据进行重新组织、清洗、检测最后得到符合用户使用目的数据。
2) 知识融合:当知识从各个数据源下获取时需要提供统一的术语将各个数据源获取的知识融合成一个庞大的知识库。提供统一术语的结构或者数据被称为本体,本体不仅提供了统一的术语字典,还构建了各个术语间的关系以及限制。本体可以让用户非常方便和灵活的根据自己的业务建立或者修改数据模型。通过数据映射技术建立本体中术语和不同数据源抽取知识中词汇的映射关系,进而将不同数据源的数据融合在一起。同时不同源的实体可能会指向现实世界的同一个客体,这时需要使用实体匹配将不同数据源相同客体的数据进行融合。不同本体间也会存在某些术语描述同一类数据,那么对这些本体间则需要本体融合技术把不同的本体融合。最后融合而成的知识库需要一个存储、管理的解决方案。知识存储和管理的解决方案会根据用户查询场景的不同采用不同的存储架构如 NoSQL 或者关系数据库。同时大规模的知识库也符合大数据的特征,因此需要传统的大数据平台如 Spark 或者 Hadoop 提供高性能计算能力,支持快速运算。
3) 知识计算及应用:知识计算主要是根据图谱提供的信息得到更多隐含的知识,如通过本体或者规则推理技术可以获取数据中存在的隐含知识,而链接预测则可预测实体间隐含的关系。同时使用社会计算的不同算法提供知识间关联的路径,通过不一致检测技术发现数据中的噪声和缺陷。
研究人员注意到知识图谱技术甄别新实体及识别实体之间关系的潜力,已经开始关注知识图谱技术在系统故障诊断上的应用前景。Sun和Wang采用基于贝叶斯理论的多层知识图谱开展了针对复杂工业系统的故障诊断。刘瑞宏等构建了电信领域知识图谱,并将电信网络领域零散的专家经验及产品、案例知识和故障数据关联,采用知识图谱推理技术进行网络故障智能诊断。赵倩提出了数控设备故障领域知识图谱构建方法,构建了数控设备故障本体模型,提出了针对结构化故障数据的知识获取方法,采用了基于模式规则的数据映射机制,最终实现并验证了该方法的有效性和合理性。张敏杰等提出了电气设备知识图谱技术组件框架,并将该框架在电力公司的变压器设备信息灵活问答、变压器故障报告自动化提取场景中进行了验证。虽然国内外研发人员已经对基于知识图谱的故障诊断开展了一些研究,截至目前,知识图谱技术在航空领域应用还非常少。
1.5.2 知识图谱在航空发动机故障诊断上的应用研究必要性
近些年民用发动机健康管理研究人员已经开始关注深度学习等智能化手段在发动机故障诊断与预测上的应用,以及基于此的维护维修决策。除了揭示已知的故障状态指示、维护和维修触发指示之间的关联并通过信息融合等手段提高诊断精度和优化维护维修决策,智能EHM还有一系列更重要的任务:
1) 搜寻目前未知的与故障发生、及最合适的维护维修时间节点相关的信息。
2) 开发基于这些新信息的故障、维护维修指示。
3) 与已知的故障、维护维修指示进行特征或者决策融合。
这一系列任务的完成就离不开知识图谱技术。如前述,航空发动机知识图谱的原始数据来源包括电子履历本、发动机知识信息数据库、发动机电子化手册数据库以及其他各种发动机的故障和维护维修数据源。发动机的故障和维护维修数据源涵盖但不限于在线EHM系统记录的数据、在翼故障诊断和无损探伤数据、外场故障诊断和无损探伤及维护维修记录、大修记录等。发动机的故障和维护维修记录数据不仅包括结构化的数据,比如维护维修技师在手持无线平台(手机、iPad等)按照系统设定好的菜单输入的选项(“Yes”或“No”,及各种相关测量值),也包括非结构化的自然语言输入。目前的深度学习、数据挖掘方法都侧重于结构化的数据。而对于非结构化的、基于自然语言的输入,则务必首先抽取概念,然后再建立概念之间的关系;这两个任务就对应知识图谱中概念(Asset)的提取及关系(Relationship)的建立。
在产品研发试制阶段及产品投入市场运营的早期阶段,开发人员对于产品在不同运营环境下的性能及故障特征并不完全了解,对于维护维修时机的把握也会经历一个学习、优化、逐渐完善的过程。知识图谱技术提供了一个快速的EHM系统性能提升和功能完善的途径,值得国内EHM研发人员重视。
1.5.3 发动机健康管理系统知识图谱的构建
在日常故障诊断与维修保养中,有些故障诊断方法对于构建发动机知识图谱能提供很好的数据源,反过来基于数据源构建的知识图谱又能有利于故障诊断的工作。这些故障诊断方法分别是以下3种:
1) 基于手册的故障诊断是通过深入分析飞机故障隔离手册和飞机维护手册的详细内容记载,构建出民航飞机及发动机的故障诊断系统模型,并以此为基础制作出一个能够实现电子化手册的管理与智能搜索、自动关联相关手册、更改和完善电子化手册内容,从而实现数据库管理的故障智能诊断系统。
2) 基于信息融合的故障诊断是将同一系统内安装的诸多传感器所获取的所有信息综合进行处理和分析,从而有效地提高决策的准确性。对于民航发动机这种复杂环境工作的复杂系统,单纯依靠单一的信息源进行故障诊断往往很难获得可信的诊断结果,引入信息融合可以提高系统故障诊断的可信度与可靠度。
3) 基于案例推理的故障诊断方法关键是运用和模仿曾经的有益经验来处理相似故障,这些“曾经有效”的故障解决方案为新的故障分析提供参考和依据。
构建发动机知识图谱的数据源主要有以下6种:
1) 用户信息库:该数据库主要是作为某种发动机机型全球使用者的有效信息,比如使用该机型的用户名称、用户主要业务,使用日期,使用时长,过程中的机型服务航线、维修信息等,总之与用户有关的常见可以公开的信息等都可以在该数据库中显现。
2) 公司信息数据库:主要是指不同的航空公司或者发动机用户等在从事航空运营中使用不同发动机机型等与发动机有关的信息,比如公司名称、公司地址、公司核心业务,公司的主要航线、飞机种类与数量、发动机的种类与数量、该公司的股东信息、财务信息以及客运货运等信息,是数据库中的核心部分。
3) 机型信息数据库:主要是指某公司或某区域或全球不同公司使用的某机型、不同机型的信息,使用户对不同发动机机型信息有初步的认知,使各使用用户,如航空公司、维修基地等对各种不同类型的发动机的使用情况掌握,主要包括不同发动机机型的基本介绍、基本尺寸、改型尺寸、安装配置、适用机型、最大推力、基本性能以及对维修间隔的特殊要求等。
4) 故障案例数据库:主要机载该型发动机在不同的运行时间、航程中的各种不同程度的发动机故障案例,包括故障发生时的航线、飞机类型、故障现象、维修方式、维修时间等,以及故障发生时统计的该故障或相似故障的发生数、处理难度、最大的影响后果等,并能采用不同检索方法进行快速检索等。
5) 电子化手册数据库:主要是将发动机不同机型的常用以及重要手册电子化以不同格式存储,用于机型培训、故障诊断等信息支持,为用户提供下载与上传等服务,发动机正常手册包括:飞机维修手册、故障排除手册、结构修理手册、图解零件目录、最低设备清单、构型偏离清单及其他修理和改装文件和不常见的适航指令、服务通告、服务信函等。
6) 知识信息数据库:主要是不同发动机机型在设计、制造、运行、维修等过程中积累的或汇集的大量运行、维修等经验,主要包括装配某种发动机的飞机不同结构与系统的常见故障以及带来的影响程度、发动机运行的常见故障以及飞机与发动机匹配运行过程中存在的问题等、记录着飞机电子系统以及自动控制系统的机载设备故障等的维修经验期及其他与维修过程中的经验、知识等。
构建发动机健康管理系统的知识图谱,有两种构建思路:首先基于已有的诊断及维护维修经验建立发动机故障专家系统,也就是初步的一个知识图谱;然后采用采用机器学习方法从大量故障数据源中抽取故障相关概念和关系,不断充实完善发动机故障知识图谱;再由发动机专家对扩充后的知识图谱验证,并进一步完善、补充。另一个思路是直接从海量发动机故障数据源通过机器学习方法抽取概念、关系,首先形成一个机器构建的发动机故障知识图谱,然后再补充发动机专家的故障知识,并进行正确性验证和分析,最终形成构建发动机健康管理系统的知识图谱。基于上述知识图谱构建的基本方法,对发动机故障中的气路故障、振动故障的少量数据进行了简单的知识图谱构建举例(图9)。实际的知识图谱网络要比图9示例复杂庞大的多,是融合了多维度信息的海量数据的关系网络图。
图9 航空发动机气路、振动故障知识图谱的搭建举例Fig.9 Example of knowledge graph construction for aero engine gas path and vibration diagnostics
1.5.4 知识图谱在发动机诊断上的应用及未来发展方向
截至目前已开展的知识图谱在故障诊断及维护维修决策的应用工作都还没有进入实际应用阶段,在民用航空方面的研发就更少。因而,基于知识图谱的航空发动机故障诊断及预测的未来研发重点需要从基础搭建开始:
1) 采用知识图谱对于现有的故障诊断专家系统进行补充、完善。现有的主力民用发动机机型故障诊断系统主要还是依赖机载传感器和在翼无损检测捕捉发动机健康状态,并开展维护、维修。EHM系统可以及时发现绝大部分发动机故障,但仍有一小部分故障未被及时发现最终酿成惨剧(例如2018年4月17日美国西南航空公司波音737客机发动机包容事故)。采用知识图谱深入分析以前未被梳理到的信号(也即知识图谱里的概念提取)、信号分析方法及数据融合得到的新状态指示(也即知识图谱里的关系提取和学习),将降低EHM漏检率和虚警率。采用在役主流民用发动机机型运维数据,针对相应主要故障失效模式、维护(水洗)和维修记录,有针对性地甄别潜在的故障指示及维护维修触发指示,并采用知识图谱技术建立更完备的故障CI集和维护维修触发指示集。
2) 采用知识图谱将维护维修及备件更换记录、航线状况等信息都纳入成为发动机EHM系统输入,对子系统和零部件健康状况进行综合评估。提取维护维修记录、航线状况语言描述里的概念,并将其和从机载传感器及在翼、离翼无损探伤和孔探等得到的结构化、半结构化、和无结构的信息进行融合,完成知识图谱推理(Knowledge Graph Reasoning and Inference),得到多角度的更准确地状态评估。
3) 建立发动机知识图谱数据存储和管理(Knowledge Graph Storage and Management) 平台。
2 航空发动机寿命管理
2.1 发动机健康管理框架内的寿命管理背景
发动机健康管理(EHM)框架内的寿命管理主要包括:发动机关键部件的使用寿命监控、寿命消耗计算、剩余寿命预测、延寿控制等,其目的是保障发动机在复杂环境和使用条件下能够安全运行。随着航空发动机技术的不断发展,寿命管理子系统逐渐成为现代航空发动机健康管理系统的一个重要功能模块。
寿命管理子系统根据发动机关键部件寿命消耗、健康监测、运行状态参数等数据信息预测发动机在翼剩余可用寿命,为发动机寿命管理和维修决策提供依据,消除潜在安全隐患和避免事故发生。民用航空发动机市场竞争激烈,必须在保障安全运行、遵守适航规章的基础上,通过科学有效的寿命管理实现发动机全寿命期维修使用成本的最优化。因此,及时准确的寿命预测、科学合理的寿命管理是实现以上目标的重要保证。
民航业对发动机寿命管理的需求主要来自6个方面:
1) 飞行安全:通过寿命管理提高机队运行可靠性和安全性,预防重大运行事件,避免运行中断,提高发动机在翼使用寿命。
2) 可靠性监控:通过准确的寿命预估实现发动机实时可靠性监控。
3) 维修决策:通过寿命管理减少不必要的在翼维护,包括航线计划性维护、特殊检查、非计划换发、振动监控等,优化维修决策,增强发动机排故技术能力。
4) 备发预测:通过可预测的送修管理,减少备发数,降低备发成本。
5) 航材管理:通过准确的机队可靠性预测改进航材与备件供应。
6) 成本分析:提高发动机大修成本预估的准确性,优化发动机修理成本。
2.2 EHM寿命管理方法
图10所示为某发动机OEM公司寿命管理及相关联的活动,在一定程度上反映了发动机寿命管理的角色、价值,以及寿命管理技术的复杂性。发动机寿命管理技术包含整机和部件两个层级。部件级寿命管理包括关键部件的使用寿命监控和安全使用寿命预测;整机级寿命管理包括发动机在翼使用寿命监控和可靠寿命预测。关键部件主要包括高能转动件和承压件,发生非包容失效时可能导致危害性,甚至是灾难性的后果。同时,这些部件使用了昂贵的原材料、经历了复杂的设计过程、采用了先进的制造工艺、承受了严格的质量控制,成本高昂。因此,民用航空发动机寿命管理必须考虑如何在保证安全的前提下,最大限度地使用关键部件的寿命,降低其全寿命期成本。
图10 民用航空发动机寿命管理及关联活动Fig.10 Life management and relevant activities of civil aero engine
2.3 国内外寿命管理研究现状及发展趋势
早期的发动机寿命管理以使用寿命检测为主。20世纪七八十年代,美国和英国的研究人员开始进行航空发动机使用监测技术的研究。英国国防部开发了发动机涡轮叶片寿命监测器,应用于鹞式战斗机。俄罗斯航空发动机中央研究院对寿命管理进行了比较深入的研究,指出基于状态的维修是支持发动机寿命管理最可靠的方法。北约研究与技术组织本世纪初推出的研究报告,介绍了涡轮发动机寿命控制及损伤消耗监测方法。美国通用电气的研究人员对燃气涡轮寿命管理方法进行了比较全面的综述,提出旋转类零件的寿命管理影响安全性,气路部件的寿命管理影响经济性,并归纳了多种航空发动机常见的寿命管理方法。美国空军有专门的“发动机寿命管理计划”来处理运营中的发动机的寿命更新与维护。美国机械工程协会在2004年的涡轮技术学术会议中专门介绍了航空发动机寿命管理。美国西南研究院的研究人员用3D有限元和概率法分析旋转件的裂纹增长,定量研究结构破裂的风险,预测发动机涡轮旋转件的寿命。
寿命消耗计算和延寿控制是寿命管理工作的重要内容。寿命消耗计算主要采用以疲劳损伤理论和断裂力学为基础的循环计数法。Wiseman和Guo专门研究了发动机延寿控制技术。在航空发动机寿命预测领域,美国、英国的研究人员率先起步,迄今已有大量研究工作。Abu等利用N/S损伤模型对航空发动机涡轮叶片剩余寿命的多种影响因素进行研究,发现分阶段氧化损伤对涡轮叶片的疲劳寿命起着至关重要的作用。Xi等通过传递矩阵变换将多维特征融合为单一监测指标,并用融合指标对航空发动机剩余寿命进行预测。Liu等以趋势单调性和失效幅值一致性为指标优劣的评判准则,并以此为目标对特征指标进行加权融合构造最优监测指标用于航空发动机剩余寿命预测。Mosallam等采用无监督信息度量从多传感器信号中选取敏感信号,再用主分量分析和经验模式分解从多源信号特征集中提取主成分衰退趋势作为健康指标,对航空发动机剩余寿命进行预测。Ragab等提出了一种基于Kaplan-Meier生存分析、同时使用时间数据和状态监测数据的剩余寿命预测方法,并将其应用于航空发动机剩余寿命预测。
发动机运行过程所经历的环境和载荷是造成发动机系统/部件失效(退化)的根本原因,因此,发动机状态和性能参数可用来表征其退化过程,建立基于状态和性能数据的剩余寿命预测模型。在基于退化数据的寿命预测建模方面,Lu和Meeker提出了用通用退化路径模型描述退化数据来估计产品的失效时间分布;Crk进一步利用多元、多重回归分析进行退化路径的参数化建模。这些基于统计的方法具有较广泛的通用性,可用于发动机性能退化建模和在翼剩余寿命预测。在基于退化的剩余寿命预测领域, Al-Dahidi等针对设备群通常经历不同的运行状态而影响状态监测数据和设备退化过程的问题,提出了一种三阶段异构机群数据剩余寿命预测方法:首先采用半马尔可夫模型将衰退过程进行无监督阶段划分,然后采用极大似然估计和Fisher信息矩估计状态空间转移参数,最后通过蒙特卡洛仿真预测剩余寿命,并将该方法应用于航空发动机剩余寿命预测。在上述退化模型的基础上,Hu等采用相关向量机、指数拟合、递归神经网络等5种模型对航空发动机剩余寿命进行预测,并采用3种加权方法将不同模型的预测结果进行融合,得到更为准确的最终剩余寿命预测结果。
发动机存在着多种潜在失效模式。多种失效模式下的可靠性寿命预测是寿命管理技术难点问题之一。早在20世纪70年代,David就提出了考虑多种失效模式的竞争性风险评估理论。Misra阐述了一个复杂系统通常存在多种失效模式,当某种失效模式发生系统就失效,而其他失效模式不再发生,将各失效模式相互竞争的现象称为竞争性法则。Teresa和Yeh研究了同时具有衰退和随机冲击两类失效模式的多态系统,认为退化过程服从半马尔可夫过程,假设两次连续状态的到达时间间隔为有限均值的连续分布,提出了基于状态和寿命的更换策略。Klutke和Yang研究了具有退化和随机冲击失效模式的系统可靠性问题,假设随机冲击服从泊松过程,而冲击力是独立同分布的随机变量。Pham和Xie提出了一种包含两个相互依赖的随机过程的检测模型,可用于具有检查和维修过程的系统安全性评估。Huang和Askin研究了假定两种失效模式相互独立条件下的竞争失效模型。Zuo等将系统按退化失效和突发失效划分为两部分,提出了一种混合失效模型。Hosseini等假定系统既存在退化失效又存在泊松失效,利用广义随机Petri网建立了基于状态的维修模型。Bunea和Mazzuchi在假设两种不同失效模式相互独立的基础上,建立了加速应力条件下的竞争失效模型。Amari和Misra研究了有序的多状态系统的动态可靠性和不同失效模式及随机冲击条件下的可靠性建模问题,并假设各失效模式相互独立。Li和Pham研究了不同失效模式及随机冲击条件下多状态退化系统的可靠性建模问题,同样假设各失效模式间相互独立。总之,对于多失效模式系统寿命预测的研究多数是在假设各失效模式相互独立基础上开展的,针对多失效模式相关的问题,特别是航空发动机多失效模式相关情况下的在翼寿命预测问题有待进一步研究。
针对寿命管理技术中的剩余寿命预测问题,根据实际使用的数据类型,将剩余寿命预测建模方法归纳为3大类(表2)。第1类为传统的可靠性分析方法,借助机队平均可靠性指标来评估个体剩余寿命;第2类为基于状态/性能数据的方法,如退化路径模型、随机过程及状态空间模型等,模型参数估计采用最大似然估计法,也有采用贝叶斯参数估计法。由于退化数据通常来自个体系统,这就使得基于退化数据来预测个体剩余寿命成为可能,特别是近几年随着系统故障预测与健康管理研究的兴起,基于退化数据的分析方法获得了广泛的关注,在理论和应用方面开展了大量的研究;第3类是基于环境/载荷数据的建模方法,这方面的研究较少,虽然PoF等基于物理模型的分析方法能够提高剩余寿命预测的精度,但物理模型建模通常建立在掌握了大量的产品设计数据的基础上,难度较大,这是影响其实际应用的主要原因。
表2 剩余寿命预测建模方法比较Table 2 Comparisons of modeling methodologies for remaining useful life prediction
国外已开展了大量的基于状态/性能数据的剩余寿命预测建模方法研究,而基于环境/载荷数据的剩余寿命预测建模方法则相对较少,有待进一步研究。现代民机状态监测系统记录的海量数据通常与结构/系统的使用环境载荷参数有关,这些数据一般具有数据量大、连续采样、多源性、动态的特点。如何充分利用这些动态环境载荷数据用于系统/部件使用可靠性评估或剩余寿命预测,已经成为当前挖掘机载“大数据”的一个新的研究方向;将对航空公司保障飞行安全、制定更高效的运营维护计划和零部件库存以及延长发动机寿命和减少意外中断事件具有重要意义。
在发动机寿命管理技术的工程应用方面,国外已经取得了很多成果,主要包括:英国国防部开发了发动机涡轮叶片寿命监控系统,并成功应用于鹞式战斗机;美、英、澳大利亚等国倡导使用的HUMS系统,对直升飞机发动机、结构等进行健康与使用监测,可以提供全时段的发动机和机械传动系统的健康信息以及运行状态,对发动机进行健康诊断与剩余寿命预测;美国普惠公司集成了多种剩余寿命预测技术,开发了一套先进的发动机寿命预测系统。美国国防部和美国国家航天局联合开发了作战飞机健康管理系统,将关键部件或系统失效的预测功能作为系统的重要功能模块,从航空安全的角度对推进系统健康监测的价值和作用进行了阐述;常用的发动机寿命管理流程(图11)涵盖了多个分析步骤,包括:初始安全寿命计算、飞行剖面定义、传热分析、应力分析、材料数据获取、低周疲劳寿命计算、分析评估、寿命限制值调整等。
图11 国产发动机寿命管理流程Fig.11 Life management process of domestically made aero engines
国内学者在航空发动机寿命预测领域虽起步较晚,但也开展了大量的研究工作,在航空发动机寿命预测的基础理论和方法研究中取得一定成果。Li等基于分布函数和广义应力—强度干涉模型计算了航空发动机的累积疲劳损伤,在应用了载荷谱分析和累积疲劳损伤理论后,通过使用N/S曲线和Miner法则来评估航空发动机一级涡轮盘的疲劳寿命。Feng等提出了一种基于核主分量分析的航空发动机剩余寿命预测方法,该方法首先利用核主分量分析对监测数据进行预处理,得到能反映衰退趋势的健康指标,而后建立了基于维纳过程的衰退模型进行寿命预测。Liu等针对部分传感器信号无法为航空发动机失效预测提供有用信息的问题,提出了一种基于熵的敏感传感器信号选择方法,选择对航空发动机衰退过程敏感的传感器信号进行寿命预测。Lu等对比了多种动态滤波监测算法在航空发动机气路状态监测中的应用效果,对比结果显示,约束扩展卡尔曼粒子滤波能够更准确地从测量值中估计发动机气道的运行状态,从而更适用于发动机气道的状态监测。在基于机器学习算法的寿命预测研究方面,Yuan等基于长短期记忆神经网络提出了一种航空发动机的剩余寿命预测方法,与传统方法相比,取得了较高的预测精度。南京航空航天大学的胡昊磊等运用性能退化可靠性理论和随机过程方法分析发动机性能退化过程,运用威布尔分布建立基于随机过程的模型来预测民用航空发动机整个机队的平均寿命,为维修规划提供依据。任淑红等、周玉辉和康锐分别进行了基于带漂移的布朗运动模型预测民航发动机实时性能可靠性和基于退化失效模型的旋转机械寿命预测方法的研究。
在发动机寿命预测、关键部件寿命消耗监控等研究方面,张逸民等在1981年通过数理统计方法分析航空涡轮发动机翻修可靠性与寿命。吴学亮等以英国斯贝MK202发动机为例,介绍了西方国家军用航空发动机的现行寿命控制方法,阐述了控制关键零件使用寿命的意义。洪杰等设计了航空发动机关键件使用寿命监视系统。寿命管理流程包括:通过飞行参数记录飞行剖面数据,跟踪航空发动机关键零部件的寿命消耗,对其使用寿命进行监控,对剩余寿命进行预测,确定维修方案(图11)。
针对发动机等高可靠性、高成本产品普遍存在的失效数少、样本数不足问题,傅惠民等建立了不同状态间不完全数据的损伤折算公式,实现了极小失效数据条件下的可靠性评估和寿命预测。国内学者在小样本无失效数据的可靠性分析及寿命预测领域开展了大量研究工作。李伟认为,由于航空发动机的系统复杂性,可能同时存在突发失效和退化失效两类失效模式,提出了基于竞争失效的发动机可靠性分析思路。南京航空航天大学王华伟等根据失效模式特征将航空发动机的失效划分为性能失效、结构强度失效及突发失效3大类,针对不同失效模式特点,分别采用Gamma过程、Wiener过程和Weibull分布模型建立不同的发动机可靠性及寿命预测模型。
2.4 发动机寿命管理发展趋势
综上述,国内发动机关键件寿命预测及损伤评估、整机在翼剩余寿命预测、寿命预测算法开发及验证等各个方面距离世界先进水平还有差距,亟需在关键性的寿命管理技术及算法上开展研发。航空发动机寿命管理技术的未来主要需求是:
1) 发动机关键部件的寿命监控与寿命预测趋于数字化、智能化、实时化。
2) 大数据环境下的寿命监控、寿命预测依赖多元数据融合的方法(图12)。
图12 大数据环境下的寿命预测Fig.12 Remaining useful life prediction using “big data” approach
3) 发动机维修策略由被动式维修、预防性维修发展到视情维修、预测性维修,未来将趋向于智能化维修,对健康管理系统框架内的寿命管理技术提出了更高要求。
3 航空发动机智能维护维修决策
3.1 研究背景
国内外航空发动机维修管理模式总结归纳可分为总翻修寿命与定时翻修寿命、单元体视情翻修的两种维修管理体系。总翻修寿命与定时翻修管理体系,整机采取定时翻修的模式,这种模式下总寿命和翻修寿命均较短,经济成本非常高。单元体视情翻修管理体系,没有总寿命和翻修次数的限制,通常将翻修的经济成本寿命作为发动机总寿命的终结点。这种模式下每台发动机和关键零部件发挥了最大的寿命潜力,其经济性较好。无论从科学性、安全性和经济性角度,单元体视情翻修管理模式比总翻修寿命与定时翻修寿命体系具有明显的优势。
总体上,欧美先进国家的先进军民用航空发动机均已发展进入单元体视情翻修管理体系,特别是近几年来,伴随预测与健康管理 (PHM) 理论与技术逐渐应用于新一代先进发动机,进一步促进了发动机视情维修策略的落地和成熟。在此基础上,国外发动机主制造商进一步提出了“发动机“智能维护”的理念,其特点是利用工业人工智能技术挖掘海量运维数据,用于“智能维护”决策支持。
3.2 国内外研究现状及发展趋势
3.2.1 基于健康管理的发动机单元体视情维修模式设计
纵观欧美航空发动机的寿命管理,经历了由修复性维修 (CM) 向定时维修(TBM)、由定时维修向视情维修 (CBM) 的发展过程。早在20世纪70年代基本上完成了“机群寿命管理”向基于循环寿命监控为核心的“单机寿命管理”过渡。西方国家对关键件有循环寿命指标要求的航空发动机,均加装了历程记录仪进行单机寿命监控。在单机寿命监控与状态监测基础上,实现了发动机的视情维修。随着视情维修技术的发展,以预测维修为代表的CBM+(Condition-Based Maintenance Plus) 技术已在航空领域开始应用。在此背景下,一些先进的理论与技术,如预测与健康管理(Prognostics and Health Management, PHM)、扩展的基于状态的维修(Condition Based Maintenance plus, CBM+)、自主保障(Autonomic Logistics, AL)等在欧美等航空发达国家得到了长足的发展,并正被新一代发动机所采用,是实现其经济可承受性和自主式保障的关键,成为当今世界上先进军用和民用航空发动机发展的重要标志。基于单元体的视情维修体制也成为国外四代机发动机维修保障模式发展的一个重要趋势。
国内在民机PHM维修模式方面有一定研究基础,而在RCM/MSG计划维修任务分析基础上,融合民机系统PHM技术,实现基于PHM的发动机视情维修模式设计方面的研究刚刚起步。
3.2.2 发动机在翼技术状态管理与下发时机预测
发动机在翼技术状态管理的工作主要包括发动机状态监控、发动机水洗和发动机故障诊断与部件更换以及下发时间管理等。目前,对于发动机状态监控主要包括两方面的工作,一是发动机性能参数的监控,主要包括飞机起飞和巡航阶段的发动机参数;另一方面的工作主要包括日常的维修检查和勤务,主要内容是目视或详细目视检查、孔探检查、无损探伤检查、滑油消耗量检查与记录、清洗发动机等。
送修时限预测可分为直接法和间接法两种。直接法是首先分析影响送修时限的各个因素并分别确定各单因素对应的送修时限,然后再取其中的最小值作为发动机的最终送修时限。间接法不直接采用各影响因素进行送修时限预测,可将影响因素分为四大类:故障状态、时间状态、性能状态和初始状态,通过权值函数将各个因素的指标值转化为权值,再根据权值计算故障测评值、时间测评值、性能测评值、初始测评值及各个因素对应的送修时限,最终得到综合测评值及综合送修时限。送修时机优化属于组合优化问题。与函数优化问题不同,由于“组合爆炸” 很多组合优化问题的求解非常困难。发动机拆换率不均衡是国内外所有航空公司面临的共同难题。大幅度变化的拆换率会带来以下3方面的严重问题:大大增加库存成本;在拆换高峰季节很难找到租赁发动机,尤其是夏天,容易因缺发造成飞机AOG (Aircraft On Ground),带来巨大经济损失;拆换率不均衡还会引起 TAT (Turn Around Time)时间过长,维修厂负荷过重,发动机维修不能按时正常返回。
3.2.3 发动机返厂维修工作等级与范围决策优化
维修工作范围直接影响着发动机的维修成本以及修后性能。美国通用电气公司 (General Electric,GE)根据多年的发动机设计经验及运维数据建立了基于巡航趋势偏差的维修工作指南,该成果已应用于对CF6、GE90、CFM56系列发动机的维修决策中。AerData公司开发EFPAC软件能针对特定的送修间隔,综合民航发动机自新时间和健康状态等因素对维修 工作范围进行优化,并对优化得到的维修工作范围的成本进行预测。此外,各民航发动机制造商还编制了维修工作范围制定指导文件,比如普惠公司的维修计划指导(Maintenance Planning Guide,MPG)、CFMI公司的工作范围计划指导(Work-scope Planning Guide,WPG)等。
目前国内研究发动机维修等级决策方法主要是通过建立发动机监测参数与维修等级的关系的模型,从而给出在一定维修目标下的发动机维修等级。梁剑针对发动机送修等级决策问题,引入变精度粗糙集理论挖掘发动机状态-送修等级决策规则。提出了基于变精度粗糙集理论的信息熵启发约简算法以改善对知识不确定性信息的描述,给出了发动机送修等级决策优化方法。张海军应用变精度粗糙集理论研究了发动机状态信息与单元体性能参数之间的关系,提出了一种基于信息熵属性约简的航空公司发动机维修等级决策方法。张海军等基于民航发动机的状态监控信息,提出了采用变精度粗糙集 (Variable Precision Rough Set, VPRS) 理论方法来挖掘反映送修等级和状态参数之间内在关联性的决策规则。郑波为降低航空公司维修成本,增强送修等级决策科学性,研究并提出基于PSO-SVM的民航发动机送修等级决策算法。付旭云和钟诗胜将发动机各单元体各维修级别能够恢复的整机性能值表示为一个梯形模糊数,建立单元体性能恢复值分配优化的模糊机会约束规划模型。付旭云等建立了确定条件下和不确定条件下以维修成本最小为目标的单元体性能恢复值分配优化模型。
3.2.4 基于状态监控的发动机使用维护流程与决策支持系统
20世纪90年代以后,随着神经网络等人工智能方法的成熟发展,美国空军研究实验室和英国航空公司等将气路诊断和其它诊断技术相融合开发了相关发动机维修决策支持系统。美国普惠公司的研究人员开发一套集PHM的喷气发动机寿命预测系统并带有对关键件的寿命跟踪和维修决策功能。Jardine等开发了基于CBM技术的装备维修优化与定寿、延寿决策软件EXAKTtm,并被波音、空客、RR、NASA等公司应用。
近几年随着网络、大数据以及人工智能技术的发展,网络化的发动机健康管理系统是新的发展趋势。监控数据由飞机ACARS系统实时传输给发动机OEM,由厂家和航空公司同时对发动机状态趋势进行监控分析,跟传统的用户独立监控方式相比,OEM与航空公司共同监控可加强对发动机性能趋势监控的力度。除OEM外,目前一些第三方的维修企业也可提供类似的网络化发动机健康监控服务,如MTU的“ECM@MTU”系统、EZECM的“EMMPowered”系统,第三方系统对所有发动机型号,其输出均为统一格式,非常便于用户记录数据,这对运营着多种机型的机队用户来说非常有利。
国内开发的航空发动机健康管理与维修决策支持系统,可以对发动机的拆发时间、单元体维修级别以及维修工作范围等进行决策;开发的民航发动机全寿命管理系统,通过采集、管理、处理并预测在翼航空发动机的性能参数,为航空发动机性能仿真和维修策略的制定提供决策支持; 开发的发动机性能预测与维修成本控制系统、民航发动机集成维修管理系统,实现机队维修信息的统一管理、决策的综合分析以及资源的合理配置; 开发的机群视情维修调度软件系统将发动机机队的计划调度和维修成本实现了自动寻优计算,提高发动机工程管理和梯次调度的效率。除了维修决策支持系统的开发外,对多个方面的航空发动机维修决策内容进行了研究,为发动机维修决策支持系统的开发和完善提供了技术支撑。国内在视情维修决策技术研究和系统开发方面基本处于刚刚起步阶段,还没有完备的发动机智能计划和动态调度的软件。
3.3 基于健康管理的视情维修设计未来发展方向
基于健康管理的视情维修设计优化方法的研究内容包括5项,如图13所示:① 基于健康管理的视情维修模式顶层设计方法研究;② 面向外场运营和维护数据的多源信息管理方法研究;③ 基于智能优化和多源信息融合的发动机在翼技术状态管理方法研究;④ 基于智能优化和多源信息融合的发动机离翼维修决策方法研究;⑤ 基于健康管理信息融合的发动机使用维护流程和方法研究。
图13 基于健康管理的视情维修设计优化方法Fig.13 EHM-based MRO
3.3.1 顶层设计方法
图14给出了基于健康管理的航空发动机视情维修设计优化方法总体技术路线。发动机视情维修工程分析框架与流程如图15所示,基于传统RCM/MSG-3维修任务分析框架基础上,考虑融入PHM监测的发动机维修任务分析。在RCM/MSG-3的流程基础上,将基于PHM监测的检查方式增加到下层逻辑分析过程,并考虑利用先进的机载监测传感器和维护系统代替人工操作检查或功能检查,节约维修工时和成本。
图14 基于健康管理的视情维修决策技术总体研究路线图Fig.14 Overall research path map for EHM-based MRO
图15 设计阶段:基于RCM/MSG分析的视情维修任务制定流程Fig.15 Design phase: condition MRO planning based on RCM/MSG analysis
3.3.2 面向外场运营和维护数据的多源信息管理
发动机健康状态、寿命评估及维修决策相关的信息存在于多种数据源中,除其材料、设计、制造数据资源外,还包括在线传感器监测数据、离线检测/检查报告、维修历史记录、故障记录和大修报告等。发动机视情维修决策依赖于从这些多源异构、不同时间尺度的 数据中充分挖掘出发动机健康状态及典型结构件(盘、轴、机匣等)寿命相关的信息。多层级、多模态、全过程的集成数据模型是建立实现航空发动机全寿命运维数据集成管理的基础。推荐以BOM (Bill Of Material)为主线组织发动机外场使用与运维中涉及的众多数据,将各阶段产品数据关联起来并对其进行管理和控制,从而保证产品数据一致性和有效性。BOM 集成原理如图16所示。
图16 航空发动机多BOM 集成数据模型Fig.16 Integrated multi-BOM digital model for aero engines
3.3.3 基于智能优化和多源信息融合的发动机在翼技术状态管理
在翼技术状态管理是保障飞行安全并延长发动机在翼寿命的关键,包括:① 融合气路/振动/滑油等多路健康监测与诊断信息的发动机外场故障隔离;② 发动机单机在翼使用时间的预测与主动管理;③ 发动机机队送修时机优化与备发预测。
1) 基于多源健康信息与智能算法与的发动机外场故障隔离推理方法研究
用贝叶斯多源信息融合方法实现发动机多源数据的关联性分析和深度挖掘,以常规的气路可测状态参数为主,而其他状态监控信息或经验信息则以先验信息的形式引进气路分析,借助多模态深度学习架构实现多源信息的融合与故障智能推理,提高发动机故障定位的准确性。
2) 发动机单机在翼使用时间的预测与主动管理
发动机整机在翼使用寿命主要取决于两个关键因素,即发动机关键件的寿命损耗、性能衰退状况。而整机性能退化具有较大不确定性,因此为准确预测发动机下发期限,在考虑系统单个参数之间的相关性的基础上,分别研究基于单参数(如EGTM)、多参数如(DEGT、DN2、DFF、AOC等)的航空发动机性能退化可靠性模型和基于系统健康指数的发动机剩余寿命预测与可靠性评估方法。研究上次送修等级、运行环境、减推力起飞以及外场维护等维修活动,对发动机性能衰退的影响机理,建立基于多源信息融合的性能衰退剩余寿命预测方法。
3) 基于排序理论的发动机机队送修时机优化与备发预测
① 基于排序理论的发动机机队送修时机优化方法。发动机机队维修保障成本是调度方案、备用发数量、计划期长度和保障率等相关因素的函数,其中调度方案又是排序规则、梯次使用和发动机在翼寿命的函数。在分析发动机拆换历史记录基础上,依据机队发动机平均送修间隔和一定的备发数量、计划期长度等情况,以保障率为约束条件,研究排序规则对中长期机队保障成本的影响,选择最优送修方案,在此基础上进一步优化方案以均衡机队下发率。
② 基于仿真模型的机队发动机备发预测方法。建立发动机备件预测仿真模型,模型使用最大似然拟合历史时间间隔数据和当前机翼数据的组合,首先采用发动机的平均拆换率来参数化一个概率分布以实现仿真的输入。进一步,构建发动机送修等级函数以及发动机的修理周期分布函数,考虑修理车间的容量限制和机队规模等因素,仿真出每天的备件数量。最后根据保障率水平的指标确定机队的备发件数,将其作为发动机备件数量的重要参考。
3.3.4 基于智能优化和多源信息融合的发动机离翼维修决策
1) 基于限寿件及硬件损伤的最低维修范围
由于发动机各部件之间结构和功能上关联性和复杂性,单机维修范围的合理确定需建立在精确的故障诊断以及单元体健康状态准确评估的基础上,首先满足限寿件以及其他硬件损伤修复的基础上确定最低维修等级和范围,进一步根据航空发动机性能恢复要求,以单机最低维修范围为基础,确定各单元体的维修等级,从而实现单元体维修决策的精确化和发动机维修的整体最优化。
2) 送修目标导向的发动机维修工作范围优化
标导向的发动机维修工作范围优化流程如图17 所示。航空发动机维修工作范围包括其各组成单元体的维修级别、寿命件的更换清单、附件工作指令等内容。由于更换的寿命件清单、附件工作指令等内容的确定方法相对简单,因此,航空发动机维修工作范围优化主要指的是其各组成单元体的维修级别的优化。
图17 航空发动机维修工作范围智能优化流程Fig.17 Intelligent optimization of aero engine MRO work scope
4 结 论
EHM的终极价值是通过智能视情维护维修保证乘客和机组人员的生命财产安全从而提供优质的客户体验、保证发动机机队最大的可用率和最小的备发率、优化航司的运维成本从而提高盈利率,这主要是通过“下游”的地面综合诊断、寿命管理和智能视情维护维修决策3个模块实现。以GE、P&W、RR为首的国外OEM都将EHM视为核心竞争力,并纷纷推出全包服务方案;此外,三大OEM最近都在智能视情诊断与预测及维护维修决策上发力,希望进一步扩大其在OEM市场的份额和优势,这给国内的民用发动机OEM带来了极大的竞争压力和研发动力。本综述重点讨论了EHM“下游”3个模块地面综合诊断、寿命管理和智能视情维护维修决策的需求、必要性、现状及未来发展趋势和热点技术。包括基于深度学习、数字孪生模型、知识图谱的故障诊断与预测、寿命管理、维护维修决策,都进行了讨论。
致 谢
中国航发商用航空发动机有限责任公司马晶玮、刘虔、邵传金、凡非龙等为本文撰写提供了帮助;西安交通大学赵志斌老师在投稿、退修过程中提供了协助,在此一并表示感谢。