基于逻辑回归的民机空调系统状态退化评估
2018-10-11李超役吴鑫睿孙见忠
岳 霆,李超役,吴鑫睿,孙见忠
(1.东方航空技术有限公司, 上海 200000; 2.南京航空航天大学 民航学院, 南京 210016)
飞机空调系统作为飞机的重要子系统直接关系到飞机驾驶舱、旅客舱、设备舱及货舱的环境,影响驾驶员和乘客的正常工作条件和生活条件、设备的正常工作及货物安全。根据某航空公司年度可靠性报告,飞机系统故障发生次数高居飞机总故障第二位,而其重要子系统空调系统故障次数占到总故障数10%以上。空调系统故障不仅影响飞机飞行安全而且直接影响到飞机的派遣放行,导致航班延误甚至取消,给航空公司带来巨大的经济损失。该系统属于非线性的多变量控制复杂系统,系统的故障定位、诊断和排除工作困难,一直是民航领域航线维修的难题。
现代民机状态监控系统记录了飞机系统运行期间的环境、载荷、状态和性能等数据,数据保存在快速存取记录器( Quick Access Recorder,QAR) 中,记载了丰富的系统健康状态相关飞行数据信息,不仅可用于飞行品质监控和评价,还为系统故障监测与诊断提供了丰富的数据源。从数据挖掘的角度,应用QAR数据进行民机系统故障诊断和预测,辅助机务人员完成预防维修工作,对于切实保障飞机的运行安全性、使用性、经济性和准点率具有重要意义。建立基于QAR数据的民机系统模型是进行故障诊断和预测的一种有效方法[1-2]。随着数据采集成本的降低以及提高民机运营安全、降低运营成本的目的,现代大型飞机采集的状态参数越来越多。数据上的保障使得近年来国内外很多学者及机构对飞行数据展开了大量研究。文献[1-2]分别利用多元状态回归以及EWMA的方法对民机引气QAR数据进行了分析研究,对引气性能进行监控。文献[3]对利用某机型QAR数据对飞机着陆阶段出现的QAR超限事件进行了分析,以此诊断可能触发该QAR超限事件的高风险区域。文献[4-5]利用QAR数据对某机型巡航阶段燃油流量进行了建模,对飞机性能进行监控,但这些研究仅考虑单一因变量的回归模型,没有提及异常监测方法。文献[6-9]对飞行数据采取了特征提取、信号处理、聚类等方法对飞机实施健康监测,这些方法主要考虑单变量的情况并没有考虑多变量。文献[10-11] 提出了一种基于模型和数据驱动的环控系统热交换器飞行前故障评估的故障诊断方法。文献[12]利用飞行记录仪中所记录的数据加以卡尔曼滤波去噪对飞机的飞行状态进行识别。这些文献充分说明飞机在运行中所采集的实际数据对于飞机自身健康评估、故障检测、预测以及诊断都有巨大的帮助。
空调系统内布局了大量的传感器,理论上可以获取大量的飞行数据,但实际上,传感器得到的大量飞行信息并没有保存到QAR 中,无法对大量在线参数进行数据挖掘.为了给航空公司维修人员提供更多空调系统状态监测参数系统信息,帮助排故。国内某航空公司根据波音的改装经验,将空调传感器连接到DFDAU空调系统,增加了3个关键传感器参数到飞机状态监控系统( Aircraft Condition Monitoring System,ACMS),数据保存在快速存取记录器(QAR) 中,为飞机空调系统异常检测与维修决策提供了丰富的数据源。但是由于国内关于民机空调改装还未普及,改装飞机数量少,针对相关改装参数的数据分析方法以及研究手段都还处于空白阶段。因此,研究如何通过收集和分析空调系统目前可利用监测数据来对系统健康状况进行评估,对保障飞机的运行安全性、使用性、经济性和准点率有重要意义。
1 空调系统在线监测参数分析
1.1 空调系统概述
飞机空调系统是保证飞机座舱和设备舱内所有乘员和设备正常工作所需的适当环境条件的整套装置,是现代民用飞机必不可少的一个组成部分。现代飞机空调系统(ACS)主要功能是满足舱内加热、冷却、增压、通风和湿度调节的要求。空调系统从功能上讲主要有组件流量控制、组件制冷、区域温度控制、再循环以及空气分配五个部分。来自气源系统的新鲜空气通过左右两个流量控制与关断活门进入空调系统,该活门控制进入飞机的新鲜空气的量。新鲜空气进入制冷组件后被降温和抽湿,再进入空调分配系统。对左组件的控制通常可保证驾驶舱制冷,而对右组件的控制则保证对混合总管制冷。来自组件和地面空调接口的空调空气通过分配系统进入温度控制区域,区域温度控制部分为进入用户区域的空调空气加温并调节气压。选择系统中故障最多的制冷子系统展开研究。制冷系统的关键部件包括:流量控制与关断阀门(FCSOV)、热交换器(主/次)、空气循环机(ACM)、回热器、冷凝器、水分离器、冲压空气系统。其工作原理如图1所示。
引气通过FCSOV进入主交换器,主热交换器通过冲压空气将引气降温,冷却的空气就进入ACM的压缩机部分。冷却引气经ACM压缩,压力和温度升高,高温压缩空气回到次热交换器,再次通过冲压空气降温。冷却空气再经水分离管除湿后,首次进入再加热器,在高温部分被来自冷凝器的冷空气(低温部分)预冷却,引气再次进入再加热器时,在低温部分被高温部分再加热,再回到ACM的涡轮部分。在ACM涡轮里,压缩热空气膨胀做功,温度降低,被送到冷凝器低温部分,被再加热器高温部分出来(进入冷凝器的高温部分)的空气加温后进入空调组件的分配系统。
1.2 空调系统在线监测参数分析
空调系统有关的监测数据是飞机采集组件记录下来的用于描述工作状态的参数的集合。性能参数主要有空调系统主管道压力、出口温度、环境载荷参数、航空发动机N1和N2转速、飞行高度、飞行速度、空调组件开/关状态、大气温度等。这些参数是空调系统性能评估与故障监控的主要输入信号。除去这些主要的性能参数,空调系统内还布局了大量的传感器,能够对空调系统内部一些温度信息直接进行采集并存储。例如,制冷子系统内部3个关键温度传感器:冲压温度传感器、组件温度传感器、混合总管温度传感器。传感器位置分别如图2所示。
空调系统在实际工作中会受到外界环境以及内部因素的影响,仅仅只对与空调系统直接相关的温度、压力参数等进行分析不能够充分反应空调系统的工作状况以及健康状态。根据航空公司相关工程师的建议以及信号统计的知识,最终选择了大气静温、总温、航空发动机N1和N2转速、飞行高度、飞行速度、空调组件开/关状态等12个参数作为空调系统健康监控辅助参数,同冲压空气温度、组件温度、混合总管温度三个主要监测参数共15个参数共同组成空调系统健康监控参数集,如表1所示。
表1 空调系统监测参数集
2 逻辑回归理论
2.1 逻辑回归模型
逻辑回归模型作为广义线性模型类别,属于概率性回归,主要用来推断两分类或者多分类应变量与多维解释变量的关系。由于常规情况下最小二乘法模型的不适宜性,对于二分类因变量的分析通常采用非线性函数。对于二分类,事件发生的条件概率P(yi=1|xi)与解释变量xi之间通常单调,因此,通常其值域是在(0,1)区间的一个S形曲线。类似于一个随机变量累计分布曲线,最常用的函数是逻辑分布。
(1)
由式(1)可得到:
P(yi=1|xi)=P[(α+βxi+εi)>0]=
P[εi>(-α-βxi)]
(2)
假设式(2)中误差项εi为逻辑分布,则有:
(3)
上述函数称之为逻辑函数,其分布为S型。下面将逻辑函数转化为逻辑回归模型,式(3)变为:
(4)
即可得到事件发生条件概率的回归模型:
(5)
式(5)中,Pi为第i个事件发生的概率。
2.2 逻辑回归模型参数估计
线性回归的参数估计通常会用到最小二乘法,逻辑回归为非线性模型,在文中采取最大似然估计法(MLE)对模型中参数进行估计。估计前首先要建立似然函数。假设有N个观测值组成的整体Y1,Y2,Y3…YN,从中抽取n个样本y1,y2,…,yn。设Pi=P(yi=1|xi)为yi=1的条件概率,则yi=0的条件概率P(yi=0|xi)=1-Pi。则观测值的概率为:
P(yi)=Pi(1-Pi)1-yi
(6)
上述各观测值相互独立,因此其联合分布可表示为:
(7)
(8)
这时,假设有m个训练样本,即m个解释变量x1,x2,x3,…,xm能够表示Y的取值为0或者1,那么采用极大似然估计法可以求得逻辑回归的系数,令InL=0,即可求得β1,β2,…,βm。
3 案例验证
为了验证所提方法的可行性,利用国内某航空公司所提供的4架飞机实际外场QAR数据来进行分析。
3.1 数据预处理
文中1.2节提出了围绕空调系统健康监控所建立的由15个参数组成的监控参数集。飞机在一次完整的飞行中(包括:地面、起飞、爬升、巡航……)由于不同工况,系统所处工作环境的不同使得各参数的变化非常明显,图3所示为一次完整飞行中N1、N2、PKT、MFDT等参数的变化情况。从图3可以明显看出,在不同飞行工况下,各参数均有较大的变化。因此,想要对空调系统展开精确的健康监控,必须针对特定工况,选取特征参数,才能取得一定的监控效果。
此外,为了增加监控的针对性以及提高监控效果准确率,选择空调系统中故障率较高的热交换器展开研究。一方面是因为热交换器作为空调系统主要部件,其故障率在整个系统中一直处于前列;另一方面,在空调系统主热交换器和次热交换器之间设置有冲压空气温度传感器,能够记录从主热交换器出来的气体温度。在确定好监控对象之后,接下来就是特定工况下特征参数的选择。当飞机在地面以及襟翼未收起的飞行阶段,冲压空气门处于全开位置,通过增大冷空气的供应量增加热交换器工作效率,降低压缩机出口温度。在在冲压空气门全开的固定条件下,压缩机温度的变化只受到散热器以及ACM压缩机的影响,但两者的影响机理完全相反,当散热器出现性能退化或者故障时,会降低气体热交换效率,造成压缩机出口温度升高;当压缩机发生故障时,会降低气体压缩效率,造成温度降低。在上述特定条件下压缩机出口温度能够表征空调系统热交换器工作状态的最佳参数,因此,特定工况的选择最终确定在冲压空气门全开情况下的起飞阶段发动机排气温度值达到峰值时各传感器所记录的参数值作为特定工况下的特征参数。此外,为了排除其他因素对监控结果造成的影响,以压缩机出口温度为核心,选择与该参数相关系数大于0.7的参数作为逻辑回归的解释变量,各参数相关系数如表2所示。
表2 参数相关系数
3.2 训练样本选择
在3.1节已经介绍过验证所用数据取自于国内某航空公司提供的4架飞机2016年一年完整的数据。根据表3可知,飞机A与飞机C在2016年1月17年1月分别出现了一次热交换器故障,而飞机B与飞机D则没有出现热交换器故障。因此,打算选取飞机A和B有用的数据作为训练样本,求解逻辑回归模型中的位置参数,然后利用飞机C和D的数据验证模型的准确性。
表3 4架飞机热交换器维修数据
在训练逻辑回归模型的时候,上文已经确定了利用SAT、TAT、MFDT以及RAMT四个参数作为自变量X。接下来就是要定义不同自变量所对应的系统退化程度,即对应的P值。根据飞机A和飞机B的维修记录,可以将热交换器维修前10天QAR所记录的数据定义为故障状态,与之所对应的P值为1;然后将热交换器维修过后QAR所记录的数据定义为健康状态,与之所对应的P值为0.01。用逻辑回归模型表示即事件发生的概率(热交换器故障):
P=Pr(Y=1|X1=x1,…Xn=xn)=
(9)
此外,为了使所选择的热交换器健康状态数据更加全面,采用了样本向量排序法从飞机A和飞机B中选择400组数据作为训练样本:
因为训练样本中各自变量的量纲均不相同,不同参数绝对值相差很大,为了提高建模精度,需要在选择训练样本之前对参数进行标准化处理。其中各自变量均按照式(9)处理:
nxi(tj)=(xi(tj)-μi)/σi
(10)
式(10)中:μi和σi分别是第i个参数序列的均值和标准差。由下式得到:
(11)
(12)
3.3 模型训练与测试
将400个训练样本对逻辑回归进行训练,得到模型中的未知参数值,即式(9)中的β0,β1,β2,β3,β4的值。结果如表4所示。
得到逻辑回归模型:
在得到逻辑回归模型后,就可以进行下一步的案例验证。为了对热交换器的性能退化做出一个形象的描述,定义一个性能指标参数H来描述热交换器的退化程度,其中H=1-P。根据逻辑回归的定义,可知H=1时表示数据样本对应的设备处于健康状态;H=0时表示数据样本对应的设备处于故障状态。
首先从飞机C开始验证,将飞机C的数据输入到逻辑回归模型后,计算得到不同自变量所对应的故障发生概率以及设备的性能退化参数H,如图4所示。图4中横坐标表示飞行循环,纵坐标表示性能退化参数H。从图4可以明显看出,飞机C的热交换器在第500飞行循环左右开始出现性能退化,随着时间的推移,退化愈发明显,到第760飞行循环左右,热交换器性能退化指标的参数H已接近0,表示热交换器已经出现故障,但是由于空调系统各部件具有互相补偿机制,还未引起系统报警。该飞机在第806飞行循环发生了驾驶舱PACK灯亮的故障现象,航后经过工程人员排故,确定了热交换器故障并进行了维修活动。从图4也可看出,经过维修后,热交换器性能退化指标的参数H立刻回到表示健康状况的“1”附近。
此外,从图4可以看出,虽然能够明显看出热交换器性能退化指标H在第500到第800循环出现退化,但是在这期间H指标数据波动幅度较大,较为杂乱。可能由于空调系统运行中一些不确定因素和随机干扰(例如传感器测量误差等)所造成。为了消除误差,采取了汉宁窗的数据平滑处理方法对H进行平滑处理,窗口宽度N=80,处理后H指标如图5所示。
从图5可以明显看出,经过平滑后的指标H能够更为清晰的显示热交换器的退化过程。为了更为直观的反应热交换器的健康状况,将其分为健康、亚健康、异常与故障四种退化状态,与之对应的H指标范围分别为:健康[1,0.9];亚健康(0.9,0.5];异常(0.5,0.1];故障(0.1,0]。如图5所示,飞机C分别在第608、第664与第733飞行循环进入到亚健康、异常与故障状态,可以提前73飞行循环检测到热交换器进入到故障状态,在检测到异常后,可以合理安排热交换器维修时间,避免由于空调系统热交换器故障导致非计划维修。
图6所示为飞机D平滑后热交换器性能退化指标H随时间变化情况。从图6中可以明显看出,飞机D的热交换器性能退化指标H一直在“1”附近波动,说明了飞机D的热交换器一直处于健康状态,结合飞机D在该时间段内热交换器无维修记录证明了方法的有效性。
4 结论
1) 基于逻辑回归模型的热交换器状态退化评估能够很好的反应热交换器自身的工作性能,当热交换器出现性能退化时,其性能退化指标H会逐渐偏离“1”且越来越大。
2) 通过合理的故障报警阈值的设置,可以在热交换器由于性能退化最终引起空调系统故障前提前监测到异常,实现“风险关口前移”,在此期间合理安排维修时机,避免非计划维修,实现热交换器的视情维修。