改进模糊C 均值的客机空调系统退化评估算法
2021-03-31丁建立方正汉
丁建立,方正汉
(中国民航大学计算机科学技术学院,天津300300)
大型客机空调系统的作用是使飞机在不同的飞行状况和外界条件下,维持驾驶舱、客舱、电子舱及货舱环境参数的稳定。良好的座舱环境不仅可以为乘客、机组人员提供舒适的工作生活条件,也能保障货物安全、设备正常运行。飞机空调系统属于多维复杂系统,故障原因多样,在故障定位、诊断和排除等工作上一直存在着诸多难题[1]。在过去的空调系统维修过程中,一般按工卡,定时进行部件的更换或维修。但因飞机的运营环境不同、新旧程度不同,根据经验确定拆换周期会导致在实际维修中未出现故障的部件遭到过度修理,或部件提前出现故障未得到及时修理而影响飞机的运营[2⁃3],造成维修成本的提高,降低了飞机部件的利用率。
随着航电系统的发展,很多大型客机如波音787、空客A320 和A350 等都安装了宽带光纤网络和大量传感器、控制系统,产生了海量数据。飞行数据快速存储记录器(Quick access recorder,QAR)数据在基于大数据的飞机健康管理系统中得到了广泛的应用[4]。QAR 可以连续记录长达600 h 的飞行原始数据,对1 000 多种数据进行采集,是进行飞机性能监控、飞机维修排故的重要手段[5]。通过QAR 数据,可实现对飞机系统各个传感器参数值及其变化的连续或定期的监测,进行基于超限报警的拆修或维护[6]。QAR 数据与维修数据的整合使得通过大数据分析方式监控飞机系统故障成为了可能[7]。
对于客机空调系统的健康管理方法,国内外学者和机构都进行了诸多研究,其中包括:在AIR⁃MAN 和AHM 平台上的基于大数据分析的飞机监控模型[8],以及在飞机空调系统上的应用,即通过维修经验设定空调参数报警门限值,以此构建飞机空调系统监控模型;通过改进BP 神经网络,建立基于环境温度、初级与主级热交换器进出口温度的飞机热交换器污垢厚度预测模型[9];利用逻辑回归模型对空调系统退化状态进行评估,通过设置合理的报警阈值实现系统故障预警[10],以及其他物理层面[11⁃13]与 统 计 学 层 面[14⁃16]的 空 调 系 统 退 化 状 态 评 估方法。
而上述预测模型仍存在无法避免的问题。在构建预测模型时常将数据分为正常状态与故障状态,使用故障前的10 个飞行循环作为故障状态进行学习。实际客机空调系统在维修前的衰退程度不同,超过90%的飞机进入维修流程前的状态并非性能完全失效状态。数据标注上存在的困难导致了监督学习方法面临先验知识不足的问题[17],从而产生过拟合,进而导致预测模型鲁棒性降低。性能衰退指标在不同工况下存在大幅振荡,难以对系统进行更精确的性能衰退评价。
本文以A320 大型客机空调系统为例,在现有空调健康管理方法的基础上,以FCM 算法[18]为基础,引入左右空调组件的监控数据建立模型。弥补了数据不平衡与先验知识不足的问题,提高了模型在不同工况下的鲁棒性,优化了现有健康管理平台的性能衰退评价标准。
1 大型客机空调系统
现代民航大型客机空调系统广泛使用的制冷原理为空气循环制冷,其原理为使用外界冲压空气作为冷却介质,热空气经过初级热交换器冷却后再进行压缩,再经过主级热交换器冷却。压缩空气进入涡轮进行膨胀做功,从而得到合适温度、压力的气体,其优点在于使用的冷却介质是空气,成本低易于维护。可以通过一个系统同时完成压力与温度的控制。缺点在于相较于使用蒸发制冷其精度低,依赖飞机发动机的工作才能运行。大型客机空调系统原理图如图1 所示。
飞机在飞行时通过发动机引气,在地面时使用地面气源车或APU 引气。热空气进入空调系统先通过初级热交换器与冲压空气进行热交换;后进入ACM(Air cycle machine)中的压缩机进行压缩;再通过主级热交换器与冲压空气进行热交换;随后通过再加热器与冷凝器使气体温度在露点附近波动,使气体中的水分在通过冷凝器后凝结在水分离器的外壁上,从而得到干燥空气防止飞机部件遭到侵蚀。得到的干燥空气通过ACM 中的涡轮进行膨胀做功,进一步降低温度。使用旁通活门调节一定的热空气与涡轮输出的冷空气进行混合后得到温度、压力合适的气体,输送到空调管道中。大型客机空调系统常见的故障主要有热交换器堵塞、ACM 轴承磨损、ACM 方形胶圈老化等。
2 改进模糊C 均值的大型客机空调退化评估算法
2.1 模糊C 均值算法
对于大型客机空调系统数据而言,使用模糊C均值(Fuzzy C⁃means, FCM)聚类可以有效避免先验知识不足的问题,且该方法在小样本条件下的航空发动机性能监测领域得到了一定程度的应用[17]。FCM 聚类算法是一种基于目标函数的无监督模糊聚类算法。通过FCM 算法可计算飞机空调系统处于正常状态与故障状态的聚类中心,再通过数据点与每个聚类中心的距离判定其从属于某个中心。FCM 由Dunn[19]首先提出,并由Bezdek[20]作为硬C 均值算法的一种推广,其原理如下:确定数据集X ={ x1,x2,…,xn}聚类类别数c,其中2≤c≤n。FCM 聚类通过不断的迭代更新划分矩阵U 与聚类中心V,使目标函数收敛。目标函数为
图1 大型客机空调系统原理图Fig.1 Principle diagram of air conditioning system for large passenger aircraft
式中:uik为数据集中第k 条数据xk对第i 类的隶属度,其中uik∈[0,1],模糊矩阵U =(uik)c×n即为划分矩阵;V={v1,v2,…,vc}为各个类别的聚类中心;m 为加权指数,根据Pal 等[21]的实验结论m 的最佳取值范围为[1.5,2.5];dik表示样本xk与聚类中心vi之间的距离,通常使用欧氏距离:=||xk-vi||2。对于大型客机空调系统而言,uik为空调数据中第k 条报文数据xk对正常、故障两种工作状态的隶属度;dik表示空调数据xk与正常、故障两种工作状态的聚类中心vi的距离。
2.2 改进FCM 算法
客机上装有左右两套空调组件,不仅维持了左右平衡,同时也保证了其中之一出现故障的情况下,整个系统可以继续维持驾驶舱、客舱、电子舱及货仓环境参数的稳定。因此本文引入了左右空调组件的状态差衡量样本xk与聚类中心vi之间的距离,距离公式为
式中:dik表示第k 条样本xk与聚类中心vi之间的距离;xkjL、xkjR表示样本xk第j 维的左右组件数据,其中不包括旁通活门相关参数。经过修正后的dik同时也受空调系统的左右组件差值影响,其差值越大样本xk距离正常状态聚类中心的距离越远。
2.3 改进FCM 聚类算法的迭代过程
(1)确定聚类中心个数c,加权指数m,算法终止阈值ε,初始聚类中心V={v1,v2,…,vc}
(2)根据当前的聚类中心数和聚类中心计算每一个像素点属于每一类的隶属度
(3)根据当前的隶属度更新各聚类中心
2.4 监测参数选择
QAR 数据中包含大量未经分类的飞行器数据,从中分离出监测空调系统所需的数据是重要的一步。与空调系统相关的内容包括飞机性能参数如飞机号、记录时间、大气总温、大气静温、大气静压、马赫数、飞行高度;以及空调系统自身传感器参数如:压缩机出口温度、水分离器温度、冲压空气入口活门开度、旁通活门开度。除此之外,根据飞机空调系统原理加入空调系统上游引气系统参数:APU 通气阀门状态、预冷器出口温度、预冷器入口压力、监测参数如表1 所示。
为了直观比较初级、主级热交换器性能变化,本文中还加入了初级热交换器效率、主级热交换器效率两个参数。通常航空公司使用的评价标准为
表1 大型客机空调系统参数集Table 1 Parameter set of aircraft air conditioning sys⁃tem for large passenger aircraft
式中:EprHX为初级热交换器温度效率;EmHX为主级热交换器温度效率;Ttpo为预冷器出口温度;Tcot为压缩机出口温度;Ttw为水分离器温度;Tsat为大气静温。
3 实验验证分析
3.1 数据样本选择
实验选择某飞机维修企业2019 年上半年维修记录中的所有A320 属于ATA 章节Air⁃Condition的航班QAR 数据,表2 中列举了全部转入维修流程的航班数据,以及部分出现告警进入监控流程的航班数据。
表2 大型客机空调系统数据集Table 2 Data set of aircraft air conditioning system for large passenger aircraft
3.2 数据预处理
当飞机处于不同的工作方式时,引气气源有所不同;飞机在每一次飞行中处于不同的飞行阶段(起飞、巡航、降落)时,使用的引气气源也不同。其中在地面使用地面气源车供气或通过APU 引气。该方式很大程度上绕过了客机空调系统直接为机舱提供了低压气源,因此本实验通过APU 通气阀门状态以及飞行高度等参数为参考,去除了在这些气源下的空调数据,仅使用飞机巡航状态以发动机引气为气源的数据进行实验。
数据样本中不同参数之间的量纲不同,直接进行模型训练容易导致模型无法收敛。因此为了提高收敛速度以及模型精确度,通常在进行模型训练之前需对样本进行标准化处理。本实验选择对数据样本参数进行L2 标准化处理。标准化公式为
客机空调数据中正常样本数量远远多于故障样本,而分类算法常用于训练的数据集各类样本数量大致相等的情况下。因此为了解决数据不平衡带来的少数类分类准确率较低的问题,本实验采用了smote 算法对数据集进行了处理。其算法如下:
(1)对于少数类中的每一个样本xi,计算其以欧氏距离为标准最近的k 个样本作为其k 近邻;
(2)根据少数类样本所需的放大比例设置采样倍率N,对于少数类中的每一个样本xi,从其k 近邻中随机选择N 次样本x̂=(x̂1,x̂2,…,x̂n);
(3)对于每一个随机选出的近邻x̂j,按照如下公式构建新样本
图2 大型客机空调旁通活门开度数据Fig.2 Pack bypass valve position data of large passen⁃ger aircraft
旁通活门开度参数对于判断飞机空调系统的运行状态有着至关重要的作用。旁通活门的打开会提高空调系统出口温度的数值,而对于降温效率低下的空调系统,旁通活门常处于关闭状态。
图2 是飞机B⁃185X 维修前2 月旁通活门开度变化情况,可以看到该参数在空调性能正常或衰退时波动较大,不利于对衰退特征的观测。因而本实验对该参数根据维修时点进行分段后,进行了窗口宽度为25 的均值滤波。
图3 大型客机空调旁通活门开度滤波后数据Fig.3 Pack bypass valve position data of large passen⁃ger aircraft after filtering
图3 是飞机B⁃185X 维修前2 月旁通活门开度数据经过滤波后的图像,由图3 可更明显地观察到性能衰退特征。
3.3 训练模型参数设置
本实验为对比改进FCM 算法与其他机器学习模型的效果,验证改进FCM 算法的有效性。除改进FCM 模型外,还训练了使用BP 神经网络算法及逻辑回归算法的模型,还训练了使用逻辑回归算法的模型[10]及BP 神经网络算法[22]。
实验中以故障记录中出现性能衰退前的数据及正常数据作为正常状态性能数据,以故障记录中维修前5 日数据作为故障数据进行模型训练。分别使用出现性能衰减暂进入监控流程及出现性能衰减已进入维修流程的两类数据作为测试数据。
逻辑回归方法及BP 神经网络方法模型训练过程中设置性能正常数据的输出为1,性能失效数据的输出为0。其中BP 神经网络方法根据多次试验对比,选定使用2 隐藏层,隐藏层神经元数量为12,8。逻辑回归方法使用Sigmod 函数为逻辑回归函数。改进FCM 方法设置最大聚类数量c=2,加权指数m=2,距离函数为欧式距离。
3.4 实验结果对比与分析
对于出现性能衰减已进入维修流程的数据而言,以飞机B⁃185X 的数据为例,3 种方法的结果如图4~6 所示。3 种方法得到的性能曲线趋势相似。
在基于逻辑回归算法与基于BP 神经网络算法的结果中,开始的450 个飞行循环显示状态正常,随后在50 个飞行循环显现出幅度在0.2~0.5 的较大波动,最后50 个飞行循环显示处于失效状态,经过维修后性能状态指标立刻恢复到1.0 附近。出现这样的波动以及突变的原因主要是数据难于标注真实的性能衰退状态值,仅标注正常与失效两种状态会导致中间状态缺失,易造成学习结果过拟合。因此监督学习在空调系统寿命预测问题上无法得到良好的效果。
图4 逻辑回归算法性能曲线Fig.4 Results of logistic regression algorithm
图5 BP 神经网络算法性能曲线Fig.5 Results of BP neural network algorithm
图6 改进FCM 算法性能曲线Fig.6 Results of improved FCM algorithm
在基于改进FCM 算法的结果中,前450 飞行循环显示性能指标在0.9 左右浮动,在维修前的150 个飞行循环稳步下降到0.2 以下,经过维修后性能状态指标立刻恢复到在0.9 左右浮动的正常状态。由于改进FCM 算法方法是基于其与性能正常状态基准的距离,因此结果并不会产生前两种方法的大幅波动。
对于出现性能衰减已进入维修流程的数据而言,以飞机B⁃679X 为例,FCM 算法与改进FCM 算法结果如图7 所示。 BP 神经网络算法结果一直维持在性能正常的1 左右,而基于FCM 算法的结果在0.8 左右波动,这体现出FCM 对于性能状态的前期退化具有一定的敏感性。而基于改进的FCM算法的结果在0~500 个飞行循环的时间内性能状态指标已经下降到0.7 附近,随后该飞机因为人工检测到组件出口温度过高而被转入了监控流程。因此该方法可以更好的反应性能状态的前期退化,提早检测出故障风险。对于ACM 等易磨损部件的维修有重要的参考价值。
图7 性能状态指标对比图Fig.7 Performance state indicators contrast diagram
在客机健康管理平台中,飞机性能健康状况分为:正常、监控、转故障3 种状态。图8 是飞机B⁃185X 的空调数据使用改进FCM 算法的结果经过窗口尺寸25 的均值滤波后的图像。通过参考性能状态指标的评估,将各类按照评估数值分为:正 常(0.75,1.0],监 控(0.2,0.75],转 故 障(0,0.2]。在性能状态指标低于门限值时,及时安排维修工作可以有效地降低维修成本,提高飞机部件的利用率。
图8 性能状态指标评估门限Fig.8 Performance state indicator evaluation threshold
以飞机B⁃679X 为例,基于改进FCM 算法的性能状态指标如图9 所示。根据设定的门限值程序可自动在约第350 个飞行循环处检测出空调系统性能产生了衰退,相比人工监控的方法提早了约250 个飞行循环的时间。对于提早检测故障风险、实现预测维修提供了有力的技术支持。
图9 转入监控状态时间点对比图Fig.9 Comparison of time points in monitoring status
4 结 论
(1)基于FCM 算法的大型客机空调系统状态退化评估方法,能够有效地解决其他方法面临的先验知识不足及数据不平衡的问题,相较于现有其他方法有更好的实际效果,更好地反映出了飞机由性能正常到性能退化的中间过程。
(2)基于改进的FCM 算法的大型客机空调系统状态退化评估结果,能够更敏感地反映出部件的前期退化。根据该算法提供的性能状态指标可制定更为精准的故障评估标准。
(3)结合基于改进的FCM 算法的大型客机空调系统状态退化评估结果,可以设置合理的故障报警门限值。提早检测出故障风险,实现预测维修,为航空公司安排航班计划与维修计划,降低运行成本提供了有力的技术支持。