支持向量回归机建立排气温度模型研究
2018-08-28夏存江
夏存江
1 引言
航空发动机是飞机的核心动力系统,而且是一种结构复杂高度精密的机械,对之实施有效的状态监控是保障飞机安全性,可靠性和经济性的重要途径。发动机排气温度(exhaustgastemperature,EGT)是最能反映发动机运行情况的性能参数,通过分析EGT测量值偏离对应基线值的偏差值,可监控和预测发动机的健康状态及其性能衰退趋势。EGT的基线值是生产厂家通过大量的试验综合统计获得,属于航空发动机状态监控核心技术,厂家并未公布,国内航空公司的状态监控也只是停留在监控软件的简单操作[1]。
为了避免过度依赖发动机生产厂家,目前在航空发动机基线挖掘方面,一些研究学者对其进行了较深入的研究。如文献[2]应用正交实验设计原理和最小二乘曲线拟合的方法建立了JT9D三种类型的发动机基线方程;文献[3]采用基于核函数的多元非线性回归分析方法,对Rolls-Royce公司的Trent700发动机基线方程进行挖掘,建立了标准化过程中的核函数和性能参数的偏差值模型,文献[4]中,以CFM56-5B航空发动机为例,利用RBF神经网络建立了EGT的基线模型。在以往的工作中,采用不同方法对航空发动机的基线进行挖掘,但很少采用支持向量回归机(SVR)对民航发动机EGT基线方程进行建模分析,并且之前的研究结果和模型精度并不是很理想。
以民航某主力型号发动机为例,采用支持向量回归机的方法建立了精度较高且对未知数据预测能力较强的EGT基线模型。
2 样本数据预处理
航空发动机常年在高温、高压等恶劣环境下工作,其相关参数的测量较为困难,常见的问题主要有数据测量误差大、传感器易发生故障、某些数据甚至难以采集等[5]。收集到的航空发动机相关性能参数的数据若不加以预处理,则很难准确反映航空发动机的实际健康状态。因此,首先从不同地区的两家航空公司收集某型号发动机的2014年5月至2015年5月的实际飞行数据,然后对其进行预处理以用于后续的发动机基线模型训练和验证。预处理的内容主要包括对原始数据中的异常点判别与粗大误差剔除。
异常点的识别方法是用以往数据信息来判断当前点是否异常,即:对于某一时间序列{Xi}ni=1,判别t=i个数据是否异常,可根据t=i之前的序列{Xi}nn=1进行判断。判别方法可以是根据子序列{X预测 t=i时的值为 Yi,预测精度为 δi,如果 Yi∉[Yi-δi,Yi+δi],则称Yi为异常点。针对航空发动机数据特点,采用拉依达准则(3σ准则)来判别异常点,它以数据足够多为前提,其预测值取为前面数据的算术平均值,预测精度为3σ(3倍的标准差)[6]。流程图,如图1所示。
图1 拉依达法则流程图Fig.1 Float Chat of Pauta Criterion
根据图1所示的异常点的判别方法,将收集到的数据剔除粗大误差之后得到回归模型的输入样本训练数据500组和验证数据300组。
目前,有很多文献资料中对于模型的输出样本即发动机基线值的求解方法进行了研究,计算方法如式(1):
式中:EGTb—EGT对应的基线值;EGTk—将EGT的测量值EGTm转化为标准大气条件下的修正值。
查阅原始文献[7],该型号发动机参数基线值的实际求解方法如下:
由式(2)可知发动机EGTb的计算公式如(3)式:
由于EGT基线模型是基于大气条件等因素建立的,所以公式(3)中采用EGT的直接测量值EGTm计算EGTb,国内许多研究学者采用的式(1)是不符合厂家系统的规律。为了提高后续训练的EGT基线模型的推广泛化能力,考虑选取一架飞机的两台发动机的相关数据,由于其在巡航状态下工作在同一个外界环境,获得的发动机的性能参数值也趋近于相同,并且对应同样的基线,所以利用式(3)分别计算两台发动机的EGTb并且取两者平均值,得到EGT基线模型的输出样本空间EGTb,从而保证了模型的普遍适用性。
3 支持向量回归机建模原理
支持向量机(support vector machines,SVM)是数据挖掘问题的一种新的、有效的方法,理论基础是统计学理论,在小样本建模领域表现出优异的推广泛化能力。处理回归问题的向量机称为支持向量回归机(support vector regression,SVR),是结构风险最小化的实现,它通过非线性函数,将输入样本转换到高维线性特征空间,巧妙地解决了维数问题,并且能够有效避免神经网络出现的过学习和局部最小化的缺陷,最终得到一个全局最优解[8]。
假设n个训练数据样本(xi,yi),式中:xi—第i个输入样本;yi—对应的输出值。首先考虑用线性函数进行回归,方程为:
在数值计算中,对于xi的预测值f(xi),允许其与真实值yi存在一定的误差ε,需要引入合适的损失函数,SVR常选择的是不敏感损失函数[9]:
基于结构风险最小化原则,就得到了线性的支持向量回归算法,回归估计问题转换为解决一个在约束条件下的最优化问题,形式为:
通过求解可得到αi和α*i,并根据Kuhn-Tucker定理计算得到b,最终得到线性回归函数。
对于非线性回归,支持向量回归机的基本思想是利用合适的内积函数把训练数据转换到某一个高维Hilbert空间中,然后在此高维空间中用函数进行线性回归,最终取得在原空间非线性回归的效果。此内积函数称为核函数K(xi,xj)。
4 发动机EGT基线建模
分析原厂家系统气路参数基线值的求解过程可知,发动机EGT基线模型是一个关于有关测量参数的多元非线性模型,所以可以将其的求解描述为如下的数学模型:
式中:TAT—外界大气总温;N1K—风扇修正转速;Mach—飞机飞行马赫数;Alt—飞机飞行高度;Bleed—飞机环境控制及飞机和发动机防冰系统的引气量。
由于收集的数据中ECS数据都为1,飞机巡航状态客舱引气处于打开状态,对基线影响很小,故bleed不予考虑;通过确定每个自变量与EGTb相关程度来验证数据的准确性,求解的每个变量与EGTb的复相关系数,表明:N1K和TAT与EGTb高度相关,Alt和Mach与EGTb中度相关,与厂家理论模型吻合。因此在选择EGT基线模型的训练集时,分别构造以下的输入变量和输出变量:
在模型训练的过程中,核函数的选择是决定高维特征的的关键因素,由于高斯径向基核函数能够实现较好的非线性映射,且具有较宽的收敛域,拟合和预测精度高,是较为理想的回归依据函数,将选用该核函数,具体表达式如下[10]:
SVR模型的性能取决于选择适当的参数,惩罚因子c,高斯径向基核函数中的g和ε-不敏感损失函数中的精度p都是影响回归的重要因素,为了解决经验法选取支持向量回归机参数效率低,取值不准确的问题,采取遗传算法(Genetic Algorithm,GA)对参数进行寻优,寻优结果,如图2所示。
图2遗传算法寻找最佳参数的适应度曲线Fig.2 Fitness Curve of the Best Parameter by Genetic Algorithm
图2 中适应度是在遗传算法中描述个体性能的主要指标,用于评价个体的优劣程度。从图中可以得到惩罚因子c,核函数中的g和精度 p 的优化值,分别为 c=80.4866,g=0.22163,p=0.010032,此时的均方误差为3.3057e-5,满足其精度要求。
结合之前构造的输入变量和输出变量,利用选择的核函数和用遗传算法寻优得到的最佳参数进行发动机EGT基线模型训练,对训练数据进行预测得到相应的EGTb预测值,表1列举了10组数据训练结果的误差对比,平均相对误差只有-0.0164%,表明支持向量回归机下的模型在EGT基线求解中具有较高的精度。SVR评价回归模型精度的高低,采用平均平方相关系数(mean squared error,MSE)和平均相关系数(squared correlation coefficient,R2)作为评价指标。此模型的参数指标为:
由模型参数指标和表1所示的结果可知:EGT基线预测值与原始值高度相关,模型具有很好的回归性能。
表1 训练样本的EGTb的预测值与原始值对比Tab.1 Comparison Between Predicted Values and Original Values of EGTb for Training Sample
5 EGT基线模型的验证
为了进一步验证训练的EGT基线模型的精确性和推广泛化能力,即对未知样本的预测能力,选取另外一台相同型号的发动机的300组数据作为测试样本。随机选取该测试样本预测值与真实值对比的50组数据,对比结果,如图3所示。
图3 测试样本的EGTb预测值与原始值对比Fig.3 Comparison Between Predicted Values and Original Values of EGTb for Test Sample
从图3的对比图可以看出,测试样本的EGT基线预测值与真实值很接近,绝对误差在0线上均匀分布且无突变情况,验证了本次模型具有较强的泛化能力,同时说明了求解方法符合SVR的结构风险最小化的原则。
航空发动机气路偏差值的大小以及变化趋势能够反映发动机气路部件性能衰退的程度和速度,许多航空公司以气路参数偏差值作为发动机性能健康状态评估的主要参数。所以采用本次挖掘的EGT基线模型和式(1)计算EGT的偏差值,得到EGT偏差值的对比结果,如图4所示。
从图4可以看出,通过该模型求出的EGT偏差值与原始值基本吻合,准确度较高,在发动机的性能监控中具有实际意义。
图4 EGT偏差值的预测值与原始值对比Fig.4 Comparison Between Predicted Values and Original Values of Deviation Value for EGT
6 结束语
以民航某主力型号发动机为例,收集其相关性能参数数据,将拉依达法则作为数据预处理方法,建立模型的输入和输出训练样本,采用遗传算法进行相关参数的优化计算,提高了模型求解精度和效率,选用另一台相同型号的发动机的性能参数数据作为测试样本,并且求解测试样本的EGTb预测值的偏差值,误差结果表明:利用支持向量回归机建立的EGT基线模型具有较高的精度且对未知数据的预测准确性高,使用该模型计算的EGT的偏差值与厂家返回的数据很接近,在航空发动机性能监控过程中具有非常高的实际应用价值。