APP下载

基于随机森林算法的飞机发动机故障诊断方法的研究

2016-11-02郝姜伟鲁斌

电脑知识与技术 2016年23期
关键词:随机森林故障诊断

郝姜伟 鲁斌

摘要:根据飞机发动机状态参数建立决策树进行分类是发动机故障检测的重要方法,本文针对单棵决策树模型分类方法精度不高、容易出现过拟合等问题,提出使用组合单决策树来提高计算精度的随机森林算法,并将该方法进行仿真实验。结果表明,随机森林算法能够解决单个决策树过拟合问题,在解决飞机发动机故障诊断领域中具有广阔的发展及应用前景。

关键词:飞机发动机;故障诊断;随机森林

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2016)23-0158-03

Abstract:Establish decision tree for aircraft engines state parameters to classify is an important method of engine fault detection, the paper according to the accuracy of a single decision tree classification model is not high, prone to problems of over-fitting,propose the Random Forest algorithm which use a combination of a single decision tree classification model to improve the accuracy, and use it for simulation experiments.The results show that the Random Forest algorithm can solve the problem of over-fitting with a single tree,and it has a broad development prospect in solving aircraft engine fault diagnosis.

Key words:aircraft engine; fault diagnosis; random forest

随着互联网技术的持续快速发展,各种创新技术、前沿概念不断影响着人们的生活,人类社会进入了一个前所未有的信息化时代。国内航空市场发展迅速,飞机的数量不断增加,航空维修行业在不断发展。在航空业繁荣的背后,航空维修承担着非常重要的作用,航空公司近百分之二十的飞行成本是维修费用。飞机安全飞行是航空公司的生命线,飞机发动机是航空器的“心脏”是安全飞行的基础[1],飞机发动机的重要性不言而喻。目前的航空领域正处于快速发展时期,新技术、新需求不断出现,对维修方面也提出了更高的要求,按照原来的维修方法、要求,以及安全性、可靠性已无法满足新时代的新的需求。在短时间内,利用有效、可靠的技术手段完成维修任务变得越来越重要。

分类预测是数据挖掘技术领域的主要方法。利用数据挖掘技术,根据现有的数据,对未来发展趋势进行准确、有效的分类和预测,受到了广泛的关注和研究,而且其成果也不断投入到我们的现实生活。其中应用很多优秀的算法,比如决策树、贝叶斯、k-近邻分类、神经网络、支持向量机等。近几年分类器在飞机发动机故障诊断领域也逐渐被推广,但是单模型分类器会出现诊断精度不高、过拟合、训练速度慢、陷入局部最优解等缺点。

本文提出采用随机森林算法对飞机发动机进行故障诊断,根据波音747-400(发动机型号为 PW-4000)发动机四个状态参数进行初步诊断:低压压缩机转速 NL;高压压缩机转速 NH;排气温度 EGT;燃油流量 FF[3]。建立随机森林的组合分类器模型,每个分类器起到互补的作用,将单决策树错误判断影响降低,最终根据每个决策树的投票得出最终诊断结果,该方法具有速度快、准确率高等优点。

1 决策树和随机森林

1.1 决策树

决策树,根据给定的无规律的样本,推理得出树状的分类规则的方法,它的一个分支就是一个决策过程,每个决策过程中涉及一个数据的属性[6],然后递归直到满足决策条件。其中样本数据集中含有多个特征属性和目标属性,采用从上向下的原则,从根节点开始遍历,直到每一个数据子集都有唯一的对应的目标。建立好决策树后,输入测试样本,测试数据根据生成的决策树,确定一条由根节点到叶节点的唯一路径,叶节点即为测试样本所属类别[2]。决策树算法有着很多良好的特性,比如说训练时间复杂度较低、预测的过程比较快速、模型容易展示等。但是同时,单决策树又有一些不好的地方,比如说容易过拟合。

1.2 随机森林

随机森林算法是Leo Breiman于2001年提出的一种新型分类和预测模型,是基于决策树(decision tree)的分类器集成算法,用随机的方式建立一个森林,由多个决策树组成的集成分类器算法[5],再输入X时,每一棵树只投一票给它认为最合适的类。

随机森林通过在每个节点处随机选择特征进行分支,最小化了各棵分类树之间的相关性,提高了分类精确度。由于每棵树的生长速度很快,所以随机森林的分类速度很快,并且很容易实现并行化。按这种算法得到的随机森林中的每一棵都很弱,但是多颗决策树组合起来就可以达到更精确的结果。即:将每一棵决策树看成一个精通于某一个窄领域的专家,随机森林中就有了很多个精通不同领域的专家决策树,对待新的问题,用不同的角度去看待它,最后由各个专家,投票得到最终结果[4]。该算法具有需要调整的参数少、分类速度快、不用担心过度拟合、能高效处理大样本数据、能估计哪个特征在分类中更重要以及较强的抗噪音能力、数据集上表现良好等特点。

2 基于随机森林算法的飞机发动机故障诊断步骤

随机森林应用自助法重采样技术生成整个决策树分类器,其步骤如下:

1)从样本集中用自助法(Boot-strap)重采样选出n个样本,预建立决策树(CART),每个自助样本集包括每棵分类树的全部训练数据。

2)在树的每个节点上,从所有属性中随机选择k个属性,选择出一个最佳分割属性作为节点。

3)每棵树最大限度地生长, 不进行剪枝操作;

4)将生成的多棵分类树组成随机森林,对新的数据进行判别与分类,分类结果按树分类器的投票多少而定,最终决策结果根据如下公式给出:

用投票策略来得到最终结果。

基于随机森林的飞机发动机故障诊断流程如图1所示:

3 基于随机森林算法的飞机发动机故障诊断的应用

本文使用Google开发的一种编译型、可并行化、并具有垃圾回收功能的编程语言GoLang对随机森林算法进行仿真实验。

3.1 输入特征

根据飞机发动机故障维修人员的经验,波音 747-400(发动机型号为 PW-4000)的故障可以通过如下四个参数进行初步诊断:低压压缩机转速 NL;高压压缩机转速 NH;排气温度 EGT;燃油流量 FF。故障诊断就是利用这些有限的参数所提供的特征信息来确定发动机的故障状态的[3]。 选用文献[3]的12个特征,即典型故障模式作为学习样本输入,如表1所示。

3.2 学习样本和测试样本

本文为每种故障分别选定20个样本,总共240个学习样本,将输入和目标样本作为算法入口进行分类学习,试验中取100棵独立决策树组成随机森林。根据文献[3]典型故障模式输入输出样本如表2所示。

本文进行多组实验将随机森林算法应用到飞机发动机故障诊断中,当选取的样本集数量为100组,即数量较少、生成决策树数量较少或样本差异不明显时,测试数据故障诊断错误率高达30%及以上,随着样本集数量以及样本数据的不断调整,错误率不断降低。因此,正确选取学习样本、确定适合的样本数量、减少样本数据的相关性是随机森林算法能否准确决策的关键因素。

3.3 系统实现

前端借鉴MVC模式,使用Angularjs框架,结合HTML,CSS开发,数据通信基于http协议,采用RESTful风格,使用JSON数据格式进行数据传送。服务端使用Google开发的一种编译型、可并行化、并具有垃圾回收功能的编程语言GoLang。Web API层基于RESTful Web API开源框架Martini实现,分为路由管理、控制器、RPC代理三层,其中路由管理模块负责资源的路由分配;控制器模块定义了应用系统的行为,通过提供的HTTP方法向前端暴露资源;RPC代理模块负责与模型层的通讯,使用MongoDB进行数据的存储。实现结果如图3和图4所示:

4结论

本文研究了基于随机森林算法的飞机发动机故障诊断方法,并通过实验验证该方法的有效性,实现了相应的web应用。实验结果表明,利用该方法进行飞机发动机故障诊断能取得理想的效果,证明该方法的可行性,在解决飞机发动机故障诊断领域中具有广阔的发展及应用前景。

参考文献:

[1] 李爱. 航空发动机磨损故障智能诊断若干关键技术研究[D].南京航空航天大学,2013.

[2] 陶栋琦,薄翠梅,易辉. 基于随机森林的变压器故障检测方法的研究[J]. 电子器件,2015(4):840-844.

[3] 吴月伟. 基于径向基神经网络的飞机发动机故障诊断研究[D].中国民用航空学院,2006.

[4] 尹玲. 基于心率变异和脑波分析的塑身腹带着装压力舒适性研究[D].东华大学,2012.

[5] 鄢仁武,叶轻舟,周理. 基于随机森林的电力电子电路故障诊断技术[J]. 武汉大学学报:工学版,2013(6):742-746.

[6] 叶圣永,王晓茹,刘志刚,等. 基于随机森林算法的电力系统暂态稳定性评估[J]. 西南交通大学学报,2008(5):573-577.

猜你喜欢

随机森林故障诊断
冻干机常见故障诊断与维修
拱坝变形监测预报的随机森林模型及应用
基于量子万有引力搜索的SVM自驾故障诊断
因果图定性分析法及其在故障诊断中的应用
基于随机森林算法的B2B客户分级系统的设计
基于多视角特征融合与随机森林的蛋白质结晶预测
基于LCD和排列熵的滚动轴承故障诊断
基于WPD-HHT的滚动轴承故障诊断
高速泵的故障诊断