APP下载

基于信息熵和BP神经网络的故障分类方法

2017-04-21孙海蓉耿军亚

电力科学与工程 2017年3期
关键词:决策表约简粗糙集

孙海蓉,王 蕊,2,耿军亚,2

(1.华北电力大学控制与计算机工程学院,河北保定 071003;2.华北电力大学河北省发电过程仿真与优化控制工程技术研究中心,河北保定071003)

基于信息熵和BP神经网络的故障分类方法

孙海蓉1,王 蕊1,2,耿军亚1,2

(1.华北电力大学控制与计算机工程学院,河北保定 071003;2.华北电力大学河北省发电过程仿真与优化控制工程技术研究中心,河北保定071003)

为了实现电厂运行中设备故障类型的快速、准确判断,解决神经网络因输入量增多导致收敛速度大幅降低的问题,将基于近似决策熵模型的属性约简算法结合BP神经网络进行故障分类预测。基于信息熵的属性约简算法对故障样本数据进行预处理,得到约简决策表,将约简数据样本作为BP神经网络的输入进行训练,预测故障分类。将该方法用于汽轮机振动故障诊断,结果表明:有效降低了神经网络的输入维数,简化了网络结构,获得了较高的分类精度,同时降低了计算开销,对快速判断故障类型,提高维修效率,具有工程实用价值。

粗糙集;神经网络;近似决策熵;故障分类预测;汽轮机

0 引言

设备故障诊断方法主要有三种,分别是基于信号处理的方法、基于解析模型的方法和基于知识的诊断方法。近年来,随着人工智能及计算机技术的进步,基于知识的故障诊断方法发展迅速。基于知识的故障诊断方法包括神经网络法、故障树法、数据驱动法以及粗糙集法[1]等。由于现有设备系统的复杂性,现有诊断方法难以满足诊断要求,且无法满足在线诊断的要求,因此多种诊断方法融合的诊断方法得到关注。将粗糙集与神经网络方法相结合[2-6],利用粗糙集对数据的预处理能力对数据样本进行属性约简[7-9],可以降低神经网络的复杂度,但是粗糙集的计算性能对运行时间的影响是其面临的问题。

寻求样本数据的最小约简已被证明是一个NP-hard问题,因此提出了很多启发式属性约简方法,通过计算局部最优解来获得全局最优解。信息熵概念的引入,使得基于熵的属性约简得到广泛关注。但是现有基于熵的属性约简算法大多是从信息论观点出发,忽略了代数观点的影响,且计算性能还有待提高。

针对传统属性约简算法的现有问题,本文提出了结合信息熵的BP神经网络故障分类办法,采用一种新的信息熵模型——近似决策熵模型作为属性约简算法,对输入样本进行处理,将得到的约简样本用于构建神经网络,结果表明,该方法运行时间快,能获得较小的约简和较高的分类精度,最终达到提高收敛速度的目的。将该方法用于汽轮机振动故障诊断,验证了该方法的可行性和有效性,对于快速准确地判断故障类型,提高维修效率,具有重要的现实意义。

1 粗糙集理论

给定一个论域U和该论域上的一簇等价关系S,若P⊆S,且P≠φ,则∩P仍然是论域U上的一个等价关系,即可定义不可分辨关系IND(P)[10]。

对于给定的知识库K=(U,S),其中S为论域U上的等价关系簇,则∀X⊆U和论域U上的一个等价关系R∈IND(K),可以定义子集X关于知识R的下近似和上近似分别为

(1)

(2)

给定一个论域U和该论域上的一个等价关系R,∀X⊆U,等价关系R定义的集合X的近似精度为

(3)

2 近似决策熵模型

2.1 定义

已知给定决策表为DT=(U,C,D,V,f),其中,令U/IND(B)={X1,X2,…,Xn},X为任意属性集B在论域U上的等价类,n为属性集B在论域U上的等价类数;令U/IND(D)={Y1,Y2,…,Ym},Y为决策属性D在论域U上的等价类,m为决策属性D在论域U上的等价类数。并且对于任意属性集B⊆C,将决策属性集D相对于B的近似决策熵定义为[10]

(4)

式中:αB(Yi)为Yi在不可分辨关系IND(B)下的近似精度;p(Xj)=|Xj|/|U|;p(Yi|Xj)=|Xj∩Yi|/|Xj|;i和j的取值范围为1≤i≤m,1≤j≤n。

可知,在近似决策熵的定义中,将粗糙集中的近似精度引入到传统的条件熵模型中。相对于传统的信息熵模型,近似决策熵重新定义属性重要性,不仅可以度量知识的粒度大小,而且可以度量知识的完备性,提供了一种更加全面的不确定性度量方法。在计算不可分辨关系的划分时引入了基数排序和增量式的思想,提高了计算性能。

在决策表DT中的任何属性a∈C-B相对于B和D的重要性定义为

Sig(a,B,D)=

(5)

该属性重要性由近似决策熵度量,以此作为寻找约简的启发式信息。

2.2 属性约简算法

知识库中的属性并不都是同等重要的,甚至其中某些属性是冗余的。属性约简就是在保持知识库分类能力不变的条件下,删除其中不相关或不重要的属性。令R为一族等价关系,且有属性a∈R,如果IND(R)=IND(R-{a}),则称R-{a}是R的一个约简。其中IND(R)为子集R在论域上的不可分辨关系。约简算法[10]的具体步骤如下:

第1步:置核属性集合和约简集合为空。

第2步:计算条件属性和决策属性的划分。

第3步:计算条件属性的近似决策熵。

第4步:计算基于近似决策熵的核属性。令约简集等于核属性集,并求取约简集合的近似决策熵。

第5步:求取约简集。对约简集合以外的每个条件属性,计算其对约简集和决策属性的重要性,该重要性以近似决策熵度量。选取重要性最大的条件属性并入约简集合,并计算新的约简集的近似决策熵。

终止条件为:约简属性集合的近似决策熵和条件属性集合的近似决策熵相等。

表1 汽轮机振动故障数据样本序号

3 信息熵与BP神经网络结合

BP神经网络最主要的优点是其具有极强的非线性映射能力以及可以滤除训练样本中的随机噪声,但是神经网络不具备对输入数据预处理的能力。粗糙集可以剔除冗余属性,降低样本空间的维数,但是其对噪声很敏感。因此,先利用粗糙集对冗余数据进行约简,然后将约简样本空间作为BP神经网络的输入数据进行训练。粗糙集和神经网络相结合的方法,弥补各自的不足,可以达到优化网络性能的目的。但是粗糙集的计算性能对运行时间的影响是需要解决的问题。

本文将基于近似决策熵的属性约简算法用于对故障样本数据的预处理。该算法在分类精度、运行时间等方面优于传统的基于信息熵的属性约简算法等多个算法[10]。具体步骤为:

第一步:对连续数据进行离散化、标准化,得到原始决策表。

第二步:对原始决策表进行约简,删除冗余属性,得到约简决策表。

第三步:将约简数据样本作为BP神经网络的输入进行训练。

4 仿真实验及分析

4.1 汽轮机振动故障信息系统

本文所采用的数据为模拟转子实验台采集的故障数据[11-12],模拟转子实验台可用于研究轴系振动特性,同时测量x和y方向轴的相对振动,在实验台上人为制造了4组故障试验,本文选取其中的3种故障数据作为训练数据,包括不平衡、碰磨和油膜振荡等故障信息,每类故障选取5组数据,构成3类15组数据样本,如表1所示。

其中f1为转速工频。另选取3类9组故障数据作为测试样本,验证网络性能。表1中的征兆数据是根据给定的征兆提取公式获得的,例如,2倍频信号的征兆提取公式为X2f1/Xf1≥K,即相应频谱信号幅值与工频信号幅值的比值,若其大于给定的判别基准,则认定为故障征兆。其中,X代表振幅,K代表该成分振动是否存在的判别基准。

4.2 连续决策表离散化

将故障数据的频谱值作为条件属性,故障类别作为决策属性,构建原始决策表。根据频谱值特性将连续决策表离散化,得到离散化后的决策表,如表2所示,其中,决策属性1代表不平衡故障,2代表碰磨故障,3代表油膜振荡故障;条件属性中的c1~c9分别代表频谱值(0.01~0.39)f1,(0.4~0.49)f1,0.5f1,(0.51~0.99)f1,1f1,2f1,(3~5)f1,奇数f1,>5f1(f1为转速工频);离散化后的决策表中离散型数值0代表连续属性值范围为(0,0.1),离散型数值1代表连续属性值范围为(0.1,0.3),数值2代表范围为(0.3,1)。

表2 离散化后的故障样本决策表

4.3 故障样本属性约简

利用基于近似决策熵模型的属性约简算法对故障样本进行预处理,决策表进行属性约简后的故障样本见表3。

由表3可知,得到约简条件属性集为[c4,c5,c6],即频谱值为(0.51~0.99)f1,1f1,2f1,共3个属性,剔除了冗余故障征兆,简化了样本空间。

表3 约简后的故障样本

4.4 信息熵与BP神经网络结合故障分类

当隐含层神经元个数不同时,比较预测误差,如表4所示。可知隐含层节点数为11时分类正确率较高,且训练时间较短,因此确定该网络隐含层节点个数为11,即网络结构为3-11-3。

表4 不同隐含层神经元个数时的网络性能

为了验证本文方法的可行性和有效性,用信息熵与BP神经网络结合的方法和传统BP神经网络进行对比。使用9个测试样本对训练好的BP神经网络进行分类准确性的检验,离散化后的测试样本如表5所示,表中只给出了约简后的属性数据。图1为传统BP神经网络预测类别和实际类别的比较,由图可知,在9个样本数据中,7个数据分类正确,2个数据分类错误,分类准确率为77.78%。图2为近似决策熵与BP神经网络结合方法的预测结果比较,由图可知,在9个样本数据中,8个数据分类正确,1个数据分类错误,其中不平衡故障和油膜振荡故障全部分类正确,分类准确率为88.89%。

表5 离散化后的测试样本决策表

由图1、图2比较结果可知,近似决策熵与BP神经网络结合的方法比传统BP神经网络方法分类准确度更高。

图1 传统BP神经网络预测结果

图2 近似决策熵与BP神经网络结合的预测结果

分别用传统BP神经网络(BP NN)、近似决策熵与BP神经网络结合(ADE-BP NN)两种方法对故障样本进行10次训练。可得平均预测分类正确率和运行时间(表6)。将预测结果与基于粗糙集和支持向量机分类方法(RS-(LS-SVM))[10]的诊断结果进行对比,如表6所示。

可知,与传统的BP神经网络相比,近似决策熵与BP网络的结合方法消除了反应不明显的故障征兆,将原始的9维数据集降为3维,在不改变分类能力的条件下简化了BP网络结构,最终使得训练时间减少,网络性能得到改善。与基于粗糙集和支持向量机的分类方法相比,本文提到的方法有更高的分类精度。因而验证了本文提到的基于近似决策熵模型的属性约简算法与神经网络结合的可行性和有效性,体现了其在数据挖掘方面的应用价值[13-17]。

表6 不同方法网络性能比较结果

5 结论

本文将信息熵与神经网络相结合应用于汽轮机振动故障诊断,采用近似决策熵模型进行属性约简,在保证分类能力不变的条件下简化了网络结构。结果表明,约简结果剔除反应不明显的故障征兆,有效降低了神经网络的输入维数,提高了神经网络的收敛速度,提高了故障分类预测的正确率,验证了本文方法的有效性。该方法可以实现运行过程中快速准确判断故障类型,提高维修效率,具有工程实用价值。

[1]张小易,徐兵,张岩,等.利用气象等影响要素的电力系统故障元件识别与故障原因分析[J].华北电力大学学报(自然科学版),2014,41(6):14-21.

[2]张鹏,郝一川.粗糙集-神经网络在民航飞机故障数据处理中的应用[J].控制工程,2016,23(1):87-90.

[3]李虎成,邱建东,李屹.基于粗糙集-BP神经网络的机车滚动轴承故障诊断[J].计算机与数字工程,2014,42(3):526-530.

[4]王学明.几种粗糙集模型及与神经网络相结合的研究[D].成都:电子科技大学,2013.

[5]李伟,何鹏举,杨恒,等.基于粗糙集和改进遗传算法优化BP神经网络的算法研究[J].西北工业大学学报,2012,30(4):601-606.

[6]洪月华.一种基于蚁群算法与粗糙集的混合BP神经网络[J].微电子学与计算机,2014,31(4):156-159.

[7]马立新,郑晓栋,尹晶晶.主分量启发式约简算法的短期负荷预测[J].电力科学与工程,2015,31(1):27-30.

[8]王秋平,陈志强,魏浩.基于数据挖掘的电站运行参数目标值优化[J].电力科学与工程,2015,31(7):19-24.

[9]李建强,姜翻,汪安明,等.粗糙集在控制燃煤电厂NOx排放中的应用[J].电力科学与工程,2014,30(12):19-23.

[10]江峰,王莎莎,杜军威,等.基于近似决策熵的属性约简[J].控制与决策,2015,30(1):65-70.

[11]张鸿雁.基于改进支持向量机方法的汽轮机故障诊断研究[J].煤矿机械,2008,29(7):197-199.

[12]李鹏.基于粗糙集和支持向量机的汽轮机振动故障诊断研究[D].保定:华北电力大学,2009.

[13]李成,于永斌,王舜燕,等. 基于BP和WTA神经网络的滚动轴承故障诊断方法研究[J]. 计算机与数字工程,2017(2):291-298.

[14]王松岭,许小刚,刘锦廉,等.基于符号动力学信息熵与改进神经网络的风机故障诊断研究[J].华北电力大学学报(自然科学版),2013,40(4):51-58.

[15]刘国庆,史小春,廖强.基于神经网络分类算法的电机轴承故障检测方法[J].微特电机,2017,45(1):30-33,37.

[16]刘鑫,贾云献,孙磊,等.基于BP神经网络的变速箱故障诊断方法研究[J]. 计算机测量与控制,2017,25(1):12-15.

[17]韩中合,韩悦,朱霄珣.基于IMF信息熵与SVM的转子振动故障智能诊断方法[J].华北电力大学学报(自然科学版),2012,39(4):81-85.

Fault Classification Prediction Based on Entropy and BP Neural Network

SUN Hairong1,WANG Rui1,2,GENG Junya1,2

(1.School of Control and Computer Engineering,North China Electric Power University,Baoding 071003,China;2. Hebei Engineering Research Center of Simulation & Optimized Control for Power Generation,North China Electric Power University,Baoding 071003,China)

In order to determine the fault type quickly and accurately during the normal operation of a power plant, and solve the problem that the convergence rate of Neural Network (NN) decreases dramatically with the increase of the inputs, a new prediction scheme based on entropy was presented. The model of approximation decision entropy was used to reduce attribute of the fault sample and then the reduction results were used as the inputs of BP NN. The scheme was applied to the vibration fault classification prediction of the steam turbine. The prediction results were also compared with the ones obtained by other algorithms. The results show that the input dimension of BP NN was reduced, and the proposed scheme obtains smaller reductions and higher classification accuracies with relatively low computational cost. This scheme will have the practical value on fault diagnosis.

rough set;neural network;approximation decision entropy;fault classification prediction;steam turbine

10.3969/j.ISSN.1672-0792.2017.03.009

2016-09-05。

中央高校基本科研业务费专项资金(2016MS143)。

TP18

A

1672-0792(2017)03-0049-06

孙海蓉(1972-),女,副教授,博士,研究方向为智能控制、数据挖掘、火电厂优化控制、故障诊断。

猜你喜欢

决策表约简粗糙集
基于决策表相容度和属性重要度的连续属性离散化算法*
基于Pawlak粗糙集模型的集合运算关系
基于二进制链表的粗糙集属性约简
实值多变量维数约简:综述
基于模糊贴近度的属性约简
多粒化粗糙集性质的几个充分条件
双论域粗糙集在故障诊断中的应用
正反转电机缺相保护功能的实现及决策表分析测试
两个域上的覆盖变精度粗糙集模型
一种改进的分布约简与最大分布约简求法