APP下载

粗糙集约简算法在变压器故障诊断中的应用研究

2015-06-23吕宏丽

唐山学院学报 2015年3期
关键词:决策表约简粗糙集

吕宏丽

(唐山学院 信息工程系,河北 唐山 063000)

粗糙集约简算法在变压器故障诊断中的应用研究

吕宏丽

(唐山学院 信息工程系,河北 唐山 063000)

将粗糙集理论和神经网络技术应用于变压器故障诊断中,粗糙集约简作为神经网络的前置单元,采用基于属性重要性的约简算法。详细阐述了基于属性重要性的约简算法和实现方法,经实际数据训练和测试结果表明,该算法减少了输入样本数,提高了训练速度效率和故障诊断准确率,验证了该算法应用于变压器故障诊断系统的可行性和有效性。

故障诊断;神经网络;粗糙集;属性约简;属性重要性

0 引言

电力变压器是电力系统中输电、变电、配电设备中最重要和最昂贵的设备之一,其运行状态的安全与否直接关系到整个电力系统的安全性和经济性。变压器故障诊断技术一直是学术界研究的热点,变压器故障的因果关系复杂,其中蕴涵着较大的冗余性。采用传统的神经网络诊断方法,由于不能有效地简化知识,压缩样本空间,影响了诊断的实时性与效率。由于目前智能故障诊断技术发展趋势是将多种诊断技术融合起来,从而实现优势互补,因此本设计将粗糙集理论引入变压器故障诊断中,用于简化数据,提高诊断速度。

粗糙集理论是由波兰华沙理工大学Z.Pawlak教授于1982年提出来的,是一种处理不确定信息的数学工具,具有对数据进行压缩和约简的能力,同时不需要任何先验信息,因此更具有客观性[1],被广泛应用于人工智能、模式识别和故障诊断等领域。粗糙集理论的主要思想是通过属性约简和值约简,导出问题的决策或分类规则,其核心内容是属性约简。

属性约简是在保持信息系统的分类能力不变的前提下,去除其中的冗余属性。经过属性约简能形成精简的规则库以便作出快速、准确的决策。目前属性约简算法主要有:启发式约简算法[2-4]、基于差别矩阵的属性约简算法[5]和基于属性重要性的属性约简算法[6]。这些属性约简算法各有优缺点,而本设计选用基于属性重要性的约简算法。

1 基于属性重要性的属性约简算法

属性的重要性是建立在属性的分类能力上的,属性的重要程度是当删除该属性时,考察对信息系统的分类产生的影响。如果删除前后分类没有变化,说明属性重要程度低;如果产生相应的变化,说明该属性重要。

1.1 信息系统的定义

粗糙集理论研究的信息系统通常用一个数据表来表示[7]。S=(U,A,V,f)是一个信息系统,其中U是非空的对象集,即U={X1,X2,…,Xn},U中的每个xi称为一个对象;A=C∪D是表示属性的非空有限集合,C={c1,c2,…,cm}称为条件属性集合,D={d1,d2,…,dk}表示决策属性集合;V=∪va,∀a∈A,va表示属性的值域;f=U×A→V是一个信息函数,它对一个对象的每一个属性赋予一个信息值,即x∈U,a∈A有f(x,a)∈va。

1.2 属性重要性的定义

设S=(U,A,V,f)是一个信息系统,X⊆A,∀x∈(A-X)的重要性定义为:

(1)

其中|X|=|IND(X)|,IND(X)是由X构造的不可分辨关系。具有不可分辨关系的对象是属性值完全相同的对象,所以只要通过判断离散决策表中各样本的不可分辨关系,就能够找到重复的实例。

信息系统I=(U,A),X是A中的属性子集,属性x∈A,当x加入到集合X使得其分辨程度越大,就说明属性x对集合X的重要性越大。

定理[8]:设S=(U,A,V,f)是一个信息系统,P⊆A,若|U/P|=|U/A|,且∀x∈P,有SigP-x(x)>0,则P为A的一个约简。

令X⊆A,如果X-CORE(X)≠φ,CORE(X)=RED(X)的充分必要条件是SigCORE(X)(x)=0,x∈X-CORE(X)。

其中CORE(X)为信息系统的“核”。“核”可以作为所有约简的计算基础,因为核包含在所有的约简之中。RED(X)表示信息系统的“约简”。

图1 属性约简算法流程图

基于属性重要性的属性约简算法分成两个阶段:第一阶段先计算出决策表中单个属性的重要性,当某一属性的重要性大于零时此属性为核属性,并入到核属性集CORE中;第二阶段以核属性为基础,计算条件属性集中除核以外其他属性的重要性,取重要性最大的属性加入到核集中形成新的集合RED,再以RED为基础依次循环下去直至剩下所有属性的重要性都为零,最后就得到了属性约简结果。图1为算法流程图。2 变压器故障诊断系统

油中溶解气体分析方法(DisoslvdeGasesAnalyssi,简称DGA)作为一种有效的油浸式电力变压器异常监测手段,在电力系统得到广泛的应用。其诊断原理是运行中的变压器会产生一定数量的氢气(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)等气体,正常运行和故障运行时气体的组分、含量及产气速率不同从而判断是否发生故障。典型故障分为低能放电、高能放电、中低温过热、高温过热[9]。

以DGA为基础,建立粗糙集神经网络(RoughSetNeuralNetwork,简称RSNN)故障诊断系统。神经网络可以确定变压器油中溶解气体组分含量与变压器故障之间的非线性映射关系;粗糙集理论在变压器故障知识不完备的情况下,采用基于属性重要性的属性约简算法对样本数据进行约简,去除冗余属性和冗余样本,作为神经网络系统的前置单元。图2为RSNN系统框图。

图2 RSNN系统框图

3 属性约简算法的应用

结合DGA方法,选取氢气(H2),甲烷(CH4),乙烷(C2H6),乙烯(C2H4),乙炔(C2H2)为故障诊断的五种特征气体,以其组分含量占总含量的百分比作为神经网络的输入向量,输出层表示变压器工作状态:正常、低能放电、高能放电、中低温过热、高温过热,分别表示为1,2,3,4,5。选取15组数据作为训练样本,离散化处理得到原始决策表(见表1),8个样本输入数据作为条件属性分别用{C1,…,C8}表示,样本输出数据作为决策属性用D表示。

条件属性集C对决策表的划分是:

U/C={{x1},{x2},{x3},{x4,x6},{x5},{x7},{x8},{x9},{x10},{x11},{x12},{x13},{x14},{x15}}。

在条件属性集C中依次去除属性C1,…,C8,新的划分为:

U/C-{C1}={{x1},{x2},{x3},{x4,x6},{x5},{x7},{x8},{x9},{x10},{x11},{x12},{x13,x15},{x14}},

U/C-{C5}={{x1},{x2},{x3},{x4,x6},{x5},{x7,x8},{x9},{x10},{x11},{x12},{x13},{x14},{x15}},

U/C-{C2}=U/C-{C3}=U/C-{C4}=U/C-{C6}=U/C-{C7}=U/C-{C8}=U/C。

表1 训练样本原始决策表

根据公式(1)推演出去除各属性后的重要性公式为

(2)

计算出各属性的重要性如表2所示。

表2 各属性的重要性

根据属性重要性的计算结果,得到CORE(C)={C1,C5}。

令RED(C)=CORE(C),约简对U的划分为

U/RED={{x1},{x2},{x3},{x4,x6},{x5},{x7},{x8},{x9},{x10},{x11,x12},{x13},{x14},{x15}},

U/RED+{C2}=U/RED+{C8}={{x1},{x2},{x3},{x4,x6},{x5},{x7},{x8},{x9},{x10},{x11},{x12},{x13},{x14},{x15}},

U/RED+{C3}=U/RED+{C4}=U/RED+{C6}=U/RED+{C7}=U/RED。

根据公式(1)计算基于核属性的属性重要性,见表3。

表3 基于核属性的各属性重要性

将15组原始样本数据经过粗糙集约简后,作为三层BP神经网络系统的输入层数据,选取LM算法,训练目标误差为0.001,依次采用不同的隐含层节点数,当隐含层为10时训练次数和测试正确率最佳,RSNN诊断系统训练曲线如图3所示。与之对比,将15组原始样本数据直接作为三层BP神经网络系统的输入层数据,其它参数与前设置相同,当隐含层为7时训练效果最佳,图4为NN诊断系统训练曲线图。

图3 RSNN诊断系统训练曲线图

图4 NN诊断系统训练曲线图

选取10组数据作为RSNN和NN诊断系统的测试样本,测试结果如表4所示。

表4 两种方法的测试结果比较表

4 结论

通过将粗糙集理论与BP神经网络相结合形成RSNN智能方法进行变压器故障诊断,把粗糙集约简作为神经网络的前置单元。测试结果表明,基于属性重要性的约简算法在变压器故障诊断系统中实现了样本化简,较之常规的神经网络诊断系统的变压器故障诊断训练效率提高,故障诊断准确率提高。

[1] Pawlak Z. Rough set[J]. International Journal of Computer and Information Science,1982,11(5):341-356.

[2] 蔡莉,胡学刚.一种基于依赖度的决策表属性约简算法[J].安庆师范学院学报:自然科学版,2008,14(1):37-39.

[3] 王国胤,于洪,杨大春.基于条件信息熵的决策表约简[J].计算机学报,2002,25(7):759-766.

[4] 卢佳华.基于属性频率函数的粗糙集属性约简算法[J].武汉大学学报:理学版,2006,52(3):331-334.

[5] 蒋瑜,王燮,叶振.基于差别矩阵的Rough集属性约简算法[J].系统仿真学报,2008,20(14):3717-3720.

[6] 廖启明.基于粗糙集理论的属性约简与求核算法研究[D].长沙:长沙理工大学,2012.

[7] 周献中,黄兵,李华雄,等.不完备信息系统知识获取的粗糙集理论与方法[M].南京:南京大学出版社,2010:120-121.

[8] 丁军,高学东.一种信息系统的快速属性约简算法[J].计算机工程与应用,2007,3(14):173-176.

[9] 李俭.大型电力变压器以油中溶解气体为特征量的内部故障诊断模型研究[D].重庆:重庆大学:2001.

(责任编校:李高峰)

Application of Rough Set Reduction Algorithm in Fault Diagnosis of Power Transformer

LV Hong-li

(Department of Information Engineering,Tangshan College,Tangshan 063000,China)

In this paper, the rough set theory and neural network technology are applied to transformer fault diagnosis, through reduction algorithm with rough set reduction as the pre-unit of neural network. Reduction algorithm and its implementation are discussed in detail. The actual training data and test results show that rough set reduction algorithm reduces the number of input samples, improves the training speed and efficiency and accuracy of fault diagnosis. In conclusion, the application of rough set reduction algorithm to fault diagnosis system of power transformers is feasible and effective.

fault diagnosis;neural network;rough set;attribute reduction;attribute significance

TP299

A

1672-349X(2015)03-0029-03

10.16160/j.cnki.tsxyxb.2015.03.010

猜你喜欢

决策表约简粗糙集
粗糙集与包络分析下舰船运行数据聚类算法
基于决策表相容度和属性重要度的连续属性离散化算法*
基于粗糙集不确定度的特定类属性约简
基于Pawlak粗糙集模型的集合运算关系
带权决策表的变精度约简算法
近似边界精度信息熵的属性约简
实值多变量维数约简:综述
广义分布保持属性约简研究
基于决策等价性的决策表属性集分解研究*
一种基于粗糙集理论的社交网络潜在路径研究