APP下载

基于粗糙集的机车牵引变流器故障诊断方法

2012-08-06岳生吉王焕民牛彩云

铁路计算机应用 2012年3期
关键词:断点约简变流器

岳生吉,王焕民,牛彩云

(1. 兰州交通大学机电技术研究所,兰州730070;2. 兰州大学第一医院信息中心,兰州 730000 )

当前,我国的机车故障诊断技术相当程度上依赖于“计划修”,而机车设计日趋复杂导致机车故障复杂多样,从而加大了机车检修的困难。为有效实现机车“状态修”,需要对实时获取的故障数据进行必要的数据挖掘[1]。对此,粗糙集是一种行之有效的方法,其主要思想就是在所提供的不确定、不精确、不完整的数据保持分类能力不变的前提下,进行知识约简,获得易于处理、鲁棒性强的决策方案。依据粗糙集理论提出的大型复杂机车电器故障诊断维修方案,具有很好的应用前景。

1 粗糙集理论

1.1 粗糙集理论的发展

粗糙集理论是由波兰数学家Z.Pawlak于1982年首次提出的一种用于数据分析的理论[2],是研究不精确、不确定性知识的工具。近些年来,随着研究工作的不断深入,粗糙集理论得到了迅速的发展,已经广泛应用于数据决策与分析、模式识别、机器学习、知识获取和发现、故障诊断、专家系统等多个领域。

1.2 粗糙集理论基础

粗糙集理论引入了两个重要的概念[3~4]:“约简”(reduct)和“核”(core)。“约简”即为不含多于属性并保证分类正确的最小条件属性集,一个决策表可能含有多个约简;“核”为约简的交集,是所有在条件属性中对决策属性起重要作用、不可省略的属性组成的集合。

设R是一个等价关系族,r∈R,如果ind(R)=ind(R-{r}),则称r为R中不必要的;否则称r为R中必要的。如果任一r∈R都为R中必要的,则等价关系族R是独立的;否则称R为依赖的。如果P=R-{r}是独立的,则P是R中的一个约简。R中所有不可约去的关系组成的集合称为R的核,记作core(R)。其中,core(R)=∩red(R),red(R)是R的所有约简。设P和Q为U中的等价关系,Q的P正域为posP(Q),即。Q的P正域是U中所有根据分类U/P的信息可以准确地划分到关系Q的等价类中去的对象集合。它们的依赖关系为:

γP(Q)=|posP(Q)|/|U|,其中0≤γP(Q)≤1。依据γP(Q)判定P和Q是否相容。当γP(Q)=1时,二者相容;否则不相容。

2 基于粗糙集故障诊断方法

基于粗糙集的故障诊断(FDD)技术是一种基于知识的“软诊断”技术,已经逐渐应用于机车检修等领域[5~6]。本文提出的基于粗糙集的机车牵引变流器故障诊断方法,首先是对故障数据经过数据采集、数据管理、预处理(即连续属性离散化)、知识约简(属性约简和值约简),得出故障诊断规则,接下来把规则入库。当故障诊断模块被调用时,利用故障诊断规则对新输入数据进行诊断,如果新样本符合规则,说明系统运行正常;否则进入故障定位,给出故障诊断报告。

具体诊断原理如图1。

3 实验

图1 机车故障诊断原理框图

机车牵引变流器是电力机车能量转换过程中一个重要设备,也是机车上的关键设备之一[7]。当整个牵引系统出现故障时,在变流器上会突出的反映和表现出来,其特征参数的变化主要是输出电压和电流的波形畸变。对变流器进行MATLAB仿真,可以得到充足的故障数据。对主变流器输出电压通过小波变换提取波形的7个能量值作为故障特征,在决策表中,这7个故障特征作为条件属性C={ca6,cd6,cd5,cd4,cd3,cd2,cd1},其中,ca6是低频能量,cd6、cd5、cd4、cd3、cd2、cd1均是高频能量,决策属性D=faultNO,faultNO是故障号。原始数据见表1。

表1 原始数据表

(1)将数据编入Matlab软件可识别的文件中,并对其调用相应的程序,对数据离散化处理[8],得到具有离散属性的决策表如表2。需要说明的是,合理进行连续属性值离散化,是体现故障诊断归纳过程合理性的关键。由于本文试验中原始样本数据单个属性值变化波动不大,故离散化时选用等距离划分算法[9]。此方法不考虑各断点段中属性值个数的多少,仅仅根据用户给定的参数,把属性值简单地划分为等距离的断点段。若属性的最大值、最小值分别为xmax、xmin,需要划分的断点段个数为k,则断点间隔为δ=(xmax-xmin)/k,因而得到此属性上的断点为xmin+iδ,i=0,1,…,k。实际应用中,k值对应于不同属性的状态个数,这往往要依据研究对象的本身故障属性或者具体工作人员的经验来确定。如k值过大,则会使得最终的规则可信度相对较低;如值过小,则不易体现相应故障的特征。本实验中,faultNO有4种,经过验证,当k=5时分类更具有代表性。例如:令属性ca6=a,amax=7.321 7,amin=6.189 2,断点间隔为,δ=(7.321 7-6.189 2)/5=0.226 5,把属性ca6分为5个区间:[6.189 2, 6.415 7] 、[6.415 7,6.642 2] 、[6.642 2, 6.868 7] 、[6.868 7, 7.095 2] 、[7.095 2, 7.321 7] 。这5个区间分别用0、l、2、3、4来表示,就得到了属性的量化值。需要说明的是,采用等距离划分算法时,断点段的边界值划分在哪个区间,对最终故障分类的影响不大。

表2 决策表

(2)根据粗糙集理论进行处理提取决策属性[10],先转化为二进制分辨矩阵,然后再进行化简。最终得到的属性约简如表3。

(3)由上述结果可知,核属性为ca6,cd1约简为{ca6, cd6, cd1}或者{ca6, cd4, cd1}。这里取约简{ca6, cd6, cd1}产生的规则。故得表4。

(4)对此进行简化处理,以表4的第1行为例,对(ca6)4(cd6)0(cd1)0→(faultNO)1:由于在表4中仅有(ca6)4(cd6)0→(faultNO)1,所以“(ca6)4(cd6)0→(faultNO)1”和“(ca6)4(cd6)0(cd1)0→(faultNO)1”相容。又有(ca6)4(cd1)0→(faultNO)1在表4中也是唯一的,所以“(ca6)4(cd1)0→(faultNO)1”和“(ca6)4(cd6)0(cd1)0→(faultNO)1”也相容。还有(ca6)0(cd1)0→(faultNO)1(第1行)和(ca6)0(cd1)0→(faultNO)2(第5行),所以“(ca6)0(cd1)0→(faultNO)1”和“(ca6)4(cd6)0(cd1)0→(faultNO)1”不相容。从而,cd6和cd1均可省,而cd6不可省。依次处理,最后得到决策规则核值表,见表5。

表3 最终得到的属性约简

表4 由约简得到的规则

表5 决策规则核值表

(5)由表得5到如下规则:

(ca6)4∨(cd6)2→(faultNO)1

(ca6)1∨(ca6)0(cd6)0∨(cd1)1→(faultNO)2

(ca6)0(cd6)1(cd1)0→(faultNO)3

(ca6)1(cd6)2→(faultNO)4

通过以上操作,便可应用新建立的决策规则表处理故障检测数据。在使用数据来提取新规则时,有时还需通过专家按其经验对部分数据进行校验修正。决策表是通过新规则的加入而不断更新的。从实验结果看出,在保持分类能力不变的前提下,大量的故障数据被约简,从而挖掘出新的决策规则。由此看出,应用粗糙集的方法来约简大量的故障数据是十分有效的。

4 结束语

本文将粗糙集理论应用于机车电器故障诊断,对一组机车牵引变流器的不完备故障数据进行处理,得出对故障诊断有价值的规则。粗糙集数据库的建立及更新加强了机车故障诊断的能力,从而逐渐提高处理数据的效率和精度。基于粗糙集的机车故障检测在应用方面有广阔的前景。

[1] 王冬梅,王继成.基于粗糙集的机车电线路故障诊断方法[J] . 长春工业大学学报(自然科学版),2008,29(5):541-545.

[2] 张文修,吴伟志,梁吉业,等. 粗糙集理论与方法[M] . 北京:科学出版社,2001:1-56.

[3] Tuan-Fang Fan, Duen-Ren Liu, Gwo-Hshiung Tzeng. Rough set-based logics for multicriteria decision analysis[J] . European Jouranl of Operational Research, 2007(182): 340-355.

[4] William Zhu. Generalized rough sets based on relations[J] .Information Sciences, 2007(37): 12-27.

[5] 王仲生.智能故障诊断与容错控制[M] . 西安:西北工业大学出版社,2005:172-214.

[6] 张学毅.铁路机车故障智能诊断的实现[J] .计算机测量与控制,2005,13(5):428-430.

[7] 崔光玮. SS8机车变流装置中硅远元件损坏后的故障现象[J] .机车电传动,2002(2):56-57.

[8] 石博强,滕贵法,李海鹏,等. MATLAB数学计算范例教程[M] . 北京:中国铁道出版社,2004.

[9] 郭亚中,左洪福,王华伟.基于粗糙集的民航飞机故障诊断规则获取方法[J] . 系统工程理论与实践,2006(11).

[10] 马跃峰,赵予.一种基于粗糙集理论的数据挖掘算法的研究[J] . 洛阳大学学报,2006,21(2):5-8.

猜你喜欢

断点约简变流器
一种适用于继电保护在线整定的极小断点集求取算法
基于粗糙集不确定度的特定类属性约简
用Eclipse调试Python
一类无限可能问题的解法
用于能量回馈装置的变流器设计与实现
一种风电变流器并联环流抑制方法
近似边界精度信息熵的属性约简
实值多变量维数约简:综述
广义分布保持属性约简研究
基于背靠背变流器的并网控制研究