APP下载

基于粗糙集理论和FCM的轨道电路故障诊断模型

2019-08-27李林霄

铁道标准设计 2019年9期
关键词:约简轨道电路粗糙集

李林霄,董 昱

(兰州交通大学自动化与电气工程学院,兰州 730070)

引言

ZPW-2000A作为目前铁路广泛运用的一种轨道电路设备,与人民生活密切相关,对其安全性和可靠性的要求较高。当轨道电路发生故障时,就很有可能发生火车相撞等事故,损害人身安全。轨道电路故障诊断是依据监测数据(包括正常和设备故障数据),判断当前故障发生在何种设备上,以便维修人员可以快速找到故障点进行维修,提高维修效率。

近年来,国内外已经引入一些较为先进的故障诊断概念和算法来诊断轨道电路故障,用来提高故障自动智能诊断的效率和能力。文献[1]提出一种基于模糊神经网络的轨道电路故障诊断模型,验证了4种常见故障。文献[2]采用一种自适应最优核时频分布提取数据的时频分布信息的方法,该方法可以解决轨道电路补偿电容故障的定位问题。文献[3]将轨道电路复杂网络分解成许多小的神经网络组态,并对常见的6种故障进行故障诊断。文献[4]使用信息融合技术定位轨道电路故障,得到良好的效果。然而这些方法都忽略了随机收集的监测数据,关联性高、数据量大且维数较高。因此初选的特征之间存在冗余和相容性,并且需要大量的数据进行分析,对数据的需求较高。

粗糙集理论(Rough Sets)是一种强有力的数据分析的理论工具,用于处理模糊、不完全和海量的数据,可对数据进行降维和特征选择[5]。约简是粗糙集理论研究的核心,每个约简结果都拥有和原始数据类似的分类能力。属性约简的作用是提取特征属性的有效信息,使知识处理的过程得以简化并提高数据的利用率。本文采用主分量式的约简算法并结合相容度概念,使用相容度模型快速选定核集,主分量式选取要素属性,从而得到最优化或者较为优化的属性约简。最终实现预处理数据,简化原始样本集。

轨道电路故障诊断的核心是分类。模糊认知图(Fuzzy Cognitive Map, FCM)具有简单的推理过程和数学建模方法,用来解决不确定性的数据内在特征和模式的系统。在工程[6]、医疗[7]、环境和管理等众多领域广泛应用。FCM的分类性能与其权重的选择有着密切的关系,但由于其选择的权值通常是根据专家的经验得出,具有个人主观性和局限性。

近些年,粗糙集理论与FCM算法相结合的方法已经在不同领域广泛应用。由于粗糙集理论能够通过提取主要特征信息简化原始数据,达到消除样本的噪声及冗余信息的目的,弥补了由于FCM建模时庞大的节点数而造成的系统过大,运行速度过慢的缺点。该方法已成功应用于文本分类、安全评估、数据挖掘等相关领域。

为了能够更为准确地判别故障,提出一种基于粗糙集,并结合模糊认知图的轨道电路故障诊断模型。在保证分类能力不变的情况下,使用改进主分量启发式算法对原始样本进行降维处理,降低样本的维数,减少FCM训练和分类的时间。FCM训练过程中利用最小二乘法(Least Squares, LS)和历史数据确定对FCM权值,并使用实例检验该方法是否能够有效地应用在轨道电路故障诊断。

1 算法简介

属性约简算法,是在分类能力不变时,从原始数据中剔除其冗余特性,得到有效的相关属性。当前,约简算法主要可分为两方面的内容。一是,通过求得核属性来得到约简集;二是,通过比较启发式信息的属性重要度得到约简集。在本文中,第一步使用相容度概念求出属性核,第二步使用差异矩阵建造分量函数,与此同时对分量值进行排序补充约简集,最后得到最优约简集。

1.1 主分量启发式的约简算法

粗糙集定义:信息知识表达系统是S=(U,A,V,f),U表示非空有限集合,即为论域;C∪D=A是属性集,C是条件属性,D为决策属性;V是属性的值域;f为度量函数。

相容度:信息系统S=(U,A,V,f),A包含C,D[8]。若在信息系统S中,有Ci⟹Di(i=1,2,…,n)且Cx⟹Cy(x,y=1,2,…,n),说明Cx与Cy相容。则属性ai的相容度的计算公式[9-10]

kai=|PosC(D)|/|(C,D)| (0≤kai≤1)

(1)

式中,(C,D)是C、D决策算法;算法正区域用PosC(D)表示;当kai=1,算法相容;当kai≠1,D部分依赖于C,故其相容度为kai。

主分量启发式算法是基于差别矩阵,产生属性的分量函数,其中某属性ai的分量函数[11]

(2)

式中,count(ai)为属性ai的次数;card(mij)为集合的基数。在约简过程中,当使用启发式信息定义的属性重要度求取属性时,通常会假设所选属性是唯一的。之后采取分量函数可以免除(次数和比值)多个属性满足前提时可能留存的冗余现象。

差别矩阵是提取核属性的一个方法,但容易出现较大误差。因此为达到直接且快速地完成核属性的选取的目的,提出将相容度定义和主分量启发式算法相结合的搜索方法,详细算法如下。

输入:决策系统DS=(U,C∪D,V,f)参数kai,fmc(ai)。

输出:信息系统S的最优约简集。

步骤1:依据式(1),算出各个属性的相容度kai;

步骤2:选出kai≠1的条件属性,当作核集,记作CORE(P)={ai|kai≠1};

步骤3:根据主分量启发式算法得到kai=1的要素属性,操作过程如下。

(1)解差别矩阵M,同时计算矩阵中的单个属性(相对核),若不存在,采用步骤2得到的核集。

(2)根据式(2)获得差异矩阵M内每个属性的分量函数值,在mij≠0时,取属性元素M*,记为M*={mij|mij∩CORE=Ø,mij≠0,∀i,j}。

(3)降序排列M*中的属性,依据分量函数值fmc(ai)。

步骤4:得到最优约简集。

1.2 模糊认知图

模糊认知图分类原理:在对输入数据通过模糊认知图的有限动态迭代之后,当系统中节点的状态值在每次迭代后,不再发生变化,此时的状态值,则为样本所属的类别。输入训练样本集(x1,y1),(x2,y2),…,(xN,yN),通过推理规则求解迭代过程中各时刻的状态值[12]:

(3)

通过Sigmod函数将函数的值保证在[0,1]上。最终,根据终止条件确定迭代是否继续进行,此时终止条件[13]是

(4)

1.3 最小二乘法求取FCM权值

目前对于FCM权值的计算方法分为两个方面,一个方面是根据专家意见人为确定,这种方法误差较大,个人主观性较强,另一个方面是利用智能算法计算求得,但无论是利用遗传算法,还是粒子群算法在FCM权值的学习过程中都需要进行反复的迭代运算,因此计算量庞大,很难满足实际需求。本文提出基于最小二乘法的模糊认知图学习法(Least Squares FCM, LS-FCM),该方法不需要迭代计算,省去了迭代终止条件和事先指定参数的工作[14]。

由式(3)可以得到

(5)

(6)

式中,左边是类节点状态值,右边是对类节点产生影响的特征节点的状态值。也就是说左端只有因变量,右端只有自变量。为了寻求满足自变量x(it)和因变量yt的最佳权重值wi,则可以转化为求取如下平方差的最小权值[15]wi

(7)

(8)

设A=(xit)n×T,i=1,2,…n,t=1,2,…T,w=(w1,w2,…,wn)T,D=(D1,D2,…,DT)T,则式(8)可以改写为

AD=AATw

(9)

则可以求出w的表达式为

w=(AAT)-1AD

(10)

当FCM具有N个概念节点时,只需对i=1,2,…,N分别求解线性方程式(10),即可得出FCM的所有权值。因此,根据历史数据,应用LS-FCM算法可以获得FCM的权值。

2 轨道电路故障诊断模型

由于FCM分类器输入的原始样本各属性之间存在一定的相容性和冗余,本文将相容度的概念引入到主分量启发式算法中,目的为找到最优的特征属性节点,提取原始数据中最主要的特征参数信息、降维并减少占用的空间和运行的空间,并利用最小二乘法来计算FCM节点之间的权重。最后根据权重建立FCM轨道电路诊断模型,对样本进行训练和分类。综上,本文所提出的新型诊断模型可以分为3个阶段:属性约简、权重计算和FCM分类。诊断过程如图1所示。

图1 轨道电路故障诊断模型

3 实验仿真与分析

本文选用现场ZPW-2000A轨道电路在某区段的历史故障数据,包括主轨道故障、小轨道故障、衰耗盒故障、发送器和共用发送通道故障。选择这些故障特征参数以分类和识别轨道电路故障。当轨道电路正常时,所测数据在标准范围之内,若所测数据异常,则轨道电路有可能发生故障。由此,通过判断所测数据是否正常,可以判断轨道电路处于正常工作状态还是发生故障。本文选取的ZPW-2000 A轨道电路历史数据的10个特征参数作为条件属性,主要包括主轨道输入电压、小轨道输入电压、轨输出1、轨输出2、GJ电压、衰耗器“XG”电压、XGJ电压、发送功出、载频频率、模拟网络盘电压,将信息熵的离散化方法应用于连续属性进行离散化处理[17-18],并标记为Ci,i=1,2,…,10,以轨道电路的5种故障类别作为决策属性D,依次标号为1,2,3,4,5。

通过公式(1)计算每个属性的相容度,得到核集COPE(P),即是kai≠1的条件属性,则有CORE(P)={C2,C8}。利用式(2)计算剩余条件属性的分量值fmc(ai),则有fmc(a5)=fmc(a7)=fmc(a9)=fmc(a10)=0,最终得到的约简集合为CORE(P)={C1,C2,C3,C4,C6,C8}。

为了综合评估RS-LS-FCM的分类模型,使用准确率(Accuracy)、召回率(Recall)、运行时间以及迭代次数进行评判[19]。将测试数据进行归一化处理到[0,1]区间,通过LS算法求得关联矩阵,设置λ系数为1,ε取值为0.01,通过10次交叉验证,表1列出其结果。

表1 实验比较结果

对表1进行分析可以得到:

(1)相比较人工计算权值,利用LS算法确定权值有较高的准确率和召回率,表明LS算法可提高FCM的分类性能;

(2)结合属性约简算法后,FCM分类的准确率和召回率升高,并且运行时间和迭代次数都有所减少,说明属性约简可以提高FCM判别效率。

为了更有效地分析属性约简后的模型分类能力,分别考虑在50,60,80,100组数据情况下,比较约简前后FCM的分类性能。图2可以看出属性约简保证了分类能力的不变。

图2 准确率对比结果

考虑到不同循环次数对FCM分类运行精度的影响,对约简前后FCM分类器进行对比,查看各自的收敛情况,对比结果如图3所示。

图3 收敛对比结果

分析图3可以知道,约简前迭代次数在达到200次左右收敛,约简后迭代次数在170次左右收敛。结果说明属性约简可以降低迭代次数,减少运行时间。

4 结论

(1)由于轨道电路历史数据中特征属性间存在冗余和重复的特点,提出利用主分量启发式和相容度相结合的算法,获取原始数据中最主要的特征参数。实验表明,属性约简算法可以在确保分类能力不变的状态下,能够相对准确地提取主要特征参数。

(2)考虑到人工法和其他智能算法确定权值都需要进行大量迭代的问题,利用最小二乘法技术构建线性方程来求解权值,节省大量的迭代循环,增加准确度。

(3)通过对不同样本的测试得到诊断模型的平均准确率达到87.75%,运行时间达到3.54 s,说明此方法识别率较高,而且能够在短时间内快速、准确地定位故障。

猜你喜欢

约简轨道电路粗糙集
粗糙集与包络分析下舰船运行数据聚类算法
基于混合增量式属性约简的中医甲状腺结节诊疗规律分析
基于Pawlak粗糙集模型的集合运算关系
基于0-1规划的最小属性约简算法
基于HHT及LCS的轨道电路传输变化识别探讨
区间轨道电路智能诊断系统的探讨
基于DSP的25Hz相敏轨道电路接收设备的研究和实现
多粒度犹豫模糊粗糙集*
FTGS轨道电路离线测试平台开发
直觉模糊序决策系统的部分一致约简*