基于SOM-BP混合神经网络的道岔设备退化状态研究
2020-06-10高利民许庆阳孟景辉杨树忠
高利民,许庆阳,李 锋,杨 吉,孟景辉,杨树忠
(1.中国国家铁路集团有限公司 铁路基础设施检测中心,北京 100081;2.中国铁道科学研究院集团有限公司 基础设施检测研究所,北京 100081;3.朔黄铁路发展有限责任公司,河北 肃宁 062350)
道岔作为铁路系统重要的线路连接设备,主要包括道岔和道岔转换部分,其所处环境复杂,易受风沙、雨雪等恶劣天气影响,是铁路系统工电结合部重点关注的设备之一,据现场调研发现,每年道岔设备维护工作量约占工务、电务设备维护工作量的1/3 以上。铁路现场主要通过采集道岔转换过程中的电流、时间等参数,反映道岔的工作状态,利用信号集中监测系统中的道岔转换电流、功率曲线进行人工判断道岔设备的使用状态[1]。该方法过于依赖工作人员的现场经验,且易造成漏检漏报现象,导致设备出现维修不足及过维修等问题。因此,有必要准确掌握道岔设备实际工作状态,以保证其可靠运行。
国内外学者在道岔设备故障诊断方法取得了很多研究成果。Asada 等人[2]提出了一种小波变换(WT)与支持向量机(SVM)组合的状态识别方法,利用SVM 学习WT 提取的功率信号特征数据,并在此模型基础上对道岔故障进行识别。Vileiniskis[3]、程宇佳[4]等人采用SVM 方法对道岔设备典型故障进行诊断学习,得到典型故障分类器模型用于道岔故障诊断。李雅美[5]、Zhang K[6]、Yilboga H[7]等人则是利用神经网络对道岔设备故障进行诊断学习。这些学者通过将机器学习方法与道岔设备故障数据结合建立故障诊断模型,从而精确识别不同类型的故障状态。但是这类方法将道岔设备的状态简单化分为正常和故障,未能描述道岔设备的退化过程,难以实现故障超前预判。因此有必要针对道岔设备退化状态展开研究,对故障进行预判以减少故障发生的概率。
本文提出基于SOM-BP 混合神经网络的道岔设备退化状态分析方法。采用SOM 神经网络对经特征处理后的道岔功率数据进行多次无监督聚类学习,得到典型退化状态样本,利用BP 神经网络建立退化状态识别模型,从而实现道岔设备退化状态的识别。
1 道岔动作功率数据
信号集中监测系统(CSM)是铁路信号设备的综合监测平台,通过实时监控并记录设备的运行数据,为铁路部门掌握设备的当前状态和开展维护工作提供依据。CSM 通过采集道岔动作过程中转辙机的功率、电流以及电压数据实时监测道岔运行状态。相较于道岔动作电流曲线,功率曲线不仅能体现电气电路特性,与道岔转换力也有一定的关系,更能体现道岔的实际状态,故本文针对道岔动作功率数据展开研究。图1给出了道岔正常动作的功率曲线[8]。
图1 道岔正常动作功率曲线
结合道岔动作过程,按时间先后顺序可将道岔动作功率数据划分3个区段:解锁、动作—锁闭及缓放区段,分别对应图1中的A,B和C共3个区段。
2 基于混合神经网络退化状态研究方法
为了研究道岔退化过程,提出一种基于SOM-BP混合神经网络的道岔设备退化状态分析方法。该方法主要包含3部分内容。
(1)特征参数处理。对原始数据集进行特征参数提取和选择处理,得到低维特征参数集。
(2)状态挖掘。采用SOM 神经网络对非故障特征参数集进行聚类分析,得到具有不同特点的退化状态数据。
(3)状态识别。使用BP 神经网络对道岔设备退化状态进行识别分类。
图2为方法的总体流程,其中SOM 神经网络用于挖掘道岔退化数据,BP 神经网络用于识别退化状态。
图2 基于SOM-BP混合神经网络道岔退化状态分析方法流程
2.1 特征参数处理
由于道岔正常动作1 次约采集165 个动作功率数据,数据点数过多,需针对功率数据进行特征参数处理,以便得到合适维数的特征输入。
对功率信号数据按区段分析发现,解锁区段数据有较大峰值,动作—锁闭区段数据平缓,且持续时间较长,而缓放区段数据均值较小,且持续时间较短。针对不同区段数据特点,按照表1的特征参数分别提取各区段数据,其中由于B区段数据点数较多且曲线较为平缓,故将B 区段平均划分为5 个小区段:B1,B2,B3,B4和B5,分别提取每个小区段的进出口差值、平均值、差分和等统计特征。
特征提取后,需进一步对提取的特征进行特征选择,以得到合适维数的特征输入。在进行特征选择过程中,有多种方法可供选择。其中平均影响值(Mean Impact Value,MIV)常被用来描述输入神经元对输出神经元的影响大小,是神经网络中评价变量相关性最好的指标之一,可用于进行典型特征选择,表2给出了前15维特征参数的MIV 位次表,后续将以该15 维特征作为模型的输入。具体计算过程如下。
(1)利用原始样本P对BP神经网络进行训练,得到正确的神经网络模型。
(2)网络训练终止后,将原始训练样本P中每一维输入特征参数在其原值的基础上分别加和减10%构成新的训练样本P1和P2。
表1 各区段提取的特征参数
表2 前15维特征参数的MIV值位次表
(3)将P1 和P2 分别作为新的输入样本,输入到已建成的神经网络模型,得到输出结果A1和A2。
(4)计算A1与A2的差值,即为变动该维输入特征后对输出结果产生的影响变化IV。
(5)将IV 按样本数平均得出该维输入特征对于输出结果的影响变化,即网络输出的MIV。
(6)依次计算出各维输入特征的MIV 值,根据MIV 绝对值的大小确定各维特征参数排序,得到候选集特征对网路输出影响相对重要性的位次表,从而判断出输入特征对于网络结果的影响程度,即实现了特征选择过程。
2.2 基于SOM神经网络退化状态挖掘
SOM 神经网络是一种自组织竞争型神经网络,由输入层和竞争层组成,其结构如图3所示。其中,输入层神经元个数为m1,与输入样本向量xSOM=(x1,x2,…,xm1)的维数相同。竞争层,也称输出层,该层的n1个神经元呈二维(2D)阵列分布。2层神经元之间通过可变权值进行全连接,连接权值为ωSOM,ij(i=1,2,…,m1;j=1,2,…,n1)。SOM 神经网络通过对输入特征进行自组织映射,不断调整网络权值,使各神经元分布收敛于一种表现形式,此时不同神经元对不同输入模式匹配或敏感,从而完成无监督学习并自动聚类[9]。但SOM 神经网络学习结果具有不确定性,且易陷入局部最优。故采用多次不同数量竞争层神经元输出的SOM 神经网络模型对道岔动作功率特征进行学习,并建立相应的选择策略综合分析各次聚类结果,以得到具有不同特点的道岔退化状态。
图3 SOM神经网络结构模型
使用SOM 神经网络进行退化状态挖掘过程如下:
1)网络结构设计
确定输入层、竞争层神经元数目。根据特征处理结果,将功率数据降维至15 维,故输入层神经元数目为15 个。通过对道岔功率数据进行初步分析,拟建立6~8个退化状态,故本文分别设置竞争层神经元数目为(3×3),(4×4)和(5×5)个。
2)确定神经网络训练参数
为满足SOM 神经网络学习需求,本文设置领域半径范围是[0.2,1.5],学习概率范围是[0.01,0.1],网络共学习调整10 000次。
3)输入特征归一化处理
对输入特征进行归一化处理,以减少值的差异性对算法的影响,采用最大最小归一化处理方法[10],计算公式为
式中:xi,k为第k个样本第i维特征数据;为N个样本特征中的最小值;为N个样本特征中的最大值;xi,k′为归一化后的特征数据。
4)网络权值调整
输入m1维特征向量xSOM=(x1,x2,…,xm1),计算竞争层神经元与输入向量的欧式距离,以得到与输入向量距离最近的神经元j*。将j*作为获胜神经元,满足其中输入向量xSOM=(x1,x2,…,xm1)与竞争层神经元j之间的距离dj计算公式为
之后,按式(3)更新获胜神经元j*和他邻域的权值。
式中:xi为第i维特征输入;ωSOM,ij′为更新后连接权值;η为1个大于0小于1的常数,随着时间变化逐渐下降到0。
领域Ni(j)定义为
式中:cpos和jpos分别表示神经元c和j的位置;norm计算2神经元之间的欧式距离;r为领域半径。
5)退化状态挖掘
针对由N个输入特征向量xSOMk(k=1,2,…,N)组成的输入特征矩阵X。采用多次不同数量竞争层神经元输出,最终得到聚类序列集合Cset1={(a1,k,b1,k,c1,k)|k=1,2,…,N},其中,a1,k,b1,k,c1,k是第k个样本3 次学习结果,(a1,k,b1,k,c1,k)表示第k个样本对应的聚类序列,N为实际样本个数。针对聚类序列集合Cset1,建立有效的退化状态挖掘策略,以提高模型的准确性。具体操作如下:
(1)统计sn×sn竞争层聚类样本数目不小于的神经元进行编号,并构建神经元编号集合SNum1。根据Cset1的第1 维数据,选择出输入特征矩阵X中与SNum1所属编号对应的样本。利用选择出的样本构建数据集Dset1={xk1|k1=1,2,…,N1}以及对应的聚类序列集合Cset2={(a2,k1,b2,k1,c2,k1)|k1=1,2,…,N1},其中N1为选择后的样本数。
(2)统计sn+1×sn+1竞争层聚类样本数目不小于的神经元编号,并构建神经元编号集合SNum2。根据Cset2的第2 维数据,选择出输入特征矩阵X中与SNum2所属编号对应的样本。利用选择出的样本构建数据集Dset2={xk2|k2=1,2,…,N2}以及对应的聚类序列集合Cset3={(a3,k2,b3,k2,c3,k2)|k2=1,2,…,N2},其中N2为第2次选择后的结果。
(3)统计sn+2×sn+2竞争层聚类样本数目不小于的神经元编号,并构建神经元编号矩阵SNum3。根据Cset3的第3 维数据,选择出输入特征矩阵X中与SNum3所属编号对应的样本。利用选择出的样本构建数据集Dset3={xk3|k3=1,2,…,N3}以及对应的聚类序列集合Cset4={(a4,k3,b4,k3,c4,k3)|k3=1,2,…,N3},其中N3为第3次选择后的结果。
(4)根据sn+2×sn+2,sn+1×sn+1竞争层神经元距离分布,分析SNum3集合中各神经元邻域,将距离最近的神经元进行合并,结果编号与聚类数目最多的神经元保持一致,并更新样本数据集Dset4={xk4| k4=1,2,…,N4}以及对应的聚类序列集合Cset5={(a5,k4,b5,k4,c5,k4)|k4=1,2,…,N4}。
(5)根据Cset5,将Dset4中的样本整理至各自对应的聚类状态下。分析各状态的功率曲线,找到正常状态对应的类别并将其移除。最后得到退化状态数据集。具体流程如图4所示。
图4 退化状态挖掘流程
2.3 基于BP神经网络退化状态识别
BP神经网络是一种多层前馈神经网络,主要由输入层、隐藏层和输出层组成[11],网络结构如图5所示。其中输入层神经元数目m2与输入数据xBP=(x1,x2,…,xm2)的维数保持一致,隐藏层神经元数目根据需求设置,输出层神经元数目数n2根据预期分类值Y={y1,y2,…,yn2}设置,ωBP,ij(i=1,2,…,m2;j=1,2,…,p) 和ωBP,jk(j=1,2,…,p;k=1,2,…,n2)分别为输入层神经元和隐藏层神经元、隐藏层神经元和输出层神经元间的连接权值,其中p为隐藏层神经元个数。该网络的主要特点是信号前向传递,误差反向传播。
图5 BP神经网络结构模型
利用BP神经网络进行退化状态识别过程如下。
1)网络结构设计
确定各层神经元数目采用3层神经网络结构,其中输入层神经元个数与道岔功率数据输入特征维数保持一致,数目为15个。最终建立6种退化状态识别分类器,故输出层神经元数目为6个。针对隐藏层神经元数目,根据经验公式其中m2和n2分别为输入层和输出层神经元数目,a为0~10之间的常数,确定隐藏层神经元数目p的范围在[5,15]之间变动,计算BP 神经网络识别模型的预测误差如图6所示,选取误差最小的值作为最优隐藏层神经元数目,最后选择隐藏层神经元数目为13个,从而设定15-13-6型神经网络结构模型。
图6 分类误差率与隐藏层神经元数目关系曲线
2)输入特征归一化处理
按照2.2 节所述数据归一化方法对输入数据进行归一化处理,消除各维数据间数据级差别。
3)测试集与训练集数据选取
根据“留出法”设定训练集数据与测试集数据比例为3∶1[12],使用训练集数据进行BP 神经网络的训练。
4)确定神经网络训练参数并进行模型训练
采用自适应学习率梯度下降算法进行网络训练,学习率为0.01。
5)准确性验证
利用测试集数据验证基于BP 神经网络的退化状态识别准确性。
3 试验验证
为验证基于SOM-BP 混合神经网络的道岔退化状态研究方法的可行性,现场采集了近2 个月共计2 300 个不同区段道岔动作非故障功率信号数据进行分析,具体实验分析步骤与结果如下。
1)基于SOM神经网络退化状态挖掘
对2 300个非故障功率数据样本按上述方法进行特征处理后,分别采用(3×3),(4×4)和(5×5)3种SOM 神经网络竞争层神经元输出,得到图7和图8的结果。图7为不同数量竞争层神经元输出的神经元样本分布,其中六角晶格表示竞争层的神经元,神经元内的数字是聚类的样本数目。图8给出了聚类后的竞争层神经元的距离分布。其中,紫色的六角晶格代表竞争层神经元。彩色的连接带用来度量神经元间的距离。连接带颜色的深浅表示神经元间距离的远近。
利用分析流程对SOM 聚类样本进行选择、合并以及移除,最终得到6 种道岔退化状态。表3给出了各状态的聚类序列和样本数目以及退化状态的描述。
这些退化状态的样本的数目总计818 个,约占非故障数据集的35.57%。这说明数据集中有绝大部分样本未被划分至退化状态中。这些样本可分为正常和中间状态样本。道岔在由正常至退化状态的转移过程中,会经历若干个中间状态。这个状态与正常状态之间的差异模糊。与挖掘出的退化状态相比,中间状态不具备典型性以反映道岔设备的退化。因此,它们未被划分至退化状态。这说明在退化挖掘过程中,应选择大容量、样本类型多样的数据集,以获得多个能够表示道岔退化特点的状态。
图7 不同数量竞争层神经元输出的样本分布
图8 竞争层神经元的距离分布
表3 退化状态挖掘结果
图9—图14分别给出了退化状态的功率曲线及局部放大图,可以发现,状态4、状态5、状态6的功率曲线在动作和锁闭区段有明显的波动,且波动程度依次增加,通过与现场人员交流推断出3种状态与道岔转换过程阻力异常故障有关;状态1曲线解锁功率过低,且锁闭时功率幅值有异常波动,从而推断出由于道岔密贴不足导致解锁功率峰值低,与道岔锁闭设备故障有关;状态2 曲线在锁闭时有异常波动,与现场人员交流发现该类数据与锁闭过程中阻力异常故障有一定关联;而状态3曲线的功率值整体偏低,但波动程度不存在异常,与其他5个状态相比,这一状态的退化特点并不明显。通过查看现场维护日志,推断状态3产生的原因可能是转辙机在投入使用前调试不完善所致。
图9 退化状态1功率曲线及局部放大图
图10 退化状态2功率曲线及局部放大图
图11 退化状态3功率曲线及局部放大图
图12 退化状态4功率曲线及局部放大图
2)基于BP神经网络退化状态识别
采用SOM 神经网络对非故障功率数据进行聚类学习后,得到出6 种道岔设备典型退化状态样本。针对这6 种退化状态,建立样本数为600 个的退化数据集,其中各状态样本数为100个。按照3∶1的比例随机划分数据集中各状态样本,分别用于构建训练数据集和测试数据集。使用训练集数据训练BP 神经网络,并利用测试集数据验证模型的分类准确性。图15为BP 神经网络的分类结果和分类误差,最终测试样本的分类准确率达到95.56%。
图13 退化状态5功率曲线及局部放大图
图14 退化状态6功率曲线及局部放大图
表4展示了不同方案的识别结果。基于MIV降维的BP 神经网络的准确率最高。与SVM 相比,BP 神经网络在多分类问题上有更大的优越性。此外,如果未对特征集数据进一步降维,而是直接使用原始维数数据集对模型进行学习,则会造成模型的准确率较低,证明了对功率数据进一步降维处理的必要性。
4 结 论
(1)利用道岔设备动作功率数据,针对道岔退化状态展开研究。
(2)提出一种基于SOM-BP 混合神经网络的道岔设备退化状态研究方法,采用SOM 神经网络进行多次聚类学习并建立选择策略得到6种典型退化状态样本,使用BP 神经网络对退化状态样本进行识别,从而建立退化状态挖掘-识别模型。
图15 BP神经网络分类结果及误差
表4 不同组合方法退化状态识别结果准确率 %
(3)最终采用SOM-BP 混合神经网络进行退化状态识别准确率达到95.56%,证实所提出的方法可有效用于道岔设备退化状态研究。