基于GA-BP神经网络的列控车载设备故障诊断方法研究
2018-12-18周璐婕董昱
周璐婕,董昱
基于GA-BP神经网络的列控车载设备故障诊断方法研究
周璐婕,董昱
(兰州交通大学 自动化与电气工程学院,甘肃 兰州 730070)
针对列控车载设备故障复杂且故障分析多依赖人工经验完成等问题,以车载安全计算机记录的AElog故障数据为样本,提出一种基于反向传播(Back Propagation, BP)神经网络的车载设备智能故障诊断方法。为避免初选特征信息冗余,通过主分量启发式属性约简算法,对样本进行降维降噪处理。另外,考虑到BP神经网络对初始网络权重非常敏感,以不同的权重初始化网络,往往会收敛于不同的局部极小,利用遗传算法对BP神经网络的初始权值/阈值进行优化。研究结果表明:加入属性约简提高分类器的分类性能,通过遗传算法优化的BP神经网络避免局部极小问题,且迭代步数少,降低平均误差,提高分类精度。
车载设备;故障诊断;属性约简;遗传算法;BP神经网络
在高速铁路安全运营中,列控车载设备是重要的行车控制设备,是保证正常运行的核心。在实际运行中,列控车载设备的故障比例相对较高。目前,车载设备的故障检查和维护主要依赖于工作人员的经验,已不能满足现代化铁路高速运行的需求,因此,进一步研究列控车载设备故障诊断技术具有重要的意义。近年来,基于数据驱动的智能故障诊断技术在铁路领域得到了大量的应用。赵阳等[1−2]以电务人员记录的故障信息表为依据,提出了基于贝叶斯网络的车载设备智能诊断方法,实现用故障现象挖掘故障原因。但故障数据不规范,不易获得有用信息,算法要求特征属性间条件独立,很难满足。王振显等[3−4]提出了基于案例推理的故障诊断方法,通过建立案例库完成故障识别和定位,由于实际应用中全面的案例库获得难度大,其完备性影响诊断效率和效果,为诊断带来较大的困难。赵阳等[5−6]引入专家知识完成对诊断网络的优化,实现了故障诊断分类,但对专家水平和经验依赖度强,规则过多可能出现组合爆炸。车载设备结构复杂,故障模式多样,其诊断的核心是分类。BP神经网络结构简单,适合求解内部机制复杂的问题,能够以任意精度逼近任何非线性函数。反向学习通过反复调整网络权值阈值,实现最小化实际与期望输出间的差异[7]。现已成功应用于诸多领域的故障诊断系统中[8−9]。但BP神经网络的初始权值和阈值是随机选取的,取值不当会引起网络振荡不宜收敛问题,容易陷入局部极小值,每次训练后的结果差异较大。初选故障特征间存在冗余和相容性,粗糙集理论(Rough Sets)具有较强的定性分析能力和属性约简能力,可以对数据降维和特征选择。文献[10]证实,通过粗糙集进行属性约简不仅可以提高诊断能力,而且可以简化神经网络结构,提高训练和学习效率。针对列控车载故障的特点和现有技术的缺陷,本文以列控车载安全计算机记录的AElog数据为依据,提出一种基于粗糙集和遗传BP神经网络相结合的列控车载故障诊断模型。在保证分类能力不变的前提下,采用属性主分量启发式约简算法,在差别矩阵的基础上构造出属性的分量函数,简化原始样本集,提高训练效率。利用遗传算法(Genetic Algorithm, GA)全局寻优特性和稳健性[11]优化神经网络初始的权值和阈值,再将寻优结果带入神经网络利用BP算法进行训练。不仅能发挥BP神经网络泛化的映射能力,而且避免了局部极小问题,提高分类精度。并结合实例验证该方法在列控车载故障诊断中的有效性。
1 背景介绍
1.1 列控车载设备
目前,CTCS-3级列控车载系统采用C2/C3一体化设计,设备为分布式的结构,300T车载设备双系冷备,核心控制模块采用“单硬件双软件”设计,由车载设备Profibus总线和车辆MVB双总线进行不同模块的连接[12]。CTCS3-300T型列控车载设备主要由CTCS-3控制单元(ATPCU)、CTCS-2控制单元(C2CU)、测速测距单元(SDU)、应答器信息接收模块(BTM+CAU)、轨道电路信息接收单元(TCR)、人机界面(DMI)、司法记录单元(JRU)、网关(TSG)、安全无线传输单元((STU-V)和安全数字输入输出单元(VDX) 等组成[13],其结构如图1 所示。
CTCS3-300T车载设备的ATPCU,C2CU,SDP和TSG 4个模块中有记录信息,其中ATPCU的记录信息最为重要,在运行过程中,列控车载安全计算机记录的AElog数据按时间顺序逐条记录了模块正常工作或故障时的标志性语句。其故障的标志性语句是由英文短句进行描述的,BTM工作异常导致的BTM端口无效的实例如截图2所示,ATPCU AElog报“Balise Port invalid”或“StatusPort invalid in BTM”。本文主要关注故障语句及所属故障类别。
1.2 属性主分量启发式约简算法
属性约简可以剔除信息中的冗余属性,实现数据的降维和特征选择,是粗糙集理论研究的核心内容之一。本文通过差别矩阵提取出核属性,再利用其构造分量函数,并按分量值补充约简集,得到最优约简集。
粗糙集定义:知识表达系统S由一个4元组构成,可表示为S(,,,),其中是论域;∪是属性集,是条件属性,为决策属性;是属性集的值域;为度量函数。
设有知识表达系统=(,,,),定义差别矩阵(c),c表示差别矩阵中的第行第列的元素,(,)是数据对象在条件属性上的具体值,则其任一元素c可定义为:
式中:=1, 2, …,;=1, 2, …,。
主分量启发式算法是在差别矩阵的基础上构造出属性的分量函数,某一属性w的分量函数[14]为:
式中:
图2 ATPCU记录的AElog数据(部分)截图
先利用差别矩阵求核属性,再将其余元素中较大的分量函数值也加入到约简集中。若不能通过差别矩阵得到核属性,则可将分量函数值较大的属性作为约简集。这样可减少对原始决策表的遍历,使约简更加简单。本文给出了属性主分量启发式约简算法具体过程如下所示:
3) 对中的属性,依据分量函数值的大小降序排列。
此方法减少了对决策表的遍历搜索,也不用简化差别矩阵,针对有核或无核的决策表,均可利用分量函数得到约简集。
1.3 BP神经网络
网络的输出为:
输出层第个神经元的输出误差为:
输出层所有神经元误差能量总和:
因梯度下降法具有简单、并行能力强等优点,常用此算法修正网络的权值和偏差。按梯度下降法得到误差能量在各权阈值上的梯度为:
1.4 遗传算法优化BP神经网络
通过GA优化BP神经网络的初始权阈值来提高网络的学习收敛速度,优化后的BP神经网络更好地预测函数的输出[15],GA优化BP神经网络的流程如图3所示。
图3 GA优化BP网络流程图
其中GA优化BP神经网络如下。
1) 染色体编码
通常GA采用二进制编码,但神经网络的权值阈值初始化后为大量浮点数,若采用二进制编码则导致位串过长,影响搜索效率,因此本文采用浮点数编码直接进行自然描述[16],无编码解码过程,以相对较小的长度实现足够大精度的要求。并随机产生初始种群。
2) 适应度函数
适应度函数可对种群中每个个体进行评估,与性能的优良成正比,适应度越高,被选择概率越大,则利用其将神经网络初始权值阈值的最优解分布范围缩小,再经过BP算法精确求解,以防止神经网络陷入局部极小,从而达到加速收敛,减少训练次数的目的。适应度函数一般由所求问题的目标函数转化得到。以神经网络的误差能量作为所求问题的目标函数,要求误差越小越好;而用遗传算法对BP神经网络优化,要求适应度值越大越好,因此确定GA的适应度函数为:
式中:为种群大小;′()和()分别为此神经网络第个节点的期望输出与实际输出;为一个很小的正量。
3) 遗传操作算子
采用Monte Carlo法选择算子[17],个体适应度越大,被选择的概率越高。设种群数量为,个体的适度值为,则选中个体的概率为:
从父代里随机选择2个个体w和w随机独立地选连接值进行交换,其在位的交叉操作为:
其中:为[0,1]间的随机数。
以某一较小的概率完成均匀变异,使个体适应度更高,从局部角度逼近最优解。变异后的新基因值为:
其中:max和min分别为初始个体的最大和最小值,为[0,1]间的随机数。
将GA得到的最优个体作为神经网络的初始权值阈值,再按BP算法进行训练。
2 基于粗糙集和神经网络的车载设备故障诊断
本文以AElog故障数据为样本,数据间存在关联性和冗余性,通过选择特征词,建立空间向量模型(Vector Space Model, VSM),利用主分量启发式算法对特征属性进行最优选择,实现数据预处理。用遗传算法优化神经网络的初始权值和阈值,经BP算法实现模型训练和分类。诊断过程如图4所示。
2.1 数据预处理
在故障语句中提取故障特征词作为训练基础,在去除停用词后,利用卡方检验(Chi-square test, CHI)进行特征选择,CHI可以有效衡量特征项和类别之间的相关度,同时考虑了特征存在与不存在时的情况。以BTM故障为例,共选取特征词{state, BTM, StatusPort, invalid……BSA}等28个词,故障类型如表1所示。
图4 列控车载设备故障诊断模型
表1 故障类型表
再通过词频-逆文件频率(term frequency -inverse document frequency,TF-IDF)以选择出来的特征频率为基础计算相应的权重,完成词语到向量空间的转换,依此建立故障决策表。
式中:a表示词汇在文本中出现的次数,表示全部训练集中的文本数;N表示训练文本中出现的文本频率;根据经验来定,一般取0.01。
由于初选故障特征间存在冗余和相容性,会使之后的网络训练变得复杂,利用粗糙集进行约简,先将原始决策表的属性权重通过聚类(K-means)的方法离散化,设聚类个数为3,再通过主分量启发式算法,利用差别矩阵计算核集,再用式(2)求其余属性的分量值F(w),最终获得{state, Statusport, Status,Telegram,invalid,data,port,inactive,Protocol,mism,Temporary,Missed,BSA,permanent,active,Transmission,hours,Different,timeout,Progress,startup}等21个词,将其按顺序编号作为条件属性。约简后的故障决策表,如表2所示。减少了神经网络的输入节点数量,简化网络结构。
表2 故障诊断决策表
2.2 基于GA优化BP神经网络的构建
依故障诊断决策表设计3层BP网络结构,隐层神经元个数依据经验公式(16)得到一个范围,再通过比较不同神经元个数的网络收敛误差来确定,如表3所示。
其中:,分别为输入、输出神经元个数;为1-10之间的整数。
本例中的隐层和输出层激活函数均选Sigmoid函数,最终确定隐层神经元个数12个。由此所确定的BP网络拓扑图如5所示。
表3 隐层不同神经元个数的训练误差对比
随机产生网络的权阈值集,按前述的GA对其全局寻优法得到最优解集,以此作为初始值,利用梯度下降法进行反向传播训练。
图5 BP神经网络模型拓扑结构
3 仿真实验与分析
利用Matlab/simulink作为仿真集成环境训练BP神经网络,训练函数选trainlm,学习速率0.1,目标误差10−5,最大迭代次数1 000次。其训练误差曲线如图6所示。可以看出在第24步达到收敛。
利用GA-BP网络结构,采用与BP网络相同的训练样本,其差别仅在于BP网络权值和阈值初始化时由系统随机分配,GA-BP网络的权值和阈值由GA优化得到。由BP网络确定待优化的权值个数为21×12+12×8=348,待优化阈值个数为12+8=20,共由368个变量。设置初始种群数目40个,选择参数0.09,交叉算子0.75 ,变异概率0.01。
图6 BP神经网络误差曲线
可得遗传算法目标函数随代数的变化曲线如图7所示,其适应度随代数的变化曲线如图8所示,曲线均在42代趋向平缓,说明优化到42代网络可获得最优个体。
图7 GA目标函数随代数变化曲线
图8 GA适应度随代数变化曲线
网络误差曲线如图9所示,在第5步达到收敛状态。
图9 GA-BP神经网络误差曲线
由图10和图11中的验证误差和测试误差曲线,可以看出误差变化基本一致,说明样本集的划分基本合理。
图10 验证误差曲线
图11 测试误差曲线
为综合评价网络的实际性能,采用收敛步数、测试样本平均绝对误差,测试样本最大绝对误差和准确率(Accuracy)进行评判,通过验证得到表4所示的结果。
对表4分析可以得到:
1) 加入属性约简算法后,平均误差和正确率都较约简前有了改善,迭代次数有所减少,说明属性约简可以提高神经网络的性能。
2) 遗传算法优化后的BP神经网络训练时收敛速度远大于未优化的BP神经网络。约简后,平均绝对误差降低了48.92%,正确率也相对提高了5.26%。
表4 实验结果对比
4 结论
1) 车载记录的AElog数据的特征属性冗余,通过采用主分量启发式算法提取主要特征,实验表明,该方法可以较准确的提取主要特征参数,提高训练效率和分类能力。
2) 通过实验验证得到RS-GA-BP诊断模型的准确率达到93.02%,平均绝对误差降低了48.92%,说明优化后的网络模型能更加准确的进行故障分类,减少迭代步数,避免了局部极小问题,降低了平均误差,提高了分类精度。
3) 本文以车载安全计算机记录的AElog数据入手,提出一种基于遗传算法优化BP神经网络的列控车载设备故障诊断方法。计算机记录的数据规范、全面,很好的提供了本研究的数据支持,以BTM故障为例进行实际仿真验证,证实本文提出的故障诊断模型的有效性和准确性,也为高速铁路列控车载设备故障诊断的优化提供依据。
[1] 赵阳, 徐田华, 周玉平, 等. 基于贝叶斯网络的高铁信号系统车载设备故障诊断方法的研究[J]. 铁道学报, 2014, 36(11): 48−53. ZHAO Yang, XU Tianhua, ZHOU Yuping, et al. Bayesian network basedfault diagnosis system forvehicle on-board equipmentof high-speed railway[J]. Journal of Railway Science and Technology, 2014, 36(11): 48−53.
[2] 梁潇, 王海峰, 郭进, 等. 基于贝叶斯网络的列控车载设备故障诊断方法[J]. 铁道学报, 2017, 39(8): 93−100. LIANG Xiao, WANG Haifeng, GUO Jin, et al. Bayesian network basedfault diagnosis method foron-board equipment of train control system[J]. Journal of China Railway Society, 2017, 39(8): 93−100.
[3] 王振显. 基于案例推理的高铁信号系统车载设备故障诊断[D]. 北京: 北京交通大学, 2015. WANG Zhenxian. CBR-based fault diagnosis of system for vehicle equipment of high speed railway[D]. Beijing: Beijing Jiaotong University, 2015.
[4] ZHAO Hui, LIU Jingwei, DONG Wei, et al. An improved case-based reasoning method and its application on fault diagnosis of Tennessee Eastman process[J]. Neurocomputing, 2017, 249(1): 266−276.
[5] 赵阳, 徐田华. 基于文本挖掘的高铁信号系统车载设备故障诊断[J]. 铁道学报, 2015, 37(8): 53−59. ZHAO Yang, XU Tianhua. Text mining based fault diagnosis for vehicle on-board equipment of high speed railway signal system[J]. Journal of Railway, 2015, 37(8): 53−59.
[6] CHENG Shu, CHEN Fang, LI Wei. Research on expert system for electric locomotives fault diagnosis[J]. Advanced Materials Research, 2012(562−564): 927−932.
[7] Rob Callan. Artificial intelligence[M]. Beijing: Electronics Industry Press, 2004.
[8] LONG Qi, GUO Shuyong, LI Qing, et al. Research of converter transformer fault diagnosis based on improved PSO-BP algorithm[C]// Materials Science and Engineering Conference Series, 2017: 012015.
[9] 谢敏, 吴亚雄, 闫圆圆, 等. 基于改进动态自适应模糊Petri网与BP算法的电网故障诊断[J]. 中国电机工程学报, 2015(12): 3008−3017. XIE Min, WU Yaxiong, YAN Yuanyuan, et al. Fault diagnosis of power grid based on improved dynamic adaptive fuzzy Petri nets and BP algorithm[J]. Proceedings of the Chinese Society of Electrical Engineering, 2015(12): 3008−3017.
[10] LIAO Hongmei, DING Shifei, WANG Miaomiao. An overview on rough neural networks[J]. Neural Computing and Applications, 2016(7): 1805−1816.
[11] 刘浩然, 赵翠香, 李轩, 等. 一种基于改进遗传算法的神经网络优化算法研究[J]. 仪器仪表学报, 2016(7): 1573−1580. LIU Haoran, ZHAO Cuixiang, LI Xuan, et al. An improved neural network optimization algorithm based on improved genetic algorithm[J]. Journal of Instrumentation, 2016(7): 1573−1580.
[12] 张曙光. CTCS-3级列控系统总体技术方案[M]. 北京: 中国铁道出版社, 2008: 198−218. ZHANG Shuguang. CTCS-3 train control system overall technical scheme[M]. Beijing: China Railway Press, 2008.
[13] 中国铁路总公司编著. 列控车载设备典型故障案例[M]. 北京: 中国铁道出版社, 2013: 6−94. China Railway Corporation. Typical fault case of train control on-board equipment[M]. Beijing: China Railway Press, 2013: 6−94.
[14] 马立新, 郑晓栋, 尹晶晶. 主分量启发式约简算法的短期负荷预测[J]. 电力科学与工程, 2015, 31(1): 27−30. MA Lixin, ZHENG Xiaodong, YIN Jingjing. Short term load forecasting based on principal component heuristic reduction algorithm[J]. Electric Power Science and Engineering, 2015, 31(1): 27−30.
[15] 曾小华, 李广含, 宋大凤, 等. 基于遗传算法优化的BP神经网络侧翻预警算法[J]. 华南理工大学学报(自然科学版), 2017(2): 30−38. ZENG Xiaohua, LI Guanghan, SONG Dafeng, et al. BP neural network rollover warning algorithm based on genetic algorithm optimization[J]. Journal of South China University of Technology (Natural Science Edition), 2017(2): 30−38.
[16] ZHENG Feilong, ZENG Liangcai, LU Yundan, et al. Fault diagnosis research for servo valve based on GA-BP neural network[J]. Journal of Computational and Theoretical Nanoscience, 2015(9): 2846−2850.
[17] 王志斌, 孔亚楠, 刘永成, 等. 遗传算法优化BP神经网络的大功率LED结温预测[J]. 光电子·激光, 2014(7): 1303−1309. WANG Zhibin, KONG Yanan, LIU Yongcheng, et al. Genetic algorithm optimized BP neural network for high power LED junction temperature prediction[J]. Journal of Opto Electronics·Laser, 2014(7): 1303−1309.
(编辑 蒋学东)
Research on fault diagnosis method for on-board equipment of train control system based on GA-BP neural network
ZHOU Lujie, DONG Yu
(School of Automation and Electrical Engineering, Lanzhou Jiaotong University, Lanzhou 730070, China)
The on-board equipment of train control system is the core of the safe operation of high-speed rail. Due to the complexity of fault reason, fault analysis depending on the personal experience and other issues, this paper proposes an intelligent fault diagnosis method based on Back Propagation (BP), which takes AElog fault data from vehicle safety computer records as samples. In order to avoid the redundancy of features selected, the main component heuristic attribute reduction algorithm is adopted to achieve dimension reduction and noise reduction. In addition, considering that the BP neural network is very sensitive to the initial weights, thus it will converge to different local minimum when different weights are used to initialize the network. Therefore, genetic algorithm (GA) is used to optimize the initial weight and threshold of BP neural network. And finally, simulation results show that the classification performance of the classifier is improved after attribute reduction processing, and the BP neural network optimized by genetic algorithm not only avoids the local minimum problem, but also has fewer iterative steps, reduces the average error and improves the classification accuracy.
on-board equipment; fault diagnosis; attribute reduction; genetic algorithm; BP neural network
10.19713/j.cnki.43−1423/u.2018.12.031
U284
A
1672 − 7029(2018)12 − 3257 − 09
2017−10−20
国家自然科学基金地区科学基金资助项目(61763023)
董昱(1962−),男,甘肃兰州人,教授,从事轨道交通运输自动化方面的研究;E−mail:dongyu@mail.lzjtu.cn