APP下载

基于CNN-LSTM的铁路道岔故障诊断系统研究

2024-12-11陈溥

时代汽车 2024年21期

摘 要:铁路道岔是铁路运输系统中的关键组成部分,其工作状态直接影响着列车运行的安全与效率,铁路道岔故障的及时诊断与检修对确保铁路系统正常运行至关重要。本文提出了一种基于卷积神经网络(CNN)和长短期记忆网络(LSTM)混合而成的深度学习故障诊断模型,通过采集铁路道岔动作电流和功率曲线数据来组成训练集和测试集,并对模型进行训练和测试,结果表明,与单一的CNN和LSTM诊断模型相比,本文提出的CNN-LSTM混合模型的故障诊断效果更优。最后设计并开发了一套铁路道岔故障监测和诊断系统,实现了对铁路道岔的实时监测和故障诊断。

关键词:铁路道岔 卷积神经网络 长短期记忆网络

0 引言

随着我国高速铁路网的快速发展,铁路运输的安全性与可靠性日益受到社会各界的关注。铁路道岔作为铁路线路中的重要组成部分,其工作性能状态直接关系到列车的安全运行和铁路运输的效率。然而,由于道岔结构的复杂性以及工作环境的恶劣性,道岔故障时有发生,给铁路安全带来了极大的隐患。因此,开展铁路道岔故障诊断的研究,对于保障铁路运输安全具有重要的理论意义和实用价值。近年来,深度学习技术的发展为铁路道岔故障诊断提供了新的解决思路,卷积神经网络以其在图像处理领域的卓越性能,被广泛应用于特征提取和模式识别任务中。而长短期记忆网络作为一种特殊类型的循环神经网络,能够有效处理时间序列数据,并捕捉数据中的长期依赖关系。国内学者运用深度学习的方法对铁路道岔故障的诊断开展了一系列的相关研究,并取得了许多研究成果,但大部分研究都是使用单一的诊断方法,将多种方法综合起来使用的研究相对较少。将CNN与LSTM相结合,组合起来使用可以充分发挥两者的优势,实现对铁路道岔故障信号的深度特征学习和时序分析,从而提高故障诊断的准确性和效率。

1 相关原理

1.1 卷积神经网络(CNN)

在20世纪80年代,受生物神经科学的启迪,Yann LeCun及其团队提出了一种基于前馈原理的神经网络架构模型,该模型广为人知为卷积神经网络(CNN)[1],它由五个关键层级构成:输入层、卷积层、池化层、全连接层以及输出层。特别地,卷积层利用卷积操作作为其核心机制,旨在从输入的铁路道岔信号数据中高效地提取出关键特征。池化层通过缩小故障预测模型的大小来提高计算速度,在保留铁路道岔信号数据重要特征的前提下降低特征的维度,提高所提取数据特征的鲁棒性。全连接层通过对提取的特征值进行整合并将其转换为向量输出。

卷积层的计算表达式如下:

在此公式中,第1个卷积层的第i个特征输出被表达为,其中j代表了当前层输出特征的总数,这一数量是基于上一层输出向量的计算得出的。偏置项以符号表示,而特征图矩阵则用j表示。卷积核的权重则由符号表示,其中n为卷积核的索引值。此外,卷积层的输出数量由变量N给出,而激活函数则通过符号表示。

池化层计算公式如下:

其中,表示池化层的输出结果,T,R分别表示池化层的步长和核的大小,r为池化窗口。

1.2 长短期记忆网络(LSTM)

在20世纪90年代,Sepp Hochreiter与Jürgen Schmidhuber针对循环神经网络所存在的局限性,创新性地提出了长短期记忆网络(LSTM)模型[2]。该模型通过引入独特的“门控机制”,具体包括输入门、遗忘门、记忆单元以及输出门,实现了对历史信息的精细化更新与保留策略。这一设计显著增强了网络处理长时间序列数据时的记忆能力,同时有效解决了梯度消失与梯度爆炸这一长期困扰神经网络训练的难题。图1为长短期记忆网络的基本单元结构。

LSTM单元的向前计算公式如下[3]:

其中,ft表示遗忘门的激活值,it表示输入门的激活值,Wf表示遗忘门的权重参数矩阵,Wi表示输入门的权重参数矩阵,[ht-1,Xt]表示双向量拼接结果,bf表示遗忘门的偏置值,bi表示输入门的偏置值,sigmoid函数由表示。表示候选元素的状态,ct-1表示t-1时刻的状态,ct表示由当前记忆状态和长期记忆状态ct-1组合而成的新单元状态,ht表示t时刻的输出。

2 CNN-LSTM故障诊断模型构建

考虑到铁路道岔转辙机的动作电流及功率曲线数据具有多维性和时序性的特点,为了能够从时间和空间两个方面对数据的特征进行充分提取,本文提出了一种基于CNN-LSTM的混合深度学习的故障诊断模型,CNN提取数据的空间特性,LSTM提取数据的时间特性。模型主要包含三个部分,第一部分为三层一维卷积的结构网络(CNN),每一层都进行卷积、归一化和最大池化的操作,选取Re lu激活函数[4]。第二部分为LSTM网络。第三部分为全连接层,包含两层全连接。数据输入模型后,首先经过三层CNN部分进行维度的转变处理,其次输入到LSTM部分,完成时间和空间上的特征提取和计算,最后数据进入全连接层后输出诊断结果。CNN-LSTM混合网络模型结构如图2所示。

3 实验和分析

3.1 数据采集

本文通过高铁车站信号自动控制CSM-KA型信号集中监测系统采集得到了600组铁路道岔转辙机动作电流和功率曲线数据,其中正常工作数据100组,另外五种故障[5](转辙机无法启动、转辙机空转、无小台阶、小台阶偏高、动作电流波动较大)数据各100组。将数据集中的70%作为训练集,剩下的30%作为测试集。

3.2 评价指标

为了衡量模型在故障诊断方面的性能,我们选取了准确率(Accuracy)、精确率(Precision)和召回率(Recall)[6]三个指标作为关键的评估标准,三个评价指标的计算公式分别如下:

其中,TP表示模型正确地预测为故障的样本数,TN表示模型正确地预测为正常的样本数,FP表示模型错误地预测为故障的样本数,FN表示模型错误地预测为正常的样本数。

3.3 实验与结果分析

首先,实验阶段采用了训练数据集对卷积神经网络(CNN)、长短期记忆网络(LSTM)以及它们的组合模型(CNN-LSTM)进行了充分的训练。随后,利用独立的测试数据集对这三个模型在故障诊断方面的表现进行了验证,所得到的评估指标包括准确率、精确度和召回率,具体数值已汇总至下表所示。

准确率(Accuracy)是衡量模型整体预测准确性的核心指标,它反映了模型对所有样本的综合判断能力;精确率(Precision)则侧重于评估模型在识别异常样本时的精确度,即模型判断为异常的样本中实际异常的比例;而召回率(Recall)则强调模型在筛查异常时的全面性,即模型成功识别出所有实际异常样本的能力。通过分析CNN、LSTM及CNN-LSTM这三个模型的测试结果,我们可以观察到CNN-LSTM模型在准确率、精确率及召回率这三项关键评价指标上均达到了三个模型中的最高水平,这充分证明了相较于单一的诊断模型,该混合模型在铁路道岔故障诊断中展现出了更为优越的性能。

4 诊断系统开发

基于上述建立的CNN-LSTM铁路道岔故障诊断模型,设计并开发了一套铁路道岔故障监测和诊断系统,以此来对铁路道岔的工作状态进行实时监测,对铁路道岔的故障进行诊断。

4.1 系统开发环境

系统开发和运行的硬件环境:CPU:AMD 锐龙 Threadripper 3990X ,内存:32G,硬盘:128G;系统开发的操作系统和运行平台:Windows 8 64位 旗舰版;系统开发的环境和工具:IntelliJ IDEA、Eclipse;系统运行的支撑环境和支持软件:mysql v5.7.19;系统使用的编程语言:Java。

4.2 系统功能架构

系统主要包含两大模块:故障诊断管理和数据处理管理,故障诊断管理模块中包含有诊断首页、故障诊断报警、故障预测预防和数据可视化四项功能,数据处理管理模块中包含有数据采集处理、用户管理权限和故障历史记录三项功能。

4.3 系统功能和特点

该系统运用了先进的传感器技术,并采用了基于CNN-LSTM混合模型的数据处理技术,能够实时监测铁路道岔的运行状态,包括道岔的位置、速度、电流、电压等参数。通过监测这些参数,可以及时发现道岔的故障,并对其进行诊断。该系统具有以下特点:(1)实时监测:系统能够实时监测铁路道岔的运行状态,及时发现故障,并对其进行诊断。(2)数据处理:系统采用了基于CNN-LSTM混合模型的数据处理技术,对监测到的数据进行处理和分析,提取出有用的信息。(3)故障诊断:系统能够根据监测到的数据和历史数据,对道岔的故障进行诊断,并给出相应的解决方案。(4)预警功能:系统能够根据监测到的数据和历史数据,对道岔的故障进行预警,及时通知相关人员进行处理。(图4)

5 结论

本文结合CNN与LSTM两者的优势,构建了一种基于CNN-LSTM的混合深度学习的铁路道岔故障诊断模型,通过对铁路道岔故障信号进行深度特征学习和时序分析,提升了故障诊断的效果,诊断效果明显优于单一的CNN和LSTM诊断模型。基于混合模型,设计并开发了一套铁路道岔故障监测和诊断系统,实现了对铁路道岔的实时监测和故障诊断,可以及时发现故障并对其进行诊断,并给出相应的解决方案,可为铁路的安全和高效运输提供一定的参考意义。

基金项目:2023年广西高校中青年教师科研基础能力提升项目“基于CNN-LSTM的铁路道岔故障诊断系统研究”(立项编号:2023KY1437)、2022年柳州铁道职业技术学院校级项目“基于深度学习的铁路道岔故障诊断系统的开发与研究”(立项编号:2022-KJB10)。

参考文献:

[1] Yann Lecun,Leon Bottou,Y. Bengio, et al. Gradient-Based Learning Applied to Document Recognition[J]. Proceedings of the Ieee, 1988, 86(11): 2278-2324.

[2] Sepp Hochreiter,Jürgen Schmidhuber. Long Short-term Memory[J]. Neural Computation, 1997, 9.

[3]姚竞争,方玉洁,周雪菲.基于CNN-LSTM故障预测模型的客滚船安全评估研究[J].船电技术,2024,44(06):6-10.

[4]何宗博.基于深度学习的铁路道岔转辙机故障诊断[D].太原:中北大学,2021.

[5]杨菊花,于苡健,陈光武,司涌波,邢东峰.基于CNN-GRU模型的道岔故障诊断算法研究[J].铁道学报,2020,42(07):102-109.

[6]王成瀚,苏沛源,张臣宏,等.基于深度CNN-LSTM神经网络的加工过程实时异常监测模型[J].机械设计与研究,2021,37(06):128-132.