APP下载

基于BP-LSTM 网络的列车脱轨系数预测

2022-10-31张卜刘怡伶张文静

农业装备与车辆工程 2022年7期
关键词:权重神经网络系数

张卜,刘怡伶,张文静

(201620 上海市 上海工程技术大学 机械与汽车工程学院)

0 引言

随着人工智能蓬勃发展,利用机器学习和深度学习的方法挖掘大量轨道交通监测数据背后的规律,建立基于数据的预测方法成为了最近的研究热点。郭超[1]等结合深度信念网络(DBN)与多个支持向量机建立了EDBN—SVM 网络,以构架振动响应为数据集训练网络,实现了对空气弹簧故障、横向减振器故障、抗蛇行减振器故障3 种典型故障的分类;庞荣[2]等利用自动编码器(DAE)对原始数据进行降噪,再利用softmax 分类器进行特征分类,对各工况下的转向架故障进行了准确分类;肖爽[3]根据汽车运动轨迹的时序特性,将深度学习技术应用于有轨电车安全性评价,验证了基于长短时记忆神经网络的轨迹预测方法,采取均方差函数作为损失函数优化模型,测试了不同学习参数下网络的准确度和收敛速度,结合列车碰撞安全距离公式验证了网络可靠性;金永泽[4]分别使用误差逆传播网络(BP)和LSTM 对列车制动模型的参数进行了预测,发现BP 网络在预测过程中比LSTM 更加依赖数据的输入;DINDAR[5]建立了决策树(DT)模型分析事故起因,利用遗传算法对模型进行剪枝;Yan[6]等人利用深层信念网络(Deep Belief Network,DBN)对列车运行的安全性进行预测,并且考虑了乘客舒适性。Serdar Dindar 用分层贝叶斯网络预测了美国列车事故的高发地带,并以极大似然估计加以验证。

为了解决单项深度学习预测模型的缺陷,增加准确性,学者尝试将多个神经网络结合起来使用。SITTON[7]等建立了多个BP 网络分别训练,网络收敛后将预测结果与验证集进行比较,根据网络性能表现对它们赋予权重,将多个带权重的BP 网络组成投票系统以预测货车冲击对轨、桥带来的破坏;KAEENI[8]通过遗传算法(GA)对人工神经网络(ANN)、朴素贝叶斯(NB)和决策树(DT)3种深度学习赋予权重,将三者结合起来提出了一种针对轨道交通运输中脱轨事故隐患预测的组合式模型,将不同模型结合起来得出最终预测。以上两种利用组合式神经网络的研究的优点在于学习规律全面、预测结果准确、有较强的泛化性能。DINDAR[9]等人设计了一种由贝叶斯分类器(NB)组成的网络,该网络上层NB 的分类结果会成为下一层NB 的输入,可对因极端天气造成的脱轨事故进行准确分类。然而,目前系统地利用大规模多源轮轨系统力学、运动学以及交叉的动力学响应作为数据集,训练不同的组合式深度学习模型,从而较为准确地评估轮轨接触安全的研究尚未见到。

综上所述,可知两点:第一,在分析轨道交通事故方面,研究者们在利用深度学习方法,从列车安全距离、轨道桥梁系统安全性和事故分类等多方面展开了深入的研究,但是在根据列车工况预测脱轨方面的研究还不多;第二,学者们在利用深度学习研究车辆脱轨问题时,倾向于结合多个相同或不同结构的神经网络的预测结果,组成预测更准确、泛化性能更强的组合式预测模型。

要想保证深度学习的效果,需要准备大量的训练数据,然而列车实车试验成本高昂,铁路日常运营中收集到的数据一般研究机构也难以获得。通过仿真方法获取数据集是解决该难题的方法之一。近年来,仿真软件的性能逐步提升,被学者们广泛应用到研究之中,其中SIMPACK 在多体动力学,尤其是轮轨接触方面的仿真效果非常有效。陈杨[10]在SIMPACK 中建立了整车动力学仿真模型,并对轮轨接触面和悬挂系统做了处理,加入轨道不平顺激励模型,得到了较为真实的仿真场景,利用仿真研究了各向不平顺对蛇形失稳临界速度的影响;王海涛[11]在SIMPACK 中建立了车-线-隧刚柔耦合动力学模型,利用仿真与实测数据研究了车轮抬升力、车轮踏面磨耗数与隧道壁振幅等参数对列车运行的影响;何银川[12]在SIMPACK 中建立了驮背运输车辆系统振动模型,根据仿真分析了临界速度、曲线通过能力和悬架对垂向稳定性的影响,并且做了实际试验,结果与仿真结果相吻合;姚常伟[13]通过Fluent、ANSYS 和SIMPACK 等仿真软件对受侧风影响的列车模型进行了仿真,仿真结果与通过理论计算得到的风载荷对车辆的影响是等效的。

上述科研成果都能证明SIMPACK 在研究轮轨接触方面的可靠性,因此借助仿真工具得到数据集,再用深度学习方法分析数据得到关键参数与列车轮轨状态之关系是可行的。

本文对车辆在曲线上运行的最大脱轨系数进行研究,选取了线路半径、车速、车体重心横向偏移量和外轨超高角作为参数变量,建立仿真模型,对不同工况下车辆在曲线处的脱轨系数进行模拟,得到列车脱轨数据集,分别对多层前馈神经网络(BP 网络)和长短时记忆神经网络(LSTM 网络)进行训练和优化,使二者能够独立预测脱轨系数,最后综合二者建立了用于预测列车曲线脱轨系数的最优加权系数法组合式神经网络。

1 单项神经网络

1.1 BPNN 神经网络

误差逆传播神经网络即BP 神经网络(以下简称BPNN)是目前最成熟、应用最广泛的一种人工神经网络,BPNN 单元结构如图1 所示。

图1 神经网络单元结构Fig.1 Neural network unit structure

BPNN 训练时将误差沿着原先的权重通道反向传播,按照梯度下降的原则调整通道权重与神经元阈值。在如图2 的网络中,输入网络的样例由 d种属性描述,输出的是l 维向量,所以该网络的输入层有d 个单元,输出层有l 个单元,隐藏层设为q 个单元。第h 个隐藏层单元的阈值为γh,第j 个隐藏层单元的阈值为θj。输入层第i 个单元到隐层第h 个单元之间的信息通道权重为νih,隐藏层第h个单元到输出层第j 个单元之间的信息通道权重为ωhj。隐藏层第h 个单元的输入为输出为bh,输出层第j 个单元的输入为隐藏层和输出层都采用Sigmoid 函数,如图3(a)所示,其表达式为

图2 神经网络结构示意图Fig.2 Neural network structure

图3 激活函数图像Fig.3 Activation function image

其导函数见式(2),图像见3(b)。

1.2 LSTM 神经网络

LSTM 具有外部循环和本身节点间的自循环能力。自循环由遗忘门、输入门和输出门控制,这三者可根据当前时刻的输入从隐层中删除、添加、提取信息,在训练过程中控制每个节点上的输入对整体结果的影响。图4 展示了LSTM 的单元结构。

图4 LSTM 的单元结构Fig.4 LSTM unit structure

其中,遗忘门会根据当前的输入Xt、上一时刻的输出ht-1,其激活函数为sigmoid 函数;表示当前时刻第i 个循环体单元的遗忘门的输出值,可用式(3)计算:

输入门根据x(t)、输入门的输入偏置b(g)和h(t-1)决定计算当前时刻输出的状态,可用式(4)计算。

式中:U——单元体输入门的输入权重;W——单元体输入门的循环权重;sigmoid——激活函数。

2 组合式神经网络

组合式预测方法的核心是用各种单项模型针对训练数据展开学习,在单项网络都能从数据集中有效学习规律后,用某些准则或者方法,将多个单项网络的预测结果统合起来解决问题[14]。本文使用的组合方案如图5 所示,采用BP 神经网络和LSTM 神经网络两种不同单项预测模型通过加权平均法组成异质组合式预测模型,获得该组合式预测模型有2 个步骤:(1)通过数据集训练单项神经网络,使其预测得尽可能准确,一般来说,单项网络的结构应该尽可能不同,通过将2 个学习偏好分歧较大的预测模型组合能多角度、全面地学习数据集规律;(2)通过加权平均法组合二者的预测结果。

图5 组合式预测模型架构Fig.5 Construction of combined forecasting model

LSTM 和BPNN 的结构不同,性能有区别,应使用加权平均法进行组合。加权平均法根据各单项模型的性能为其赋予不同的权值,调整各模型对最终预测的影响,ωi表示单项模型的权重,其组合可表示为

设模型需要通过学习掌握的真实规律为f(x),x 从分布p(x)中取样获得,则组合单项模型后的组合预测法的误差为

要想求得最优权重,即

需求得BPNN 和LSTM 两种预测方法的偏差矩阵,e1x和e2x分别表示2 种网络对样例x 的预测值和真实值的误差,有N 条预测样例,则

根据拉格朗日乘子法可求得如下最优解:

ω1和ω2即为BPNN 和LSTM 的最优权重,R为单位矩阵。

3 预测模型训练数据集的构建

3.1 仿真模型构建

本文所使用的模型中,车身、构架和轮对考虑到了沿长度、宽度及高度方向上的平移,以及绕3 条轴线的转动共6 个自由度,轴箱考虑绕车架交接点的转动,只有1 个自由度,摇枕与车身刚性连接,不考虑其自由度,故该模型共有50 个自由度。

该模型包含54 个力元,因只考虑单节车辆,故没有车钩力,其中轴套与构架间使用43 号力元,一系悬挂中的弹簧使用85 号力元,一二系悬挂中的阻尼以及蛇形减振器选用6 号力元,二系悬挂的两个剪切弹簧使用79 号力元,车架与摇枕之间用13 号力元作为缓冲器以防止二者碰撞,轮轨接触力元采用78 号力元并考虑到了它的非线性特性。该模型拓扑结构如图6 所示,其转向架拓扑结构如图7 所示。

图6 主模型拓扑结构Fig.6 Topological structure of main model

图7 转向架拓扑结构Fig.7 Topological structure of bogie structure

车辆行驶线路包括:直线—过渡曲线—弯道—过渡曲线—直线。列车在直线的行驶状态不是研究重点,故设置为10 m;过渡曲线用线性过渡,长度为10 m;弯道的长度为500 m,半径可调。引入的轨道水平不平顺激励参考美国6 级谱[19],式(12)是其谱密度分析式。

式中:Av=0.033 9 cm2·(rad/m);Ωc=0.438 0 rad/m;Ωv=0.824 5 rad/m。

3.2 数据集与数据集预处理

列车在弯道上的脱轨系数会受到线路、车速等众多因素影响,本文将重点放在车速、重心横向偏移量、半径和超高上,研究这3 者对脱轨系数的影响,通过不同条件下的仿真实验,提取车速、半径、超高、重心横向偏移量作为属性,对应的脱轨系数作为标记,得到如表1 所示的1 269 条样例。

表1 脱轨系数数据集Tab.1 Derailment coefficient data

由于各值之间数量级相差巨大,且网络采用了误差梯度下降法,数据直接输入网络会导致误差无法沿最短梯度方向下降,故采用进行归一化处理,将各维度的数值放缩至(0,1)范围,x为原始数值,μ为该维数据的平均值,σ为该维数据的标准差。

4 BP-LSTM 组合式脱轨系数预测模型研究

根据加权平均法加权系数的求解方法求得BPNN和LSTM 的最优加权系数,2 种网络的预测结果乘以各自的加权系数之和Y=ωBPyBP+yLSTMωLSTM即为组合式预测模型的输出结果,如图8 所示。

图8 组合模型的预测结果Fig.8 Prediction of BP-LSTM

其在验证集上的RMSE 为0.005 34,相较BPNN 减少了30.1%,较LSTM 减少了43.4%,符合加权平均法预测误差相较单项模型减少的特性,BP-LSTM 网络综合了2 种网络的特点,即可体现出LSTM 对脱轨系数随重心偏移量变化的敏感性,在整体走势上,BPNN 的引入也纠正了单项LSTM相差实际值较小的弱点。在样本号150~200 之间的一段曲线,不论是单项网络还是BP-LSTM 都没能给出较好的预测,推测是样本集上某些特殊规律造成的变化,但是预测值的走势还是与实际值一致的,实际预测中也不可能使网络输出和真实值完全一致,重要的是BP-LSTM 能够预测出脱轨系数随工况恶化而增大的趋势,实际应用中可为列车脱轨提供预警。

5 结语

本文分析了国内外深度学习方法在列车安全运营上的研究现状,说明误差逆传播神经网络和长短时记忆神经网络的结构、功能及数学原理,对2 种网络的缺点和改善方法进行分析。对组合式预测方法的原理进行描述,说明其相较单项神经网络在预测问题上具有的优势。基于Python 语言和TensorFlow 框架完成预测脱轨系数的组合式神经网络BP-LSTM。分别对多层前馈神经网络(BPNN)和长短时记忆神经网络(LSTM)进行训练,使二者能够独立预测脱轨系数,最后求得二者在验证集上的最优加权系数,通过最优加权系数法建立用于预测列车曲线脱轨系数的组合式神经网络,结果表明,二者能采用加权平均法进行组合后,BPLSTM 预测精度有很大提升。

猜你喜欢

权重神经网络系数
基于神经网络的船舶电力系统故障诊断方法
权重望寡:如何化解低地位领导的补偿性辱虐管理行为?*
基于人工智能LSTM循环神经网络的学习成绩预测
MIV-PSO-BP神经网络用户热负荷预测
权重常思“浮名轻”
为党督政勤履职 代民行权重担当
权重涨个股跌 持有白马蓝筹
小小糕点师
苹果屋
嬉水