APP下载

地铁闸机扇门机构故障时间序列预测研究

2020-11-04步春辰王亚平闫雅斌

铁路计算机应用 2020年9期
关键词:神经网络样本预测

步春辰,王亚平,闫雅斌

(1. 南京理工大学 机械工程学院,南京 210094;

2. 广州地铁集团有限公司 运营事业总部,广州 510330)

在地铁营运的高峰时段,站台人流量大且非常密集。若地铁闸机出现故障不及时修复,车站通行效率将大幅降低,且增加安全隐患。

时间序列预测通过将某一现象统计指标的数值按时间先后顺序形成数列,从中分析发现该现象随时间变化的规律,得出一定的模式,并基于此模式预测该现象将来的情况。时间序列预测在经济、金融、工程等领域有着广泛的应用[1-2]。产品的故障时间序列作为重要的可靠性指标,能够反映产品故障的动态演化过程。目前,常用的分析故障时间序列预测的方法有:自回归移动平均(ARIMA,Autoregressive Integrated Moving Average)[3]、奇 异 谱 分 析(SSA,Singular Spectrum Analysis)[4]、支持向量回归(SVR,Support Vector machines Regression)[5]、人工神经网络[6](ANN,Artificial Neural Network)等。

本文采用CNN+LSTM 混合神经网络,对地铁闸机扇门机构故障时间序列预测进行研究,以期准确掌握故障规律,制定合理的维修计划,减少应急维修频次,保障地铁车站运营可靠性和安全性。

1 机器学习相关研究及应用

机器学习模型在过去几年中取得显著进步,在轨道交通领域已有不少应用。茅飞[7]使用ARIMA 模型预测分析闸机口各个时段的客流量,合理安排工作人员,疏导城市交通,并调节闸机参数,提高其工作效率;徐文文等人[8]针对列车供电系统无法有效拟合和预测受电弓滑板的磨损趋势问题,利用优化的SVR 对其进行预测,提升受电弓的效能;李建伟等人[9]采用BP 神经网络对故障数据进行学习训练,检测学习相关度,预测城市轨道交通车辆的可靠性。

作为机器学习的热门分支,深度学习逐渐被应用到故障时间序列的研究中。常见的深度学习诊断模型包括深度自动编码器、递归神经网络和长短期记忆神经网络(LSTM)等[10]。LSTM 擅长学习具有长程依赖关系的时间序列数据,对识别高维时间序列中的长程依赖性和时序性具有明显优势,而卷积神经网络(CNN)[11]适合处理具有统计平稳性和局部关联性的数据。基于CNN+LSTM 混合神经网络的时间序列预测已在多个领域得到应用,如图像识别、自然语言处理、智能电表故障检测[12]、能源资产能量预测、设备剩余使用寿命预测[13]等方面,具有精度高、适用性广、可拓展的特点。

目前,国内尚未见针对地铁闸机故障时间序列预测分析的相关研究。

2 基于CNN+LSTM 的故障时间序列预测方法2.1 CNN

用于时间序列预测的典型CNN 由1 个用于提取特征图的单卷积层、1 个用于特征图二次采样的单合并层及1 个用于学习输出的完全连接层组成。

令X={X1,···,XN},Xi=[x1,···,xT]T作为具有N个样本和T个嵌入维的输入时间序列,且Yi=[xT+1,···,xT+H]T是具有H个预测范围的相应输出序列,带有C 的卷积滤波器可以表示为:

2.2 LSTM

LSTM 由3 个门组成,分别为遗忘门、输入门和输出门。

遗忘门是sigmod函数的常用单元,用于决定保留或者删除现有信息;通过ht−1和xt输出值ft(0~1)来表示细胞状态Ct−1,0 表示完全与学习值脱节,1则表示保留完整的值,输出公式为:

其中,bf为常数, σ表 示sigmod函数。

输入门决定是否将新信息添加至LSTM 中,由sigmod层和tanh层组成;sigmod层决定哪些值需要更新替换,tanh层为新候选值创建一个向量并添加到LSTM 中,这些信息更新到现有细胞信息中,可表达为:

其中,it表 示该值是否需要更新,表示新候选值的向量,ht−1表示细胞输出。

输入门为LSTM 的存储提供更新,使用遗忘门将旧值(i,ct−1) 相乘,然后加上新的候选值来忘记当前值,可表达为:

输出门通过sigmod层来决定LSTM 内存的哪一部分对输出做出贡献,再使用非线性tanh函数将向量值映射至−1 和1 之间,最后将结果乘以sigmod函数并输出,可表达式为:

其中,ot表示输出值,ht表示介于−1 和1 之间的值,W和b分 别指代各状态的权重和偏置量。

2.3 基于CNN+LSTM 的故障时间序列预测

基于从简设计循环神经网络的原则,分析高维多变量时间序列数据,构建基于CNN+LSTM 的时间序列预测模型,其整体框架如图1 所示,包括输入层、隐藏层、输出层及Adam 优化4 个功能模块。

其中,输入层完成闸机故障数据的采集和处理;隐藏层采用CNN+LSTM 构建循环神经网络,采用经过归一化的特征数据,通过卷积层和池化层,提取出数据中重要特征后,输入到多层结构的LSTM 网络中,并利用全连接层中Dropout(全连接层中的一个功能)来防止过拟合,提升模型泛化能力;再经Adam 算法优化和损失计算,最后通过输出层进行迭代,输出预测结果。

图1 基于CNN+LSTM 的时间序列预测模型框架

具体算法描述如下:

(1)以月为单位,通过滑动窗口训练,采用归一化数据集输入,迭代次数epochs设置,从卷积层获取特征向量x,I={i|xi≠0}, 将x输入,进行卷积与池化操作得到特征向量y,使用ReLU 函数激活,即maxpooling(⊗w+b)通过池化层输入LSTM 神经网络。

(2)通过LSTM 神经网络,将输出概率ht输入ReLU 函数中,得到0~1 之间的值,设置阈值后对结果进行分类,并将结果与样本标签进行比对,计算交叉熵损失函数,并使用Adam 优化算法对权值进行优化,即有:

(3)按照上述步骤调整输入,结束前向传播,得到预测输出值。再利用真实值,进行反向传播并更新参数,完成训练。

3 闸机扇门机构故障数据分析与度量指标

采用某型号地铁闸机2015年—2019年期间237条在役闸机的扇门机构故障记录,包括站点及闸机编号、故障时间、故障原因、故障现象、电机运行电流、线缆连接是否稳固、扇门门体与中门间隙值、运行噪声值、扇门主要机构动作是否正常等数据。

对故障时间序列中的冗余数据和空值进行清洗,移除冗余数据,采用均值对空值进行填充。

故障率指工作到t时刻尚未失效的产品,在t时刻后的单位时间内发生失效的概率,记为 λ(t)。对于有限样本,设样本数目为N,经过时间t有n(t)个样本失效,而在 (t+∆t)时 刻产品的失效数为n(t+∆t),则故障率估计值为:

地铁闸机发生故障后,会更换故障模块,被更换的模块返厂维修,相当于总体样本在维修后进行了一次更新。本文近似的认为下一个周期(单位时间)的故障率约等于故障数除以样本总数。

经整理得到包含70 个数据点的月度故障时间序列数据,如图2 可知,随着不断的维修,闸机系统级故障率总体呈上升趋势。

图2 某型号闸机月度故障时间序列数据

故障率样本分组方式:故障率样本总数为n,将其分为m个 组;每组包含n−m+1个 值,其中前n−m个值为训练用输入样本,第n−m+1个值为期望映射;m个 组中前k组用于训练,后m−k组用于检测。

如表1 所示,将这70 条数据分成60 组,每组包含11 个值;前10 个值为训练用输入样本,第11个值为期望映射;60 组数据中,前40 组用来训练,后20 组进行检测。

表1 故障率数据分组

为评价预测模型的预测准确性,选择3 个统计指标:均方根误差(RMSE)、平均绝对误差(MAE)和测定系数(R2)。

其中,n为 样本数,yt表示真实值,为预测值,表示闸机门机构故障数据真值的均值。

RMSE 和MAE 接近0 意味着性能更好,而R2接近1 则性能更佳。

4 预测结果与分析

4.1 实验环境配置

实验环境配置见表2。

表2 实验环境配置

4.2 参数调节

为获得最优结果,需要调节故障时间序列预测模型中多个超参数,主要包括:卷积核的大小、CNN 的移动步长、激活函数的选取、CNN 的深度、LSTM 的步长、隐藏层节点数、Dropout 值和优化方法的选取。经测试发现,CNN 的移动步长、CNN 的深度、LSTM 的隐藏层节点数、每次训练所选取的样本数对预测结果的影响较大。经实验对比,CNN+LSTM 故障时间序列预测模型的参数设置见表3。

4.3 结果分析

本文采用故障率指标对数据集中每条故障数据进行归一化,并将数据集随机分为2 组:训练数据集(占70%)和验证数据集(占30%)。经预训练,从规范化故障数据中提取时序特征,利用预测模型所准备的数据进行再训练。

为评估CNN+LSTM 混合神经网络时间序列预测模型的性能,与CNN、LSTM 及ARIMA 这3 种单一预测模型进行比较,结果如图3~图6 所示,表4 列出了这4 种模型预测结果准确性的对比。

图3 CNN+LSTM 模型的预测结果与真实值对比

图4 ARIMA 模型的预测结果与真实值对比

由表4 可知:

(1)ARIMA 模型要求时序数据(不论是否经过差分化)具备稳定性,即只能捕捉线性关系,未考虑地铁闸机工作中各种复杂变量所带来的影响,其RMSE 和MAE 指标上的表现都是最差的。

图5 CNN 模型的预测结果与真实值对比

图6 LSTM 模型的预测结果与真实值对比

表4 4 种模型预测结果准确性对比

(2)CNN 模型与LSTM 模型的预测效果及各项性能指标均相差不大,但由于训练数据量不足,CNN 与LSTM 图像分析的中后期均出现一定的滞后现象;CNN 仅考虑当前输入,不具备记忆功能,会丢失部分信息,也会忽略局部与整体之间的关联性;LSTM 因具有全局性记忆功能,但在训练大数据量时,需要更高的硬件条件。

(3)CNN+LSTM 混合神经网络模型利用CNN通道提取时序特征,并通过LSTM 输出到全连接层,以获得预测信息,其性能优于其它单一模型;相比CNN 模型和LSTM 模型,其RMSE 值分别提升6.45%与7.11%,R2值分别提升8.96%与15.87%。

5 结束语

构建基于CNN+LSTM 混合神经网络的故障时间序列预测模型,利用某型号地铁闸机扇门机构的故障数据,以降低预测误差为目标,调节模型参数,对高维故障数据进行特征提取,经神经网络迭代训练后输出预测结果;并与ARIMA、CNN 和LSTM 模型的预测结果进行对比,结果表明:CNN+LSTM 混合神经网络时间序列预测模型的预测结果准确性较高,具有较好的应用前景。

研究成果可用于支持地铁闸机维修计划的制定和优化,减少应急维护频次,保障地铁车站运营的可靠性与安全性。

猜你喜欢

神经网络样本预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
基于递归模糊神经网络的风电平滑控制策略
选修2—2期中考试预测卷(A卷)
用样本估计总体复习点拨
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
规划·样本
基于Q-Learning算法和神经网络的飞艇控制