铁路基础设施位移数据预测模型研究
2022-03-31路志远潘佩芬白雪娇张吉峰张良会
路志远,潘佩芬,白雪娇,张吉峰,张良会
(1.中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081;2.川藏铁路技术创新中心有限公司,成都 610404)
铁路作为我国基础设施建设的重要内容,在国民经济发展、国家安全战略、构建和谐社会等众多方面都扮演着不可或缺的角色。自2008年,我国高速铁路建设快速推进,更高的行车速度及更长的运营里程都对行车安全提出了更加严格的要求。由于铁路跨度广,其涉及的行车环境也更加复杂,当铁路基础设施稳定性产生改变时,往往会严重影响行车安全。例如边坡失稳造成的崩塌、滑坡,路基沉降引起的塌方等都是直接影响行车安全的潜在问题。因此,对铁路基础设施进行实时位移监测和精准预报预警是十分必要的。
针对时间序列预测算法的研究一直伴随着机器学习算法的相关研究而发展,并成功地将一系列经典的机器学习模型应用于电力[1]、交通[2]、气象[3]等受固定时间周期影响的领域。综合来看,对于短期内时间相关性强的数据,尽管通过简单的机器学习模型已能达到较好的效果,但仍然有许多问题需要进一步解决,比如人工依赖性强、建立过程复杂、模型只能针对具体单一场景、泛化能力差等。
随着深度学习技术的成熟,循环神经网络(RNN,Recurrent Neural Networks)[4]被广泛地应用于时间序列建模分析,但其本身存在较严重的梯度爆炸、梯度弥散及长期依赖的问题[5-6]。为解决上述缺陷,Hochreiter在1997年提出了长短期记忆(LSTM ,Long Short-Term Memory)模型[7]。发展至今,LSTM已经在自然语言处理[8]、机器翻译[9]、轨迹预测、蛋白质结构预测[10]、音乐创作[11]等众多领域取得了显著成果。全球导航卫星系统(GNSS,Global Navigation Satellite System)监测数据可以看作一种特殊的时间序列数据,本文将LSTM模型应用于基于GNSS检测数据的铁路基础设施位移预测研究,对于保障线路安全,提升管理水平和治理能力具有重要意义。
1 监测系统及预测算法
1.1 监测系统概述
基于GNSS的铁路基础设施形变监测系统能够有效监测铁路边坡、路基、桥梁毫米级的三维形变信息,提升铁路工程监测能力。结合我国自主研发的北斗卫星导航系统不仅能够推动我国北斗产业的发展,同时,也能够在根本层面摆脱全球定位系统(GPS ,Global Positioning System)的限制,有效保障数据安全可控。
该系统由北斗卫星、北斗监测网、应用服务平台及基础设施监测系统组成,系统架构如图1所示。其中,北斗监测网由基准站与监测站共同组成,通过对北斗卫星信号的连续观测、接收、加密并传输至铁路北斗应用服务平台;应用服务平台对信号进行解密、解算并计算位移形变信息,得到的毫米级精度位移形变信息通过专业的监测应用算法,如卡尔曼滤波、形变预测等进行汇集应用,可提供专业的统计分析、预测预警信息。本文主要针对系统中用于形变预测分析的时间序列预测算法开展研究及对比实验分析。
图1 铁路基础设施形变监测系统架构
1.2 时间序列预测算法
LSTM是RNN的一种改进变体,通过对常规RNN的循环单元做出改进,实现了长期依赖,解决了梯度爆炸及梯度消失的问题[6]。每一个LSTM单元通过单元状态传递信息,同时,建立通过门结构来对单元信息进行调整的数据处理模块,每一个单元的门结构包含遗忘门、输入门及输出门。目前,广泛应用的LSTM单元结构[12]如图2所示。
图2 LSTM 单元结构
其中,f、i、o分别代表遗忘门、输入门、输出门;Cn(n=1, 2, ···,m) 表示第n个单元的状态,m为单元总数;σ、tanh分别表示Sigmoid激活函数和双曲线正切激活函数;hn表示第n个隐含层的输出;x表示当前单元的输入;y表示当前单元的输出。与RNN的循环结构不同,LSTM单元不仅数据处理过程有所增加,而且额外多出了一条单元状态信息Cn。在单元状态信息链上,仅存在极少的线性操作,使得信息能够一直传递下去,从而保证了长距离依赖关系。
(1)在LSTM单元的门结构中,输入信号最先通过的是遗忘门,即决定输入信号要遗忘掉的信息;(2)经过输入门及一个tanh网络层结构,将LSTM单元的状态信息由Cn-1更新至Cn;(3)输入信号经过输出门并与经过tanh层的最新单元状态信息进行乘运算,确定单元的输出。
2 数据研究
2.1 实验数据分类
本文以边坡形变数据为研究对象,在边坡形变监测中,监测数据往往根据监测点位的不同呈现出不同的形变曲线。因受到边坡形变特征、环境因素及随机误差的影响,可将其分为3个类型:(1)发育型,该类型有形变发生,且形变量呈增长趋势;(2)稳定型,该类型无明显形变,且形变曲线较稳定;(3)波动稳定型,该类型无明显形变,但形变曲线波动较大。为了研究LSTM模型对这3种形变特征的应用效果,本文采集了一处铁路隧道仰坡2021年9月14日—10月13日,12个监测站点的GNSS三维位移监测数据,共计7832条,从中归纳选取了上述3类具有代表性的形变监测曲线开展实验,每类均包含垂直、东西、南北3个方向的形变数据,其位移曲线如图3所示。
图3 3 种形变类型各维度位移曲线
2.2 实验数据准备
数据准备包括数据标准化和数据分割。数据标准化是数据分析中较为常见的预处理方法,无量纲化是较为常见的方式之一,主要解决同一类型数据间数值相差较大,量级不同的问题。本文所选用实验数据均为表示形变的位移数据,不同监测站的各类型数据间存在量级差异。在数据集建立之前,需对所有数据进行极值标准化,为
由于每个类型的GNSS监测数据均为一维的位移数据,为了开展时间序列预测分析,我们将一维位移数据经过截取、组合,组建为m×(k+1)的二维矩阵Z。矩阵Z的每一行为一组时间序列。对于每组序列,规定前m-1个数据,作为训练数据用来学习形变特征,第m个数据作为标签,供模型计算损失值,并调整模型权值。假设有GNSS监测数据X={X1,X2,···,Xn},相邻两组数据间的时间步长为L,则矩阵Z为
3 实验设计
实验总体设计如图4所示,整体实验流程如下。
图4 实验设计
(1)数据准备:利用极值标准化法进行数据标准化,3种形变类型的3个方向维度的9组形变数据分别根据设定的时间步长(L=1)制作二维数据矩阵,并采用7:3的训练测试比进行训练集、测试集的划分,制定实验数据集。
(2)模型训练:为了进一步研究LSTM模型隐藏层数对预测精度的影响,本文分别定义了包含8个隐藏层的LSTM8和包含12个隐藏层的LSTM12。设定学习率为0.01,迭代次数为500,按照划分好的数据集开展多模型对比实验,对比模型均选用常见的回归模型。
(3)数据预测:通过对比训练完成的模型对测试数据开展预测,并对预测结果进行反标准化,得到真实量纲的预测形变值。
(4)结果分析:将结果与真实数据对比,绘制形变预测曲线,并计算均方根误差(RMSE ,Root Mean Square Error)、平均绝对误差(MAE ,Mean Absolute Error)指标开展精度评价,分析各模型的预测效果。
4 实验分析
4.1 精度评估
为进一步检验LSTM模型的预测效果,本文采用常见的时间序列预测模型进行对比实验,选用的模型有线性回归(Linear)、决策树回归(DT ,Decision Tree)、支持向量机(SVM ,Support Vector Machine)、随机森林(RF ,Random Forest)回归、迭代决策树(GBRT ,Gradient Boost Regression Tree)等。
为量化模型训练、预测效果,本文选定训练时间、RMSE及MAE 3个指标对模型性能进行评价,RMSE、MAE的计算分别表示为
其中,N为数据样本数;yt表示t时刻的形变位移预测值;xt表示t时刻的形变位移真实值。
4.2 发育型实验及分析
对于发育型监测曲线,其形变量随时间变化而累计,形变数据主要受监测区域的自身形变特性影响。对该类型数据开展多模型对比实验,各模型精度指标如表1所示。观察表1可知,Linear模型具有更好的指标值,拟合特性及时间效率均较好。LSTM模型用时最高,整体拟合效果略差于Linear模型。
表1 发育型监测数据预测精度指标
针对表中各类模型的指标,重点选取了Byesian、DT、Linear、RF、LSTM8及LSTM12进行预测曲线制图,并与实际形变曲线(“label”曲线)进行对比,如图5所示。结果显示,对于表现出了显著形变趋势的数据样本(如该组监测数据的东西、垂直方向监测数据),线性模型具有较好的预测拟合效果。DT、RF等模型都仅在训练过程中(绿线左侧)表现出了较好的拟合特性,在测试数据部分(绿线右侧)表现较差。虽然LSTM模型在两个位移变化趋势明显的数据(东西、垂直方向)中预测效果略差于线性模型,但整体来看3个方向的位移预测均有较好表现。此外,可以发现针对该类型数据,LSTM8预测效果略好于LSTM12。
图5 发育型监测数据位移预测曲线
4.3 稳定型实验及分析
对于稳定型监测曲线,其整体形变趋势不随时间变化而变化,且曲线波动较小,形变数据整体受无序的观测误差影响。对该类型的GNSS监测数据开展多模型对比实验,模型精度指标如表2所示。可以发现,虽然LSTM模型依旧花费了最高的时间成本,但其在该类监测数据的3个方位位移预测拟合上均取得了最好的结果,而其他对比模型的预测拟合效果均较差。
表2 稳定型监测数据预测精度指标
对4.2中选取的6个模型的预测结果进行制图分析,如图6所示。结果显示,该类型监测数据整体呈现平稳波动,如东西、南北方向。对于存在相对波动较大的垂直方向,LSTM模型在预测位移时也表现出了较好的鲁棒性。LSTM8取得了东西方向预测指标的最佳,当隐藏层数增加到12后,南北、垂直方向预测精度得到了提升,东西方向却有所下降,由此可见模型构建参数对于预测精度存在较大影响。
图6 稳定型监测数据位移预测曲线
4.4 波动稳定型实验及分析
对于波动稳定型监测曲线,其在整体的位移趋势上保持稳定,但在较小的时间范围内存在一定的形变特征,这主要是受环境如温度、降雨等因素影响产生的,针对该类监测数据开展多模型对比实验,模型精度指标如表3所示。通过表中的精度指标对比可以发现, LSTM模型的拟合预测结果优于其他10个时间序列预测模型,说明在GNSS监测数据的预测上,LSTM相较于其他模型更具有优势。对于时间成本问题,考虑整体时间成本仍然处于较低水平,同时,在应用过程中的计算资源要远大于实验环境所能提供的计算资源,因此可忽略不计。
表3 波动稳定型监测数据预测精度指标
同样对前述6个模型的预测拟合结果进行制图分析,如图7所示。
图7 波动稳定型监测数据位移预测曲线
结果显示,实验所采用的对比实验模型均存在训练数据预测效果与测试数据预测效果相差较大的问题,模型泛化性能差,难以适应复杂序列预测任务。而LSTM模型的拟合效果要优于其他对比模型,其学习效果更好、更能够适应复杂的任务需求。
5 结束语
随着铁路建设的快速发展,实现铁路线路监测自动预警对于线路安全保障工作具有重要意义。在本文实验中,LSTM模型取得了最佳的预测结果,在3个常见的监测数据类型的形变预测中都有较好的表现,是一种鲁棒性强、精度可靠的预测模型,但在时间效率层面,LSTM要略差于线性模型。考虑到LSTM的主要时间成本花费在前期训练过程,训练出一个泛化性强、具有迁移能力的模型将会是有效缩短时间成本的重要研究方向。