基于LSTM 的地下工程变形预测适用性研究
2022-07-11彭渊张军
彭渊 张军
(江西省赣西土木工程勘测设计院 江西宜春 336000)
1 引言
近年来,我国为缓解城市交通拥堵状况,方便市民出行,地铁隧道与地下通道等地下工程的建设飞速发展,其建设规模、建设数量、修建速度已成为世界首位[1]。由于地表高层建筑物的增加与地下复杂地质条件的限制,在建设过程中不可避免地面临变形、塌方和地表沉陷等工程与地质灾害的威胁,所以在施工阶段必须布设变形监测点并实时监测,通过对监测数据的实时分析,让施工作业人员实时掌握地质结构与建筑体的变形信息,判断施工安全状态,提高安全风险预警能力,保障地下工程安全高效地建设。地下工程的变形控制要求能对施工过程中产生的形变实时掌握,并对其形变趋势做出预测,其中预测分析尤为重要,可以通过建立适用的变形预测模型,来满足实际工程的应用需求。目前自动化监测技术发展成熟,已实现自动化、智能化、全天候数据采集与分析。
工程上常用的形变预测方法有回归分析法[2]、支持向量机法(SVM)[3]、时间序列法[4]、灰色模型法[5]和神经网络法[6]等单独或组合预测方法,其中神经网络法如BP(Back Propagation)神经网络[7]方法结构简单,非线性逼近能力强,在工程中对变形预测的准确性高,径向基(Radial Basis Function, RBF)神经网络[8]泛化能力更强,收敛速度更快,具有全局逼近能力。这些前向或反向传播的神经网络都是非时序性的,不能很好地利用历史变化值对当前预测的影响,引入LSTM[9]可以发挥神经网络在沉降预测方面的性能优势,可以使建立的预测模型能够利用和处理时序性的数据。它是循环神经网络 (Recurrent Neural Network,RNN)的一种特殊形式,比RNN 多加了一个单元状态记忆长期状态信息,使LSTM 能学习过去时间段的数据信息,完成数据的过滤,用来进行当前时刻的预测使模型更精准。
2 神经网络模型
2.1 BP 神经网络
BP 神经网络是目前使用最为广泛的一种神经网络,是一种按照误差逆向传播训练的多层前馈神经网络,通过改善隐含层的连接权重,优化神经网络的自学习能力,改进输入层与输出层的非线性映射关系,具有较强的自学习和自适应能力,在沉降预测方面应用广泛,BP 神经网络的三层结构如图1 所示。
图1 BP 神经网络结构图
BP 神经网络解决了简单感知器不能解决的问题,但BP 神经网络是以误差平方为目标函数,采用梯度下降法来计算其最小值,本质上是一种局部寻优算法,收敛速度慢,易陷入局部极值。
2.2 长短记忆循环神经网络(LSTM)
LTSM 神经网络结构如图2 所示,令给定时序输入序列X=[x1,x2,…,xn],xt为t 时刻的输入,H=[h1,h2,…,hn]为输出序列,ht为t 时刻的输出,C=[c1,c2,…,cn]表示模块的单元状态,ct表示t 时刻的单元状态。
图2 LSTM 结构示意图
LSTM 具有一种重复神经网络模块的链式结构,每一个模块主要由遗忘门、输入门和输出门三个门组成。LSTM 循环神经网络的结构示意图如2 所示,其中三个门的作用和计算过程如下:
(1)遗忘门:决定上一个单元状态有多少保留到这一时刻的单元状态。
在上式中,w 和b 表示对应的权重和偏置,δ 为sigmoid 型函数,tanh 为双曲正切函数。fi为遗忘门输出,it为输入门输入,ct为更新当前输入值后的单元状态值,ct为当前单元状态,ot为输出门输出,°表示矩阵内的对应值的乘积运算。
遗忘门和输入门一起控制了单元状态中储存的内容,输出门控制了当前模块的输出值。三个门和激活函数相互配合,使LSTM 能够从历史信息中筛选和保留有用的长期和短期信息,并结合当前时刻的输入值进行学习。
LSTM 的训练过程主要分为四个步骤:
(1)按照公式1-6 进行前向计算过程,得出每一个模块的输出值。
(2)分别在实践中和网络层级两个传播方向计算每一个模块的误差项。
(3)根据误差项计算各个权值的梯度。
(4)利用梯度优化算法更新权值。训练结束后,使得时间序列上的信息形成一个平衡的长短期依赖,能够运用LSTM 进行建筑物沉降预测工作。
3 数据源与精度评价
数据源采用正在施工的某地下工程的四个固定监测点60 期的检测数据,为验证本文所建模型的性能,在当前数据量下,利用五期数据对下一期数据进行循环预测,为验证单一数据量对神经网络预测的影响,采用四个监测点的数据进行分别预测。预测结果的精度评价采用平均绝对误差(MAE)和均方根误差(RMSE)。性能指标的计算公式如式(7)和(8)所示,性能指标的计算公式如式(7)和(8)所示,当MAR 和RMSE 的值越小,表明预测结果的精度越高。
其中四个固定监测点累积沉降量的部分数据如表1 所示。
表1 四个监测点的部分数据展示
4 实验结果分析
为了验证LSTM 在建筑物沉降预测中的优势,使用相同的实验环境和数据建立BPNN 神经网络预测模型进行对比分析,在实验中分别就四个监测的数据分别采用LSTM、BPNN 两种预测模型进行预测,两种模型的预测和测量真值的对比结果如图3、图4、图5 和图6 所示。
图3 A1 点预测模型与测量真值对比
图4 A2 点预测模型与测量真值对比
图5 A3 点预测模型与测量真值对比
图6 A4 点预测模型与测量真值对比
图中蓝色实线表示测量真值数据曲线,带三角形的红色虚线表示本文所建立的LSTM 神经网络模型预测曲线,紫色虚线为BP 神经网络的预测曲线。由图可直观地看到,各个监测点上LSTM 模型预测的数据比BP 神经网络对测量真值的拟合程度好,预测的精度高。结合表2 两种模型预测结果评价,可以看出LSTM 比传统BPNN 预测模型在MAE、RMSE两项评价指标上各个点分别提高A1:75.127%,94.168%;A2:87.370%,98.410%;A3:71.092%,91.657%;A4,78.121%,94.405%。所以结合图3、图4、图5、图6 和表2,可以看出,LSTM 神经网络结构可以提高地下工程周边建筑物沉降预测精度。
表2 两种模型预测结果评价
5 结束语
本文引入LSTM 神经网络建立建筑物的沉降预测模型,利用实际观测数据分别建立LSTM 和BPNN两种模型与测量真值进行对比。通过精度评价指标进行性能评估,表明基于LSTM 循环神经网络建立的预测模型比传统的BP 神经网络预测更准确,在少量数据情况下能达到较为准确的预测值,为地下工程沉降预测提供新方法和新思路。