基于改进LSTM神经网络模型的深基坑沉降变形预测
2019-07-01
(江西理工大学建筑与测绘工程学院 江西 赣州 341000)
引言
针对地铁深基坑工程事故频发给社会造成人员伤亡和财政损失的现象[1],对深基坑开挖过程中的变形做出准确的预测和及时的预警是亟待解决的问题。
常见的深基坑变形预测的方法有回归分析法,小波分析法,灰色模型,指数平滑法,时间序列法等。各种模型有着它的优势和局限性,灰色模型能通过小样本数据对变形系统对规律进行预测,但缺点在于对非线性数据样本预测效果差;递归神经网络在时间序列的应用广泛,长短记忆时(LSTM)神经网络是一种特殊的递归神经网络,其在基于时间序列的非线性数据具有特殊的优势,但对样本数据量的要求比较高。Jordan在1986年提出了递归神经网络框架,Elman在1990年提出了Elman递归神经网络。正是这种网络结构的循环设计,在每次向历史传播的过程中都会产生一个梯度,当传播次数递增时,梯度也会出现消失或爆炸等问题。1997年,Hochreiter和Schmidhuber为解决循环神经网络(RNN)中梯度消失的问题,提出了长短时记忆单元(Long Short Term Memory,LSTM);2005年,Graves提出使用完全的后向传播方式训练LSTM模型,使得LSTM的实现过程更加可靠。2014年,Chung提出了简化版本的LSTM,GRU(Gated Recurrent Unit)。GRU单元只有两个门,重置门(reset gate)和更新门(update gate)。从2014年以来,LSTM神经网络已经成为RNN的研究热点,在很多行业都有广泛的应用。2015年孙瑞奇将LSTM网络模型应用在股票数据的预测上,结果表明该网络模型适用于股票预测。2016年,左玲云,张晴晴将其应用在语音识别上,也取得了不错的效果。
一、改进的LSTM模型
文中在python的语言环境建立了改进的LSTM预测模型,具体步骤如下:
1.在开始训练之前,首先是对数据进行预处理,使其是沿时间序列的;
2.优先修正随机数种子,以确保结果是可重复的;
3.导入数据,然后将数据转化为浮点型,并且进行标准化处理,一般用Scikit-Learning库的MinMaxScaler预处理类来规范数据集;
4.将数据模型分割为训练模型和测试模型,对于时间序列数据,值的顺序很重要。将训练数据集分离成测试数据和预测数据,其中80%作为测试数据,剩下的20%用作预测数据;
5.定义一个函数来创建一个新的数据集,函数有两个参数:DataSet(利用DataSet的NumPy数组)和look_back(上一时间段数据作为输入变量预测下一个时间段的时间步骤数),一般默认为1;此默认设置将创建一个数据集,其中X是指定日期的相对高程,Y是下一次的相对高程;
6.重塑数据结构,利用Numpy可以将准备好的训练数据和测试输入数据转换成预期的结构;
7.设计LSTM网络,其中输入层为1,隐含层为4,输出层为1,同时将Sigmoid函数用于LSTM块,取迭代次数为1000,批量为1。
二、模型对比
BP神经网络和SVM预测模型具有较强的泛化能力,非线性捕捉能力等特点。文中分别选用适用于变形监测的BP预测模型和SVM预测模型对185期沉降样本数据进行训练,训练样本为168期数据,预测数据为17期数据。并与改进的LSTM神经网络模型预测结果进行对比。
三种预测模型的精度评定见表1:
表1 三种预测模型精度对比(单位:mm)
由表1可知,三种预测模型整体预测精度最好的是改进的LSTM预测模型,较BP预测模型其RMSE值精度提高了13.3%,MAE值精度提高了12.5%;较SVM预测模型其MAE值精度提高了23.3%,RMSE值精度提高了32.8%。改进的LSTM模型结合了LSTM预测模型对时间序列的非线性样本数据预测的优势性,对一定量的深基坑变形监测数据进行有效的预测。
三、结论
文中提出改进的LSTM模型应用于地铁深基坑变形监测中,文中将组合模型与BP模型和SVM模型对比,结果表明组合模型预测效果更好,RMSE值精度分别提高了13.3%和32.8%,具有一定的实际应用价值。