基于深度学习的深基坑变形预测研究
2017-10-21郑田杨
郑田杨
摘要:针对深基坑开挖过程中,围护结构形变预测难的问题,本文基于深度学习方法,以武汉市轨道交通6号线唐家墩站深基坑监测数据为例,提出了一种基于LSTM的深基坑变形预测方法, 实验证明了本文方法的有效性。
关键词:深度学习;深基坑;变形;预测
1引言
随着城市建设的发展,基坑开挖的深度已经越来越大,技术难度也越来越高。深基础工程的基坑开挖一直是建筑施工过程中的难题,而基坑围护结构形变的有效控制又是基坑工程成功开挖的关键。由于土体本构模型的高度非线性及土体参数的不确定性,给基坑围护结构形变的计算和预测带来了一定的困难。针对基坑形变预测研究,众多学者已经做了大量工作,目前常用的方法主要有三大类:(1)基于灰色模型的形变预测方法;文献[1] 使用了改进的灰色系统作为预测工具,对基坑周围建筑物的沉降进行了预测;文献[2] 利用变形监测灰色GM模型预测方法,分析基于小波变换前后的预测效果和精度水平;文献[3] 将时间序列分析与灰色系统理论相结合用于变形监测沉降数据预测(2)基于BP神经网络的形变预测方法。文献[4] 利用建立的BP神经网络模型分别预测深基坑围护产生的深层土体水平位移;文献[5]利用遗传算法,对BP神经网络初始权重和阈值进行优化,建立了关于深基坑地下连续墙围护结构水平位移的神经网络模型,并对该基坑测斜孔对应的围护结构水平位移进行预测。文献[6]综合利用小波理论、灰色模型、BP神经网络三种模型理论,设计了一种较好的预测方法。(3)回归分析法。文献[7]利用支持向量机的方法对基坑形变进行分析;文献[8] 提出了基于小波变换的LSSVM-ARMA(最小二乘支持向量机-自回归移动平均模型)模型,实现基坑变形时间序列滚动预测,文献[9] 利用随机森林模型进行影响变量评价及优选,基于优选的影响变量建立深基坑桩顶水平位移预测模型。
由此可见,通过对基坑形变预测研究,发现其具有可建模性、时间序列性。传统的神经网络无法实现延续性(保留对前序数据的理解),这似乎成了它们一个巨大的缺陷,近年来,随着深度学习的研究取得较大进展,长短时记忆网络Long Short-Term Memory(LSTM)作为循环神经网络(Recurrent Neural Network, RNN)的一种,在继承循环神经网络对时间序列优秀的记忆能力的前提下,克服了在 RNN 网络结构下较为遥远的历史信号无法传递至当前时刻的问题,凭借其对前序数据的学习能力和记忆功能,已被广泛应用于时序问题建模中,并证实了其有效性[10-14]。本文以武汉市地铁6号线唐家墩站深基坑监测数据为例,通过分析选取影响围护结构变形的因素,将 LSTM 扩展应用到深基坑围护结构变形预测中,并与传统方法进行比较,为基坑工程施工控制提供了新的思路,对基坑的施工安全具有现实的指导意义。
2工程概况
唐家墩地铁站是武汉市轨道交通6号线(地下三层站)的一座13.6米宽岛式站台。车站共设置8个出入口、2个消防疏散口和5组风亭。有效站台中心里程为K24+901.033,起点里程为右K24+801.733,终点里程为右K25+29.533,车站主体长度为227.8m。有效站台中心处基坑深度为25.7m,图1为基坑平面图。
场地地层自上而下主要由7大层组成:(1)人工填土层;(2)第四系全新统新近沉积形成的淤泥质土层;(3)第四系全新统冲积形成的一般粘性土层;(4)第四系全新统冲积形成的淤泥质土层及一般粘性土层;(5)第四系全新统冲积形成的粉砂夹粉土、粉质粘土过渡层;(6)第四系全新统冲积形成的粉砂层;(7)白垩—下第三系泥质粉砂岩层及砾岩层。地下水按赋存条件,可分为上部滞水、孔隙承压水和基岩裂隙水三种类型。
车站采用明挖法施工,局部采用盖挖法。根据本站周边环境、地质条件及现场情况,经综合考虑,其围护结构形式: 6号线主体基坑选用1000mm厚地下连续墙+六道内支撑,其中,盾构井段第一至五道采用砼支撑,第六道采用Φ800钢管支撑,标准段第一、四、五道采用砼支撑,其余采用Φ800钢管支撑,并倒撑一次。施工时间自2014年8月至2016年底正式开通运营。监测频率严格按照规范执行,为本研究提供了数据保证。
3 LSTM原理
LSTM属于循环神经网络RNN一种,其最大特点是引入了门控单元(Gated Unit)和记忆单元(Memory Cell) 。这些单元格有不同的组成部分,称为输入门、遗忘门和输出门。以下是LSTM单元格的图形表示:
首先,使用tanh激活函数将输入归化到-1和1之间。这可以表示为:
其中,Uθ和Vθ是之前单元的输出,作为下一个输入的权重。Bθ为输入偏移,指数g不是幂,而是表示这些是输入权重和偏置值(与输入门、遗忘门、输出门等相反)。
然后将这个调整后的输入按元素乘上输入门的输出,如上所述,输入门是一系列sigmoid激活节点:
LSTM单元输入部分的输出:
g。i
其中。表示元素乘。
遗忘门输出表示为:
前一状态和遗忘门的元素乘积的输出表示为:
遗忘门/状态循环阶段的输出为:
输出门表示为:
因此,经过tanh压缩后,单元格的最终输出为:
注意,在上面所有的公式中处理的都是向量
4模型建立
深基坑变形与众多因素有关,归纳起来为开挖进度、支护体系、土体属性、周边环境等诸多因素共同作用的结果。本研究主要考虑以下几个方面的影响因素:1.开挖进度,主要考虑开挖深度;2.岩土物理属性,主要包括极限黏聚力,内摩擦角,渗透系数,桩间土极限摩擦力,无侧限抗压强度,基床系数和天然重度;3.地下水条件方面,主要包括地下水位;4.支護结构方面,主要考虑支撑应力和围护结构内部应力5.周边环境,主要考虑基坑影响范围内地表沉降、立柱位移。综上,共14个模型参数。
本研究实验数据选取围护结构测斜数据来代表基坑维护结构的形变,按照基坑6层支撑的设计,在围护结构测斜数据对应各支撑标高处进行采样,基坑测斜管埋设40点,筛选正对支撑位置的作为研究数据,总共30处,排除中途被破坏点,选取能够贯穿整个工程的监测时序尽可能长的点,共计10个, 6个监测断面。沿着6个监测断面,6层标高,选取围护结构形变值作为训练和验证数据,对应剖面和标高的14个模型参数作为建模数据的特征值。特征值来源于监测数据、水文地质勘察数据。采样频率为3天,最终,通过筛选获取样本特征数据结构为:60*200*14(其中,60为监测点个数,200为采样次数,14为建模参数),对应位移数据为60*200。从训练数据中选取700个作为训练数据,500个作为验证数据。
LSTM网络结构使用两层LSTM叠加网络,每层网络32个神经元,为避免过拟合配备Dropout(0.5)层,最后为全连接层,输出为预测值。网络结构如图3所示。
5实验
为了验证本文方法,选取常用的几种回归计算方法,决策树回归(DecisionTree)、K近邻回归(KNN)、随机森林回归(RandomForest)、Adaboost回归、GradientBoosting(GBRT)回归、Bagging回归和ExtraTree极端随机数回归几种方法进行比较,评价指标为Root Mean Square Error (RMSE)。
图4为本文方法和各种传统回归方法比较结果,图中红色为围护结构形变预测值、绿色为真实值,纵轴单位CM,正负分别代表向坑外和坑内位移。由图4可知,本文提出的基于LSTM的預测方法精度较好,RMSE为0.052,胜过其他传统方法。证明了本文方法的有效性。传统回归方法中,GradientBoosting精度略好,RMSE为0.184左右。RandomForest作为近年来广泛使用的机器学习回归方法也有不错的表现,RMSE为0.285左右。
6结论
(1)基坑变形的有效控制是现代安全施工的关键。由于影响基坑围护结构形变因素众多,且无明显规律,因此对深基坑开挖过程中维护结构形变准确预测存在一定的困难,本文基于目前广泛研究的深度学习方法,针对基坑形变预测的特性,提出了一种LSTM的形变预测方法,实验证明了方法的有效性,研究为基坑施工的信息化控制预报提供了一个新的思路。
(2) 应该注意的是,本文采用的 LSTM方法属于一种智能化方法,它是建立在具有大量的训练数据,因此下一步,将搜集更多深基坑监测数据对模型进行强化,验证本文方法的模型是否具有迁移性。
参考文献:
[1]刘文生, 吴作启, 崔铁军, 等. 基于改进灰色系统的深基坑变形预测方法研究[J]. 中国安全生产科学技术, 2014,10(11):21-26.
[2]岳仁宾, 滕德贵, 胡波, 等. 灰色模型在深基坑变形监测中的应用研究[J]. 测绘通报, 2014(S2):85-87.
[3]唐争气, 谭志强. 灰色时序组合模型在基坑监测中的运用[J]. 测绘工程, 2014,23(02):49-53.
[4]孟凡丽, 郑棋, 李燕, 等. 基于BP神经网络的深基坑围护变形预测[J]. 浙江工业大学学报, 2014,42(04):367-372.
[5]李彦杰, 薛亚东, 岳磊, 等. 基于遗传算法-BP神经网络的深基坑变形预测[J]. 地下空间与工程学报, 2015,11(S2):741-749.
[6]付博. 基于小波优化的灰色BP神经网络在深基坑变形预测中的应用[D]. 东华理工大学, 2016.
[7]渠孟飞, 谢强, 李朝阳, 等. 基于支持向量机的膨胀土深基坑变形预测研究[J]. 施工技术, 2016,45(19):30-32.
[8]王丽芬. 基于LSSVM-ARMA地铁站基坑变形滚动预测分析[D]. 河北工程大学, 2017.
[9]林楠, 张文春, 刘鹰, 等. 基于随机森林模型的季节性冻区深基坑变形预测[J]. 地下空间与工程学报, 2018,14(S1):357-362.
[10]赵盛杰. 基于脑电及卷积神经网络的抑郁症实时监测方法研究[D]. 兰州大学, 2018.
[11]史亚星. 基于深度学习的交通流量预测与可视化方法研究[D]. 北方工业大学, 2018.
[12]陈宁, 毛善君, 李德龙, 等. 多基站协同训练神经网络的PM2.5预测模型[J]. 测绘科学, 2018,43(07):87-93.
[13]杨杰. 基于稀疏高斯伯努利受限玻尔兹曼机的故障分类[D]. 浙江大学, 2018.
[14]许石罗. 基于多源遥感影像的动态滑坡灾害空间预测模型研究[D]. 中国地质大学, 2018.
(作者单位:中铁上海工程局集团市政工程有限公司)