基于深度学习的东天山特长隧道围岩等级预测
2022-10-13孟馨秦拥军谢良甫袁扬淳谭顺利
孟馨, 秦拥军, 谢良甫, 袁扬淳, 谭顺利
(新疆大学建筑工程学院, 乌鲁木齐 830017)
围岩质量预测在隧道建设中是必不可少的一环,提前对隧道掌子面前方的地质情况掌握清楚,就能为面临的各种可能发生的地质灾害做好充足准备。在新疆天山地区,拥有着复杂的地理地质环境,温度低、海拔高、构造复杂、岩体破碎、不良地质发育等都制约着隧道的建设,在这种特殊的地理地质环境下修建隧道,可借鉴的工程经验比较缺乏,这也导致天山地区隧道施工过程中围岩变更率极高,严重影响施工进度,造成项目成本剧增,并会造成较大的安全隐患。如伊犁州果子沟隧道围岩变更率接近80%,这表明传统的围岩分类方法难以满足天山地区复杂地理地质环境下修建隧道的要求。
李志林等[1]结合模糊评价法、小波理论和神经网络构建了岩溶突水风险评估体系,弥补了传统方法在岩溶突水风险评估的复杂性、局限性及不确定性。He等[2]提出了高斯过程机器学习,建立了基于TSP-203 系统的先进围岩分类模型,该方法从 TSP-203 的检测结果中提取有用信息,建立了围岩分类的定量指标体系。Qiu等[3]以数字钻井技术和量子遗传算法为基础,构建了径向基函数神经网络并应用于围岩分类。王佳信等[4]、孔祥松等[5]、李一冬等[6]建立了基于人工神经网络理论的围岩分类识别模型。Gholami等[7]利用人工智能算法对岩体质量分级(rock mass rating,RMR)进行了改进。Izadi等[8]建立了薄片矿物的智能识别系统。Jalalifar等[9]将自适应神经模糊推理系统应用在岩石工程分类系统预测中。Asadi[10]基于人工神经网络测定岩石磨蚀性。越来越多的学者将各类机器学习用于隧道围岩识别,如Saeid等[11]基于神经网络预测岩体可挖性指数。刘慧敏等[12]、张凯等[13]、高磊等[14]和田睿等[15]利用神经网络模型进行了岩爆危险性和强度预测方面的研究。李汪石[16]、查焕奕[17]、柳厚祥等[18]、张峰瑞等[19]众多学者将深层卷积神经网络应用到隧道围岩分类预测,并取得了较为理想的效果。这表明今后人工智能将逐步取代传统经验法用于隧道工程[20-24],因此现利用人工智能建立天山地区隧道围岩类别预测模型完全符合今后该领域的研究发展趋势。
目前,采用神经网络研究围岩变形规律的研究较多,但基于深度学习理论研究围岩等级的研究略显不足,因此现基于深度学习理论的 ResNet神经网络通过对东天山超长隧道现场实测等数据加以分析,实现对围岩等级的智能监测。
1 物探数据采集及处理
1.1 工程概况
东天山超长隧道属于G575线的重要组成部分,隧址位于新疆维吾尔自治区哈密市北部,进口位于哈密市巴里坤哈萨克自治县松树塘滑雪场下游。出口位于哈密市西山乡葫芦沟北侧,车辆可由乡道X089进入施工便道到达隧道出口附近,隧道进出口交通条件较好,如图1所示。隧道隧址区为典型的高中山深谷类型,隧址区大部分属于高中山地貌区,也有局部的山间沟谷地貌和丘陵地貌分布。东天山被隧道由北到南贯穿,隧道沿线区域东天山海拔最高点位于里程K13+700段附近,海拔最高点向两侧延伸,海拔逐渐降低。
图1 东天山隧道规划图(1∶250 000)Fig.1 Planning of East Tianshan tunnel(1∶250 000)
1.2 隧道地质超前预报工作原理
隧道散射地震成像(tunnel seismic tomography,TST)技术的主要组成部分包括地震波信号采集器、三硝基甲苯(TNT)引爆装置和TST数据采集终端。TST系统的震源一般采用少量的TNT炸药引爆产生,TST系统充分认识三维波场的复杂性,能有效消除侧向波和面波干扰,以保证成像的真实性。TST是以逆散射成像原理为基础建立的,地震波的运动学和动力学信息也被引用进来,不但能获得围岩力学性状的空间变化,也能确定各种地质构造的位置。
1.3 现场探测工作
依托于东天山隧道,进入隧道内共进行了39次TST隧道地质超前预报工作。进口左洞5次,进口右洞5次,出口左洞12次,出口右洞17次。东天山隧道现场TST物探超前预报工作共分为六步,具体如下:①埋置TNT炸药,形成震源;②埋置信号采集器;③用湿黄泥封口;④信号采集器连接主线缆;⑤主线缆连接TST终端;⑥连接引爆装置。
(1)仪器设备。TST系统硬件主要包括地震波信号采集器、TNT引爆装置、连接线缆和TST数据采集终端等几部分组成,详见图2。
图2 TST隧道地质超前预报系统工作原理Fig.2 Working principle of TST tunnel geological advance forecast system
(2)观测系统设计及布置。在掌子面近端的隧道左右边墙体等高处各布置4个地震波信号接收器,同时在远端的隧道左右墙体等高处各布置4个地震波激发源,具体布置的观测系统情况如表1及图3所示。
(3)探测数据处理。将通过TST隧道地质超前预报系统采集得到的原始物探数据采用专业软件TSTwin进行处理后可以获得地质偏移图像。
表1 观测系统布置图
P1~P8为激发炮孔的编号;S1~S8为接收(检波器)孔的编号; L为S4、S5到Y轴线的垂直距离图3 TST观测系统设计标准布置示意图Fig.3 TST observation system design standard layout diagram
2 东天山隧道数据集构建
2.1 TST图像预处理
以东天山隧道工程项目为依托,采用TST超前地质预报技术得到的TST偏移图构建数据集,TST超前预报一次能预报掌子面前方150 m,因此采集到的偏移图像数量有限。数据集的大小对深度学习模型效果有着重要影响,数据量太少可能会发生过拟合,一般来说,数据量越多训练出来的模型效果越好。通过TST超前地质预报技术得到的东天山隧道出口右线TST偏移图像如图4所示,地质偏移图像中的红蓝条带代表围岩中的岩石反射界面,红色代表岩体由软变硬的反射界面,蓝色代表岩石由硬变软的界面,先蓝、后红条带的组合代表岩体先变软然后变硬,表明存在断裂。为了扩充数据集,采取以滑动窗口长50 m,步长为10 m,将原始的150 m长的TST偏移图像分割成11张50 m长的图像总共得到1 287张偏移图像。
由于不同尺寸的TST偏移图像包含的围岩质量特征信息量不同,使用不同的图像尺寸会出现实验结果的偏差。为了确定最合理的图像尺寸,分别用不同尺寸的TST偏移图像数据集对改进ResNet18模型进行训练,结果如图5所示。可以看出,随着图像尺寸的增大,top-1预测准确率越高,说明了尺寸越大的TST偏移图像包含越多的围岩质量特征信息,但随着图像尺寸增大到256×256时,实验效果趋于稳定,说明当图像尺寸达到256×256时包含的围岩质量特征信息量最大,再继续增大图像尺寸就会包含不必要的信息,还会导致网络的冗余、参数量增大、占有内存增多及训练时间过长,因此TST偏移图像数据集尺寸取256×256。
图5 不同图像尺寸实验效果Fig.5 Experimental results of different image sizes
2.2 数据集构建
2.2.1 TST偏移图像数据集
将经过滑动窗口分割的1 287张256×256×3的TST图像作为深度学习模型的输入值,各TST图像对应段揭露围岩等级作为标签值,以此构建TST偏移图像数据集。
2.2.2 TST偏移图像+地质分区数据集
在TST偏移图像数据集的基础上,将每张TST偏移图像与其对应围岩区段的地质分区指标相结合,即将对应围岩区段的地质分区指标扩展成为一个256 ×256×1的矩阵作为TST偏移图像的第4通道,形成每张TST偏移图像尺寸为256×256×4的组合数据矩阵,将组合后的TST偏移图像作为深度学习模型的输入值,组合TST偏移图像对应段的揭露围岩等级作为标签值,以此构建 TST偏移图像+地质分区数据集。
图4 东天山隧道出口右线TST偏移图像Fig.4 TST offset image of right line of East Tianshan tunnel exit
TST偏移图像+地质分区组合数据集构建过程:某一围岩区段对应的TST偏移图像为一张尺寸为256×256×3的图像,东天山隧道地区地质分区总共分为11类,由于TST偏移图像的红绿蓝(red-green-blue,RGB)矩阵值区间为[0,255],因此将该区间平均分成11段,每一类地质分区指标取对应RGB区间的中间值,形成一个256×256×1的数据矩阵并与原始TST偏移图像数据矩阵组合形成256×256×4的组合数据集。
2.2.3 TST偏移图像+物探指标数据集
在TST偏移图像数据集的基础上与偏移图像对应区段的高关联度的4个物探参数扩展成为一个256×256×1的数据矩阵,并作为偏移图像的第四通道与偏移图像叠加形成一张4通道的图像,即图像尺寸为256×256×4。将组合后的TST偏移图像作为深度学习模型的输入值,与之相对应段的揭露围岩等级作为标签值,依次构建TST偏移图像+物探指标数据集。
TST偏移图像+物探指标组合数据集构建过程:将某一围岩区段对应的4个高关联度物探指标分别形成64×256的矩阵,然后依次从上到下组合起来形成一个256×256×1的矩阵,最后与原始的3通道TST偏移图像组合形成256×256 ×4的组合数据集。
2.2.4 TST偏移图像+地质分区+物探指标数据集
将3通道TST偏移图像作为前3个通道,地质分区指标作为第4通道,高关联度物探指标作为第5通道,按通道依次组合形成一个5通道的数据矩阵,即尺寸为256×256×5的组合数据矩阵。将组合后的数据矩阵作为深度学习模型的输入值,与之相对应段的揭露围岩等级作为标签值,构建TST偏移图像+地质分区+物探指标数据集。
2.3 数据集增强
为了进一步扩大数据集,采用数据增强技术对上述4种数据集进行增强,为了使偏移图像与围岩之间的对应关系不发生改变,采用了垂直镜像(图6)、水平镜像(图7)这两种数据增强方法对数据进行增强,最终得到3 861张偏移图像。将偏移图像所对应段的围岩等级作为该偏移图像的标签值,按照训练集比测试集约为4∶1的比例将数据集划分成训练集和测试集两部分,训练集共3 100张,测试集共761张,数据集具体分布如表2所示。
图6 TST偏移图像垂直镜像Fig.6 Vertical mirror image of TST offset image
图7 TST偏移图像水平镜像Fig.7 Horizontal mirror image of TST offset image
表2 东天山隧道数据集分布
3 模型建立
3.1 深度学习
深度学习就是由深层的神经网络构成,典型的神经网络如图8所示,一般由输入层、中间层和输出层三部分组成。
xi(i=1,2,3)为输入层的值;ai(i=1,2,3)为隐含层输入的值; h(x)为输出值图8 全连接神经网络结构Fig.8 Full-connected neural network structure
将具有多个中间层的神经网络称为“深度学习网络”,深度学习的本意就是具有很深层次的网络,一般来说,深度学习的深度指的是能够解决深层次的问题。
其中ResNet18主要是应用于ImageNet数据集,ImageNet数据集中的图像像素偏小,因此ResNet18网络的第一层卷积核一般尺寸是7×7,感受视野较大,而主要用于对TST物探成像图像进行学习,物探图像的像素值比较大,为了能更准确提取TST物探图像的特征,将ResNet18的第一层卷积核替换为2层3×3的小尺寸卷积核,小尺寸的卷积核感受视野较小能更精确地捕捉到图像特征,提高模型效果。此外,为了避免无用信息的影响,更准确捕捉到图像更深层的特征,在残差单元的x路径上添加一个2×2的平均池化层整合空间信息,步长stride=1,即可保证经过该池化层图像尺寸不发生改变,平均池化层不会增添权重参数,同时可以防止该层出现过拟合,经过改进的ResNet18网络结构如图9所示。
图9 改进ResNet18网络结构Fig.9 Improved ResNet18 network structure
3.2 模型训练
采用Python3.8编程对数据集进行读取,由于数据集图像RGB矩阵值处于[0,255],为了使深度学习更好地进行优化学习,将RGB矩阵值缩小至[-1,1],由于内存限制,将10张图像作为一个批次(batch)进行训练,训练前将数据集的顺序随机打乱10 000次。深度学习模型参数取学习率η=0.001,激活函数为Relu函数,损失函数为交叉熵损失函数,优化器为Adam。深度学习网络训练流程如图10所示。
图10 网络训练流程Fig.10 Network training process
4 模型结果及分析
深度学习模型采用测试集准确率ACC、损失值和过拟合度作为模型的评价指标,则ACC的表达式为
(1)
式(1)中:Na为测试集图像总数量;Nc为通过深度学习模型正确分类围岩等级的图像数量。
ACC值越大,代表通过深度学习模型得到的预测结果与实际结果越接近,模型的性能也就越好。
损失值为模型训练过程中输出值与实际标签值之间的差异性评价指标,损失值越小,代表输出值与实际值越接近,模型性能越好;过拟合度为训练准确率与测试准确率的比值,过拟合度为大于1的数,越接近于1,说明训练准确率和测试准确率越接近,过拟合程度越低,模型性能越好。
采用东天山隧道TST偏移图像数据集、TST偏移图像+地质分区数据集、TST偏移图像+物探指标数据集、TST偏移图像+地质分区+物探指标数据集这4种数据集分别对改进ResNet18模型进行训练,结果如图11~图14所示。
图11 改进ResNet18网络模型训练过程损失曲线Fig.11 Improved ResNet18 network model training process loss curve
图12 改进ResNet18网络模型测试集准确率曲线Fig.12 Improved ResNet18 network model test set accuracy curve
图13 改进ResNet18网络模型训练集准确率曲线Fig.13 Improved ResNet18 network model training set accuracy curve
图14 改进ResNet18网络模型测试集过拟合度比较Fig.14 Comparison of overfitting degree of improved ResNet18 network model test set
通过分别采用TST偏移图像数据集、TST偏移图像+地质分区数据集、TST偏移图像+物探指标数据集、TST偏移图像+地质分区+物探指标数据集这4种数据集对改进ResNet18网络模型进行训练,由图11~图13可知,TST偏移图像数据集收敛速度最快,遍历5个epoch时损失值开始收敛,测试集预测准确率也达到最高值69.5%;TST偏移图像+地质分区数据集在遍历10个epoch时损失值开始收敛,且同时测试集预测准确率达到最高值71.7%;TST偏移图像+物探指标数据集经历8个epoch时损失值开始收敛,此时测试集预测准确率达到最高值70.0%;TST偏移图像+地质分区+物探指标数据集在遍历15个epoch左右时损失值开始收敛,同时测试集预测准确率达到最大值72.5%。4种数据集的训练集准确率达到最高值的时间都要稍落后于测试集,分别为74.5%、76.4%、74.9%、77.1%。
根据测试集准确率和训练集准确率计算出过拟合度,依据过拟合度分别对4种数据集发生过拟合程度做比较,如图14所示。可以看出,4种数据集中TST偏移图像数据集发生过拟合程度最高,TST偏移图像+地质分区+物探指标数据集过拟合程度最低。
TST偏移图像+物探指标数据集相对于TST偏移图像数据集的测试集准确率的提升很小,这可能是由于物探指标和TST偏移图像都是由TST超前地质预报系统收集得到,因此两者可能会有许多重复的地质特征,所以添加物探指标后模型性能并没有得到明显的提升。
5 结论
依托于东天山隧道工程项目,在TST超前地质预报技术的基础上,构建了4种东天山隧道深度学习数据集,并分别对改进ResNet18网络模型进行训练,得出结论如下。
(1)以TST超前地质预报技术得到的东天山隧道围岩TST偏移图像构建了TST偏移图像数据集,TST偏移图像与地质分区组合构建了TST偏移图像+地质分区数据集,TST偏移图像与高关联度物探指标组合构建了TST偏移图像+物探指标数据集,TST偏移图像、地质分区和高关联度物探指标三者组合构建了TST偏移图像+地质分区+物探指标数据集。
(2)用4个数据集分别对改进ResNet18网络模型进行训练,4种数据集的测试集准确率分别为69.5%、71.7%、70.0%和72.5%,TST+地质分区+物探指标数据集在改进ResNet18网络模型上表现最好。