岩石变形局部化智能识别的DSCM-CNN 方法1)
2024-03-16姚海波张军徽马少军
张 鹏 利 铭 姚海波 张军徽,2) 马少军 高 峰
*(北京市市政一建设工程有限责任公司,北京 100036)
†(北方工业大学土木工程学院,北京 100144)
**(中国电建中国水利水电第七工程局有限公司,成都 610200)
岩石变形局部化是岩体变形破坏过程中应变由均匀分布演化为非均匀分布,呈现出一条或多条应变集中窄带的现象。岩石变形局部化与裂缝形成、断裂破坏、整体失稳等都有着直接联系。岩石变形局部化的识别对岩石破坏机理研究和岩土工程灾害监测预警都有重要的意义。
数字散斑相关方法(digital speckle correlation methods,DSCM)通过采集到的试件表面散斑图像进行分析即可得到变形相关的信息。目前,该方法已被广泛用于岩石变形局部化的测量。王学滨等[1]使用DSCM 对岩石变形非均匀性进行研究,提出采用变异系数描述变形非均匀性;吴加权等[2]利用DSCM 得到了试件的载荷-位移曲线,实现了对常用工程材料聚甲基丙烯酸甲酯(polymethylmethacrylate,PMMA)的弹性模量的测量;李元海等[3]利用DSCM 对岩土材料变形时空的非均匀特征进行研究,提出了一种DSCM的快速优化分析方法;吴佳宁等[4]通过DSCM 获取岩石表面位移场,基于有限元法反演了岩石边界条件和弹性参数;王杰等[5]使用DSCM 观测类岩石试件的单轴压缩实验过程,对变形局部化带的位置、方向演化特性与预警应用进行了研究;文献[6-8]采用DSCM 作为实验观测手段,对岩石变形演化、材料力学参数及声发射特征进行了研究;文献[9-12]采用DSCM 对岩体加载实验进行观测,从而分析研究了岩石局部化变形演化规律;许海亮等[13]使用DSCM 和声发射技术对红砂岩单轴压缩过程进行观测,对震源时空演化特征和破裂机制进行了研究。
近年来,采用卷积神经网络(convolutional neural networks,CNN)进行岩石宏观裂缝检测识别的研究方兴未艾。薛东杰等[14]提出基于CNN的智能识别算法,用于天然岩石与混凝土裂隙识别;张伟光等[15]使用多层感知器和CNN 从路面图像中识别裂缝,结果表明CNN 的准确率更高,达到了99.75%;余加勇等[16]将Mask R-CNN 和无人机结合,实现了对高耸桥梁结构表面裂缝的远程非接触、自动化识别;刘奇等[17]使用转置CNN 对路面图像进行裂缝识别,结果表明该神经网络的识别效果优于CrackNet 神经网络;任松等[18]使用单步多框目标检测卷积神经网络(single shot multibox detector,SSD)和基于区域的全卷积目标检测网络(region-based fully convolutional networks,R-FCN)分别对公路隧道衬砌裂缝图像进行识别,结果表明SSD 识别速度快,R-FCN 识别精度高;许颖等[19]基于视觉几何组卷积神经网络(visual geometry group convolutional neural networks,VGG16 CNN)提出一种用于混凝土锈蚀裂缝识别的SCNet 模型,结果表明该模型能从图像中识别裂缝并分类,准确率达96.8%;吴子燕等[20]比较了多种经典CNN对桥梁裂隙的识别效果,结果表明拥有Inception-V3 模块的GoogLeNet CNN 模型具有较高的精度;李雯雯等[21]提出一种新的基于全CNN 和朴素贝叶斯数据融合模型的混凝土桥梁裂缝自动识别算法,结果表明,与其他算法相比,该方法的识别精确度与识别时间均具有优势。采用CNN网络模型对岩石变形局部化图像进行识别,无需人工进行大量的图像处理过程,一般只需要对所采集的图像进行灰度化便可以直接作为输入进行训练,CNN 能够自动学习不同图像的像素差异,从而能够实现对岩石变形局部化的快速、准确识别。
本文针对岩石变形局部化的识别问题,提出了一种结合DSCM 与CNN 的岩石变形局部化智能识别模型,以DSCM 获得岩石试件的变形场作为数据集输入,搭建CNN,实现对岩石局部化带的智能识别,该模型能够充分利用图像的高维特征,避免原始光学图像容易受到环境光照、设备噪声等外界因素影响的缺点,与之前的方法相比具有高精度、抗干扰、自动化识别的优点。
1 基本原理
DSCM-CNN 岩石变形局部化智能识别方法的实现主要包括:(1)DSCM 获取岩石表面变形场;(2)对应变场进行归一化、数据增强等预处理,设置滤除门槛确定变形局部化带位置,进行图片标注完成数据集构建;(3)搭建变形局部化智能识别的CNN 模型;(4)对DSCMCNN 模型性能进行评估。流程如图1所示。
图1 DSCM-CNN 岩石变形局部化识别流程Fig.1 Identification process of rock deformation localization by DSCM-CNN model
1.1 采用DSCM 获取变形场
使用CCD 相机实时采集试件表面散斑图像,从散斑图像中提取试件变形场,原理如图2 所示。首先,计算参考图像子区和目标图像子区的相关系数,确定匹配点;然后,跟踪匹配点的运动,获得其坐标位置,进而计算出变形场。
图2 DSCM 原理示意图Fig.2 Schematic diagram of DSCM
式中,Δx和 Δy为点A到子区中心点的距离;∂u/∂x,∂u/∂y,∂v/∂x,∂v/∂y为位移的一阶导数。最终将图3(a)散斑云图转化成图3(b)的DSCM 变形场云图。
图3 将散斑图像转化为DSCM 变形场云图Fig.3 Convert speckle image into DSCM deformation field nephogram
1.2 数据集的构建
岩石变形局部化与最大剪应变场密切相关[9],将最大剪应变场归一化处理后绘制成云图,然后,采用旋转、增加噪音的方式进行数据增强。按式(3)设置滤除门槛,将过大或过小的应变值滤除,并用emin和emax代替原应变值e,获得更清晰的变形局部化带云图。滤除门槛效果如图4所示。
图4 滤除门槛效果示意图Fig.4 Schematic diagram of filtering threshold effect
将增强处理后的云图划分为若干个子区域,采用one-hot 编码标签描述岩石整体和局部是否存在变形局部化现象:当整体处于安全状态时,即整体未出现变形局部化现象,第一个子标签为“1”,否则为“0”;后4 个子标签用于描述各子区域是否存在变形局部化带,存在时标签为“1”,否则为“0”。根据上述标注方法,图5 的整体标签为:[0,1,0,1,0]。对所有增强处理后的DSCM最大剪应变云图进行标注,完成数据集的构建。
图5 云图标注方法Fig.5 Nephogram labeling method
1.3 智能识别的DSCM-CNN 模型
试件表面的每个子区域都可能存在变形局部化带,且区域之间相互独立,可能出现多个区域同时存在变形局部化带的情况,这样的问题被称为多标签分类。本文采用二元相关法将多标签问题转化为L个相互独立的二分类问题,L为子标签数量,即针对每个子标签分别构建一个二元分类器,用于判别该标签对应区域是否存在变形局部化带。二元分类器采用标准逻辑回归Sigmoid函数,计算公式为
式中,x是i个神经元接收到的输入信号;pi是第i个子标签的正实例概率。当pi >0.5 时,则标记为正实例,即存在变形局部化;当pi <0.5时,则标记为负实例,即不存在变形局部化。
智能识别的DSCM-CNN 模型如图6 所示。应变场云图从输入层进入智能识别模型,通过CNN 实现特征提取和整合,然后将特征信息传递到拥有L个神经元的Sigmoid 分类层,最终输出云图对应的预测标签。
图6 变形局部化智能识别的DSCM-CNN 模型Fig.6 DSCM-CNN model for intelligent identification of deformation localization
智能识别模型训练时需要将损失函数最小化,通常与Sigmoid 函数搭配使用的损失函数是二元交叉熵,计算公式为
式中,yi为第i个子标签的真实标签,L是Sigmoid 分类层的神经元个数。
2 红砂岩单轴压缩DSCM 实验
对红砂岩试件进行单轴压缩实验,试件尺寸如表1 所示。在试件的待观测面上轮流喷涂黑、白油漆制作人工散斑,完成试件的制备。实验采用RLJW-2000 型液压伺服实验机进行加载,通过Basler A641f 型CCD 相机对加载过程的试件表面散斑图像进行采集,整体实验系统如图7所示。实验机下方底座保持不动,上方压头按0.1 mm/min 速度向下加载;CCD 相机以5 帧/s的速率采集散斑图像,图像分辨率为1600 pixel×1200 pixel。
表1 红砂岩试件尺寸Table 1 Red sandstone specimens sizes
图7 实验系统Fig.7 Experimental system
图8 是试件1 加载曲线和标识点散斑图像处理示意图。以加载开始时刻的散斑图像作为参考图像,标识点时刻散斑图像作为变形图像,在试件表面选取尺寸约为400 pixel×800 pixel 的分析区域,并在区域内选取清晰的白色散斑作为校对点,消除变形图像的刚体位移;设置计算子区尺寸为31 pixel×31 pixel,步长为5 pixel,运行DSCM 分析软件计算得到最大剪应变场,并绘制应变云图;最后将云图尺寸统一调整为192 pixel×192 pixel×3(RGB 通道)。
图8 散斑图像处理示意图Fig.8 Speckle images processing diagram
3 智能识别DSCM-CNN 模型搭建
3.1 数据集构建
采用单轴压缩DSCM 实验获得的应变云图搭建智能模型的数据集。原始应变云图的变形局部化带位置不清晰,试件标识点处云图的标注过程如图9 所示。通过设置滤除门槛emax=1.2% 和emin=0.2%将过大、过小应变滤除,得到清晰的变形局部化带云图;变形局部化带从左下角向右上角延伸,穿过子区域2 和子区域3,可确定标签为[0,0,1,1,0];将原始应变云图和标签绑定为一组样本数据。
图9 云图标注过程示意图Fig.9 Schematic diagram of nephograms labeling process
从加载过程的所有应变云图中每间隔5 s 选取一张按以上流程进行云图标注,共获得381 组样本数据。然后对这381 组样本数据进行数据增强:将云图进行旋转,角度包括0°,90°,180°和270°;为云图增加噪音,噪音按正态分布随机生成。样本数量扩充至1524 组,最终构建的红砂岩变形局部化带数据集(部分)如表2 所示。
表2 红砂岩变形局部化带数据集Table 2 Red sandstone deformation localization zone dataset
3.2 智能识别的DSCM-CNN 模型训练
采用1.3 节所述方法搭建DSCM-CNN 模型,编程语言为Python3.7.0,深度学习框架为Tensor-Flow 2.10.0。CNN 的基本架构为搭载了最大池化层的ResNet50v2,采用Adam 算法优化器,初始学习率设置为0.001。运行环境为:Windows 10 系统笔记本电脑,CPU 为Intel i5-6300HQ,内存20 GB,未启用GPU 加速。
从数据集中抽取80%样本作为训练集数据。需要注意的是,设置滤除门槛的云图仅用于确定标签,不作为样本数据的云图。将训练集按每批次100 份样本输入到DSCM-CNN 模型中,所有样本都完成输入则记为1 次迭代训练,共进行50次迭代训练。验证集同时输入至智能识别模型中,但仅用于验证模型性能,不参与训练。
采用汉明损失对DSCM-CNN 模型的收敛性进行评价,计算公式为
式中,m为样本总数,L表示子标签数量,Yi为第i个样本的真实标签,Pi为第i个样本的预测标签,Δ 为对称差计算符。汉明损失表示模型的误差程度,数值越小表示误差越低。
图10 为DSCM-CNN 模型的汉明损失曲线。黑色曲线为训练集的汉明损失曲线,经过10 次迭代迅速减少至0.011 33,最终降至0.001 97,此时训练集的汉明损失值非常小,说明未出现“欠拟合”问题,智能识别模型复杂度满足变形局部化识别的需求。红色曲线为验证集的汉明损失曲线,呈现波动式下降,在第10 次、第50 次迭代时分别为0.028 38 和0.014 83,与同时期的训练集汉明损失之差分别为0.017 05 和0.012 86,两者差距在不断缩小,说明未出现“过拟合”问题,数据量满足智能识别模型训练要求,迭代次数适中,学习率取值合理。
图10 汉明损失曲线Fig.10 Curve of Hamming loss
用式I[Yi=Pi] 表示真实标签和预测标签是否完全相同,完全相同时I=1,否则I=0。采用子集准确率、精确度、召回率等指标对智能识别模型的性能进行评估
式中,∩和∪分别为交、并运算符;|A| 为输出集合A的元素数量。DSCM-CNN 模型在训练集的性能指标如图11 所示。
图11 DSCM-CNN 模型在训练集的性能指标Fig.11 Performance indicators of DSCM-CNN model in training dataset
由图11 可知,DSCM-CNN 模型在训练集的子集准确率,即预测标签和真实标签完全相同的样本在所有样本中的占比达到了99.02%;智能识别模型在训练集的精确度和召回率达到了99.60%,模型训练成功。另外,智能识别模型的训练时间仅为4 h,训练速度快,便于调试与部署,若采用GPU 加速训练时间还将大幅度减少。
4 DSCM-CNN 智能模型的实验验证
采用第2 节红砂岩单轴压缩的DSCM 实验验证本文提出的DSCM-CNN 智能模型的有效性。随机选取DSCM 实验云纹图的20%共305 张构成实验验证集,将验证集的云图样本输入至第3节训练好的DSCM-CNN 模型,智能模型将输出对应的预测标签,智能识别模型在实验验证集上的子集准确率、精确度、召回率指标如图12 所示。该智能模型在验证集上每秒可识别23 张云图,识别速率可以满足真实工程需求。
图12 DSCM-CNN 模型在验证集的性能指标Fig.12 Performance indicators of DSCM-CNN model in validation dataset
由图12 可以看出,智能识别模型在实验验证集上的子集准确率、精确度、召回率分别为94.19%,97.21%和96.41%,相较于第3 节训练集上的性能指标有所降低,但仍保持较高性能,说明模型泛化能力优秀,能准确识别陌生实验样本的变形局部化带位置,且漏报、误报占比小。
DSCM-CNN 模型在实验验证集的部分典型识别结果如表3 所示。
表3 DSCM-CNN 模型在验证集的识别结果(部分)Table 3 Results of DSCM-CNN model in validation dataset (partial)
由表3 可知,对于未出现变形局部化带的测试样本1 和2,智能识别模型给出了正确的识别结果。对于单个区域存在变形局部化带的测试样本3 和4,智能识别模型给出了正确的识别结果。对于局部化带跨区域发展的测试样本5,6,7 和8,智能识别模型也给出了正确的识别结果。测试样本9 的整体应变均匀,不存在变形局部化带,但右上角橘红色区域排列紧密,呈现细长带状特征,这使得智能识别模型将其错误识别为变形局部化带,导致误报。测试样本10 原始云图的右下角(即子区域1)出现明显变形集中现象,但通过滤除门槛得到图13,可以发现实际的变形局部化带跨越了子区域1 和子区域4,智能识别模型仅识别出子区域4 存在变形局部化带,漏报了子区域1 的变形局部化带,这可能是因为右下角的应变值远大于其他区域,使带状特征被掩盖。未来可考虑采用拉伊达准则等预处理方法,将极端应变值滤除以减少模型漏报风险。
图13 滤除门槛后的测试样本10Fig.13 The filtered test sample 10
5 结论
(1)本文将DSCM 与图像识别领域的CNN相结合,提出了一种用于岩石变形局部化智能识别的DSCM-CNN 模型。
(2)采用单轴压缩实验对该模型进行了验证,结果表明:子集准确率、精确度、召回率分别为94.19%,97.21%和96.41%,说明本文提出的DSCM-CNN 岩石变形局部化智能识别方法有效可行。
(3)DSCM-CNN 智能识别模型的训练时间短,识别速率高,便于调试与部署,为岩土工程灾害监测预警提供了一种新思路。