基于高分辨特征的隧道病害检测算法研究
2022-10-29夏鲲
夏鲲
西安工程大学后勤管理处(集团) 陕西 西安 710048
引言
我国公路总里程数约520万公里,含公路隧道21316处、2199.93万延米,传统的人工病害检测已不能满足阶段性的养护需求,但目前的自动化病害检测仍然存在较大的缺陷,不能投入实际的隧道养护工作。针对上述问题,本研究采用HR-Net[1]的第一阶段的特征提取网络作为病害检测网络的主干分支,该种网络结构提取高分辨率的图像特征并进行不同尺度特征交换与融合。但是原始的HR-Net参数数量较多,网络运算量过大虽准确率较高但检测效率不适用于本任务;实验表明,本文提出的检测网络,检测时间比原始HR-Net减少了25%,但是检测准确率与mIoU等指标并没有特别明显的下降。
1 检测算法设计
1.1 检测网络的整体框架图
在隧道病害图像中,病害像素的占比少于20%,较细微的裂缝仅占5%甚至更低[2],若使用常规的卷积神经网络检测,病害特征通过连续多次的下采样或者池化运算[3-4]会受到特征混淆,造成假阳性的检测结果。
HR-Net是于cvpr2019年提出的全新的特征提取的骨架网络,它不同于传统的骨架网络通过一支串联的多个深度的卷积层和池化层特征流去提取高度抽象的语义特征,而是设计了四支并联的由高到低不同分辨率的特征流去进行特征提取,其中的高分辨率(1/4输入图像尺寸)的特征流保留图像的低层语义信息,网络中其他三支融较低分辨率(1/8、1/16、1/32输入图像尺寸)的特征流依次提取不同尺度的高层语义信息。该设计解决了传统骨架网络再进行特征提取中由于多次的卷积或者池化运算会丢失低层次语义信息的问题,因为其内部始终保留了一个较大分辨率的特征用来保存低层次语义信息同时融合了其他分支的高层次语义。该骨架网络可以解决隧道病害检测中的特征混淆造成的假阳性检测结果。
本文设计的HR-Net(1se)网络结构如图1所示,特征提取模块为使用了1/4、1/8、1/16分支的HR-Net的第一个stage,为了更好地融合特征,同时提升特征的抽象性加入了SE[5]模块进行特征增强,之后通过1×1的卷积模块进行特征融合并对病害像素和背景像素进行分类,病害像素标记为1背景像素为0,分类结果即为病害检测的输出结果。
图1 病害检测网络结构图
1.2 改进的语义特征融合
为了优化特征融合,同时解决二分类像素样本不均衡问题,本文在特征融合运算时加入了SE(squeezeandexcitation)模块对病害特征进行增强,以提升病害特征的权重降低背景特征的权重。SE模块由Hu等人提出,结构如图2所示,
图2 SE-模块结构
特征X(H’×W’×C’)首先经过Ftr卷积运算后转换为特征U(H×W×C)通过压缩运算Fsq将C个通道每一个大小为H×W特征通过平均池化运算压缩成了C个1×1的特征通过激励运算后得到每一个通道对应的权重,再将权重通过尺度变换赋予特征U形成带有通道权重的特征X’,即对原特征X应用了通道注意力机制。
2 实验内容
2.1 实验数据
目前鲜有基于隧道检测车所拍摄的隧道病害图像的公开数据集。因此,本研究使用第三方的“LabelMe”标注软件对采集到的隧道病害图像进行标注并创建了实验数据集。步骤如下,首先将隧道图像分发给丰富经验的检测人员进行病害初筛,然后由专门的标注人员将初筛后图像中的病害在LabelMe中用接近病害宽度的画笔进行描绘标注。由于数据集的图像长度过长(4000×1000),为了保证训练时提取的病害特征不产生几何畸变,同时降低显存的消耗,本研究将原始图像裁剪至4×1000×1000。裁剪后的图像数量为5120张,按照8:1:1的比例分别划分为训练集、验证集以及测试集。
2.2 实验环境与参数设置
本研究提出隧道病害检测网络结构基于PyTorch深度学习框架搭建,运行的软、硬件环境为Ubuntu操作者系统、CPU:IntelXeon2.60GHz、内存128G以及4张NVIDIARTX3080显卡(显存8G)。训练的实验参数设置如下,优化器使用Adam,初始的学习率被设置为0.0001,batchsize根据图像尺寸、模型尺寸与显存大小,设置为16,迭代次数设置为30000次。
3 实验结果
3.1 评价指标
在结果评价中,本研究采用5 个指标,像素准确率(PA)、召回率(Recall)、平均交并比(mIoU)、Kappa以及单张推理时间(Time)。其中前4个反映了模型的检测能力,第5个为检测效率。
3.2 隧道病害数据集实验
本文检测目标为隧道内的裂缝。图像尺寸为1024×1000,在进入网络训练前会进行镜像、多角度翻转以及加入高斯白噪声的数据增广处理以扩充数据集。
从图3中可以看到在第1行图中4个算法都可以很好地完成裂缝检测任务,并没有将图像中部的环向施工缝误检为病害。在第2行、第3行图像中裂缝较细时,U-Net和DANet出现了漏检,其中第2行图像的Y型裂缝的连接处虚线标识框内均出现了检测出的裂缝断开的情况。第3行图像的中虚线框中也有类似的情况,特别在U-Net出现了3处漏检。第4行图像中,虽然裂缝都被各算法完整检测,但在真实值虚线框中手工标注的裂缝是有一个细小的分叉点,本算法可获取该病害细节,但是U-Net和DANet均将分叉处背景检测为裂缝,导致分叉被裂缝像素填充,造成了误检的情况。
图3 各算法对隧道病害的检测结果
检测结果如表1所示,本研究算法和原型网络HR-Net这类可保留高分辨率语义特征的语义分割网络在隧道裂缝检测的优势。其中HR-Net在除了推理时间的各项指标中均取得了最佳的得分,证明了高分辨率语义特征提取网络在语义分割的任务中优势明显。经典的U-Net虽然分数最低,但是耗时是最少的,同时也具有可接受的准确率。HR-Net(1se)没有超过HR-Net的分数,但是其耗时比HR-Net减少了接近25%,也具有较高的检测准确率,从表中数据可以体现本网络具有较高的检测效率。
表1 不同语义分割算法的比较
4 结束语
针对隧道裂缝检测车图像采集条件不理想造成特征混淆从而引起误检的问题,本研究提出了一种检测网络HR-Net(1se),对检测车图像中的隧道裂缝有较好的检测效果。首先将HR-Net的特征提取网络进行了精简,留下了一个stage并保留三条特征提取分支;其次在网络末端的,通过SE模块,使用注意力机制去强化融合前各特征提取分支的输出特征,以增强特征的抽象能力及降低数据分布不均衡的影响,使输出的检测结果可保留更多的病害细节特征。
通过在创建的隧道病害数据集上展开的对比实验,结果表明HR-Net在两类数据集上均取得到了最高的准确率(PA)与平均交并比mIoU,但是耗时也是最高的。本研究提出的算法在两类验证实验中中PA比HR-Net仅低不超过1%,mIoU不超过1%,但耗时却少了25%,同时其他指标远高于其他两个对比算法,证明该方法在隧道病害检测中具有较高的效率。通过实验可说明,本研究符合自动化检测算法的精度要求,可适用于隧道养护的应用场景。