基于图像特征转换和级联分类器的混凝土表面裂缝快速识别方法

2023-11-30孙瑞猛刘伟喻东晓刘妍妍

工程建设与设计 2023年21期

孙瑞猛，刘伟，喻东晓，刘妍妍

（1.泊头市交通运输局，河北沧州062154；2.沧州市道路运输事业发展中心，河北沧州061014；3.河北兴沧工程检测技术有限公司，河北沧州061000；4.河北水利电力学院，河北沧州061001）

1 引言

混凝土被广泛应用于基础设施建设，裂缝是混凝土结构的常见病害，严重时可能会导致整体性破坏。我国基础设施数量多，存量大，监测维护任务繁重，因此，高效精准地识别混凝土表面裂缝是行业中的一个重要需求。

近年来，为克服现有技术的缺陷，实现自动识别裂缝，大量学者通过摄像头采集混凝土表面图像，利用图像处理或者机器视觉技术自动识别混凝土裂缝[1-2]。此外，有学者对裂缝图像特征变换开展了针对性的研究，利用机器学习识别裂纹的高级特征以实现自动判别裂纹[3-4]。

本研究提出一种针对混凝土表面裂缝的快速识别方法，采用图像特征变换的方法，实现对裂缝图像形态特征的识别。分类器总体复杂度及样本需求量大大降低，提高了准确率，降低了开发成本和难度，具有较高的工程应用价值。

2 图像特征转换方法

2.1 混凝土表面图像形态特征分类

通过对大量桥梁、隧道等水泥混凝土工程构造物表面图像分析，可以将混凝土表面存在的视觉对象分为以下6 种类别，即裂缝、斑块或污渍、文字、水痕或者补痕、施工缝、笔画或划痕等，具体如图1 所示。

图1 水泥混凝土表面视觉对象类型

作为一种视觉对象，裂缝与其他纹理图案的差异主要在于其几何形态，而颜色、明暗等其他方面的差异并不明显。因此，通过对视觉对象进行特征转换，把像素（灰度）信息变换为几何形态信息，进而用于区分裂缝与非裂缝，能够获得较为理想的效果。

2.2 混凝土表面图像特征转换

混凝土表面图像经过二值化处理，可以得到视觉对象的轮廓。轮廓是一个由二值图形的外边缘点构成的点集，它保留了对象的形态特征，降低了其他无效特征的干扰。

Suzuki S 等[5]提出的轮廓提取算法，能够高效地获得图像的严格封闭轮廓。在此基础上，可以对轮廓进行进一步的处理，提取出裂缝轮廓的一系列特征值，进而实现对样本的特征转换，区分裂缝与其他对象的有效特征。

1）周长（Fp）：周长是轮廓作为一个点集所含点的个数。

2）面积比（Fa）：面积比的定义是轮廓的面积除以周长。裂缝的形态是狭长的，因而其面积比一般很小。

3）圆率（Fc）：圆率等于轮廓的面积除以周长相同的圆的面积，取值介于0～1。裂缝形态狭长，其圆率一般接近0。

4）方正率（Fe）：方正率等于轮廓最小外接矩形的宽与长之比。它反映了轮廓在二维平面上的集中程度。

5）填充度（Fr）：填充度是轮廓自身的面积与最小外接矩形的面积之比，它表达了轮廓整体形状的笔直程度。

6）离散度（Fs）：离散度是轮廓上每个点到最小外接矩形的中心的欧氏距离平均值。它既反映了轮廓几何上的集中程度，也反映轮廓的绝对尺寸大小。

2.3 图像特征转换示例

在获取被测表面的图像后，通过二值化、提取轮廓、求取特征3 个步骤，即可实现视觉对象的特征转换。

如图2 所示，其中视觉对象有3 类，左侧的裂缝、中部的水痕以及右侧的文字，将图像进行二值化后提取轮廓，并按照周长阈值滤除图中噪点，剩下4 个轮廓，再对4 个轮廓分别求特征值。

经过以上转换，原始图片中的视觉对象变换为由6 个双精度数值组成的数组。特征变换之后，视觉对象的信息被简化，简化后所得到的特征值体现了与裂缝特征具有强相关性的几何形态，而滤除了其他无关特征。后续的分类器训练和识别均基于特征数组进行展开。

3 级联分类器模型

通过对裂纹图案及各种干扰图案类型的分析，本文建立了一种级联结构的分类器模型，以用于对混凝土表面裂缝的快速识别。具体裂缝识别算法的级联分类器结构如图3所示。

图3 裂缝识别算法的级联分类器结构

整个分类器由5 个层级的子分类器串联而成，且每个子分类器的作用在于排除特定类型的负样本。通过了所有分类器的对象，则确定为裂缝。各个子分类器的结构、激活函数、损失函数均相同，但由于它们训练样本和所采用的特征不同，故其任务学习能力也有所差异。此外，混凝土表面裂纹识别目标相对单一，故识别算法中仅设置双隐藏层，共4 层的神经网络。各个子分类器的训练均独立进行，正样本统一采用裂纹样本组，而负样本则使用对应的干扰图案样本组。

本文采用式（1）所示损失函数：

式中，Li为第i 个样本在本级分类器的损失；x 为子分类器的输出值；k 为相关系数，若训练样本i 为裂缝，为提高弃真错误的损失，k 需大于1；若训练样本i 为非裂缝，为降低纳伪错误的损失，k 需设定为0～1。

4 模型训练及性能评价

4.1 样本库建立

为了验证级联分类模型的有效性，采用自主研发的裂缝检测手持设备进行测试。设备外观如图4 所示。通过小轮使摄像头在混凝土构造物表面扫动，外加光源与摄像头固定在一起，形成统一稳定的图像采集环境。为了尽可能减少手持重量，检测器被设计成分离式结构。

图4 自制手持式裂缝检测设备实物图

通过自开发裂缝检测手持设备共采集2 866 张混凝土照片，并对照片进行提取分类。其中裂缝图案1 042 个、斑块图案673 个、文字图案450 个、水痕图案324 个、施工缝图案109 个、笔迹图案362 个。将图案转换为6 个特征值，进而形成样本库。

4.2 子分类器的特征选取及训练

采用交叉验证的方法寻找最优特征组合，即从6 个特征量中选取n 个（1≤n≤6），则可能的取法数目为：

训练集中的所有样本随机分为5 个子集。训练时每次轮流选取其中1 个子集作为临时测试集，其他4 个子集作为训练集。对于某个子分类器，依次选用63 种特征量组合构建神经网络，对每个网络轮流测试5 组训练子集，并在临时测试集上检验准确率。多次尝试后，找到某个网络对所有临时测试集的准确度都比较高，则认为它是一个没有过拟合的最优训练结果。

经测试得到各子分类器特征选取结果如表1 所示。

表1 子分类器特征量选取结果

4.3 模型性能评价

图5 对比了级联分类器与非级联结构的普通全连接神经网络分类器的训练效率。其中级联分类器的迭代次数是每个子分类器迭代次数之和。3 次试验A、B、C 中，总的迭代次数均大于普通分类器。级联分类器中每个子分类器的结构比较简单，故其总体训练成本要低于普通分类器，训练效率可提升35%以上。级联分类器对样本库数量的敏感度更低，且效率较高，可以在样本数量偏少的情况下取得较好的训练效果。