APP下载

基于支持向量机与BP神经网络的裂缝识别算法研究

2020-04-24柯敏勇范宇鑫赵启林潘大荣

山西建筑 2020年8期
关键词:识别率分类器向量

孔 燕 袁 辉 柯敏勇 范宇鑫 赵启林 潘大荣

(1.江苏泰州大桥有限公司,江苏 泰州 225300;2.南京工业大学,江苏 南京 210000;3.南京水利科学研究院,江苏 南京 210000;4.南京工程学院,江苏 南京 210000)

0 引言

我国大部分基础设施由混凝土浇筑而成,由于混凝土材料自身的特性和服役环境中各种因素的影响,绝大多数的混凝土构件中都存在裂缝,影响结构安全。以桥梁为例,据统计90%以上的混凝土桥梁损坏由裂缝引起[1]。传统的检测方法主要基于人工视觉检测,需要搭建脚手架、挂篮或者使用专门的桥梁检测车,成本高,检测效率较低,同时会妨碍结构运营使用,而且检测效果往往依赖于检测人员的经验丰富程度[2,3]。为解决上述问题,现在越来越多的采用爬壁机器人、无人机、非接触检测仪等图像采集设备来获取结构表观图像,但完全依靠人工识别图像中的病害工作量太大,研究混凝土裂缝自动识别算法意义显著。

基于数字图像处理的裂缝自动识别算法受到广泛关注,常用的分类器有支持向量机和BP神经网络[4,5],文献[6]同时使用了这两种分类器并做对比,认为支持向量机构建的裂缝识别算法具有更高识别准确率,推荐使用支持向量机。但是不同分类器有各自的适用条件,考虑到实际工程使用初期裂缝出现少、收集的样本集规模有从少到多逐步积累的特点,本文对少样本与多样本的条件下利用支持向量机与BP神经网络进行裂缝识别的效果进行了对比分析。

1 算法流程

基于支持向量机与BP神经网络的混凝土裂缝自动识别算法都包括图像处理,图像分割,特征提取,目标识别4个步骤(见图1)。本文中的图像预处理和图像分割这两步均参考了文献[2]中的灰度化公式、中值滤波与阈值分割算法。

在特征提取这一步中,选择了像素数比、宽高比和边缘相似性三个可用于区分线状对象和块状对象的特征值,以及线状物骨架二阶差分绝对值之和的平均值、骨架三阶差分绝对值之和的平均值、骨架的拟合曲线与自身所围成的平均面积、三个可区分裂缝和同样具有狭长形态伪裂缝的特征值(见图2),共六个特征值组成了裂缝识别的特征向量,具体的计算方法参考文献[7][8]。

2 算法识别效果对比

本文试验采用自建样本库,样本图取自于泰州大桥、红枫湖大桥、鱼梁州大桥等混凝土桥梁,样本尺寸为128像素×128像素,类型包含裂缝样本和非裂缝样本,非裂缝样本包括伪裂缝样本和只包含块状物的一般背景样本,部分样本图片如图3~图5所示。每张裂缝样本图像和伪裂缝样本图像仅含一条线状物,样本分为训练集和测试集。多样本分类试验训练集包含900个样本图像,而测试集包含450个样本图像。少样本分类试验训练集包含90个样本图像,而测试集包含45个样本图像。裂缝图像、伪裂缝图像和一般背景图像的比例为1∶1∶1。

提取样本图像的像素数比、宽高比、边缘相似性、骨架二阶差分绝对值之和的平均值、骨架三阶差分绝对值之和的平均值、骨架的拟合曲线与自身所围成的平均面积作为输入矩阵。输入矩阵的行代表一个特征向量,输入矩阵的列代表所有样本的某一特征值集合。然后对数据进行标准化处理,经过标准化的处理能增加精度,它决定训练过程中运行速度的快慢、能否顺利收敛和泛化功能的强弱。数据标准化的公式如下:

(1)

其中,Xij为标准化的数据;xij为原始数据;μj为输入矩阵第j列特征值的算数平均值;σj为输入矩阵第j列特征值的标准差。

2.1 基于支持向量机的混凝土裂缝自动识别结果

支持向量机采用径向基核函数,需要确定的训练超参数有惩罚系数c和核函数超参数g。本文采用K折交叉验证法(K-CV)优化惩罚系数c和核函数超参数g,使模型的预测精度达到最高,并使用这组超参数来训练模型。K折交叉验证的基本原理是将原始数据平均分成K组,将每组数据分别做一次验证集,同时其余K-1组数据作为训练集,这样会得到K个模型,使用这K个模型验证集的分类准确率的平均值作为此K折交叉验证下分类器的性能指标[9]。使用优化后的超参数训练的模型分类的测试结果分别如表1,表2所示。

2.2 基于BP神经网络的混凝土裂缝自动识别结果

表1 基于多样本训练的支持向量机分类结果

表2 基于少样本训练的支持向量机分类结果

BP神经网络的结构包含6个节点的输入层,一个包含13个节点的隐含层和包含2个节点的输出层。在训练参数选取方面,初始权值将在[-1,1]区间内随机产生,学习速率为0.01,期望误差为0.001,最大训练次数选择20 000,传递函数选择Sigmoid函数,训练函数选择Levenberg Marquardt算法。

多样本训练的网络模型和少样本训练的网络模型的Performance曲线如图6,图7所示。Performance曲线反映的是训练误差的变化,训练误差越小表明模型拟合精度越高,两个模型的训练误差均下降到0.001以下,网络模型训练效果良好。使用测试样本检测训练好的网络模型,结果如表3,表4所示。

表3 基于多样本训练的BP神经网络分类结果

表4 基于少样本训练的BP神经网络分类结果

2.3 识别结果对比分析

支持向量机在两种训练条件下都能取得90%以上的识别率,高于相同训练条件下的BP神经网络的识别率;BP神经网络在多样本训练条件下能取得较高的识别率,但在少样本训练条件下取得的识别率低于70%。因为BP神经网络是基于传统统计学的基础上的。传统统计学研究的内容是当样本数据趋于无穷多时的统计性质,所以理论上训练BP神经网络需要大量的样本。在工程使用初期、裂缝样本较少的情况下,采用支持向量机具有更高的分类能力;而到了工程使用中后期、裂缝样本较多的情况下,BP神经网络与支持向量机对裂缝识别能力基本相当,均可以作为工程使用的识别算法,但是在考虑到训练成本与多分类需求的情况下,可能使用BP神经网络更为合适。

3 结语

本文利用三个能区分线状物与块状物的特征量以及三个能在线状物中将裂缝与水迹、划痕等伪裂缝区分的特征量同时作为支持向量机或BP神经网络输入来构造了两个算法,并在少样本与多样本情况下进行了训练和测试。以支持向量机作为分类器的算法在多样本和少样本的训练条件下的总体识别率分别为94.2%和91.1%;以BP神经网络作为分类器的算法在多样本和少样本的训练条件下的总体识别率分别为92.4%和64.4%,以六个特征向量作为网络输入可一次性实现裂缝与非裂缝的区分。在少样本情况下基于支持向量机的算法识别效果明显优越于基于BP神经网络的算法;在多样本情况下两种算法的识别效果基本一致。考虑到在工程使用初期、裂缝样本较少的情况下,采用支持向量机具有更高的分类能力;而到了工程使用中后期、裂缝样本较多的情况下,BP神经网络与支持向量机对裂缝识别能力基本相当,在考虑到训练成本与多分类需求的情况下,可能使用BP神经网络更为合适。

猜你喜欢

识别率分类器向量
向量的分解
学贯中西(6):阐述ML分类器的工作流程
聚焦“向量与三角”创新题
基于朴素Bayes组合的简易集成分类器①
基于特征选择的SVM选择性集成学习方法
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
基于差异性测度的遥感自适应分类器选择
档案数字化过程中OCR技术的应用分析
科技文档中数学表达式的结构分析与识别
人工智能现状和发展