APP下载

基于改进YOLO V3算法的轨道扣件缺陷检测

2020-12-23韦若禹李舒婷吴松荣郑英杰

铁道标准设计 2020年12期
关键词:扣件网络结构准确率

韦若禹,李舒婷,吴松荣,郑英杰,刘 东

(1.磁浮技术与磁浮列车教育部重点实验室,成都 610031; 2.西南交通大学电气工程学院,成都 611756)

随着我国铁路的快速发展,铁路运输承担能力也随之越来越高,如何有效保障铁路运营安全已成为铁路养护工作中的关键问题[1-2]。扣件是连接道床和钢轨的重要轨道组件,钢轨振动和环境温差等因素会使扣件损坏或脱落,长此以往会出现钢轨变形、坍塌等问题,严重时会直接导致列车发生脱轨事故[3-4]。而我国铁路轨道扣件数量众多,因此迫切需要智能化、自动化的检测手段来快速且准确地识别扣件缺陷[5-6]。

当前我国主要采用人工巡道的方法检查轨道扣件中的缺陷,这种方法不仅经常发生漏检现象,而且极度依赖巡道工的经验,需要耗费大量的人力和物力,已经不适应如今铁路轨道的发展[7-8]。随着深度学习(Deep learning)和神经网络的兴起[9],国内外学者提出了许多基于神经网络的目标检测[10-11]和目标跟踪算法[12],并且已有相关研究将其用于处理铁路图像,如通过卷积神经网络(Conventional neural network)识别有砟轨道区域[13-14]、轨道塞钉[15]等零件状态等,获得了良好的检测效果。

目前应用比较广泛且基于深度卷积神经网络的目标检测算法可以分为两类:一类是基于候选区域的目标检测算法,如R-CNN[16](Region-Conventional Neural Network)、Fast R-CNN[17]、Faster R-CNN[18]等,这类算法首先获取图像中可能存在目标的子区域,接着将所有的子区域作为输入,并通过深度卷积神经网络提取目标特征,最后进行类别检测和边框修正;另一类是基于端对端学习的目标检测算法,如SSD(Single Shot Multibox Detector)[19]、YOLO(You Only Look Once)[20]、YOLO V3[21]等,此类算法不需要提取候选区域,只要给定输入图像,就可以直接利用该算法检测出图像中的目标类别和目标边框,大大加快了检测速度。

本文将采集到的现场环境下的图像样本制作成轨道扣件缺陷检测数据集,以YOLO V3模型为基础,将轨道扣件的各类缺陷作为训练和检测的目标。但由于检测目标尺寸普遍较小,目标包含的特征信息量较少,在使用YOLO V3算法检测时,误识别率较高,因此本文对YOLO V3目标检测算法提出了两点改进。先使用K-means算法对扣件数据集的目标候选框尺寸进行聚类分析,采用分析得到的聚类中心进行模型训练,以提高模型的识别准确率;同时调整网络结构,根据检测目标的尺寸选取两组尺度特征,对扣件缺陷的位置和类别进行预测,以减少运算量,提升检测速度。

1 YOLO V3算法

图1 Darknet-53网络结构

YOLO[20]系列算法训练模型时通过卷积神经网络直接输入整张图像,是一种端到端的目标检测算法,省去了生成候选区域的中间步骤,因此能够快速将目标和背景区域进行区分,实现实时检测目标物体的功能。相比于YOLO V2中的骨干网络Darknet-19,YOLO V3参考了残差神经网络结构,通过在网络中引入残差单元,降低训练深层网络的难度,并且将Darknet-19网络扩充至53层并称该骨干网络为Darknet-53[21]。图1为Darknet-53的网络结构,其中方框圈出的部分为残差组件,最左侧一列的1、2、8等数字代表重复残差组件的数量;网络的输入尺寸为416×416,输出13×13、26×26和52×52三种尺度的特征图,并送入检测网络。

检测网络将输入的图像划分成S×S个相同大小的单元格,如果目标的中心落入某一单元格,则该网格负责预测该目标[20],并通过卷积层将特征提取出来,以便于正确识别目标。一个单元格需要预测多个边界框,每个边界框包含置信度信息和预测的位置信息(tx,ty,tw,th)。将图像左上角设置为坐标原点,则单元格相对于整幅图像的坐标为(cx,cy),且先验框(anchor box)的宽度和高度分别为pw和ph,那么预测出的边界框可以表示为

(1)

式中,(bx,by)为预测边界框的中心坐标;bw、bh分别表示预测边界框的宽度和高度。通过该公式可得到多个边界框的信息,YOLO V3网络采用非极大值抑制算法,去除置信得分较低的边界框,保留置信得分较高的边界框为目标的检测框[22]。

2 改进的YOLO V3模型

本文主要研究轨道扣件中的缺陷检测问题,原YOLO V3网络中定义的先验框和网络的层级结构并不适用于本文的研究对象。因此,首先使用K-means算法对数据集进行聚类分析,然后针对扣件缺陷检测,对原网络的层级结构进行修改。

2.1 数据集目标框的聚类分析

YOLO V3网络使用anchors boxes对边界框进行预测,初始anchor boxes是一组尺寸固定的先验框,对先验框的选择会影响网络对目标物体的检测准确度和速度。在Faster R-CNN和SSD检测算法中,anchor boxes的大小是通过人工确定的,这种做法会导致主观性比较强。YOLO V3网络为了选出尺寸合适的先验框,使用K-means聚类算法对数据集的目标框进行聚类分析。

在K-means算法中,设置anchor boxes的目的是使其与临近的真实框有更大的IOU值,并且IOU的值应该与框的尺寸无关。IOU表示真实标注框与预测框的交并比,用来衡量预测边界框的准确性,当IOU=1时,说明真实标注框与预测框重合,其计算公式如下

(2)

式中,btrue和bpred分别表示真实标注框和预测框。

K-means算法通常使用欧氏距离、切比雪夫距离、曼哈顿距离等方法作为距离量度,计算两点间的距离。在YOLO V3网络中,如果聚类算法仍采用这些常用的距离,会导致不能产生很好的检测效果。因此可通过自定义的距离公式计算边框之间的相似度,自定义的距离度量公式如下

d(box,centroid)=1-IOU(box,centroid)

(3)

式中,centroid表示聚类时被选作中心的边框;box表示样本中标注的边框;IOU(box,centroid)表示样本标注框和聚类中心框的交并比。

本文选取K=1~10,分别对训练集中的样本图像进行K-means聚类分析,得到K值与平均交并比AvgIOU之间的关系如图2所示。

图2 K-means聚类分析结果

从图2可以看出,随着K值的增大,平均交并比的变化曲线逐渐平缓,曲线的拐点可认为是最佳的anchor boxes的个数。当K>3时,曲线开始变得平缓,所以确定anchor boxes的数量为3,这样既可以加快损失函数的收敛速度,又可以降低预测框引起的误差。对应先验框的大小设置为3个聚类的中心,在本训练数据集上相对应的分别是(31,69),(39,82),(60,93)。

2.2 改进的目标检测网络结构

YOLO V3采用类似FPN的上采样和融合做法,在3个尺度的融合特征图上分别独立做检测,对目标物体的尺度变化适应性较好。但在轨道扣件缺陷检测任务中,检测目标普遍较小,因此需要对YOLO V3的网络结构进行一些改进,从而适应特定的轨道扣件缺陷检测任务,同时为了提升运算速率,加快缺陷检测整体流程,从原网络结构中提取两组尺度特征对扣件缺陷的位置和类别进行预测,使其更好地适应检测轨道扣件缺陷的任务。

图3为改进后的YOLO V3网络结构,输入图像尺寸为416×416,Darknet-53中conv53层做五次卷积操作后进行上采样操作,将结果与Darknet-53中的conv45层融合,然后进行五次卷积操作、3×3和1×1等卷积后得到第一尺度26×26的特征图。以类似的方法对Darknet-53中的conv29层进行特征融合,可以得到第二尺度52×52的特征图。

图3 改进后的YOLO V3网络结构

通过改进后的网络结构可以使YOLO V3网络结构更好地适应轨道扣件检测场景中检测目标普遍较小的情况,进而提高模型检测的准确率。由于采用了与现实场景相匹配的尺度数目,改进后的YOLO V3模型还可以有效减少不必要的计算量,提升检测速度。

3 实验结果与对比分析

3.1 实验运行环境

表1为本文的实验硬件环境配置,同时在服务器上搭建软件环境,包括Windows 10.0、CUDA8.0、OpenCV3.4.0等常用环境,深度学习算法使用Darknet-53框架。

表1 实验硬件环境配置

3.2 网络训练

实验的图像数据来源为安装于某地铁列车上的轨道智能巡检系统,该系统通过高速工业相机拍摄轨道,并得到DTVI2型扣件图像。该类型扣件包含弹条和螺栓两个主要零件,其中零件的脱落和松动是最容易出现的问题。因此本文自制了轨道扣件缺陷六分类数据集,类别名称分别为正常弹条(sh)、弹条松动(sh_loose)、弹条脱落(sh_off)、正常螺栓(nut)、螺栓松动(nut_loose)、螺栓脱落(nut_off),各类典型样本如图4所示。

图4 典型扣件缺陷图像

对图像数据进行整理后,因为缺陷样本稀缺,所以对100余张缺陷扣件图像进行旋转、镜像等数据增强处理后扩展到600张,其中各类缺陷均占1/4。将200张正常扣件样本与500张缺陷样本组合作为训练数据集,再选取剩余100张缺陷样本与100张正常扣件样本组合作为测试数据集。采用Yolo_mark工具对数据集的图像进行标注并以Yolo数据的格式进行存储。

使用YOLO V3网络和改进后的YOLO V3网络分别进行训练,训练的批量大小为64,衰减系数为0.000 5,采用动量为0.9的异步随机梯度下降,在训练的初始阶段选择0.001的学习率,并利用旋转、调整饱和度、调整曝光量等方法增强和扩充数据集中的图像样本。

在训练过程中,通过绘制Loss曲线可以直观地观察训练模型的迭代过程,图5为改进前后的YOLO V3网络在训练过程中对应的Loss曲线。图5(a)为原YOLO V3网络对应的Loss曲线,图5(b)为改进后YOLO V3网络对应的Loss曲线,如图所示,当迭代次数达到20000次后,各参数趋于稳定,改进前后网络的Loss值分别降至0.27和0.15左右。从Loss函数的收敛情况分析可知,改进后YOLO V3网络的训练效果比较理想。

图5 改进前后的YOLO V3损失函数曲线

3.3 改进前后检测算法的性能对比

为了准确且有效地对检测算法的性能进行评价,本文选择准确率RP和召回率RR作为评价指标,其计算公式分别为

(4)

(5)

式中,NTP为正确识别的目标数量;NFP为被错误识别的目标数量;NFN为没有被识别出来的目标数量。

用来测试的200张图像中共有489个目标,分别使用原YOLO V3算法和改进后的YOLO V3算法对测试数据集进行目标检测,分别计算它们的准确率RP和召回率RR,结果如表2所示。

从表2可以看出,与原YOLO V3算法相比,改进后的YOLO V3对扣件缺陷的漏检和误检数量均有明显下降,检测准确率达到96.38%,提高了15.37%,召回率达到98.16%,提升了17.89%,说明改进后的YOLO V3算法具有更高的可靠性。

表2 改进前后算法的目标检测结果对比

在测试数据集上,分别利用YOLO V3改进前后算法计算六类目标的平均准确率(Average Precision,AP),平均准确率对准确率和召回率综合考虑,可用来衡量检测算法的可靠性,并且可以用来分析每个类别的检测结果,是评价检测模型准确性的直观评价标准。同时计算六类目标检测的平均准确率均值(mean Average Precision,mAP),mAP值反映了检测模型识别所有类别的综合性能。测试结果如表3所示,可以看出,改进后的YOLO V3算法的平均准确率均值mAP提升了20.64%,达到95.62%,检测速度在原YOLO V3的基础上提升了82.5%,达到58.4fps,说明改进后的YOLO V3算法具有更好的检测性能。

表3 YOLO V3改进前后算法的检测结果对比

图6 YOLO V3改进前后算法的检测结果对比

图6为YOLO V3改进前后算法的检测结果,图6(a)、图6(b)是原YOLO V3目标检测算法对扣件缺陷的检测结果,图6(c)、图6(d)是改进后的YOLO V3目标检测算法对扣件缺陷的检测结果。对比图6(a)、图6(c),可以发现原YOLO V3对扣件缺陷的检测存在误检的情况,把正常的但有污渍的螺栓误认为是松动的螺栓,而改进后的YOLO V3则可以透过污渍正确识别出正常螺栓。对比图6(b)、图6(d),可以发现原YOLO V3存在漏检的问题,而改进后的YOLO V3网络则可以检测出原网络漏检的螺栓。

3.4 不同检测算法的性能对比

为了更全面地评测改进YOLO V3算法的目标检测性能,使用文献[18]中的Faster R-CNN检测算法和文献[19]中的SSD检测算法进行对比实验,并以mAP和检测速度作为评价算法检测性能的两个指标,实验结果如表4所示。

表4 不同算法的检测结果对比表

从表4可以看出,在Fater R-CNN、SSD和YOLO V3算法中,平均准确率均值mAP最高的为Faster R-CNN算法,检测速度最快的为YOLO V3算法。本文方法与FasterR-CNN相比,mAP提高了15.01%,主要原因是本文方法采用了Anchor机制和改进的网络结构,提高了网络对目标的检测准确率;本文方法与原YOLO V3算法相比,检测速度大幅提高,主要是因为本文方法精简了网络结构,减少了不必要的计算量,从而提升了检测速度。由此可见,改进后的YOLO V3算法同时保证了检测的准确性和检测速度,能够较好地完成轨道扣件缺陷检测任务。

4 结语

提出一种基于卷积神经网络的YOLO V3改进方法,并将其应用于轨道扣件缺陷检测领域。通过采用目标框维度聚类和调整网络结构等方法改进YOLO V3算法,并使用DTVI2型扣件图像作为数据集进行扣件缺陷检测实验。实验结果表明,相比于原YOLO V3网络,改进后YOLO V3算法的检测准确率和召回率均有明显提高,具有更好的检测效果。但在实时性方面,改进后的YOLO V3算法与实际工程应用仍存在着差距,如何在不影响检测性能的条件下提升检测速度将是未来的主要研究方向。

猜你喜欢

扣件网络结构准确率
城市轨道交通横向挡肩式高性能减振扣件技术研究及应用
基于区域特征的缺陷扣件视觉检测
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
快递网络结构研究进展
科隆蛋扣件力学特性分析
基于AutoML的保护区物种识别①
基于图像处理的潘得路快速弹条扣件状态识别