APP下载

基于改进YOLOv3的接触网设备目标检测方法

2023-01-08令晓明范少良王文强

软件导刊 2022年10期
关键词:接触网铁路精度

令晓明,顾䶮楠,范少良,王文强

(1.兰州交通大学国家绿色镀膜技术与装备工程技术研究中心;2.兰州交通大学机电工程学院;3.兰州交通大学光电技术与智能控制教育部重点实验室,甘肃兰州 730070)

0 引言

铁路接触网是铁路运行专线上空架设的一种给机车供电的特殊形式输电线路,可保证铁路的稳定运行。如图1 所示,接触网设备由绝缘子、接触悬挂、支持装置、定位装置、支柱、基础与导线等几部分组成。接触网设备是输电线路上的重要组成部分,出现故障时若不及时、准确处理会引发严重事故,影响列车正常运行。目前,我国在铁路接触网设备的维护和检修方面依然采用检测车拍摄,并通过人工检测对每张图进行检查并排除故障的方法。由于我国铁路里程长,该方法会造成检测时间长、漏检率高等问题。采用基于机器学习的方法代替人工检测方法,可提高铁路接触网检测的自动化水平。

Fig.1 Components of overhead lines equipment图1 接触网设备组成部分

目标检测算法是近年来的研究热点,特别是在基于深度学习的图像处理领域占据了统治地位[1]。传统的目标检测使用滑动窗口、区域候选框等方法提取区域特征图,通过分类器识别进行回归预测[2]。在检测过程中通过固定步长滑动不同大小、宽高比的窗口,将对应区域的图像分类后实现目标检测。但该方法计算冗余、训练时间较长,不适宜在铁路接触网设备的检测中应用。随着目标检测方法应用于铁路设备检测,明显提高了接触网设备的检测速度和精度。目标检测算法的其中一类是基于回归的One-stage 算法,包括YOLO[3]、SSD[4]等,其检测速度较快;另一类是基于区域候选框的Two-stage 算法,包括RCNN[5]、Fast R-CNN[6]、Mask R-CNN[7]、Faster R-CNN[8]等,检测精度较高。在目标检测过程中,Cao 等[9]改进区域候选网络(Region Proposal Network,RPN)和空间变换网络(Spatial Transformer Network,STN)对目标进行精确检测;Huang 等[10]通过加权金字塔网络(Weighted Pyramid Network,WPN)确定目标,以上模型检测精度较高。若要提高接触网设备的检测速度,高强等[11]提出基于YOLO 的目标分解及聚合表达算法对绝缘子进行检测;赖秋频等[12]用YOLOv2 模型快速检测不同缺陷状态下的绝缘子;刘舒康等[13]通过改进YOLOv3 模型增强特征提取网络,提出基于智能数据的增强算法进行图像增强,快速定位接触网吊弦和支架,但这些模型存在检测精度低的问题。

铁路接触网设备受损在铁路系统故障中较为常见,因此快速、准确地对设备进行检测可保证列车的安全运行。针对本文接触网设备的目标检测问题,使用现有Onestage 算法的典型SSD、YOLO 模型无法保证在检测速度较快的同时,实现较高的检测精度,因此需要对YOLOv3 模型进行改进。

针对YOLOv3 模型检测过程中检测精度较低的问题,本文对YOLOv3 模型进行改进,增加一块空间金字塔模块进行多尺度融合,扩大图像的感受野。由于深度学习对数据量的需求较大,数据增强能够提高图像素材的多样性,并采用Mosaic 图像增强方法增强网络的鲁棒性,使模型在提高检测精度的同时增强适应能力;用广义交并比(Generalized Intersection over Union,GIoU)损失代替原损失函数(Intersection over Union,IoU),完善图像重叠度计算,提高网络的收敛性能,从而提高目标检测精度。实验结果证明,将改进后的模型应用于接触网设备的目标检测中,可达到较好的检测效果。

1 YOLOv3基本模型

YOLO 模型采用回归方法代替RPN 网络的作用,以提高检测速度。然而,在铁路接触网检测过程中需要快速、准确地检测设备,以保证铁路的安全、稳定运行,但是直接将YOLOv3 模型应用于设备检测时,检测精度无法满足要求,因此需要对YOLOv3模型进行改进。

YOLOv3 模型借鉴残差网络思想,将YOLOv2 主干网络中的Darknet-19 主干网络换更为Darknet-53[14],通过多尺度采样方法对较小物体进行快速检测,得到合适的目标检测模型。Darknet-53 网络主体部分共有53 个卷积层,包括2 个卷积层和5 组重复的残差单元,每个残差单元由2个卷积层和1 个快捷链路组成,在残差单元的层与层之间设置快捷链路,将逐层训练转变为分步训练[15]。Darknet-53网络结构、残差单元结构如图2、图3所示。

Fig.2 Darknet-53 network architecture图2 Darknet-53网络结构

为减小模型训练难度,YOLOv3 模型通过检测关键点的坐标框进行解码,确定预测框位置时,以输出特征图的先验框为基础进行调整,通过预测框bx、by、bw、bh中心点坐标和对应网格左上角位置的相对偏移量对预测框进行位置约束[16]。则调整预测框的坐标计算表达式为:

Fig.3 Residual unit图3 残差单元

其中,tx、ty是学习预测框的中心坐标参数,bx、by、bw、bh是预测框中心和宽高的值,pw、ph是先验框的宽高,cx、cy是当前网格左上角到原图左上角之间的长度。通过σ激活函数Sigmoid 将tx、ty约束在(0,1)范围内,计算每个预测框对应的置信度。通过过滤小阈值预测框,并利用非极大值抑制方法[17]删除多余预测框,以达到最终想要的结果。

2 本文改进方法

2.1 增加空间金字塔模块

在保证铁路运行安全的前提下,改进YOLOv3 模型是提高铁路接触网设备目标检测精度的重要途径。为了增大目标感受野、提高检测精度,在YOLOv3 网络中引入一个空间金字塔模块,用于提取目标的局部特征和全局特征,从而提升目标检测精度。网络的空间金字塔模块如图4所示。

Fig.4 Spatial pyramid module图4 空间金字塔模块

在改进YOLOv3 的网络模型中,首先,Darknet-53 网络的输出与第一个预测特征层之间使用了Convolutional Set;其次,拆开Convolutional Set 并加入空间金字塔模块;最后,输入特征图通过3 个不同尺度的内核作最大池化(Maxpool)操作后,输出特征图得到改进模型。其中,Maxpool 操作可有效保留特征,空间金字塔模块相对于固定内核大小的最大池化层可扩大感受野,得到全局特征和局部特征并进行特征融合。通过训练发现,为降低模型复杂度,加入一个空间金字塔模块即能实现网络不同尺度的特征融合,提升模型性能。

2.2 数据增强

在铁路接触网设备的目标检测过程中,好的数据集对目标检测起着至关重要的作用,然而目前没有现成的数据集。由于现场拍摄环境及拍摄设备的限制,得到的图像数据差别较大,并且数据收集不方便,会出现数据较少、图像背景单一的情况,使得网络模型训练的鲁棒性降低。

为了增加图像背景的丰富性与数据的多样性,增强网络的鲁棒性,引入Mosaic 图像增强方法,将多张图拼接在一起进行网络训练。首先,通过翻转、缩放和改变色域的方式将4 张不同方位的图片拼接到一起以增加数据;其次,将图片和标注框相结合得到新图像;最后,将调整后的标签传入模型。该方法增加了训练图像的目标个数,使BN 层可一次性统计多张图片参数,并在GPU 有限的情况下获得较好的训练结果。Mosaic 数据增强如图5所示。

Fig.5 Mosaic data enhancement图5 Mosaic数据增强

2.3 改进边界框回归损失函数

YOLOv3 中的损失函数由边界框回归损失、置信度损失和类别分类损失组成,边界框回归损失函数的性能评估用IoU 表示[18]。传统的回归损失函数可能存在局部最优解而无法得到最优解[19]。因此,本文将真实框和预测框的广义交并比GIoU[20]作为回归损失函数,并用两个边框间的长度表示差距:

通过对YOLOv3模型进行改进,能够快速、准确地检测出接触网设备,从而提升铁路运行的安全性。

3 实验与结果分析

3.1 实验平台

本文实验平台配置如下:处理器为Intel RXeon RSive4112 CPU@2.60GHz,安装内存为16.0GB,GPU 为NVIDIA GeForce RTX 2080,操作系统为Ubuntn 18.04,CUDA 为10.1,Python 为3.8,用Pytorch1.6框架实现算法模型。

3.2 实验数据

目前,为了实现铁路接触网设备的目标检测,需克服数据集较少的问题。在铁路接触网设备目标检测过程中,由于场景的特殊性、目标的单一性,且实验数据集的收集途径和场所有限,因此需要通过图像增强方法扩充数据集,以实现有效的目标检测。

在数据集的处理过程中,首先通过网络、现场拍摄等方法收集图片,将图片统一成JPG 格式;然后通过调节亮度、翻转、旋转、镜像等方法进行图片扩增,并调整图片大小得到2 240 张图片;最后通过可视化图像标注软件LabelImg 进行手动标签,得到Pascal VOC 标准格式的XML 标签文件,并将数据集以7∶3 的比例分成训练集和验证集用于模型训练。

3.3 模型训练及评价指标

训练模型时,当epoch 达到500 个以后,模型趋于稳定。同时,设置初始学习率为0.005,最终学习率为0.001,批处理的尺寸大小为8,权重的衰减系数为0.000 5,动量为0.94。

本文采用目标检测中的平均精度均值(Mean Average Precision,mAP)作为模型训练过程中的评价指标,mAP 是所有类别的AP 平均后获得的。

式中,TP[21](True Positive)为预测为正样本的正样本数量,FP(False Positive)为预测为正样本的负样本数量,FN(False Negative)为预测为负样本的正样本数量,p(r)为P-R 曲线,m 为检测种类数量。

3.4 实验结果分析

本文分别将Faster R-CNN、SSD、YOLOv3 以及改进YOLOv3 等模型进行比较,得到接触网设备不同的性能指标如表1所示。

Table 1 Performance index comparison of different detection algorithms表1 不同检测算法性能指标比较

实验结果表明,改进模型针对8 种不同类别的检测精度都有所提高。从表1 可以看出,Faster R-CNN 模型的mAP 为85.75%,FPS(Frames Per Second)为9.82,SSD 模型的mAP 为71.55%,FPS 为39.08;YOLOv3 模型的mAP 为79.81%,FPS 为29.29。由此可以看出,虽然Faster R-CNN模型的检测精度高于SSD、YOLOv3 模型,但其检测速度存在明显劣势;SSD 模型的检测速度快,但是检测精度低于YOLOv3 模型,很难应用于实际接触网设备检测,因此本文选择改进YOLOv3模型对接触网设备进行目标检测。采用改进YOLOv3 模型后,其mAP 为89.19%,与Faster R-CNN相比提升了3.44%,与SSD 相比提升了17.63%,与YOLOv3相比提升了9.38%。因此,本文提出的改进YOLOv3 模型在检测速度变化不大的前提下,可显著提高接触网设备的目标检测精度,从而满足铁路接触网设备检测实时性和准确性的要求。

为了验证本文算法对于铁路接触网设备检测的准确性,根据检测精度对算法性能进行对比,构建了几种不同网络,通过消融实验在本文制作的数据集上进行训练,实验结果如表2 所示。其中,“√”表示采用相应的改进方法。

Table 2 Effects of different improved YOLOv3 algorithms表2 不同改进YOLOv3算法效果

由表2 可知,实验1 为使用原始YOLOv3 模型,其mAP为79.81%,FPS 为29.29。在原有YOLOv3 模型基础上,实验2 中引入一个空间金字塔模块,使模型的mAP 提升了1.87%,说明加入金字塔模块实现了特征融合,丰富了局部特征信息,从而提升了接触网设备的准确性。实验3 在实验2 的基础上引入Mosaic 图像增强,使模型的mAP 提升了3.97%,提升效果较为明显,说明在改进YOLOv3 模型的过程中引入Mosaic 数据增强,可一次检测4 张图像中的数据,丰富了检测目标,使网络的鲁棒性显著提高,从而简化了GPU 的功能,大幅提升了目标检测精度。实验4 在实验3 的基础上用GIoU 代替IoU,其mAP 提升了3.54%,由此说明用GIoU 代替IoU,可检测到IoU 检测不到的边界框和预测框的未重合部分,从而提升检测精度,使训练结果更优。

通过上述消融实验可知,在铁路接触网设备的目标检测过程中,相比于原来的YOLOv3 模型,本文应用的改进YOLOv3 模型在检测速度变化不大的情况下,检测精度有了显著提升,mAP 提升了9.38%,能够满足铁路接触网设备的目标检测要求。

对不同模型进行目标检测,Faster R-CNN 模型、SSD 模型、YOLOv3 模型以及改进YOLOv3 模型的目标检测结果如图6 所示。结果表明,在本文制作的VOC 数据集中训练网络,选取合适的权重,改进后的YOLOv3 模型可应用于不同场景中,网络的漏检率和误检率显著降低,精度明显提高。

4 结语

本文首先对现有的目标检测方法进行理论分析,然后对Faster R-CNN 模型、SSD 模型、YOLOv3 模型和改进模型进行阐述,最后对4 种模型的检测性能指标进行分析,并进行对比实验。实验结果表明,本文提出的改进YOLOv3模型在检测速度相差不大的情况下,能够提高铁路接触网设备的目标检测精度,且其中有4 类的精度达到92%以上,获得较好的检测效果。当阈值为0.5时,其mAP 的值相比于原有的YOLOv3 模型提升了9.38%,说明通过引入空间金字塔模块、加入Mosaic 图像增强、用GIoU 损失函数代替IoU 损失函数,有效减少了目标检测的漏检和误检问题,提高了检测精度。在下一步工作中,需使用更好的网络结构进行检测,以获得更优的目标检测性能,使铁路接触网设备的目标检测更加快速、精准。

Fig.6 Target detection results of traditional model图6 模型部分目标检测结果

猜你喜欢

接触网铁路精度
为开通打下基础!这条国际铁路完成接触网平推验收
沿着中老铁路一路向南
铁路通信线路维护体制改革探索与实践
基于DSPIC33F微处理器的采集精度的提高
接触网设备“运、检、修”分离改革的探讨
高速铁路接触网研究进展
接触网避雷器接地系统分析
GPS/GLONASS/BDS组合PPP精度分析
无人机在铁路工程建设中的应用与思考
GSM-R在铁路通信中的应用