基于YOLOv4的列车锁紧板图像故障检测
2021-05-09王苗张龙信
王苗 张龙信
摘 要:锁紧板偏移故障是货运列车频发的典型故障之一,针对其平均识别精确度较低的问题,将目标检测YOLOv4模型应用于改善货运列车部位锁紧板图像检测。首先,对锁紧板偏移、正常图像进行Mosaic数据增强,以解决数据集样本较少问题。其次,使用k-means聚类算法,得到更优的初始anchor的位置,以提高故障检测精确度。最后,通过非极大值抑制获取得分最高的检测结果。实验表明,通过使用目标检测YOLOv4能够精确地实现锁紧板故障的检测。
关键词:故障检测;锁紧板;YOLOv4
中图分类号:TP391.4 文献标识码:A文章编号:2096-4706(2021)20-0042-03
Image Fault Detection of Train Locking Plate Based on YOLOv4
WANG Miao, ZHANG Longxin
(Hunan University of Technology, Zhuzhou 412007, China)
Abstract: Locking plate offset fault is one of the typical faults frequently occurring in freight trains. Aiming at the problem of low
average recognition accuracy, the object detection YOLOv4 model is used to improve the image detection of part locking plate of freight trains. Firstly, Mosaic data enhancement is performed on the offset of the locking plate and the normal image to solve the problem of less samples in the data set. Secondly, K-means clustering algorithm is used to obtain a better initial anchor position, so as to improve the accuracy of fault detection. Finally, the detection result with the highest score is obtained by non-maximum suppression. Experiments show that the use of target detection YOLOv4 can accurately detect the fault of locking plate.
Keywords: fault detection; locking plate; YOLOv4
0 引 言
隨着经济的快速发展和铁路交通领域的飞跃进步,铁路货运列车开始转变为重载、大密度的运行方式,对于列车安全运行来说,列车故障检测的高效性和准确性的意义至关重要。由于传统的人工检测方式随着货运列车高速和高频率的运行而难以适应,为了推进铁路行业的现代化建设,满足列车故障快速、准确发现的要求,于是铁道部推广了列车运行故障动态检测系统(Trouble of moving freight car detection system, TFDS)[1]。锁紧板是货运列车频繁发生故障部位之一。一旦锁紧板偏移,表示螺栓发生了松动。螺栓的松动重则导致脱落,从而影响到列车的安全运行。因此对于列车安全,锁紧板偏移故障检测至关重要。孙国栋等人[2]针对列车挡键问题设计了一种基于形状上下文的丢失图像识别算法,该方法能够区分列车是否存在挡键。雷蕾等人[3]提出了基于HCRD的列车锁紧板偏转自动识别方法。该HCRD方法能检测出锁紧板的偏转,且具有一定的鲁棒性和抗噪能力。
本文的主要贡献在于使用目标检测YOLOv4模型[4]应用于锁紧板的故障检测,另外K-means聚类算法[5]生成更合适的先验框的准确性,采用Mosica数据增强的方式扩展了数据集,以增加模型检测的鲁棒性。
1 相关工作
1.1 YOLOv4网络结构
YOLOv4的网络结构主要有三部分:主干网(Cspdarknet53)、颈部(neck)、头部(head),颈部包括了特征集成网络模块SPP(Spatial Pyramid Pooling)、多尺度特征融合模块PAN(Path Aggregation Network),头部主要是以YOLO-Head为主。
主干网Cspdarknet53包含了多个子模块的堆叠以及一条残差边,主要是用于提取图像特征。颈部用于融合特征,SPP模块增加了感受野,用于集成最优价值的特征信息。PAN模块在FPN的基础上额外增加了一组自上而下的特征提取路径,主要在P3、P4、P5层使用了PAN结构,使得能够得到更加有效的特征信息。YOLO-Head主要用于解码和预测,利用了非极大值抑制得到得分最高的预测框。
在YOLOv4模型中使用的损失函数是CIOU-Loss,CIOU考虑了将目标与anchor之前的距离、重叠率、尺度、以及惩罚项等因素,使其在计算目标框和预测框之间的回归损失更加小。
IOU的计算表达式如所示:
式中,prediction表示预测框,ground-truth表示预测框,Intersection表示两个框之间的交集,Union表示两个框之间的并集。
CIOU-Loss的计算表达式如所示:
式中,ρ2(A,B)分别表示代表A和B点的欧式距离,b表示预测框的位置,bgt表示真实框的位置,c表示能够同时包含预测框和真实框的最小闭包区域的对角线距离,α表示权重参数以及υ表示衡量长宽比一致性的参数。
1.2 聚类算法
K-means聚类算法自研发以来广泛应用于不同的学科领域,但本文主要应用于生成最优的anchor位置。K-means聚类算法主要是通过递归的思想来选取距离最近的中心。第一步,将数据集划分为K类别,然后依次把数据放置在不同的类别中。第二步,当确定好类别之后,计算整个类别的所有数据到该聚类中心点的距离。找出离该类别距离最近的一个聚类中心,计算所有类别聚类中心的平均值作為新的聚类中心。第三步,返回至上一步重新计算。直到聚类中心不再发生变化,停止计算。此时,便成功获取一个适合数据集的聚类中心。
K-means算法虽然具有思想简单、良好的聚类效果、速度快等优点。然而该算法对于初始K值敏感和容易陷入局部优化的缺点。因此,算法中初始K值的选取、初始聚类中心点的选取对于该算法来说是至关重要的,在本论文中分类为2类,所以K值为2。原YOLOv4模型生成锚点聚类中心为16、89、19、43、53、50、61、88、67、93、67、88、68、85、71、72、75、87,后K-means生成的锚点聚类中心为15、97、18、44、22、85、54、49、62、89、67、94、68、90、68、86、72、73。
2 实验
2.1 试验配置与数据集
首先,使用LabelImg软件制作货运列车VOC格式数据集,锁紧板图像总共531张。当数据量比较小时,可以使用9:1训练数据和测试数据。训练集:478张;测试集:锁紧板53。因为实验的数据样本较少,Mosaic数据增强会利用四张图片进行计算,从而增加数据样本的多样性。因此,在本论文中使用了Mosaic数据增强方式来增强数据集。Mosaic数据增强具体步骤如下。第一步,导入4张图片。第二步,分别使用翻转、缩放、色域变化等数据增强方法处理四张图片,并且按照左上、左下、右上、右下等四个方向,忽略图片原来的位置,任意摆放。第三步,组合第二步通过数据增强的方法得到的图片,将组合好的图片合成一张新的图片。
本文的实验基于Pytorch实现。实验使用的操作系统为Ubuntu20.0.0和一块单独的GTX1080Ti GPU。数据处理使用了Python:3.6、OpenCV库,Torch:1.2.0,Torchvision:0.4.0。GPU加速库为Cuda:10.0和Cudnn:7.4.1.5。
当使用YOLOv4模型获取图像特征时,应考虑影响mAP值变化的因素,例如不同学习率(learning rate)和迭代次数(iteration),通过对比实验表明,当设置学习率为10-3时,AP值较大。另外,迭代次数设置为100次,批大小设置为2。
2.2 实验参数与性能指标
如果锁紧板的正常和故障图像分别视为正样本和负样本。那么TP(True Positive)表示当分类器把正常图像分类为正常标签时的次数;TN(True Negative)表示当分类器把故障图像分类为故障标签时的次数;FP(False Positive)表示当分类器把故障图像分类为正常标签时的次数;FN(False Negative)表示当分类器把正常图像分类为故障标签时的次数。召回率(Recall)、精确率(Precision)分别为:
2.3 实验结果
本文主要针对典型部件的货运列车故障图像的锁紧板偏移故障以及正常图像,识别并分类。在图1中,锁紧板正常如(a)所示。当列车处于运行条件下,列车不断的运动会造成交叉端部螺栓的松动,导致锁紧板偏移。锁紧板偏移故障如(b)所示。
3 结 论
本文提出了一种基于YOLOv4算法货运列车锁紧板图像故障检测方法,使用K-means聚类算法先验框和聚类中心的位置作为参数对货运列车数据进行聚类得到先验框,获取更多的细节特征信息。通过使用Mosaic数据增强方式来解决数据集样本少的问题,实验结果表明,YOLOv4模型具有较好的检测效果,mAP达到了84.22%。改进后的YOLOv4网络检测准确度有所提高。
参考文献:
[1] 黄东林.关于提高TFDS动态检查质量的探讨 [J].铁道车辆,2018,56(11):37-39+6.
[2] 孙国栋,徐威,梁永强,等.基于形状上下文的列车挡键丢失图像识别算法 [J].铁道科学与工程学报,2014,11(6):127-131.
[3] 雷蕾,宋冬利,张卫华,等.基于HCRD的列车锁紧板偏转自动识别方法 [J].铁道科学与工程学报,2021,18(7):1895-1902.
[4] BOCHKOVSKIY A,WANG C Y,LIAO H Y M. YOLOv4:Optimal Speed and Accuracy of Object Detection [J/OL].arXiv:2004.10934 [cs.CV].[2021-08-27].https://arxiv.org/abs/2004.10934.
[5] 张雨金,杨凌帆,葛双冶,等.基于Kmeans-SVM的短期光伏发电功率预测 [J].电力系统保护与控制,2018,46(21):118-124.
作者简介:王苗(1998—),女,汉族,湖南耒阳人,硕士在读,研究方向:深度学习和故障检测;
张龙信(1983—),男,汉族,湖南浏阳人,博士,副教授,CCF会员(34915M),研究方向:深度学习和大数据分析。