APP下载

基于改进YOLOv5算法的接触网绝缘子定位方法

2024-04-11刘仕兵周诗涵但业光

华东交通大学学报 2024年1期
关键词:注意力机制绝缘子

刘仕兵 周诗涵 但业光

摘要:【目的】针对高速铁路接触网绝缘子在复杂背景下检测效率不高的问题提出一种检测算法。【方法】首先对样本数据集进行大规模扩充,在原有YOLOv5s算法的基础上,为有效的提升模型的表征力,增加ECA注意力机制,进行无降维的跨信道方式来聚焦绝缘子位置信息;使用BiFPN特征金字塔网络,进行多尺度的特征融合来丰富语义信息;选用Meta-ACON自适应控制激活函数,在函数允许的最大范围内,严格把控函数的上下限,防止模型出现失控现象;将原有GIOU损失函数更换为EIOU损失函数,从梯度的角度对锚框进行更深一步的划分,进而提升网络的收敛速度。【结果】实验结果表明,通过对YOLOv5s改进后的检测算法,可以对绝缘子进行更精确的定位与识别,准确率达到了99.4%。【结论】所提出的检测算法为绝缘子定位检测提供了更加准确快捷的方法。

关键词:绝缘子;风格迁移;YOLOv5s;注意力机制;双向融合特征网络

中图分类号:U225.4 文献标志码:A

本文引用格式:刘仕兵,周诗涵,但业光. 基于改进YOLOv5算法的接触网绝缘子定位方法[J]. 华东交通大学学报,2024,41(1):105-112.

Catenary Insulator Positioning Method Based on

Improved YOLOv5 Algorithm

Liu Shibing, Zhou Shihan, Dan Yeguang

(School of Electrical and Automation Engineering, East China Jiaotong University, Nanchang 330013, China)

Abstract: 【Purpose】A detection algorithm is proposed to address the issue of low detection efficiency of high-speed railway contact line insulators in complex backgrounds. 【Methods】On the basis of the original YOLOv5s algorithm, in order to effectively improve the representation power of the model and increase the ECA attention mechanism, a cross-channel method without dimensionality reduction is carried out to focus on the position information of insulators. The BiFPN feature pyramid network is used to enrich the semantic information by multi-scale feature fusion. The Meta-ACON adaptive control activation function is selected and the upper and lower limits of the function is strictly controlled within the maximum range allowed by the function to prevent the model from running out of control. The original GIOU loss function is replaced with the EIOU loss function, and the anchor box is further divided from the perspective of gradient, so as to improve the convergence speed of the network. 【Results】Acoording to the experimental results, the improved detection algorithm of YOLOv5s can be used to locate and identify the insulator more accurately, and the accuracy rate reaches 99.4%. 【Conclusion】The proposed detection algorithm provides a more accurate and faster method for insulator positioning detection.

Key words: insulators; YOLOv5s; style migration; attention mechanism; bidirectional fusion feature network

Citation format: LIU S B, ZHOU S H, DAN Y G. Catenary insulator positioning method based on improved YOLOv5 algorithm[J]. Journal of East China Jiaotong University, 2024, 41(1): 105-112.

【研究意義】作为高铁牵引供电体系中的关键一环[1],接触网主要作用是将电能传输给动车组,并确保动车组正常运行[2]。绝缘子在高速线路中起到支撑接触网导线、防止电流回地的作用。近年来,接触网悬挂状态检测监测装置利用接触悬挂相机对接触悬挂装置进行图像的采集,并采用智能分析算法对其进行自动识别。但不断增加的图像数据造成分析工作量的大幅增加,同时现有算法存在检测效率低、漏检的情况,无法满足现场需求,因此,利用优化的深度学习网络模型实现绝缘子快速精准的检测,为接触网的巡检提供了新的方向。

【研究进展】目前应用最广泛的深度卷积网络主要涉及Faster R-CNN(faster region-based convolutional neural networks)[3]、SSD(single shot multibox detector)、YOLO(you only look once)[4]、Mask R-CNN[5]等。赵文清等[6]将注意力机制与Faster R-CNN相结合,弱化了其他无关的特征通道,检测速度相对较慢。裴莹玲等[7]通过改进的Faster R-CNN法对高铁扣件进行检测,一定程度上提高了检测精度。冯小雨等[8]将目标检测应用于防空背景下,对静态和动态目标进行检测,但模型的参数选取和网络设计存在冗余现象。卞建鹏等[9]通过改进的EfficientDet算法对吊弦进行定位与故障诊断,但对于跨接触线重合时的吊弦状态检测效果不佳。任之俊等[10]对Mask R-CNN目标检测进行了改进,利用FPN(feature pyramid networks, FPN)反向连接路径进行多次采样,但对不同特征层之间的信息无法得到很好的融合。刘正庭等[11]为解决红外分割的问题,提出了基于分水岭算法的图像分割方法,但容易受到背景影响,定位检测的正确率有待提高。潘翀等[12]将Gram矩阵法和SSD网络结合实现对绝缘子实时定位计算,但该方法在计算量上过于复杂。

【创新特色】综合现有研究,本文从轻量化、高效化的角度展开分析。【关键问题】首先对样本数据进行扩充,其次采用改进的YOLOv5s检测算法进行定位检测。从特征提取的角度,采用ECA(efficient channel attention, ECA)注意力机制与颈部网络C3模块融合形成C3ECA(C3 efficient channel attention,C3ECA)模块,不仅增强特征聚合,而且将通道与空间注意相结合;从特征融合角度,改用BiFPN(bidirectional feature pyramid network, BiFPN)网络来对信息进行多尺度的特征融合;从损失优化角度,采用EIOU(efficient intersection over union, EIOU)加速模型的收敛,实现对绝缘子的高效定位识别。

1 基于CYCLEGAN样本扩充方法

生成对抗网络(generative adversarial network, GAN)是一种无监督化的深度学习,主要是由一个生成网络G和一个判别网络D构成,生成网络从潜空间中,随机取样作为输入,输出的结果,需尽可能的满足模拟训练集中真样本数据的概率分布。

风格迁移是指将目标区域中图像所具有的风格迁移到原有的区域,使原图中风格和目标区域中的图像风格类似,该方法只需较少的训练图像就可生成较高分辨率的图像。目前,最常用的风格迁移模型是CycleGAN(cycle-consistent generative adversarial networks,CycleGAN)[13],生成网络通过所有正常样本和缺陷样本数据分别进行训练。其中,CycleGAN的架构如图1所示,x, y分别表示原区域和目标区域中的图像,G反映的是将原域映射到目标域的生成器,F表示的是将目标域映射到原域的生成器,x′, y′分别表示两个生成器生成的另一个域的图像,x″, y″分别代表从另一个域重建回自己原来所属域的图像,Dx, Dy分别代表原域和目标域的判别器,用来判定输入图像的真假。

由于绝缘子目标集数量较少,因此,有时会人为制造一些缺陷,但由于深度学习所需要的样本量过大,這些方法过于繁琐,且耗费大量的时间和人力,无法在短时间内改善数据不足的问题。因此,本文采用CycleGAN的接触网绝缘子图像生成方法,其生成过程如图2所示。

2 接触网绝缘子定位方法

YOLOv5网络在单阶段检测网络中发挥着更大的作用。根据网络的深度和特征图宽度分类,其对比指标结果如表1所示。其中检测速度单位为ms,参数单位为 M。为了绝缘子定位检测能更好地满足检测的实时性和准确性,本文选用YOLOv5s作为定位网络的基本模型。YOLOv5s算法框架如图3所示。

2.1 融合注意力机制

在注意力机制方面,最具代表性的就是SENet,主要是进行Squeeze和Excitation两大操作。ECANet主要对SENet模块进行了一些改进,是一个相对轻量级的通道注意力模块,该模块对模型复杂度的增加很小,但改进效果明显。图中k代表自适应卷积核的大小,可以通过通道维度C的映射自适应来确定,如下

式中:C代表通道数;| |odd表示k只能取奇数;γ和b分别设置为2和1。

ECANet在SENet的基础上进行了改进,通过引入无降维的局部跨信道交互策略(ECA模块)和自适应选择一维卷积核大小的方法,实现适当的跨通道交互,而不是像全连接层一样全通道交互,性能上得到了提升。其中,通道与空间注意力机制融合后的主要模型如图4所示。

本文对原有的C3模块进行了替换,将其改进为C3ECA,无需在原有Backbone的SPPF[14]层之后再加入ECA模块,简化模型如图5所示。

2.2 双向特征金字塔网络

为提高检测算法效率,在引入参数量更小的情况下,既能对网络信息有更好的提取,又不影响检测速度,本文在YOLOv5s算法的颈部网络中更换为更高效的BiFPN[15],该模块目的是为了实现跨尺度连接和加权特征融合。由于原有算法中无法充分利用不同尺度之间的特征,导致检测网络的检测精度受到限制,因此,通过BiFPN特征金字塔网络对原网络的缺点进行弥补。

从双向跨尺度连接角度来看,如图6所示,蓝色部分是一条自上向下的通路,传递的是高层特征的语义信息;红色部分是自底部向上的通路,传递的是低层特征的位置信息;紫色部分是一条新引入的在同层之间输入节点和输出节点之间的线段。因此,BiFPN不会因为删除初始输入节点而影响特征融合网络,将BiFPN看作一个整体的单元,可以重复叠加使用,来进行更高层次的特征融合。

2.3 Meta-ACON自适应控制激活函数

为更好地连接感知机和神经网络,防止神经元由于模型参数更新太大而出现失控,本文将Meta-ACON[16]激活函数代替原有的SiLU激活函数,可以明确控制网络每一层的非线性程度,严格把控函数上下限,从而自适应地选择是否需要激活神经元。Meta-ACON激活函数公式为

通过β参数的值来控制是否激活(β为0时,即不激活),p1, p2是两个可学习的参数。Meta-ACON激活函数设计了一个计算β的自适应函数,用来控制激活函数的线性和非线性,提高了泛化和传播性能,计算式为

为验证Meta-ACON激活函数具有良好的优越性,对接触网绝缘子定位进行了不同激活函数更换,得到的结果如表2所示。

2.4 优化损失函数

YOLOv5s模型的损失主要包含3个部分,边界框损失(Lbox),置信度损失(Lobj)和分类损失(Lcls)。一个较好的损失函数,不仅可以加快模型的收敛,还可以降低预测值和真实值之间的差距。损失公式如下

为了解决样本不平衡的问题,减少与目标框的重叠,并对锚框中的BBox回归进行了优化,在回归的过程更关注高质量锚框。本文采用EIoU损失函数,它主要是通过重叠面积,中心点距离、长宽边真实差,并引入Focal Loss来解决回归中存在的样本不平衡的问题,它的损失主要包括重叠损失(LIoU),中心距离损失(Ldis),宽高损失(Lasp)。在EIOU的基础上提出一种Focal EIOU Loss,从梯度的角度出发,将高、低质量的锚框分别开来,计算公式如下

式中:IOU为预测框和真实框的交集和并集之间的比值;Cw和Ch分别为覆盖两个最小外接框的宽度和高度;γ为控制异常值抑制程度的因子。

通过引入注意力机制模块、双向特征金字塔网络以及对激活函数和损失函数的优化,最终得到的网络架构图如图7所示。

3 实验与结果分析

3.1 环境配置及数据集划分

为了验证本文方法的有效性和实效性,搭建了Pytorch实验环境,硬件配置如下:操作系统为Windows 11,处理器(CPU)为i7,显卡(GPU)为8G内存的NVIDIA GeForce RTX3050Ti,GPU加速软件为CUDA10.0和 CUDNN8.5.0。模型训练的超参数设置如表3所示。

本文以武乌区间下行线高速铁路接触网4C绝缘子图像数据为研究数据集,原始图片像素为5 120×

5 120,共1 400张,在训练时统一将像素缩放为640×640。利用LabelImg图像标注软件对绝缘子图像进行标注,并随机将训练集、验证集、测试集比例按8∶1∶1划分。

3.2 绝缘子定位评价指标

为了更加客观的评价定位模型的性能,采用普遍使用的平均精度值AP(average precision),平均精度均值mAP(mean AP)以及模型检测的平均检测速度对模型的检测性能进行评价。其正确率P、召回率R、平均精度AP、平均精度均值mAP定义为

式中:N代表集合中图像的总数;P(k)表示计算k张图像时对应的精度;R(k)表示计算k-1张图像和计算k张图像时召回率的变化值。

3.3 不同模块的消融实验

为证明ECA模块、BiFPN各模块有效性,用控制变量法设计4组消融实验,如表4所示,其中GFLOPs表示每秒10亿次的浮点运算数,mAP代表平均精度。

通过对比表4中A、B方案,可知在主干网络引入C3ECA注意力机制后,不僅避免了维度缩减,而且对提取输入特征图通道特征的能力也得到了加强,这样改进的同时,既不增加模型的复杂程度,也缩短了检测时间mAP增加2.21%;A、C方案对比可知,通过引入BiFPN特征金字塔网络,将特征复用变得更加绝对化,重复多次对特征层进行融合,丰富语义信息,引入该模块后mAP增加1.37%,检测速度也在加快。

3.4 不同模型的定位实验

为了验证该定位识别算法相对于其他算法的可靠性,使用上述1 400张训练集,对YOLOv5、Shufflenetv2、GhostNet以及本文算法进行对比,如表5所示。可以看出本文算法与其他几种检测模型相比,改进后mAP最高可达99.4%,在检测速度上,优于原有YOLOv5网络。由于加入了BiFPN模块,模型大小发生了相应的变化,在平均检测速度上略差于轻量级的Shufflenetv2和GhostNet,但由于模型精度的提升较大,而且对小目标的识别能力较好,本文改进的模型基本达到识别精度和速度的平衡。

综上所述,对改进模型与Shufflenetv2、GhostNet较轻量目标定位网络模型进行了比较,由于对绝缘子这样的小目标来说,轻量型的网络架构可以更快更准确的定位。将训练后的平均精度均值、损失曲线、模型精度曲线绘制如图8所示。其中,横坐标代表训练的轮数是300轮。从图8(a)中可知,训练至100轮之后,4种网络模型的mAP都逐渐趋于稳定。Shufflenetv2也很快趋向稳定,但准确度最高只有97%。GhostNet网络自身可以生成更多的特征映射,可以揭示图像内在特征背后的信息。通过本文改进的YOLOv5网络模型最先趋于稳定,且具有最高的准确精度。对于本文所训练的数据集,最高平均精度均值可达到99.4%。图8(b)为各模型的训练损失收敛情况,在前50轮时,YOLOv5收敛相对最快,但损失也较大,GhostNet比Shufflenet2更先趋于稳定,本文的方法在50轮左右时就已经趋于稳定,且具有最低的损失值。图8(c)为定位精度图,在检测精度上,原有的YOLOv5在前50轮训练中,由于存在对绝缘子特征提取的不完整,造成特征信息的缺失,以至于精度有所欠缺。相比之下,Shufflenetv2和GhostNet网络具有较轻的网络架构,在提取特征时利用自身ShuffleNe_Blk和GhostConv结构来对特征进行提取,也提高了检测精度的效果。本文的方法不仅让网络更加关注重要的层次,还减少了一些不必要层的结点连接,可以在开始训练时就很快提升精度,最终在100轮左右趋于稳定。

圖9是改进模型在测试集上的绝缘子检测部分结果和其他网络的对比图,通过观察和对比可知,YOLOv5的检测精度最高只有90%,对于边缘部分的检测,会造成细节的丢失,准确率只有85%;从图9(b)和图9(c)中可知,Shufflenetv2和GhostNet在检测速度上有着良好的优越性,但细节特征融合的把控还是有所欠缺;通过加入注意力机制提高了跨通道交互的覆盖率,通过跨尺度特征融合,使得特征复用更加的绝对化,使其达到一个相对较高的检测度。

4 结论

1) 利用CycleGAN风格迁移模型对绝缘子数据集进行扩充,提高图像质量并保证模型的有效训练。

2) 主干网络中引入ECA注意力机制,对骨干特征提取层进行优化处理,提高特征图的表达能力;颈部采用BiFPN跨尺度加权特征融合,增强对绝缘子识别能力;使用EIOU损失函数提升网络的收敛速度和回归精度,降低网络的漏检率。

3) 利用4C检测车采集的绝缘子图片对本文算法进行验证,仿真实验结果表明本文定位算法达到了99.4%的检测准确率,具有较好的高效性。

参考文献:

[1]    赵峰, 陈子文, 陈小强,等. 高速铁路牵引变电所健康状态评估[J]. 铁道科学与工程学报, 2019, 16(9): 2162-2167.

ZHAO F, CHEN Z W,CHEN X Q, et al. Assessment of health status of high speed railway traction substation[J].Journal of Railway Science and Engineering, 2019, 16(9): 2162-2167.

[2]    刘琛, 陈民武, 宋雅琳,等. 高速铁路接触网系统风险评估与维修计划优化[J]. 铁道科学与工程学报, 2017, 14(2):205-213.

LIU C, CHEN M W, SONG Y L, et al. Research on optimization of maintenance plan forhigh-speed railway catenary system based on risk assessment[J]. Journal of Railway Science and Engineering, 2017, 14(2): 205-213.

[3]    REN S, HE K, GIRSHICK R, et al. Faster R-CNN: Towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2017, 39(6): 1137-1149.

[4]    REDMON J, DIVVALA S, GIRSHICK R, et al.You only look once: Unified, real-time object detection[C]//Las Vegas: 2016 IEEE conference on Computer Vision & Pattern Recognition(CVPR), 2016.

[5]    HE K M, GKIOXARI G, DOLLAR P, et al. Mask R-CNN[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2020, 42(2): 386-397.

[6]    赵文清, 程幸福, 赵振兵, 等. 注意力机制和Faster R-CNN相结合的绝缘子识别[J]. 智能系统学报, 2020, 15(1): 92-98.

ZHAO W Q, CHENG X F, ZHAO Z B, et al. Insulator recognition based on attention mechanism and Faster R-CNN[J]. Journal of Intelligent Systems, 2020, 15(1): 92-98.

[7]    裴莹玲, 罗晖, 张诗慧, 等. 基于改进Faster R-CNN的高铁扣件检测算法[J]. 华东交通大学学报, 2023, 40(1): 75-81.

PEI Y L, LUO H, ZHANG S H, et al. High-speed Railway fastener detection algorithm based on improved Faster R-CNN[J]. Journal of East China Jiaotong University, 2023, 40(1):75-81.

[8]    冯小雨, 梅卫, 胡大帅. 基于改进Faster R-CNN的空中目标检测[J]. 光学学报, 2018, 38(6): 250-258.

FENG X Y, MEI W, HU D S. Aerial target detection based on improved Faster R-CNN[J]. Acta Optica Sinica, 2018, 38(6): 250-258.

[9]    卞建鹏, 薛秀茹, 崔跃华, 等. 基于EfficientDet与Vision Transformer的接触网吊弦故障检测[J]. 铁道科学与工程学报, 2023, 20(6): 2340-2349.

BIAN J P, XUE X R, CUI Y H, et al. Fault detection of catenary hanger based on EfficientDet and Vision Transformer[J]. Journal of Railway Science and Engineering, 2023, 20(6): 2340-2349.

[10]  任之俊, 蔺素珍, 李大威, 等. 基于改进特征金字塔的Mask R-CNN目标检测方法[J]. 激光与光电子学进展, 2019, 56(4): 174-179.

REN Z J, LIN S Z, LI D W, et al. Mask R-CNN object detection method based on improved feature pyramid[J]. Progress in Laser and Optoelectronics, 2019, 56(4): 174-179.

[11]  刘正庭, 尹骏刚, 李凯迪, 等. 基于分水岭算法的绝缘子串红外图像分割方法[J]. 电瓷避雷器, 2020, 294(2): 216-221.

LIU Z T, YIN J G, LI K D, et al. Infrared image segmentation of insulator strings based on watershed algorithm[J]. Electroporcelain Arrester, 2020, 294(2): 216-221.

[12]  潘翀, 沈鹏飞, 张忠, 等. 基于无人机巡检图像的绝缘子串实时定位研究[J]. 电瓷避雷器, 2020, 293(1): 234-240.

PAN C, SHEN P F, ZHANG Z, et al. Research on real-time positioning of insulator strings based on UAV inspection images[J]. Electroporcelain Arrester, 2020, 293(1): 234-240.

[13]  ZHU J Y, PARK T, ISOLA P, et al. Unpaired image-to-image translation using cycle-consistent adversarial networks[C]//Venice: Proceedings of the International Conference on Computer Vision, 2017.

[14]  HE K M, ZHANG X Y, REN S Q, et al. Spatial pyramid pooling in deep convolutional networks for visual recognition[J]. IEEE Trans Pattern Anal Mach Intell, 2015, 37(9):1904-1916.

[15]  TAN M X, PANG R M. Efficient det: Scalable and efficient object detection[C]//Seattle: 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR), 2020.

[16]  MA N N, ZHANG X Y, LIU M, et al. Activate or not: Learning customized activation[C]//Nashville: 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2021.

第一作者:劉仕兵(1970—),男,教授,硕士,硕士生导师,研究方向为电气化轨道交通接触网技术。E-mail:liucyier@163.com。

通信作者:周诗涵(1998—),女,硕士研究生,研究方向为接触网零部件检测。E-mail:keaiduo0805@163.com。

猜你喜欢

注意力机制绝缘子
面向短文本的网络舆情话题
基于自注意力与动态路由的文本建模方法
基于深度学习的问题回答技术研究
基于LSTM?Attention神经网络的文本特征提取方法
基于注意力机制的双向LSTM模型在中文商品评论情感分类中的研究
InsunKBQA:一个基于知识库的问答系统
1000kV特高压输电线路失效绝缘子判断的仿真计算
1000kV耐张绝缘子串单片绝缘子的带电更换技术
500kV绝缘子串含零值绝缘子时的电晕放电分析
绝缘子的常见故障及排除方法