基于改进YOLOv8s的配电设备红外目标检测模型
2024-04-10吴合风王国伟万造君姜世浩
吴合风 王国伟 万造君 张 阔 姜世浩
基于改进YOLOv8s的配电设备红外目标检测模型
吴合风 王国伟 万造君 张 阔 姜世浩
(北京御航智能科技有限公司,北京 100080)
随着电力巡检技术的发展,利用无人机和红外热成像技术进行巡检逐渐成为电力巡检作业的一个重要模式。针对当前网络模型对配电设备识别准确度低、模型参数量大难以部署的问题,提出一种基于红外图像的配电设备目标检测方法。首先,针对原YOLOv8s模型参数量大、模型复杂的问题,提出在骨干网络和Neck部分将部分传统Conv卷积替换为GhostConv卷积,实现模型轻量化;然后,针对原YOLOv8s模型小目标识别能力差的问题,提出增加小目标检测层,提升小目标检测能力;最后,针对原YOLOv8s模型损失函数不利于普通质量样本预测回归的问题,提出使用Wise-IoUv3损失函数,聚焦训练过程中难以拟合的锚框的预测回归。研究结果表明,改进后模型的精确率达到87%,比原模型提升了4.1个百分点;召回率达到79.1%,比原模型提升了3个百分点;平均精确率均值达到83.5%,比原模型提升了1.5个百分点;推理速度为62ms/张,可有效应用于配电设备的部件检测。
配电部件检测;YOLOv8s;红外图像;小目标检测层;GhostConv卷积;Wise-IoUv3
0 引言
配电网作为供电系统的主要组成部分,与人们的生产生活密切相关[1-2],配电网的安全、稳定运行对保证电网的可靠性至关重要。考虑到配电网发生故障的主要原因是繁杂的外部环境,因此有必要依据外部环境状况对配电设备运行状态进行实时监测,尽可能避免电网事故发生[3]。随着科学技术的进步,无人机技术和红外热成像技术的发展为构建人工协同、高效安全的巡检新模式提供了技术支撑。通过在无人机上搭载红外热成像设备,不仅能实现对较长线路的大范围快速信息搜寻,还能以一种非接触的检测方式来获取配电设备的热状态信息[4-5],从而实现对配电系统中潜在故障、问题和异常的检测,使电力设备的状态检测能在不断电的情况下进行。这一巡检方式在很大程度上提高了配电设备巡检的可行性和效率,因此被广泛应用于电力设备的带电检测中。
近年来,基于深度学习的目标检测算法已成为电力设备视觉检测的研究热点[6]。目前,比较常用的目标检测算法分为两大类:一阶段目标检测算法和二阶段目标检测算法。一阶段目标检测算法直接对整张图片进行分类和定位,常见的算法有YOLO(you only look once)、单步多框目标检测(single short multibox detector, SSD)、RetinaNet等[7-11]。二阶段目标检测算法首先生成区域建议,再通过卷积神经网络进行特征分类和位置回归。常见的二阶段目标检测算法有区域卷积神经网络(region with convolutional neural network feature, R-CNN)、空间金字塔池化网络(spatial pyramid pooling networks, SPP-Net)、Fast R-CNN、基于区域的全卷积神经网络(region-based fully convolutional network, R-FCN)、Faster R-CNN等[12-14]。由于二阶段目标检测算法检测速度较慢,无法满足日常生活中实时性的要求,所以选择精确度更高、速度更快的YOLOv8s网络,对红外图像中的配电部件进行检测。
在配电设备部件检测方面,YOLOv8s基础网络仍面临以下挑战:
1)由于无人机巡检设备简单、边缘计算平台功耗低、计算资源有限,基于深度学习的红外目标检测模型在部署时面临网络参数量过大、模型复杂的问题,能够在PC端部署的算法模型无法部署到无人机上。
2)无人机拍摄的配电设备红外目标数据集中、小目标数量多,缺乏明显的纹理和几何特征。由于YOLOv8s下采样倍数较大,深层特征图难以学习到小目标的相关信息,从而降低了对小目标的检测准确率。
3)由于配电设备红外目标数据集中的图片包含多个检测目标,数据在人工标注过程中可能会产生一些标注错误的低质量样本、加入背景等不相关的特征信息,影响模型检测精度。YOLOv8s采用CIoU损失函数,致力于强化边界框损失的拟合能力,但当训练集中有标注错误的样本时,强化边界框对这些样本的回归会使模型检测性能降低。
为解决以上问题,本文提出一种基于改进YOLOv8s的配电设备红外目标检测模型,以提升模型的精确率、召回率等,实现对配电部件的准确识别。
1 基于改进YOLOv8s的红外目标检测模型
1.1 YOLOv8s模型概述
YOLOv8s是一种目标检测模型,它是YOLO系列模型的最新版本,建立在原有YOLO版本的基础上,引入了新的功能和改进,提升了原模型的性能和灵活性。
YOLOv8s模型检测网络主要由三部分组成:Backbone、Neck、Head。模型对输入图像的处理分为特征提取和目标检测两部分。特征提取部分采用CSPDarknet(cross stage partial darknet)的网络结构,将网络分为两个部分,每个部分都包含多个残差块。相较于前代模型YOLOv5,使用C2f模块替换C3模块。C2f模块将输入的特征图分成两个分支,每个分支分别经过一个卷积层进行降维,同时C2f模块将Bottleneck层替换为v8_C2fBottleneck层,每个v8_C2fBottleneck层的输出也被作为一个分支。这些分支堆叠起来,形成更高维度的特征图,并通过一个卷积层进行融合,使模型获得更多的梯度流信息。YOLOv8s还使用一个更强大的特征金字塔网络,即快速空间金字塔池化(space pyramid pooling fast, SPPF)结构,用于提取不同尺度的特征,可有效减少模型的参数量和计算量,同时提高特征提取的效率。目标检测部分采用特征金字塔网络(feature pyramid network, FPN)-路径聚合网络(path aggregation network, PAN)结构,该结构包含多个卷积层和池化层,用于处理和压缩特征图。通过多个卷积层和全连接层,将特征图转换为目标检测结果。YOLOv8s采用一种基于无锚框(Anchor-Free)的检测方式,直接预测目标的中心点和宽高比例,这种方式可减少Anchor框的数量,提高检测速度和准确度。
总之,YOLOv8s采用一种高效的特征提取和目标检测方式,具有更高的检测准确度和更快的检测速度。
1.2 改进YOLOv8s模型
针对红外数据集检测问题,本文在YOLOv8s模型基础上提出一种新的配电设备红外目标检测模型,该改进模型的网络结构如图1所示,主要由三部分组成:Backbone、Neck、Head。Backbone是主干特征提取网络,由Conv、C2f、GhostConv、SPPF模块组成,这些模块通常具有不同的滤波器尺寸和步长,以捕获不同层次的视觉特征。Neck是特征融合网络,将主干网络提取的四个不同尺度的有效特征层进行特征融合。Head是预测网络,主要获取目标物体的类别和位置信息。本文算法模型与原模型相比主要有三部分改进:①为了解决后续可能遇到的模型部署问题,本文采用GhostConv卷积来减少模型参数量,降低计算复杂度;②由于图像中小目标居多,为确保模型算法可以检测小目标,提出增加额外的小目标检测层来提升小目标识别能力; ③为防止低质量样本产生较大的有害梯度、影响模型检测性能,提出Wise-IoUv3损失函数。
图1 改进模型网络结构
1)GhostConv卷积
GhostConv[15]卷积是一种轻量化卷积模块,可代替普通卷积,是一种用于模型压缩的卷积操作。它通过使用更少的参数和计算来提取特征,降低模型的复杂性和训练难度。GhostConv卷积的结构如图2所示,为了减少计算量,GhostConv中的卷积操作分为两步进行,首先通过传统的Conv卷积生成channel较小的特征图,然后在得到的特征图的基础上进行Cheap operation操作,生成新的冗余特征图,最后将channel较小的特征图和新的冗余特征图进行Concat拼接操作,形成完整的特征图,最终得到输出特征。这种方法可有效减少模型所需计算资源,同时设计简单、易于实现。
图2 GhostConv卷积结构
2)小目标检测层
为了解决小目标样本尺寸较小、YOLOv8s下采样倍数较大、较深的特征图难以充分捕捉小目标特征信息等问题,本文提出加入额外的小目标检测层,使YOLOv8s模型更加注意小目标的特征信息,从而提升YOLOv8s检测准确度。
YOLOv8s原始模型的输入图像大小为640×640像素,在三个不同尺度的特征图上做检测,并为每个尺度的特征图设置三种不同规格的先验框。在YOLOv8s中,用于目标检测的特征图能感知到原图的最小范围是8×8像素的区域,所以原始模型能检测的最小目标为8×8像素。当原始图像中的目标宽、高都小于8像素时,原网络就很难识别网格内的目标特征信息,因此在原网络的基础上增加160×160像素尺度的小目标检测层,用于检测宽、高在4~8像素的小目标。
增加的小目标检测层如图3所示,首先将Backbone中的第五层C2f层与Neck中的Upsample层进行Concat操作,之后通过C2f和Upsample层的处理,得到包含小目标特征信息的深层语义特征层,该层继续与Backbone中第三层的C2f层进行Concat操作,补充完善160×160像素尺度融合特征层对小目标语义特征及位置信息的表达能力,最后经过C2f送至Head中的一个额外的解耦头[16]。这一解耦头分辨率更高,用于检测更小的物体。
图3 小目标检测层
小目标检测层的引入使小目标的特征信息可以传递到其他三个尺度特征层,从而加强了网络对小目标信息的特征融合能力,使网络可以有效识别出配电设备中的细小部件,提升小目标检测准确度。
3)损失函数Wise-IoUv3
Wise-IoUv3是一种用于评估边界框回归损失的方法[17]。它通过动态非单调的聚焦机制,使用离群度来评估锚框的质量,其定义为
综上所述,Wise-IoUv3损失定义为
式中:Wise-IoU为距离度量;IoU为IoU损失函数值。
Wise-IoUv3损失函数的引入,使模型聚焦于预测框和真实框难以拟合及真实框置信度低的样本的预测回归,减少了这些样本产生的有害梯度,提高了目标检测的灵活性和鲁棒性,以及模型的整体性能。
2 实验结果与分析
2.1 实验平台和训练参数
实验环境配置见表1。在使用YOLOv8s模型和改进模型对配电设备进行检测的过程中,图片输入尺寸为640×640像素,初始学习率为0.01,每次训练迭代300次,采用随机梯度下降(stochastic gradient descend, SGD)法更新网络参数,学习动量设置为0.937,权重衰减设置为0.000 5。
表1 实验环境配置
2.2 数据集
本文采用的数据集由某电网公司使用无人机对带电设备拍摄所得,共计3 086张红外图像,本文实验将其中2 160张图像作为训练集,308张图像作为验证集,618张图像作为测试集。图片中共包含五类部件,分别为jyzx、jyz、jyzt、xjt、bgxj。利用LabelImg图像标注工具对这五类部件进行标注。
2.3 模型评价指标
本文实验使用精确率recision、召回率ecall、平均精确率均值(mean average precision, mAPAP,以及1分数对模型进行评估。
精确率又叫查准率,计算公式为
式中:P为图片中正确预测部件的数量;P为图片中错误预测部件的数量。
召回率又叫查全率,计算公式为
式中,N为图片中漏检的数量。
平均精确率(average precision, AP)P是通过精确率-召回率曲线进行积分得到的,而平均精确率均值AP是对所有类别的平均精确率取平均得到的。平均精确率均值越高,代表算法的性能越好,计算公式为
式中:为待检测目标的分类数量;P()为第个分类的平均精确率。
1分数指标兼顾分类模型的精确率和召回率,是两者的加权平均,其取值范围为[0, 1],其值越大表示模型越好。1分数的计算公式为
2.4 对比实验结果
为验证改进算法对红外数据集目标检测的优越性,与原始YOLOv8s对比,以精确率recision、召回率ecall、平均精确率均值AP、1分数作为评价指标,在同一平台进行训练,并采用相同的训练集、验证集和测试集。对比实验结果见表2,其中,AP@50为IoU阈值为0.5时的平均精确率均值,AP@50-95为IoU阈值为0.5~0.95时的平均精确率均值。
表2 对比实验结果
由表2可知,与原模型相比,改进模型的精确率、召回率、平均精确率均值及1分数均有所提升,改进模型的精确率提升了4.1个百分点,召回率提升了3个百分点,平均精确率均值提升了1.5个百分点,1分数提升了3.51。为直观地展示本文改进模型的效果,使用部分红外数据集对原模型和改进模型的效果进行对比。YOLOv8s和改进YOLOv8s效果对比如图4、图5所示,在检测结果中,所有的检出目标都用边框标记其位置,并显示该目标的所属类别和置信度值。
根据图4可知,改进模型未漏检jyzx部件(图4(b)中画框部分),证明本文算法模型可以检测出原YOLOv8s算法模型漏检的目标,可在一定程度上缓解原算法模型定位不准确和目标特征表达不充分的问题。根据图5可知,原模型检测jyz和jyzt部件的置信度分别为0.3、0.4,而改进模型检测jyz和jyzt部件的置信度分别为0.8、0.8(图5中画框部分),证明本文算法模型具有更高的识别准确度,能够正确识别出红外图像中的小目标,可以有效提高对较小配电部件的识别能力。
图4 YOLOv8s和改进YOLOv8s效果对比1
图5 YOLOv8s和改进YOLOv8s效果对比2
2.5 消融实验结果
为了验证对YOLOv8s模型引入GhostConv、小目标检测层、损失函数Wise-IoUv3的有效性,本文利用相同数据集对YOLOv8s模型设计消融实验来验证每部分改进方法的效果。消融实验结果见表3。
表3 消融实验结果
加入小目标检测层后,模型的精确率较YOLOv8s有所提升,参数量降低,但召回率、平均精确率均值和1分数有所下降;在此基础上加入GhostConv卷积,与YOLOv8s+小目标检测层相比,模型的精确率、召回率、平均精确率均值和1分数分别提高了3.4个百分点、0.5个百分点、1.2个百分点、1.69,参数量降低了0.5×106,但与YOLOv8s相比,模型的精确率和1分数均有所提高,召回率降低;加入Wise-IoUv3后得到最终模型,与YOLOv8s+小目标检测层+GhostConv相比,模型的精确率降低了2.5个百分点,召回率提高了6.2个百分点,平均精确率均值提高了1.5个百分点,1分数提高了2.51。与原YOLOv8s相比,最终改进模型的精确率增长了4.1个百分点,召回率增长了3个百分点,平均精确率均值增长了1.5个百分点,1分数增长了3.51,该结果验证了本文改进模型的有效性。
3 结论
本文提出了一种基于改进YOLOv8s的配电设备红外目标检测模型。在YOLOv8s的基础上,引入GhostConv卷积,降低模型参数量,实现了模型轻量化;添加额外的小目标检测层,提升了对小目标的检测能力;使用Wise-IoUv3损失函数,防止低质量样本产生较大的有害梯度,影响模型检测性能。改进后网络模型的精确率、召回率、平均精确率均值和1分数比原始网络模型分别增长了4.1个百分点、3个百分点、1.5个百分点、3.51,并且网络的参数量相较于原始模型降低了0.8×106,有效提升了算法模型的检测准确度和速度,兼顾了模型部署的要求,具有一定的泛化能力。在未来的工作中,将继续对模型进行改进优化,并在实际应用中进行算法完善。
[1] 夏得青, 向星宇, 李宽龙, 等. 农村配电网低电压治理研究进展[J]. 电气技术, 2023, 24(6): 1-5.
[2] 林华梁, 彭松. 配电终端绝缘性能自动测试系统的研究与应用[J]. 电气技术, 2023, 24(5): 65-70.
[3] 董章, 李思尧, 陈雅旎, 等. 计及罕见变量的配电电缆线路故障风险预警方法[J]. 电气技术, 2023, 24(5): 35-40.
[4] 杨帆, 王梦珺, 谭天, 等. 基于目标像素宽度识别的电力设备红外成像单目测距改进算法[J]. 电工技术学报, 2023, 38(8): 2244-2254.
[5] 郑含博, 李金恒, 刘洋, 等. 基于改进YOLOv3的电力设备红外目标检测模型[J]. 电工技术学报, 2021, 36(7): 1389-1398.
[6] 俞峰. 基于深度学习的配电设备视觉识别技术研究[D]. 杭州: 浙江大学, 2021.
[7] 陈明, 赵连飞, 苑立民, 等. 基于特征选择YOLOv3网络的红外图像绝缘子检测方法[J]. 红外与激光工程, 2020, 49(增刊2): 262-267.
[8] 杨波, 曹雪虹, 焦良葆, 等. 改进实时目标检测算法的电力巡检鸟巢检测[J]. 电气技术, 2020, 21(5): 21- 27, 32.
[9] 马丽萍, 贠鑫, 马文哲, 等. 基于改进YOLOv3模型的道路车辆多目标检测方法[J]. 西安工程大学学报, 2021, 35(5): 64-73.
[10] 李烨, 顾晨峰. 基于注意力机制的多尺度小目标交通标志检测[J]. 小型微型计算机系统, 2022, 43(2): 381-386.
[11] 李瑞生, 张彦龙, 翟登辉, 等. 基于改进SSD的输电线路销钉缺陷检测[J]. 高电压技术, 2021, 47(11): 3795-3802.
[12] 单亚锋, 赵天宇, 付昱, 等. 基于4层 R-CNN的输电线路多目标检测[J]. 辽宁工程技术大学学报(自然科学版), 2022, 41(3): 270-276.
[13] 阮顺领, 阮炎康, 卢才武, 等. 基于红外图像的矿石传送带托辊异常检测[J]. 黄金科学技术, 2023, 31(1): 123-132.
[14] 臧国强, 刘晓莉, 徐颖菲, 等. 深度学习在电力设备缺陷识别中的应用进展[J]. 电气技术, 2022, 23(6): 1-7.
[15] 徐正军, 张强, 许亮. 一种基于改进YOLOv5s-Ghost网络的交通标志识别方法[J]. 光电子·激光, 2023, 34(1): 52- 61.
[16] 熊恩杰, 张荣芬, 刘宇红, 等. 面向交通标志的Ghost-YOLOv8检测算法[J]. 计算机工程与应用, 2023, 59(20): 200-207.
[17] 黄子杰, 欧阳, 江德港, 等. 面向牵引座焊缝表面质量检测的轻量型深度学习算法[J]. 计算机应用, 2024, 44(3): 983-988.
Infrared target detection model for distribution equipment based on improved YOLOv8s
WU Hefeng WANG Guowei WAN Zaojun ZHANG Kuo JIANG Shihao
(Beijing Yuhang Intelligent Technology Co., Ltd, Beijing 100080)
With the development of power inspection technology, using drones and infrared thermal imaging technology for inspection has become an important mode of power inspection operations. A target detection method for distribution equipment based on infrared images is proposed to address the issues of low recognition accuracy and difficulty in deploying large model parameters in current network models. Firstly, to address the problem of large parameter count and complex model in the original YOLOv8s model, it is proposed to replace some traditional Conv convolutions with GhostConv convolutions in the backbone network and Neck section to achieve model lightweight. Aiming at the problem of poor small target recognition ability in the original YOLOv8s model, it is proposed to add a small target detection layer to improve the detection ability of small targets. Finally, in response to the problem that the original YOLOv8s model loss function is not conducive to the prediction and regression of ordinary quality samples, a Wise-IoUv3 loss function is used to focus on the prediction and regression of anchor boxes that are difficult to fit during the training process. The research results show that the improved model has an accuracy of 87% which is 4.1% higher than that of the original model, a recall rate of 79.1% which is 3% higher than that of the original model, and a mean average precision (mAP) of 83.5% which is 1.5% higher than that of the original model. The inference speed is 62 ms/sheet. It can be effectively used for component detection in distribution equipment.
power distribution component inspection; YOLOv8s; infrared images; small target detection layer; GhostConv convolution; Wise-IoUv3
2023-11-17
2023-12-05
吴合风(1993—),男,山东省菏泽市单县人,本科,主要从事计算机视觉和深度学习方面的研究工作。