基于改进YOLOv5的变电站表计缺陷检测算法
2024-02-29鲍文霞
鲍文霞,袁 牧,梁 栋,王 年,杜 翔
(1.安徽大学 电子信息工程学院,安徽 合肥 230601;2.安徽大学 互联网学院,安徽 合肥 230039)
电力系统主要包括输电线路、输电塔、绝缘子和变电站表计等,这些部件长期处于极端天气(太阳直射、强风、暴风雪、暴雨等)、高机械张力下,容易出现物理缺陷[1].变电站表计是电力系统重要的组成部分,用于监控电力设备使用情况.变电站表计外壳容易生锈,表盘也易模糊和炸裂.传统电力系统部件缺陷检测主要由经验丰富的检查员人工进行,耗时长、潜在危险大[2-3].随着智能电网的发展,基于计算机视觉技术逐渐应用于电力系统[4].基于计算机视觉的电力系统设备缺陷检测算法主要有以下3类:基于图像处理、机器学习、深度学习的算法.
基于图像处理的电力系统设备缺陷检测[5]是根据缺陷部位与背景信息的纹理或对比度的差异等进行的.文献[6]利用阈值对防振锤与背景进行分割,通过Hessian矩阵提高对轮廓曲率的控制能力,根据轮廓特征分段检测防振锤.文献[7]使用局部差分处理、边缘强度映射和图像融合等,增强防振锤图像;根据RAR(rusty area ratio)和CSI(color shade index)对防振锤锈蚀程度进行分类.文献[8]采用IULBP(improved uniform local binary patterns)对监控系统中的结冰绝缘子图像进行纹理特征提取,通过纹理直方图的相关系数识别不同结冰程度的绝缘子,取得了良好的识别效果.基于机器学习的电力系统设备缺陷检测[9]是通过提取缺陷特征、使用支持向量机(support vector machine,简称SVM)进行的.文献[10]利用哈尔特征和AdaBoost(adaptive boosting)级联分类器,根据颜色特征对绝缘子进行分割,通过像素分析实现了缺陷检测.文献[11]提出一种新的高压设备缺陷检测算法,利用Alex Net(Alex Krizhevsky networks)提取高压设备特征图,将特征图送入随机森林进行训练,该算法能判断高压设备是否存在缺陷,但当检测图像背景复杂时,难以达到预期精度.文献[12]提出一种基于HOG(histogram of oriented gradient)和SVM 的输电线路缺陷检测算法,HOG用于输电线路特征提取,SVM 用于判断输电线路是否存在缺陷,其平均精度可达84.3%,单幅图像的检测时间约为539 ms.基于深度学习的电力系统设备缺陷检测算法[13],使用具备学习能力的卷积神经网络(convolutional neural networks,简称CNN)从图像中自主提取部件缺陷特征,有效补偿人工提取特征产生的信息损失,提高了缺陷检测的效率.文献[14]提出一种改进的Faster R-CNN(faster region-CNN),用于检测无人机拍摄的输电线路中的绝缘子、防震锤和鸟巢,检测单幅图像的时间约为676 ms.文献[15]提出一种基于改进RetinaNet(retina networks)的输电线路缺陷检测算法,该算法有较好的实时性,但精度不高.文献[16]提出一种基于YOLO(you only look once)和SPP-Net(spatial pyramid pooling-networks)的绝缘子缺陷检测算法,根据定位框进行裁剪,将裁剪后的图像送入SPP-Net网络进行缺陷检测,检测精度可达89%.文献[17]提出一种基于生成对抗网络的缺陷智能检测算法,通过生成器和鉴别器间的相互博弈增强图片质量,能智能识别提取准确特征,提高了检测精度.为了解决变电站表计缺陷图像背景复杂、目标尺寸不一、外形差别大等问题,该文提出一种基于改进YOLOv5(you only look once的第5个版本)[18]的变电站表计缺陷检测算法,通过对比实验证明该文算法的优越性.
1 改进的YOLOv5
YOLOv5是在YOLOv4(you only look once的第4个版本)[19]的基础上进行改进的,检测精度和速度显著提高.由于变电站表计缺陷图像背景复杂、目标尺寸不一、外形差别大,且受拍摄角度和光照强度影响较大,因此该文对YOLOv5进行改进,然后将其用于表计缺陷检测.
1.1 改进YOLOv5s的网络结构
该文改进YOLOv5s的网络结构如图1所示,包括特征提取的主干部分、特征融合的颈部和预测部分.为了在复杂背景下提取表计缺陷特征,该文在主干部分添加坐标注意力(coordinate attention,简称CA)[20].CA的加入可提升对缺陷特征聚焦的能力,减小无用背景信息的权重输入.在颈部,FPN(feature pyramid networks)利用上采样融合不同层的语义信息,PAN(path aggregation network)拼接底层语义信息和高层语义信息,解决了多尺度问题.预测部分可输出80×80×255,40×40×255,20×20×255大小的特征图.YOLOYv5将CIOU loos(complete intersection over union loss)[21]作为边界损失函数,但CIOU loss具有模糊性,为此该文将EDIOU loss(effective distance intersection over union loss))代替CIOU loss,以提高检测准确度.
图1 改进YOLOv5的网络结构
1.2 CA机制
为了提取复杂背景下表计缺陷的关键信息并抑制其他无用信息,该文引入一种轻量型的CA 机制,该模块的结构如图2所示.
图2 CA模块的结构
沿水平、竖直方向分别使用大小为(H,1),(1,W)的卷积核,对输入特征图进行平均池化.高度为h的第c个通道、宽度为w的第c个通道的输出分别为
对式(1)~(2)进行相关变换后可获得全局感受野和精确位置信息.对进行concatenate及相关操作后,得到输出
其中:[·,·]表示concatenate操作,F1为变换函数,δ为非线性激活函数H-Swish.
将f分解为2个独立fh和fw.利用卷积运算Fh,Fw分别将fh和fw变换为gh和gw,其表达式为
其中:σ为激活函数sigmoid.将gh和gw与输入特征图进行加权计算后,最终得到CA.
1.3 EDIOU loss
IOU loss(intersection over union loss)[22]的表达式为
其中:b表示预测框,bgt表示真实框.
白化病患者由于外表的异常,内心的自卑感使其长期处于孤立、封闭的环境,进而影响工作、学习及社交活动。 且目前白化病尚无有效的治疗手段,临床诊断因部分白化病表型存在交叉、重叠,也无法做出分型,因此明确致病基因、指导产前诊断是目前预防此类患儿出生唯一有效途径。然而白化病相关基因及编码区众多,传统的测序方法效率低下,应用于临床诊断费时费力,难以常规开展,二代测序技术因其检测覆盖范围广、高效,随着生物信息学分析能力的提高以及测序成本的下降,这一技术为白化病等具有高度遗传异质性的单基因病的快速检测提供了可能。
为了使边界框回归更加快速准确,该文在DIOU loss(distance intersection over union loss)[23]的基础上添加宽高损失,得到EDIOU loss(effective distance intersection over union loss),其表达式为
其中:w,wgt分别表示预测框、真实框中心的横坐标;h,hgt分别表示预测框、真实框中心的纵坐标;cw,ch分别表示连接二者(预测框和真实框)的最小外接矩形的宽、高;ρ(·,·)表示两点间的欧几里得距离.
2 基于改进YOLOv5的变电站表计缺陷检测算法
该文提出基于改进YOLOv5的变电站表计缺陷检测算法.图3为该文算法的缺陷检测流程.
图3 该文算法的缺陷检测流程
具体的缺陷检测步骤为:
(1)根据人工巡检过程中获取的图像,构建变电站表计缺陷数据集.
(2)按8∶2的比例将数据集随机划分为训练集和测试集,对训练集中的外壳破损图像进行增广.
(3)将原始图像和标签文件输入模型,通过模型预测图像的预测框,计算损失值,并利用损失值优化权重参数.
(4)通过测试集检验模型训练效果,保存准确度最高的预训练权重.
(5)使用测试集测试模型性能,给出检测结果.
3 数据采集与处理
变电站表计常见的缺陷有:表盘模糊、表盘破损及外壳破损.图4为表计缺陷数据集中的部分图像.
图4 表计缺陷数据集中的部分图像
为了提升泛化能力、避免过拟合、解决训练集中外壳破损样本数量较少的问题,该文通过对比度增强和旋转,扩充训练集中外壳破损的图像.
在专业人员指导下使用LabelImg软件对数据进行人工标注.若表盘模糊,则将其标注为“bj_bpmu”;若表盘破损,则将其标注为“bj_bpps”;若外壳破损,则将其标注为“bj_wkps”.将标注的数据严格按照公开数据集Pascal VOC格式进行制作,文件为xml格式.该文通过日常人工巡检图像,构建了表计缺陷数据集,共计1 843幅图像,其中表盘模糊图像786幅、表盘破损图像682幅、外壳破损图像375幅.将图像按8∶2的比例随机分为训练集和测试集.
4 实 验
4.1 实验环境及参数
操作系统为Ubuntu18.04 LTS 64,显卡型号为NVIDIA GTX 2080Ti.编程语言为Python3.7,深度学习框架为Pytorch1.5.图片输入尺寸为640×640×3,初始学习率为0.01,总训练次数为150次,训练和测试的Batch size均为16.
4.2 性能评价指标
准确率、召回率的表达式分别为
其中:TP表示预测为正类实际为正类的样本数,FP表示预测为正类实际为负类的样本数,FN 表示预测为负类实际为正类的样本数.
AP(average precision)为准确率P的平均值.平均准确率均值(mean average precision,简称m AP)的表达式为
其中:N表示检测的类别数.
4.3 实验结果分析
为了证明该文提出的基于改进YOLOv5 的变电站表计缺陷检测算法的优越性,将该文改进YOLOv5算法实验结果与5个主流目标检测算法(SSD(single shot multibox detector)[24],Faster RCNN[25],YOLOv3(you only look once的第3个版本)[26],YOLOv4)实验结果进行对比,如表1所示.由表1可知,6种算法中,该文算法的准确度、召回率和m AP均最高,分别达85.1%,86.6%,87.3%.因此,该文算法更适合复杂环境下的变电站表计缺陷检测.
表1 该文改进YOLOv5算法实验结果与5种主流算法实验结果的对比 %
5 结束语
为了解决变电站智能巡检中表计缺陷图像背景复杂、目标尺寸不一、外形差别大的问题,该文通过CA和EDIOU loss对YOLOv5进行改进,提出了基于改进YOLOv5的变电站表计缺陷检测算法.通过人工巡检图像构建变电站表计缺陷数据集.为了提升泛化能力、避免过拟合、解决训练集中外壳破损样本数量较少的问题,该文通过对比度增强和旋转,扩充训练集中外壳破损的图像.为了提取复杂背景下表计缺陷的关键信息并抑制其他无用信息,该文引入一种轻量型的CA机制.为了使边界框回归更快速准确,将EDIOU loss代替CIOU loss,以提高检测精度.实验结果表明:该文算法在变电站表计缺陷图像检测中的m AP可达87.3%,相对于原始的YOLOv5提高了2.4%.