基于改进YOLOV4-tiny的电力设备红外识别研究
2024-03-04刘冲冲张力平任锦飞陈群元
刘冲冲,张力平,,任锦飞,陈群元
(1.长安大学 工程机械学院,陕西 西安 710064;2.长安大学公路养护装备国家工程实验室,陕西 西安 710068)
0 引言
随着红外技术和电力设备的不断发展,红外检测技术已经在电力设备故障诊断领域得到了普遍的应用,是用来检测电力设备故障的重要手段之一[1]。红外检测技术是一种根据物体发热情况,检测是否发生过热(故障)现象的诊断技术。在进行电力设备故障检测时,具有不需要将检测设备与电力设备直接接触、降低了安全事故发生概率和电力设备带电工作、效率高等优势。在进行故障诊断过程中,对于不同类别电力设备进行精确的定位与识别,是进行设备是否发生故障和进行报警提示的关键[2]。虽然红外检测技术具有一定优势,但是对于电力设备种类精确的定位与识别,还是需要依靠人工来完成,这对技术人员的专业性和经验性要求极高,目前该方面的技术人员储备较少。因此,对于红外图像数据进行检测后,自动进行电力设备种类的定位与识别成为电力设备故障红外诊断研究的重点[3]。
随着深度学习的发展,该领域的研究人员不断尝试将深度学习的目标检测模型应用到电力设备故障红外诊断领域中[4-6]。当下比较流行的深度学习的目标检测算法主要有Two-stage(分两步进行工作)检测算法和One-stage(分一步进行工作)检测算法。由于流程的不同,使得这两种检测算法各有各的优点,各有各的缺点。就检测精度而言,Two-stage优于One-stage;就检测速度来说,One-stage比Two-stage更快。Two-stage中比较经典的为Faster R-CNN;One-stage中比较具有代表性的有YOLOv3、SSD等[7]。文献[8]利用Two-stage型目标检测对电力设备红外图像识别与定位,实现了7种电力设备的精准定位和精准识别,但是所消耗的时间较长,不满足实时性要求。文献[9]采用改进后One-stage型目标检测算法对5种复杂背景下电力设备的红外识别,识别速度较快,但是识别精度没有太多提升,与改进前精度几乎相近。
本文在YOLOv4-tiny的基础上,为了解决在电力设备密集、工作环境复杂不便识别等问题:将水平矩形框变旋转矩形框机制;用激活函数变Mish代替LeakyReLU,使得梯度在变化过程中平滑度得到提升,防止在小于零的区间范围时出现梯度消失的现象;在特征提取部分,采用新的网络进行特征提取,即使用双重网络提取特征并进行融合,充分利用多层特征图的不同信息。最后,由实验得到的数据证明了新网络具有一定的实用价值。
1 YOLOv4-tiny目标检测模型
YOLOv4-tiny属于One-stage方法,是一个深度复杂的目标检测。YOLOv4-tiny模型是YOLOv4的简化版,其网络参数量为600万,只有YOLOv4的十分之一,使得检测速度大大提高。YOLOv4-tiny网络总体上可分为三个部分,第一部分主干特征提取网络CSP Darknet53-tiny(简化CSP Darknet53):该部分与YOLOv4的相似,都是在原始的Darknet53结构上加入CSPnet结构,不同的是YOLOv4-tiny该部分的残差网络不在进行堆叠;第二部分加强特征提取网络:该部分采用的是FPN结构,相比于YOLOv4的加强提取网络SPP+PANet结构,YOLOv4-tiny的加强提取网络更轻量化;第三部分Yolov Head:该部分对提取到的特征进行卷积和预测操作。YOLOv4-tiny结构框图如图1所示,当图片输入后,在主干特征提取网络中首先进行卷积和激活函数操作;然后进行残差操作;之后进行卷积+激活函数操作,最终得到两个有效特征层即26×26×256特征层和13×13×512特征层;将得到的有效特征层送入加强特征提取网络,进行一系列卷积和上采样操作,最终得到两个带有更多可靠信息的有效特征层;最后把带有可靠信息的特征层送入Yolov Head进行预测。
图1 YOLOv4-tiny的结构框图
表1展示了YOLOv4-tiny和YOLOv4在同一数据集下进行工作的性能对比。从多组数据分析中可以看出,YOLOv4-tiny的模型为YOLOv4的十分之一左右,但是识别速度却快了至少七倍。因此,YOLOv4-tiny模型更适合电力设备红外过热故障诊断过程中的设备种类识别,实现实时的电力设备种类检测,为过热故障识别做好准备。
表1 YOLOv4-tiny与YOLOv4性能对比
YOLOy4-tiny结构简单使其检测速度快,能够适应电力设备红外故障检测实时性要求,但也带来了特征融合不充分、利用率低以及显著性不突出等缺点,大大降低了检测精度,影响电力设备红外故障诊断的结果。
2 改进YOLOV4-tiny电力设备目标识别模型
YOLOv4-tiny结构精简、检测速度快,但检测精度不高,无法对复杂场景中的电力设备目标进行精确检测。针对电力设备红外诊断的需求,以原始YOLOv4-tiny为基础对其进行改进:①引入旋转框机制代替矩形框机制,实现复杂场景下的电气设备精准定位;②在特征提取网络引入 Mish 激活函数,使梯度在变化过程中平滑度得到提升,防止在小于零的区间范围时梯度消散;③使用两层网络(FPN+PAN)对主干部分获得的特征层进行特征提取并进行融合,使多层特征图的不同信息被充分利用。
2.1 旋转矩形框机制
在YOLOV4-tiny网络中,采用的是矩形框机制,为了提高其在电力设备故障诊断领域的检测精度,在原本的检测网络中将需要的旋转框机制进入,实现在电力设备过大、相互重叠和背景复杂场景下的电力设备红外目标精细化定位,以达到提高检测精度的效果。
用来替换矩形框的旋转矩形框如图2所示,对于图中每个旋转矩形框的两条相邻的边进行定义,分别定义为边m与边n:边m指与坐标x轴正方向成角大于零度小于90度的边,同时将成角定义为角度θ,并规定其取值范围为[-π/2,0),图中-30度和-60度指的就是角度θ;与边m相邻的边就是边n。通过位置向量(x,y,m,n,θ)表示出旋转矩形框的位置,旋转矩形框位置的确定主要依靠中心点与其高度宽度,其中中心点用x、y表示,框的宽度和高度用w、h来表示。
图2 旋转矩形框示意图
旋转框与水平框定位效果对比如图3所示,通过对比可以发现,旋转矩形框将之前框选到的其他设备去除,这有利于检测精度的提高。
图3 旋转框与水平框定位效果对比图
2.2 激活函数
YOLOv4-tiny使用LeakyReLU作为激活函数(图4),其表达式为:
图4 LeakyReLU函数
LeakyReLU函数在小于零的区间范围内梯度容易消失的,因而导致梯度更新过程的中断,模型的神经元部分出现神经元死亡现象,针对这一不足之处,可以采用Mish函数(图5)来替换,其表达式为:
图5 Mish函数
图6 FPN+PAN结构
Mish=x*tanh(ln(1+ex))
之所以采用Mish函数来进行替换,是因为Mish函数在小于零的区间范围内梯度的更新并非完全被中断,Mish函数允许部分小于零的梯度存在,保证了网络梯度流的稳定,在进行训练的过程中,相比较于LeakyReLU函数,提高了梯度下降的效果。Mish函数替代LeakyReLU函数这一举措可以提高测试的准确率和训练的稳定性。
2.3 FPN+PAN结构
在进行预测工作之前,还需要对特征层进一步优化,在原始的YOLOv4-tiny中,使用FPN结构对前一阶段获得的特征层进行进一步的特征提取,经过FPN模块的处理后深、浅层特征层叠加合并在一起,使得浅层特征层可以传递深层特征的目的,但这个过程中存在目标位置信息未传递到深层特征层的问题,这个问题将会严重影响后期诊断的质量。为了解决这个问题,提出了将PAN结构后添加到FPN,PAN结构信息提取的过程弥补了FPN的不足。FPN结构与PAN结构的合理配合,解决了无法表达多个特征这一不足之处,有利于复杂环境下对电气设备红外图像的充分利用。
3 实验结果与分析
3.1 实验环境与平台
实验平台的搭建包括计算机硬件、计算机软件及环境,具体配置如表2和表3所示。
表2 计算机硬件配置表
表3 计算机软件及环境
表4 红外图像数据集各设备数量
3.2 电力设备红外图像数据集
实验所使用的数据集为自建数据集,来源于电网公司巡检过程中获得的电力设备红外图像以及上网搜集的电力设备红外图像,数据集红外图像包括变压器、电压互感器、隔离开关、电流互感器、绝缘子共5类变电站常见设备,合计2400张红外图像。
在进行实验之前,要进行模型的训练,需要对红外相机采集到的红外图像进行标注,利用图像标注的部分设备图像如图7所示。
图7 数据集标注
为了较好地评估模型性能,将标注好的红外数据按照 3∶1 随机划分训练集和测试集。
3.3 结果与分析
为了综合评估模型性能,采用每个类别的精度的平均值(AP)、AP的均值(mAP)以及检测到目标物体的速度(Speed)作为衡量模型的评估指标。同时,为了验证所提方法的有效性,采用YOLOv3、SSD、YOLOv4、YOLOv4-tiny作为对比方法。具体结果如表5和表6所示。
表5 改进算法对不同电力设备的测试结果
表6 不同方法的性能对比
结合表5与表6可以得出:相较于原YOLOv4网络,所提方法的平均检测精度均值提高1.89个百分点,表明所提方法在电力设备红外图像识别中具备一定应用价值;在检测速度方面,所提方法的检测速度略有下降,但相比其他方法,明显具备优势。
4 结论
本文在YOLOv4-tiny检测模型的基础上,依照电力设备故障红外检测的需求,对该检测模型进行优化,优化后的模型实现了在进行电力设备红外诊断过程中的电力设备的识别,为电力设备的故障诊断提供了有利保障。通过引入旋转框机制、改变激活函数和改进特征提取框架对YOLOV4-tiny进行了优化。实验结果表明,改进YOLOv4-tiny模型的mAP值比YOLOv4-tiny模型提高了1.89%,具有较好的综合性能。因此改进YOLOv4-tiny模型有利于电力设备红外诊断过程中的电力设备的识别,对电力设备的故障诊断具有一定的现实意义。