APP下载

基于YOLO V3算法的输电线路鸟类检测

2021-10-15梁永全

计算机应用与软件 2021年10期
关键词:置信鸟类比例

邹 聪 梁永全,2*

1(山东科技大学计算机科学与工程学院 山东 青岛 266590) 2(山东省智慧矿山信息技术重点实验室 山东 青岛 266590)

0 引 言

输电线路在电力系统中有着举足轻重的作用,近年来其建设规模急剧增大。鸟害是威胁线路安全的重要因素,其对输电线路的影响主要有四个方面:鸟类啄损、鸟类筑巢、鸟类排泄、鸟类飞行。针对鸟害问题,目前有效的方法是安装超声波驱鸟器,但驱鸟器长时间工作会造成能耗浪费[1-2]。因此,对输电线路实施精准的检测,当有一定数目的鸟类在线路周围活动时及时启动驱鸟器极为重要。

近年来深度学习技术在实际场景中得到广泛应用。深度卷积神经网络[3-4]进行目标检测时可以自主学习。基于深度学习的目标检测算法[5-6]大致分为两类,1) two stage目标检测算法。例如Fast R-CNN[7]、Faster R-CNN[8]等,此类算法分两步进行检测,先使用候选区域网络(RPN)生成候选区域,再实现目标的检测分类。2) one stage目标检测算法。例如SSD[9]、YOLO V3[10-11]等,此类算法经检测网络直接预测目标的位置和类别信息,具有更快的检测速度,基本可以达到实时检测。

本文以单步目标检测算法YOLO V3为基础,将输电线路鸟类作为目标,针对设备采集图片中目标较小及鸟类相互遮挡的问题对YOLO V3结构进行改进。为提高网络对图像中小目标的召回率及检测精确率,对原网络中52×52尺度下的特征图进行2倍上采样,然后与第二个残差块进行拼接,以此融合高层特征的语义信息;为解决鸟类相互遮挡的检测问题,根据检测框与预选取检测框的Intersection-over-Union(IoU)值,计算各检测框对应的比例因子,以此衰减它们的置信分数,最后经过迭代删除分数低于设定阈值的检测框。将本文改进的网络与多种网络在输电线路鸟类数据集上进行对比测试,实验结果表明改进后的网络有较好的检测效果。

1 YOLO V3算法

1.1 YOLO V3网络结构

YOLO V3骨干网络为深层卷积神经网络Darknet-53[12],该网络含有1×1、3×3的卷积层共53个,网络在13×13、26×26、52×52三个尺寸上进行特征融合后对目标进行预测,其结构如图1所示。

图1 YOLO V3网络结构

1.2 YOLO V3检测流程

首先,输入的图像被划分为13×13个单元格。然后,每个单元格会生成A个检测框[13],检测框由一个五维度的预测参数组成,包括检测框中心点坐标(x,y)、宽高(w,h)、置信得分si。置信得分计算为:

si=P(Ci|Oobject)×P(Oobject)×IoU(kT,kP)

(1)

式中:P(Oobject)表示当前单元格检测框中存在物体的可能性,若存在检测物体则取值为1,否则取值为0;P(Ci|Oobject)表示检测框存在目标的情况下,单元格预测第i类物体的条件概率;IoU(kT,kP)为预测检测框与真实标注框的交并比。

最后通过NMS[14-15]算法保留置信得分较高的目标检测框,该算法选取合适检测框的同时会抑制冗余检测框。传统的NMS处理方式由式(2)的函数表达:

(2)

式中:M为当前区域内置信得分最大的检测框;IoU(M,bi)为M与相邻重叠框bi的交并比;Nt为设定的重叠阈值。

2 改进的YOLO V3检测模型

2.1 特征融合目标检测层

在输电线路鸟类检测任务中,设备采集的图像中鸟类普遍较小,需要改进原网络结构以适应检测任务。

改进的YOLO V3结构如图2所示,输入416×416像素图像,将52×52的特征图进行2倍上采样,将上采样后的特征图与网络第二个残差块的输出进行拼接,同时通过2倍上采样使13×13、26×26的特征图进行信息传递。第二个残差块输出的特征图相对于输入图像为4倍降采样,含有更多小目标的特征信息,可以提高对图像中小目标的检测精确率。最后直接由融合的4倍降采样特征图实现对目标的检测。除此之外,为处理网络加深时出现的训练退化问题,在网络的第二个残差块中增加2个残差单元。残差单元的基本组件DBL(Darknetconv2d_BN_Leaky)由卷积层、批量归一化操作(Batch Normalization)和LReLU激活函数构成。

图2 改进的YOLO V3网络结构

2.2 比例因子NMS算法

传统NMS算法抑制冗余检测框时,判断某个检测框是否冗余主要取决于设置重叠阈值的大小,算法强制性将大于重叠阈值的检测框的置信得分置为0。当重叠区域出现真实目标时就会被误删,容易造成目标的漏检。

输电线路鸟类检测任务中,经常出现鸟类聚集的情况。本文将基于比例因子衰减的NMS算法应用于检测任务中,根据重叠程度按一定的比例衰减检测框的置信得分,使算法在有效抑制冗余检测框的同时降低目标的漏检率。算法具体如下:bm为检测框集合B中置信得分最高的检测框,计算其余相邻检测框与bm的IoU(bm,bi)值,根据此值使用式(3)得到各检测框的比例因子wi,衰减它们的置信得分为wisi;最后将衰减后置信得分小于设定阈值的检测框删除,重复执行此过程直到处理完集合B中所有的检测框。此算法根据IoU值计算检测框对应的比例因子是连续过程,当IoU值为0时,继续保留检测框原有的置信得分。

wi=1-lg(IoU(bm,bi)+1)

(3)

3 实 验

3.1 实验运行环境

本文实验的软硬件平台配置如表1所示。

表1 实验配置表

3.2 实验数据集及预处理

实验中所用数据主要来源于课题组采集的山东地区输电线路附近监控设备,随机抽取监控视频并提取单帧图像制成数据集。使用Labellmg工具标注图片并以VOC数据格式存储。数据集中图像共计5 000幅,其中训练集4 000幅,测试集1 000幅。

针对本文研究对象特点,采用平均重叠度[12](Avg IoU)对标记好的自制数据集进行聚类分析。Avg IoU目标函数如下:

(4)

式中:S为样本;C表示簇中心;IoU(S,C)表示聚类框与簇中心框的交并比,衡量预测框的准确程度;k为簇的个数;n为样本总数;nk为第k个聚类中心中的样本个数;i为样本序号,j为聚类中心中的样本序号。

对数据集进行K-means聚类[16-17]分析得到如图3所示的关系图。当k取值为3时曲线逐渐开始平缓,所以选取anchor boxes的数量为3,对应预测框的大小设为3个聚类中心,在本训练集上分别为(22,19)、(41,28)、(38,43)。

图3 K-means聚类结果

3.3 网络训练

模型训练参数如表2所示。前17 000次初始学习率为0.001,后3 000次将学习率调整为0.000 1。训练过程中每1 000次迭代保存一个权重文件。

3.4 结果分析

为验证改进的网络能够较好地检测小目标和相互遮挡的鸟类,进而提高整体检测效果,本文设置两个对比实验。

(1) 小目标检测。将YOLO[18]、YOLO V2[19]、YOLO V3及本文改进的YOLO V3分别在数据集上进行训练与测试。计算其对目标的检测精确率P与召回率R,计算公式分别表示为:

(5)

(6)

式中:XTP为正确检测出的目标数;XFP为误检的目标数;XFN为没有被检测出的目标数。

实验结果如表3所示。改进的网络对检测目标的精确率及召回率均有不同程度的提高,平均精度(AP)兼顾精确率和召回率两个指标,数值提高至89.25%。

(2) 鸟类相互遮挡检测。在实验数据集中选取100幅遮挡比例不同的鸟类图像,使用传统NMS算法和本文改进的比例因子NMS算法分别对其进行检测。检测性能对比如表4所示,当鸟类相互遮挡比例小于40%时,两种算法的检测准确率差别不大;遮挡比例为40%~60%时,改进的NMS算法较传统算法准确率提高20%;遮挡比例更高时,改进的NMS算法在鸟类遮挡检测任务中表现出更好的性能。

表4 不同遮挡比例检测性能对比(%)

图4、图5分别为传统NMS算法与改进NMS算法在鸟类遮挡比例大于60%时的检测效果图,可见传统算法无法检测出被遮挡的鸟类,而改进的NMS算法对被遮住的鸟类有较好的检测效果。

图4 传统NMS算法检测效果图

图5 改进NMS算法检测效果图

4 结 语

本文将YOLO V3算法应用于输电线路鸟类的实时有效检测,从而控制驱鸟器的启停,在节能的同时保护输电线路的稳定。针对图像小目标及目标遮挡的现实问题,在YOLO V3模型基础上,对Darknet-53网络和NMS算法进行改进。实验结果表明,改进后的YOLO V3算法精确率提高至88.36%,平均检测速度为38帧/秒,基本达到实时精准的检测效果。但改进的算法在检测目标严重遮挡的图像方面仍有不足,本文的下一步工作旨在继续改进算法使其有更好的检测能力。

猜你喜欢

置信鸟类比例
善于学习的鸟类
急诊住院医师置信职业行为指标构建及应用初探
基于置信职业行为的儿科住院医师形成性评价体系的构建探索
基于模糊深度置信网络的陶瓷梭式窑PID优化控制
人体比例知多少
我的湿地鸟类朋友
鸟类
鸟类的叫声
按事故责任比例赔付
基于CUDA和深度置信网络的手写字符识别