基于改进型YOLOV5网络的输电线塔防外破目标检测技术研究
2023-06-24刘庆陈友坤李义姜继彬李璘
刘庆(通讯作者)?陈友坤?李义?姜继彬?李璘
摘要:高压输电线路及杆塔常因自然条件、人为活动等因素影响,频繁产生大面积跳闸事件,损失极大,尤其因外力破坏为重。外力破坏的偶发性和不可预测性,造成运维成本增加、可靠性不高等问题。本文基于YOLOV5算法,利用CARAFE(Content-Aware ReAssembly of FEatures)改进上采样过程,使用SENet(Squeeze-and-Excitation Network)注意力机制重构原网络的CSP模塊,并在自建的输电线塔数据集上进行模型的训练和测试。结果表明:改进的CARAFE-SE-YOLOV5模型比传统YOLOV5模型达到了更高检测精度,对人、汽车、工程车辆的识别准确率高达92%、96%、88%。
关键词:高压输电线;外力破坏;YOLOV5算法;上采样;注意力机制
一、引言
架空高压输电线路的正常工作支撑着电网调度、营销、生产等核心业务,是电网稳定可靠运行的基石。然而因自然条件、人为活动等不确定因素存在,导致输电线路设备常发生短路、跳闸、停电等事故,造成输电线路停运。通过对国内部分省份电网线路跳闸影响因素的调研[1-2],发现外力破坏因素占比超过50%,其中施工(人、机械)破坏占比52.9%,树木砍伐占比5.9%,异物短路占比39.3%,火灾、洪水、泥石流占比1.9%。传统的人工巡检以及无人机巡检受成本的影响,无法全天候对输电线路及杆塔进行监控,且周期过长、效率极低、运营成本高、监管困难。因此,本文基于自建的高压输电线及杆塔数据集上,设计一种基于改进型YOLOV5算法网络,相比于传统YOLOV5模型,改进后的模型在自建数据集上有更高的检测准确度。
二、改进型YOLOV5算法分析
(一)YOLOV5算法原理
在YOLOV4网络基础上,YOLOV5网络作出四点修改:①输入端引入数据增强、自适应锚框计算、自适应图片缩放。②改进基准网络的Focus、CSP(Cross Stage Partial Network)结构。③Neck网络中添加新的FPN(Feature Pyramid Network)+PAN(Path Aggregation Network)结构。④输出层改进了GIOU_Loss损失函数与DIOU_NMS预测框筛选函数。使得YOLOV5的推理速度和精度皆高于YOLOV4及以往任何版本,如图1所示。
YOLOV5网络模型主要由Backbone与Head组成,其中Backbone由Focus、CBL(Conv+BN+LeakyRelu)、CSP(Cross Stage Partial Network)和SPP(Spatial Pyramid Pooling)构成,而Head由FPN(Feature Pyramid Network)、PAN(Path Aggregation Network)和Detection Head模块构成。其中,Backbone部分,Focus层通过切片操作将输入信息融入各通道,经切片后的输入通道数扩充为原来的4倍,且图像的宽度、高度信息都包含在通道中,因此输入图像的下采样过程没有信息丢失。CBL模块由Conv(Convolutional Layer)卷积层、BN(Batch Normalization)标准化层以及LeakyRelu激活函数层组成,用于特征提取。CSP模块将特征图分成两路,一路进行卷积操作,另一路和第一路的卷积结果进行合并,可在分类问题上降低计算量,对网络学习能力也有一定的提升。SPP为不同大小窗口的池化过程,目的是进一步提升特征提取的效果。
对于YOLOV5的Head部分,分为三个不同大小的尺度部分构成,每个Head经过8、16、32倍的下采样后输出结果,其中FPN结构目的是利用深层网络对浅层网络进行指导校正,提取更高级的语义信息。PAN结构相比于FPN,增加了自底向上的过程,用于提高网络对浅层信息的定位能力。
根据网络宽度、深度不同,YOLOV5又分为s、m、l、x四个不同大小的网络型号,该文需实现输电线塔目标实时检测,网络模型的性能指标更加偏向于推理结果的精度,故采用适用于较大目标检测的s型YOLOV5网络为基础模型进行改进。
(二)CARAFE上采样
CARAFE是一种高效的轻量级通用上采样框架[3],可在一个较大的范围内聚合上下文信息,并对特定于实例的内容进行感知处理,自适应生成上采样核,如图2所示。CARAFE由上采样核预测模块和内容感知重组模块组成,输入特征图大小为H×W×C,上采样倍率为,该结构首先是核预测模块得到预测的上采样核,并利用内容感知重组模块完成上采样计算,输出得到σH×σW×C大小的特征图。
上采样核预测模块利用一个1×1卷积将其通道数量压缩至Cm,然后进行内容编码和上采样核预测。若上采样核的大小为pup×pup,需使用pencoder×pencoder的卷积层预测上采样核,此时输入通道数量为Cm,输出通道为σ2pup2,将输出在空间维度展开得到σH×σW×pup2的上采样核,最后进行softmax核归一化处理。
内容感知重组模块将输出特征图的各位置信息映射回输入特征图,取其中心处pup×pup的区域与在该位置的预测上采样卷积核作点积得到输出图像,其中相同位置的不同通道共享同一个上采样核。
该文利用CARAFE上采样算子替换传统YOLOV5模型中的上采样,在目标检测任务的上采样过程中,该采样算子可明显提高网络的语义提取能力,同时仅带来很小的额外参数和计算量。
(三)SE注意力机制模块
SENet是Hu等人在2017年提出的一种架构模型[4],它通过显式方式建立通道之间的相关性,并重新自适应校准通道特性响应。SENet模块在增加少量计算成本的基础上为现有CNN网络带来显著的性能改进。
如图3所示,SENet模块是一个构建在映射变换上的计算单元,将输入端的X∈RH'×W'×C'映射至输出端的特征图U∈RH×W×C,其中U=[u1,u2,...,uc],uc的计算如下式:
(1)
其中,,,*表示卷积计算,vsc表示一个二维的空间核,作为输入端X相对应的通道。利用全局平均池函数生成通道统计将全局空间信息压缩至通道描述符中,统计信息zc∈RC的计算公式如下:
(2)
由(3)和(4)式,通过Sigmoid激活函数建立的门控机制寻找出通道间的依赖关系,再使用激活s函数重新缩放标定U,得到模块输出。
(3)
(4)
其中,,而表示Fscale(uc,sc)为特征图uc与sc间的通道相乘运算。可见,SE模块与传统CNN不同在于,将经过卷积变换后得到的特征通道进行Squeeze、Excitation、Reweight三步操作,得到新的通道特征。通过Squeeze得到通道上全局响应分布,那么靠近输入端的层也可获取全局感受野。利用Excitation的门控机制显式地寻找出通道之间的相关性。最后Reweight则是将输出权重信息完成在通道维度上对原始特征的重标定。该文通过重构原网络中CSP结构的ResNet网络层,为其添加SE注意力机制模块,提高网络的语义表征能力。
三、输电线塔防外破目标检测仿真与验证
(一)数据集与网络训练
该文对输电线塔监控视频进行帧剪辑和图片剪切,得到合计1500张图片的数据集,其中500张人体图片、400张汽车图片、600张工程车(挖掘机)图片,该数据集能有效反应真实情况下输电线塔外力破坏事件的诱发主体,使用LabelImg软件对三种标签的图片进行人工标注。然后,将数据集随机打乱后划分为75%的训练集和25%的测试集,所有模型的训练与测试均在同一台电脑上完成,其中Pytorch版本为1.8.0,网络学习率(Learning rate, Lr)设置为0.001,网络优化器(Optimizer, Opt)选用Adam,批量大小(Batch size, Bs)为4,迭代次数(Epoch, Epo)为100。
(二)实验结果与分析
模型识别准确度对比,如图4所示。可以看出:改进后的CARAFE-SE-YOLOV5模型在自建数据集上有更高的检测准确度。
在输电线塔防外破检测任务中,识别准确度可直接反应目标的检测情况,由于漏检可能导致外力破坏事件的发生,因此Precision准确度指标成为模型评价的重要指标之一,并综合考虑检测精度和速率,选择性能最好的CARAFE-SE-YOLOV5模型作为最优模型,检测效果如图5所示,在阴暗以及复杂背景环境下依然能够较好的检测出目标。
四、结束语
以输电线及杆塔防外破目标检测为研究目标,通过收集已有数据进行标注,自建专用于输电线塔外力破坏目标的检测任务数据集,利用CARAFE模块改进上采样过程,使用SENet注意力机制重构原网络中的CSP模块,得到CARAFE-SE-YOLOV5模型。测试结果已证明改进模型的检测准确度更好。在增加少量复杂度的情况下,明显改善了对工程车(挖掘机)的检测精度,实现实时目标检测。
作者单位:刘庆 陈友坤 李义 姜继彬 李璘 贵州电网有限责任公司毕节供电局
参 考 文 献
[1]陆佳政,周特军,吴传平,等.某省级电网220kV及以上输电线路故障统计与分析[J].高电压技术, 2016,42(01): 200-207.
[2]卢银均,李翊嘉,姜金节,等.输电线路故障统计分析及防控对策研究[J].山东电力技术, 2021, 48(04): 47-52.
[3]J. Wang, K. Chen, R. Xu, Z. Liu, C. C. Loy and D. Lin, CARAFE: Content-Aware ReAssembly of FEatures, 2019 IEEE/CVF International Conference on Computer Vision (ICCV), 2019, pp. 3007-3016.
[4]J. Hu, L. Shen, S. Albanie, G. Sun and E. Wu, Squeeze-and-Excitation Networks [J], IEEE Trans. Pattern Anal. Mach. Intell., vol. 42, no. 8, pp. 2011-2023, 1 Aug. 2020.
該文受2022年贵州电网有限责任公司毕节供电局电力技术开发项目”高压输电线路走廊多异常事件智能监控及通信技术研究”(0607002022030101SC00049)资助。
陈友坤(1978.08-),男,汉族,贵州毕节,本科,贵州电网有限责任公司毕节供电局工程师,研究方向:输电管理;
刘庆(1983.08-),男,苗族,贵州毕节,本科,贵州电网有限责任公司毕节供电局工程师,研究方向:输电线路运检及输电通信管理;
李义(1991.02-),男,彝族,贵州毕节,本科,工程师,研究方向:电气工程及科技管理;
姜继彬(1992.06-),男,汉族,四川江安,本科,助理工程师,研究方向:输电线路运检及输电通信管理;
李璘(1969.06.22-),男,汉族,贵州毕节,本科,工程师,研究方向:输电安全及输电通信管理。