APP下载

可提高检测精度的电力标识牌智能检测方法

2024-02-22朱建宝桑顺马青山俞鑫春张斌

电气自动化 2024年1期
关键词:锚框标识牌池化

朱建宝, 桑顺, 马青山, 俞鑫春, 张斌

(1. 国网江苏省电力有限公司 南通供电分公司,江苏 南通 226006;2.上海交通大学 电力传输与功率变换控制教育部重点实验室,上海 200240;3.江苏奥威信息系统工程有限公司,江苏 南通 226007)

0 引 言

21世纪以来,国民经济稳步发展,社会对电力的需求也逐步提高。在推动电网智能化发展的要求下,电力巡检工作开始逐步使用基于图像处理技术的电力作业管控平台[1]。电力安全标识牌检测能够提醒作业人员提高安全意识[2],是电力作业管控平台的重要组成部分之一。电力安全标识牌的检测容易受到天气、光线等外部环境的干扰[3],极大地影响算法的准确性[4]。

深度学习作为一种智能算法,能够用于电力系统中的故障诊断与预防[5]。作为深度卷积神经网络的一种“只看一次”(you only look once, YOLO)检测网络具有结构简单、检测速度和精度高等优势[6],在实际工程中应用广泛。

本文针对电力安全标识牌检测算法在实时性上要求高,在精度上要求相对较低的特点,为解决电力标识牌尺寸较小、角度样式多和易被遮挡住的难题,建立了电力安全标识牌检测的数据集,提出基于索引池化结构的改进YOLO网络,用于降维和去除冗余信息,提高电力标识牌检测的准确度。

1 索引池化YOLO

1.1 网络模型

本文采用提高特征图的分辨率和锚框密度的办法,来提高对小目标的覆盖率。与此同时,对上采样后的深层特征进行索引池化,从而精准恢复图像信息。本文称这种网络为索引池化“只看一次”(you only look once index pooling, YOLO_IP)网络。

图1给出了基于索引池化“只看一次”网络模型,其中虚线边框为池化掩码,平行四边形为特征图。上采样的过程不需要学习,上采样得到的稀疏特征图通过滤波器卷积获得稠密的特征图。将同样大小的浅层特征图与上采样后的深层特征图拼接,使得上文信息和下文信息紧密融合,让目标位置的回归更加迅速准确。

图1 基于索引池化“只看一次”网络的模型

采用式(1)的计算公式对于目标位置进行预测。

(1)

式中:tx、ty为网络预测值偏移输出特征网格中心点的偏移量;tw、th为网络预测值对应于输出特征网格中心点的宽和高;cx、cy为索引坐标;bx、by、bw、bh为输出特征所体现的检测目标的宽高,pw、ph为输出特征所体现的锚框的宽和高。

1.2 锚框密度分析

在YOLO网络中,预测层特征图尺寸相对较小,对应锚框密度在输入图像中较小,锚框数量较大,且中心相对于目标中心距离重合度不高。网络学习的回归头预测的偏差值较大,使得网络对位置锚框相对于目标框的偏差信息预测难度较大。

图2给出了两种不同分辨率特征图的输入图像锚框密度对比,其中星形为目标框的几何中心,圆点表示锚框生成于输入特征图中的位置。图2(a)、图2(b)的左侧显示了不同分辨率特征图到输入图像的锚框密度分布,右侧为锚框与目标框相对位置的距离程度。图2(a)中特征图的分辨率为13×13,网络得到的回归头预测不精确。图2(b)中特征图的分辨率为26×26,锚框能够更好地覆盖目标,减少回归预测偏差值,提高了预测准确性。

图2 锚框分布图

1.3 索引池化

图3为索引池化的原理图,对4×4大小的特征图进行索引池化,下采样为一半大小的特征图,选择池化方式为最大池化,取最大元素对应的位置掩码。此外,对下采样后的特征图进行上采样,利用取得的最大位置掩码将特征图结果恢复到原特征图大小。最大池化在取最大掩码的情况下能学习到特征图的边缘和纹理结构,提高了所提取特征的鲁棒性,有效提高了网络对目标学习的能力以及分类识别的准确度。

图3 索引池化原理图

1.4 损失函数

训练所使用的损失函数如式(2)所示。

(2)

(3)

(4)

式中:diffx、diffy为网格中心与标注过的真正中心之间的偏差值;predx、predy为网格中心位置与网络预测中心之间的偏差值;predw、predh分别为锚框宽和高处的预测值;anchorw、anchorh为先验框的宽和高;w、h为真实标注的宽和高。

式(2)中lijc的解析表达式为:

(5)

式(3)~式(5)中scaleiou、scalecoord、scaleclass的值均为1,作为控制损失各组成部分的权重。

2 试验验证

2.1 数据分类

当前,电力安全标识牌大多处在危险的环境中,还没有形成开源的检测数据集,因此,需要自行构建电力安全标识牌的检测数据集。本文以常见的12种电力安全标识牌为对象,利用监控设备对不同场景中的电力安全标识牌进行采集,如图4所示。根据采集到的数据自行制作了一个电力安全标识牌的检测数据集。

图4 常见的电力安全标识牌

根据采集到的电力安全标识牌的视频,经过加工处理后获取一万张图片。然后,对采集到的图片进行人工标注,获得两万组数据。最后,对两万组数据进行分类,其中一万八千组数据用作训练集合,两千组数据用作测试集合。

2.2 数据分析

为对索引池化结构的有效性进行验证,增加网络YOLO_26×26作为对比网络,通过上采样方式将预测层特征分辨率提升为26×26。使用相同数据集对YOLO、YOLO_IP和YOLO_26×26进行训练与测试。使用随机梯度下降法优化策略对上述三种网络加以优化,设置基础学习率为万分之一,设置迭代次数为九万次。

图5给出了试验结果。图5(a)为网络召回率关于迭代次数的曲线,YOLO的初始召回率是最低的。因此,锚框命中目标位置的概率随着特征分辨度的增大而增大。YOLO_26×26网络附带着大量的冗杂信息,造成召回率存在大幅度振荡。图5(b)给出了上述三种网络的损失曲线,从图5(b)不难看出,在九万次迭代训练以后,YOLO_IP网络的收敛速度最快。

图5 试验结果

表1给出了标识牌检测中三种网络的平均精准度均值。从表1可以看出,YOLO_26×26的平均精准度均值较原始YOLO高0.4%,说明适当提高输出层分辨率可以提高检测能力。YOLO_IP较YOLO_26×26的平均精准度均值提高2.8%,表明了YOLO_IP采用索引池化可以高效恢复高分辨率特征图中标识牌的特征信息,达到更好的检测效果。

表1 标识牌检测中三种网络的平均精准度均值

3 结束语

本文以12种常见电力安全标识牌为对象构建了专用于检测的数据集,通过深度卷积神经网络学习解决复杂电力场景下安全标识检测的问题。以YOLO为基础网络,通过增加输入图像的锚框密度,减少回归预测偏差值,减轻网络学习对于位置信息预测的难度。此外,在原始YOLO网络中采用索引池化机制,通过最大池化的方式,减少了冗余信息,突显目标位置的特征信息。试验结果标明,所采用的索引池化网络能够有效提高电力安全标识牌的检测精度。

猜你喜欢

锚框标识牌池化
面向神经网络池化层的灵活高效硬件设计
基于Sobel算子的池化算法设计
基于YOLOv3锚框优化的侧扫声呐图像目标检测
锚框策略匹配的SSD飞机遥感图像目标检测
基于SSD算法的轻量化仪器表盘检测算法*
基于GA-RoI Transformer的遥感图像任意方向目标检测
卷积神经网络中的自适应加权池化
电杆标识牌安装器研制
分类清洗标识牌在提升消毒供应中心工作质量中的应用
基于卷积神经网络和池化算法的表情识别研究