应用Crowd-YOLOv3算法实现包裹中限制品检测

2021-01-27杨国亮

物联网技术 2020年12期

张莹，朱晨，杨国亮

（江西理工大学电气工程与自动化学院，江西赣州 341000）

0 引言

包裹X光限制品检测作为物流业及重点场所的重要安防措施，承担着防止易燃、易爆等危险品，刀具、毒品等国家重点违禁品进入货运渠道等工作。目前，安检场所的包裹安检工作是由经过专业培训的安检员来完成，但由于包裹内的物体摆放密集且存在重叠，致使X光安检设备生成的图像辨识困难，使得安检员在判定包裹内的限制品时速度较慢，且辨别精度较低。

目前，计算机辅助识别X光中限制品的技术已被广泛运用，但大多是基于传统方式，如小波去噪[1]、图像增强[2]等，提升效果有限。文献[3]使用图像建模的方法分离X光图像的前景和背景，提升了图像对比度；文献[4-5]对目标建模形成立体化图像，提高了安检人员对部分重叠区域物体的识别能力。目前，关于限制品检测在图像处理、机器视觉等方面的深度学习日益得到普及[6-7]。基于此，本文提出一种用于包裹内密集重叠限制品检测的Crowd-YOLOv3算法。

1 Crowd-YOLOv3算法

Crowd-YOLOv3算法基于YOLOv3算法[8]改进而成，主要对YOLOv3算法的FPN结构损失函数进行了优化。

1.1 改进FPN结构

YOLOv3算法在将主干网络提取的特征信息进行检测前，使用标准的FPN结构将深层特征图中的语义信息复用至浅层特征图中，用于提升算法对小目标的检测效果。文献[9]表明在FPN模型内部进行多样的连接，有助于特征信息的复用，由此提出了NAS-FPN模型。本文针对YOLOv3算法的结构特点对NAS-FPN模型进行优化，将其嵌入到算法的主干网络和检测器之间，替换标准的FPN结构。

1.2 构建条件损失函数

文献[10]表明，算法的注意力可以通过调整对应目标在损失函数中的权值实现。Crowd-YOLOv3算法的侧重点在于密集重叠区域的目标检测，因此对图像中的限制品重叠程度进行了判定。判定依据是数据集中标签值给定的目标包围框坐标值，使用IoG表示两个目标的重叠部分与其中较小目标的面积比值，最终在标签文件中使用密集程度值Crowd进行标注。判定算法如公式（1）所示：

Crowd值分别用0、1表示，其中0表示IoG≤0.6，1表示IoG>0.6。本文引入超参数αCrowd作为条件加权值，作用于原损失函数的位置损失和置信度损失部分。当Crowd为0时，αCrowd=1；当Crowd为1时，αCrowd=1.10。条件损失函数的应用使算法将更多的注意力投入到重叠程度较高的目标中，从而提升算法对密集目标的检测精度。

2 实验及分析

本文分别采用YOLOv3算法和Crowd-YOLOv3算法对X光限制品图像数据集进行测试，实验环境为Ubuntu16.04系统，计算机语言为Python3.6，搭配PyTorch1.1深度学习框架与Nvidia GTX1070显卡。

2.1 数据集和参数设定

本文通过网络获取X光图像限制品数据集，并对其中的数据进行清洗。数据集中的限制品有5类，分别是铁壳打火机、黑钉打火机、刀具、电容电池、剪刀。清洗后的数据集中共有2 000张图片，上述限制品对应图片数量分别是1 222，2 426，2 113，2 668，2 023。数据集图片按照9∶1的比例设置训练集和测试集。

实验中，YOLOv3算法和Crowd-YOLOv3算法的参数设定保持一致，输入图像的分辨率为416×416。每个算法训练100个周期，优化方法采用随机梯度下降法。训练过程中，每批处理16张图片，权值衰减为0.000 5，动量为0.9，使用Xavier方法进行参数的初始化设置。网络的初始学习率为10-3，在第71训练周期时，学习率调整为10-4；在第91训练周期时，学习率降低至10-5，并保持至训练结束。

2.2 实验结果及分析

本文在数据集的测试集中按照限制品的重叠程度选取了3张图片，并分别用YOLOv3算法和Crowd-YOLOv3算法进行检测。Crowd-YOLOv3算法和YOLOv3算法的检测效果如图1所示。

图1 检测效果对比图

图1中三幅子图内限制物品的类别和数量关系见表1所列，YOLOv3算法和Crowd-YOLOv3算法识别结果见表2所列。结合表1和图1可知，本文提出的Crowd-YOLOv3算法有效提升了YOLOv3算法在检测密集、重叠目标时的性能。在图1第一列中，Crowd-YOLOv3算法检测到8个密集排列的电容电池，4个重叠的黑钉打火机，1个单独的铁壳打火机，对照标签值，召回率达到86.67%，而YOLOv3算法的召回率仅为40%；在图1第二列中，Crowd-YOLOv3算法仍无法检测到与剪刀高度重叠的刀具，存在一定的局限性，但Crowd-YOLOv3算法的包围框更精准；在图1第三列中，Crowd-YOLOv3算法仍能检测到单独的限制物品，表明改进方法没有影响Crowd-YOLOv3算法检测单独限制品的能力。实验表明，本文提出的Crowd-YOLOv3算法能有效提升传统算法的查准率和查全率，减少了限制品的漏检和误判现象。