APP下载

基于RepGT损失的改进Faster R-CNN的包裹检测算法

2022-05-30范海红

物流技术 2022年5期
关键词:卷积损失图像

范海红

(浙江邮电职业技术学院 管理信息学院,浙江 绍兴 312000)

0 引言

近几年,随着电子商务迅速发展,相应的物流产业也快速发展,包裹数量远超欧美国家的总和。但在物流技术比如包裹图像识别等方面为我国还相对落后。目前,计算机图像识别等已经在人脸识别、医学图像中广泛应用,如何将图像识别技术运用到物流运输等行业中成为比较热门的话题。物流运输中,包裹图像的检测非常重要,可以快速有效地确定包裹的数量,分配资源,同时也能避免卡塞、掉落等异常现象。但在运送过程中包裹很容易产生遮挡现象,从而导致包裹检测困难的增加,因此必须使用分类器来识别包裹特征。所以本研究通过引入卷积神经网络获得特征,从而完成包裹图像识别等的检测任务。

1 基于Faster R-CNN的特征提取

卷积神经网络系统是一个涉及卷积处理计算的深层次的前馈神经网络,网络结构一般涵盖了数据输入层、卷积计算层、池化层、连通处理层以及全连接层。卷积层可以提取大量数据的基本特征信息,通过卷积核的卷积运算得到输入图像的深层特征信息。池化层对卷积层的计算结果进行优化降维,降低图像的分辨率,减少参数量,同时获得图像平移和形变的鲁棒性。交替组合使用卷积优化层和图像池化层,完成图像特征信息的提取,同时降低图像的分辨率,完成数据降维效果。

1.1 基于VGG-16的特征提取

目前,最常见的卷积神经网络有很多,比如AlexNet、VGG、ResNet等。而VGG网络系统在图像数据获取方面也相当优秀,而且泛化能力强大,使用范围广阔。目前,VGG-16网络系统主要分为十三个卷积层和三处全连通层,卷积核为3×3,步长为1,该网络可以减少参数优化计算。为降低包裹检验的时间消耗和内存耗费,本文采用了VGG-16网络技术来获取特征信息,并将ImageNet数据集上VGG-16权重值作为本文提取网络特征的起始权重,输出的特征信息用作包裹检测依据。

1.2 基于RPN的目标候选区域提取

区域生成网络RPN 通过CNN 提取到特征信息,获取候选框。而网络训练过程中,每个像素点都会产生9个锚节点,在分类层中,利用激活函数softmax对每一个锚节点进行判断,区分为前景图像还是背景图像,在回归层中,通过调整锚节点的参数,拟合得到候选框位置,综合前景图像和候选框位置生成候选区域,RPN网络结构图如图1所示。

图1 RPN网络结构图

1.3 Faster R-CNN

Faster R-CNN 算法是基于卷积神经网络的Fast R-CNN 算法和RPN 网络结构结合实现的算法。与经典的检测框生成方法不同,Faster R-CNN直接采用RPN网络结构获取检测框,提升生成速度。首先,通过RPN网络搜索出粗略范围,识别出保护压板所在区域,然后用投入状态和退出状态的压板图片对Faster R-CNN进行训练,从而提高算法对压板投退特征的识别能力,最后采用已训练完成的Faster R-CNN算法对RPN算法划定的搜索范围进行特征检索,识别搜索框中压板的投退状态。Faster R-CNN算法的原理图如图2所示。

图2 Faster R-CNN算法设计原理演示图

1.4 目标分类与定位

当对一个包裹目标进行定位分类时,常常需要用一个定位分类器对不同包裹类型进行计算。目前,我们使用的主要包裹检测方法是SVM分类器,在结合卷积神经网络的包裹追踪检测算法中,使用Softmax 分类函数计算包裹目标追踪概率,并以此方式判断包裹类别和完成包裹目标的定位。目标定位时,先开始得到一个候选框,接着再开始使用全连接层和Softmax函数对每个包裹进行定位划分。由于部分候选框并没有很精确地选中目标物,所以就必须对每个候选框都作出细微的调节,这个方法就叫做边界框调整回归。如图3所示,最原始的目标候选框为一个虚线框P,而回归目标框为点线框G,回归目的为利用大数据训练得到与目标候选框P和回归目标框G更接近的回归框(实线框S)。当P和G之间的距离较近时,回归法对确定目标的位置更精确有效。

图3 边界框回归示意图

边界框回归过程中,主要利用回归算法完成对检测框位置的调整,包括大小和长度比的调整。具体坐标参数化设定:

其中,水平方向的中心为,垂直方向中心为,和表示宽和高,而表示真实的目标框G的数据,表示初始候选框P 的数据,从而目标框数据可以用(t,t,t,t)表示。

2 改进算法的RepGT损失函数[7]设计

为了完成目标划分和定位功能,在卷积层中使用的卷积核都必须进行训练,并且还必须把分类损失函数L与定位损失函数L结合,融合到同一个损失函数里。采用基于Softmax的损失函数作为分类损失函数,而Faster R-CNN的损失函数主要定义如下:

由于快递中转中心产生了大量包裹,从而形成聚集现象,容易导致包裹识别错误。本文通过使用RepGT损失函数调节包裹检测计算中的回归项,以选取更合理的候选框,从而减小预测框与目标框之间的间距,并增加与其周围非相应目标框的间距。因而可以设计的损失函数如下:

是(0,1)区间上连续可微的函数,∈[01)是异常值的敏感参数。可以发现,如果同时存在多个候选框都与目标框重合,则RepGT损失函数就会通过增大惩罚损失使得整体的损失值不断增大,这样就能获得对该目标框最合适的候选框。

3 实验结果

3.1 参数设置

本文将以改进前后的Faster R-CNN两个检测算法作为对照实验,在Faster R-CNN的损失函数上再添加损失函数 。全部实验都在同样的实验条件下完成,并且设置相同的计算参数,其中正则化系数为10,动量系数为0.9,通过随机梯度下降算法完成优化。初始学习效率为0.001,在20 000 次迭代后进行0.1倍的衰减,共计迭代60 000次。

3.2 结果分析

为检验Faster R-CNN算法的有效性,选择了物流企业某时刻下的包裹数据图片,利用改进后的Faster R-CNN网络,对包裹目标信息进行了检验。具体的训练方法是,在同样的实验数据和同样的参数训练网络下,先得到训练模型,并在测试集中进行测试,然后对测试结果进行统计分析。

图4的数据分析结果可得,通过增加RepGT损失函数得到的改进后的算法可以更高效、更准确地分离目标框,相比传统的Faster R-CNN,检测效率更佳。从表1中可发现,对于平均准确精度AP值,传统Faster R-CNN 的检测准确度为56.60,而改进后的算法检测准确度达到了58.98,比传统的Faster R-CNN算法增加了2.38AP,在精度方面有了显著的提高。

图4 算法实验结果对比图

表1 包裹检测数据集的测试结果

3.3 参数对比

表2结果表明随着参数的变化,模型性能也跟着变化,对算法的检测精度也有一定的影响。表中结果表明当参数1 时,包裹检测数据集中检测精确度最佳。

表2 不同参数的测试结果

4 结语

针对密集包裹检查问题,建立了由损失函数改进的Faster R-CNN 的检查计算。使用了传统的Faster R-CNN的包裹检查流程,包含了特征提取、区域形成、目标定位和分析,并结合RepGT损失函数对密集堆积包裹和遮挡现象中的问题进行了计算修正,并通过数据实验得到结果,显示改进后的检测精度从56.60提升到58.98。同时对损失函数中参数做了调试分析,得出在参数1 时算法性能良好,有待今后研究借鉴。但针对现代物流中的包装检验问题,目前还是存在着类似于小目标包装检验、人工标注等方面的不足,仍有待今后进一步研究。

猜你喜欢

卷积损失图像
洪涝造成孟加拉损失25.4万吨大米
基于全卷积神经网络的猪背膘厚快速准确测定
基于图像处理与卷积神经网络的零件识别
基于深度卷积网络与空洞卷积融合的人群计数
两败俱伤
A、B两点漂流记
卷积神经网络概述
损失
名人语录的极简图像表达
一次函数图像与性质的重难点讲析