APP下载

基于区域梯度压缩的少纹理目标候选框提取算法

2020-07-09彭茂庭

现代信息科技 2020年2期
关键词:目标检测

摘  要:针对某些应用中目标表面纹理较少,目标检测困难的问题,提出了一种基于区域梯度压缩的少纹理目标候选框提取算法。该算法是对模板匹配算法OCM的改进。算法对局部区域梯度方向进行压缩,保持了较低的计算复杂度,并且提出了新的梯度方向压缩方法与相似度衡量方法。实验证明,该算法相较于OCM算法,在产生接近数量候选框的情况下,召回率提高了6.5%;在召回率接近时,产生的候选框数量减少了41.9%。

关键词:少纹理目标;目标检测;模板匹配;目标候选框提取;量化编码梯度方向;二进制梯度方向压缩

中图分类号:TP391      文献标识码:A 文章编号:2096-4706(2020)02-0102-04

Abstract:In some applications,the objects to be detected dont have enough surface texture informations,which causes a great challenge to the accurate object detection. Aiming at above issue,this paper proposes a candidate box extraction algorithm for texture-less object based on region orientation compression. This algorithm is an improvement on the template matching algorithm OCM. The algorithm compresses the local area edge orientation and maintains a low computational complexity,the algorithm proposes new orientation compressing method and similarity measurement method. Experiments results show that compared with the OCM,the algorithm can improve the recall rate by 6.5%. When the recall rate is close,the algorithm reduce the amount of candidate boxes by 41.9%.

Keywords:texture-less object;object detection;template matching;object candidate box extraction;quantized and encoded orientation;binary gradient direction compression

0  引  言

數字图像目标检测是计算机视觉领域核心问题之一。在实际生产生活中,目标检测技术在机器人系统[1]、图像检索[2]和增强现实[3]等众多领域中都有广泛应用。在一些工业场景中目标表面纹理信息较少,称为少纹理目标。针对于少纹理目标的目标检测算法主要分为基于描述子算法与基于模板匹配算法。

基于描述子的目标检测算法根据兴趣点建立特征描述子作为检测依据。David提出的SIFT算法[4]根据邻域梯度方向建立描述子。后续提出的描述子算法BOLD[5]与BORDER[6],则都根据线段群之间的联系建立描述子。基于描述子算法往往依赖于目标表面稳定且区别度高的特征点。当目标纹理信息较少,检测准确率会受到较大影响。

基于模板匹配的目标检测算法根据选取特征对模板进行学习,将目标模板作为滑动窗口与测试图片不同区域进行匹配,得到目标候选位置。Hsiao等人提出了基于梯度网络的匹配方法[7],相较之前的模板匹配算法提高了检测准确性,但是计算复杂度较高。Hinterstoisser等人又提出了Line-2D算法[8],通过线性存储相似度查找表提高了匹配速度。然而由于算法仍使用主梯度方向作为特征信息,导致目标大量梯度信息丢失,检测准确度较差。

整个目标检测过程可以分为两个阶段完成。第一阶段负责从各个背景中提取目标候选区域。第二阶段负责对候选区域进行分类和校准,得到最终的检测结果。在工业场景目标检测算法课题研究中,针对目标检测候选区域提取阶段,本文提出了一种基于区域梯度压缩的少纹理目标候选框提取算法ROCM(Region Orientation Compress Map),该算法是对候选框提取算法OCM(Orientation Compress Map)[9]的改进。通过实验证明,相较于OCM算法,ROCM算法不仅提高了检测召回率,并且在召回率都接近100%的情况下,只产生了数量较少的候选框,大大减少了下一阶段算法需要处理的数据量。ROCM算法作为目标检测算法中第一阶段提取候选框的算法表现出更好的性能。

1  算法实现原理

算法主要分为三个步骤进行,首先对图像提取边缘后,经过量化编码过程将边缘梯度方向转换为一个16位二进制串;再对局部区域二进制梯度方向进行压缩提取特征信息;最后通过衡量输入图像与不同尺度不同角度模板之间的梯度压缩相似度,获得目标的候选位置与其尺度、角度信息。

1.1  量化编码梯度方向

首先,算法采用Canny算子提取出图像边缘。考虑到目标在光亮条件与黑暗条件下其边缘点的梯度方向是相反的。为了消除同一目标在亮背景与暗背景下边缘梯度方向相差较大的情况,算法将梯度方向范围从[0,2π]转换为[0,π]。即当梯度方向大于π时,将会被减去π。再将[0,π]范围的梯度方向空间均分为16份,处于同一范围区间的梯度方向都使用相同的二进制串表示。最终各个边缘梯度方向经过量化编码转换为一个16位二进制串。

图1为量化编码梯度方向,为了方便描述,图1(a)中将梯度空间均分为16份举例。图1(b)中虚线表示与实线方向相反的梯度方向,两者对应的二进制串是相同的。

1.2  区域梯度压缩映射

ROCM算法量化编码边缘梯度方向为16位二进制串后。接着以压缩比例lc对二进制梯度方向进行压缩。为了使压缩后像素点包含更多的梯度方向,ROCM算法在压缩过程中使用一个正方形压缩窗口取代OCM算法中使用的圆形压缩窗口。正方形压缩窗口Squ的边长为整数Lc,其与lc的关系为:

Lc=lc+[lc/2]

压缩过程中,正方形压缩窗口以lc为步长进行移动,每次移动到不同的位置时进行一次梯度方向壓缩。

如图2所示为一个像素尺寸为10×10的图像,以lc=4的比例进行压缩后,像素尺寸变为2×2。如图所示,较粗虚线窗口为边长Lc=6的正方形压缩窗口Squ,对应于压缩后的一个像素点。Squ被均分为四个子区域。ROCM算法将梯度方向空间均分为16份。压缩后每个位置上最多可能存在64个不同的梯度方向。

与OCM算法中压缩梯度方向方法相比,该压缩方法不仅保留了压缩窗口内全部梯度方向,还保留了梯度方向在压缩窗口内的方位信息,使得后续梯度匹配更加准确。

1.3  基于逻辑位操作的相似度衡量方法

使用1.2节的方法对目标模板图像和输入图像的边缘梯度方向都进行压缩后,分别得到模板图像梯度压缩GT(lc)和输入图像梯度压缩GI(lc)。压缩过程分别提取了模板图像与输入图像的特征信息,接下来需要设计一个合适的相似度得分计算方法来衡量输入图像与目标模板的相似程度。

由于GT(lc)与GI(lc)中各个像素点的梯度方向都为一个64位二进制串,利用逻辑与操作可以快速得到对应像素点上正确匹配的梯度方向个数。同理,可以利用逻辑异或操作得到非正确匹配的梯度方向个数。根据匹配情况,相似度得分可以通过下式计算:

式中,λ为常数,算法中设置为8。Mk+e,k(lc)为正确匹配的梯度方向个数。Dk+e(lc)为非正确匹配的梯度方向个数。CTk(lc)为GT(lc)在位置k的梯度方向计数。

相较于OCM算法,ROCM算法不仅利用逻辑与操作计算了对应像素点上能正确匹配的梯度方向数目,还利用逻辑异或操作快速计算了不能正确匹配的梯度方向数量。该相似度衡量方法能更好地剔除输入图像中不存在的目标且包含梯度方向较少的区域。并且由于压缩过程中保留了梯度方向在压缩窗口内的方位信息,即使输入图像中的目标边缘受到干扰,目标所处区域与模板也有较多的梯度方向能够正确匹配,有效地减少了目标漏检情况。

2  实验结果分析

实验使用数据库为D-Textureless数据库[5],它包含9张不同目标的模板图片。图片库中一共有54张测试图片,每张测试图片分辨率都为640×480。实验针对9个目标出现在测试图片中的实际情况,在[0.60,0.90]的范围以0.05为步长对目标模板图片进行7个不同尺度的缩放变换,再在[0,2π]的范围以8度为步长对目标模板图片进行45个不同角度的旋转变换。最终得到315张不同尺度、不同角度的目标模板图片。对全部模板图片二进制梯度方向进行压缩,作为后续匹配过程中的模板。

图3、图4为ROCM算法与OCM算法检测结果比较。当待检测目标为钳子时,图3(b)中ROCM算法准确提取出了目标的候选位置,而图3(c)中OCM算法则发生漏检。当待检测目标为扳手时,图4(b)中ROCM算法与图4(c)中OCM算法都可以准确地提取出目标的候选位置,但是ROCM算法产生的候选框数量少于OCM算法。

实验通过调整各模型的相似度阈值,使两种算法在检测相同模型时产生的候选框数量接近,分别对漏检率与候选框数量进行统计。表1为ROCM算法在D-Textureless数据库中检测9个模型的实验结果。表2为OCM算法在相同实验条件下的结果。

比较表1与表2数据可知,当产生的候选框数量接近时,ROCM算法相较于OCM算法平均召回率提高了约6.5%。在产生较少数量候选框的情况下,可将大部分正样本中的目标包含在候选框内。

接着实验通过降低相似度得分阈值,使OCM算法与ROCM算法都达到接近100%召回率,表3所示为两种算法产生的候选框数量。由表中数据可知当几乎不发生漏检时,OCM算法在检测9个模型过程中总共产生1 257个候选框,每个模型的每张测试图片平均产生2.6个候选框。ROCM算法总共产生730个候选框,每个模型的每张测试图片平均产生1.5个候选框。ROCM算法相较于OCM算法,在漏检率接近的情况下,产生候选框数量大大减少。

表3  召回率接近100%时,候选框数量统计

3  结  论

在工业场景目标检测算法课题研究中,针对目标检测候选区域提取阶段,本文提出了一种改进的少纹理目标候选框提取算法ROCM,该算法是对OCM算法的改进。在保留OCM算法中量化编码梯度方向的基础上,提出了新的压缩梯度方向方法与衡量相似度方法。实验数据证明,相较于OCM算法,ROCM算法不仅提高了检测召回率,并且只产生了数量较少的候选框,有效地减少了下一阶段候选框分类算法需要处理的数据量,ROCM算法作为目标检测算法中第一阶段提取候选框的算法,表现出了更好的性能。由于算法只对目标单视角进行候选框提取,后续工作中需要应用仿射变换和目标法线等信息学习三维模板特征,实现多视角下的目标候选框提取。

参考文献:

[1] REDMON J,ANGELOVA A. Real-Time Grasp Detection Using Convolutional Neural Networks [J].Proceedings-IEEE International Conference on Robotics and Automation 2015,2014:1316-1322.

[2] DATTA R,JOSHI D,LI J,et al. Image Retrieval:Ideas,Influences,and Trends of the New Age [J].ACM Trans. on Computing Surveys,2008:40(2):5.

[3] HODAN T,DAMEN D,WALTERIO M,et al. EFFICIENT TEXTURE-LESS OBJECT  DETECTION FOR AUGMENTED REALITY GUIDANCE [J].2015 IEEE International Symposium on Mixed and Augment Reality Workshops,2015:81-86.

[4] LOWE D G. Distinctive Image Features from Scale-Invariant Keypoints [J].International Journal of Computer Vision,2004,60(2):91-110.

[5] TOMBARI F,FRANCHI A,DI L. BOLD Features to Detect Texture-less Objects [C]//2013 IEEE International Conference on Computer Vision (ICCV). IEEE Computer Society,2013:1265-1272.

[6] CHAN J,LEE J A,KEMAO Q. BORDER:An Oriented Rectangles Approach to Texture-Less Object Recognition [C]//Computer Vision & Pattern Recognition. IEEE,2016:2855-2863.

[7] HSIAO E,HEBERT M. Gradient Networks:Explicit Shape Matching Without Extracting Edges [C]//AAAI13:Proceedings of the Twenty-Seventh AAAI Conference on Artificial Intelligence,2013:417-423.

[8] HINTERSTOISSER S,CAGNIART C,ILIC S,et al. Gradient Response Maps for Real-Time Detection of Texture-Less Objects [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2012,1(5):876-888.

[9] YU H,QIN H,PENG M. A Fast Approach to Texture-Less Object Detection Based on Orientation Compressing Map and Discriminative Regional Weight [J].Algorithms,2018,11(12):201.

作者簡介:彭茂庭(1995-),男,汉族,湖南邵阳人,硕士研究生,研究方向:数字图像处理、机器视觉。

猜你喜欢

目标检测
多视角目标检测与跟踪技术的研究与实现
视频中目标检测算法研究
行为识别中的人体运动目标检测方法
移动机器人图像目标识别
基于背景建模法的运动目标检测
基于P3电位的目标检测研究
智能视频技术在电力系统领域的应用
相关K分布杂波中扩展目标积累检测性能分析
基于连通域标记的目标检测算法设计与实现
一种改进的峰均功率比判源方法