APP下载

目标检测算法R-CNN在现实场景数字检测任务中的应用

2018-05-10胡靖逸郭雪亮李会军朱美强

电子技术与软件工程 2018年24期
关键词:候选框边缘卷积

胡靖逸 郭雪亮 李会军 朱美强

摘要

R-CNN (Regions withConvolutional Neural NetworkFeatures)算法及其改进,大多数用于ImageNet,coco等学术竞赛中,针对现实应用于现场检测任务的优化及研究相对较少。本文在RCNN结构上,提出了在现实场景数字检测任务中,基于经典图像处理技术完成候选框提取的思路,可极大提高目标检测效率,使其能够完成实时检测任务。

【关键词】实时目标检测 深度学习

1引言

Ross Girshick在2014年于CVPR发表论文《Rich feature hierarchies for Accurate ObjectDetection and Segmentation》,第一次将在图像分类任务中表现优异的卷积神经网络应用于目标检测当中,该检测算法即R-CNN(Regionswith Convolutional Neural Nerwork FeatureS).

但该算法也存在明显缺陷,检测效率底下,无法应用于实时检测任务当中。随后Ross Girshick尝试对其进行改进,提出了Fast-RCNN算法,Faster-RCNN算法等,用来提升检测速度。但即便如此,基本配置的个人电脑及工控机仍然难以满足计算需求。在处理现实场景数字检测任务时,本文提出了基于经典图像处理技术完成候选框提取的思路,可极大提高目标检测效率,使其能够完成实时检测任务。

2 R-CNN算法介绍

2.1候选框提取

在物体识别与定位领域,最传统的方法是基于穷举性搜索。但这种方法计算量大,非常低效。尤其在超高分辨率的遥感图像中,采用基于穷举性搜索的物体识别与定位算法,将会是一件令人十分头痛恼火的事情。此时,若能过滤掉一些无用的box将会节省大量时间。这就是Selective Search(选择性搜索)的优点,选择性搜索( Selective Search)综合了蛮力搜索( Exhausticve Search)和分割(Segmentarion)的方法,意在找到可能的目標位置进行物体的识别。

其他在R-CNN框架下用于候选框处理的算法还有Edge Boxes,Bing, Geodesic等,各算法效果比较可参考J Hosang的论文[3]。

2.2卷积神经网络

20世纪60年代,Hubel和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现其独特的网络结构可以有效地降低反馈神经网络的复杂性,继而提出了卷积神经网络( Convolutional Neural Networks, CNN)。现在,CNN已经成为众多科学领域的研究热点之一,特别是在模式分类领域,由于该网络避免了对图像的复杂前期预处理,可以直接输入原始图像,因而得到了更为广泛的应用。

通常由卷积层、池化层、全连接层、分类器等组成,而网络结构、模型参数等可具体设计。常用的网络模型包括LeNet,AlexNet,ResNet等。

3候选框提取算法改进

R-CNN框架使用通用性强的SelectiveSearch算法做候选框提取算法,但在现实环境当中,检测目标的图像特征相对固定,仍旧使用Selective Search算法会造成大量冗余。本文的中心思路是根据待检测目标的图像特点,使用传统图像处理算法有针对性地提取图中候选框。可极大的减少候选框提取数量。在此思路指导下,本文设计了基于边缘特征的候选框提取算法用于实验测试,在现实项目使用过程中可借鉴。

基于边缘特征的候选框提取算法使用Canny算子提取图像中的边缘特征。首先通过高斯卷积对图像进行高斯平滑处理,再是对平滑处理后的图像按照Sobel滤波器进行微分操作,得到梯度图,然后利用非极大抑制排除非边缘像素,最后用滞后值查找图像边缘点,得到了图像的边缘特征。根据刘少华的论文,滞后阈值选取是提取边缘特征的关键,既要保证能够检测出重要信息,又能够抑制噪声的影响。之后,使用最小包围矩形获取轮廓,在此过程中,可用矩形宽高比、面积等信息对轮廓进行筛选。筛选后所得矩形轮廓即为提取获得的候选框。

4实验测试

4.1实验环境

本文遇到的现实场景数字检测任务场景为全国机器人大赛RoboMasters的能量机关系统,其中需要通过计算机视觉识别出九宫格屏幕中每一格内的手写体数字,传递给机器人进行目标打击。所用卷积神经网络结构为LeNet。分别在三段视频中使用SelectiveSearch算法与基于边缘特征的候选框提取算法进行候选框提取与内容识别。

4.2实验结果

在测试实验中,边缘检测算法准确提取出了所需要检测的九宫格。由表1,表2可知,在各段测试视频中,采用基于边缘特征的候选框提取算法提取候选框效率远远高于SelectiveSearch算法,且准确率符合要求。5结论

R-CNN无法直接用于现实检测任务,其检测每张图片花费时间较长,无法在实时检测任务中使用。本文提出改进思路:在现实场景数字检测任务中,检测目标自身具备一定图像特征,因此在R-CNN框架上设计了基于边缘特征的候选框提取算法进行候选框提取,代替通用性强的Selective Search算法。经过实验测试,可极大减少所提取候选框数量,从而使R-CNN方法能够现实运用于现实场景数字检测任务当中。

参考文献

[l]Trevor Darrell Ross Girshick, JeffDonahue. Rich feature hierarchiesfor accurate object detection andsegmentation[C]. In CVPR, pages 580-587, 2014.

[2]T. Gevers J. R.R.Uijlings,K.E.A.van de Sande. Selective search forobject recognition. InternationalJournal of Computer Vision,104 (2):154 -171, 201 3.

[3]P. Dollar B. Schiele J. Hosang, R.Benenson. What makes for effectivedetection proposals. In IEEETransactions on Pattern Analysis andMachine Intelligence, 2015.

猜你喜欢

候选框边缘卷积
重定位非极大值抑制算法
面向自然场景文本检测的改进NMS算法
基于3D-Winograd的快速卷积算法设计及FPGA实现
基于Soft-NMS的候选框去冗余加速器设计*
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
一种针对特定目标的提议算法
一种基于卷积神经网络的性别识别方法
在边缘寻找自我
走在边缘