视频中行人检测研究方法综述
2017-12-28李锦明裴禹豪扆泽江
李锦明 曲 毅 裴禹豪 扆泽江
1.武警工程大学研究生管理大队,陕西 西安 710086
2.武警工程大学信息工程系,陕西 西安 710086
视频中行人检测研究方法综述
李锦明1曲 毅2裴禹豪1扆泽江1
1.武警工程大学研究生管理大队,陕西 西安 710086
2.武警工程大学信息工程系,陕西 西安 710086
行人检测是计算机视觉研究的热门之一,其在智能监控、虚拟现实等方面都能得到较好的应用,具有较好的应用前景。从行人检测核心——目标分类方面对其进行了论述,分析了目前常用方法的优缺点,并对现今的研究难点以及未来的研究方向进行了详细的论述。
行人检测;智能监控;运动检测;目标分类
引言
在过去的几年里,计算机视觉方面的研究获得了大量的关注[1]。其可以应用在很多方面,如智能视频监控、交互式游戏、虚拟现实[2]等等。在进行各种人体行为检测之前,应将我们所需要的人体通过自动进行的算法从视频或图像中分离出来。本文结合现今的主要行人检测方法,综述运动检测后的目标分类,并对行人检测方法的未来进行展望。
1 目标分类方法
在我们需要处理的视频中,一方面,除了行人以外还有其他运动的目标在处理的区域,他们之间的运动可能有一定的相关性,比如有人在遛狗,然而也有可能没有一点相关性;另一方面,不仅有在运动的行人,而且有静止的行人,比如两个在交谈的行人以及在路边打电话的行人。这两个方面的情况对我们的运动检测造成了极大的困难。基于这种需求,目标方法应运而生。目前常用的目标分类方法如下:
1.1 基于外部轮廓的目标分类方法
行人与其他物体直观上的区别就是外部轮廓的不同,因而可以通过筛选匹配外部轮廓来进行目标分类。这种方法适用于静止的行人,也适用于动态的行人,因而被普遍应用[3]。这种方法可分为基于整个人体的和基于人体部位的目标分类。
基于整个人体的目标分类可以通过训练好的外部轮廓模板与我们所需要检测的视频帧中的运动区域进行匹配拟合,并选用特定的误差函数与设定的阈值进行筛选判断,比如说用Hausdorff距离[4]来计算选定的运动窗口与我们的模板之间的误差并与阈值进行比对来判断最终是不是行人;或者直接利用人体外形的轮廓来进行辨别,不过不同的是这个模板是具有可以根据运动目标的刚性与非刚性特点进行调整的一个代价函数[5]。
而基于人体部位进行的目标分类则是通过在一个视频帧中分别检测头、腿以及双手这4个人体的一部分,因而需要4个不同的部位检测器[6]。显然这种检测算法要比整体的检测效果要好,也能较好地处理有部分被阻挡的行人,不过这种方法计算量比较大,平均一个普通720×480的视频帧就得需要用20分钟[7],因而要实现实时检测的话,需要较高的硬件要求。
1.2 基于运动特性的目标分类方法
行人在运动时是具有一定的规律以及周期性的,视频中连续的帧更能方便我们进行运动的分析判断,因而可以根据这种人体运动的特性来进行分类[8]。
比如可以通过行人腿部前后交替的特点来进行目标分类,也可以对运动对象进行跟踪识别,计算对象在帧与帧之间的相关性,并利用其周期性来判断是否是行人,还可以对人体的运动轨迹进行建模,只有符合运动轨迹的才是行人。但这种方法只对行走中的人有较好的识别,对于静止不动的则比较难判断出来。
1.3 基于人体特征的目标分类方法
基于人体特征的目标分类方法是用得最广泛的目标分类方法,因为其较其他方法准确度更好、速度更快,因而引起了广泛的关注。
一般地,基于特征的方法都要进行训练样本特征的提取、学习以及判断匹配,而用什么特征并通过什么来学习就是这类方法之间最主要的区别。目前用得比较多的学习方法是机器学习,有支持向量机(SVM)、多弱分类器集成(AdaBoost)、随机森林以及神经网络等;检测分类效果较好的人体特征则有方向梯度直方图特征HOG(Histogram of Oriented Gradient)、Haar-like特征、描述人体各个部位的Edgelet特征以及综合各种特征取得更好效果的方法。它们能从训练样本中学习各种人体特征,从而进行分析判断是否为行人。
2 总结以及研究展望
本文对视频中的行人检测里面的目标分类进行了综述,并进行了优缺点的分析与比较。如今的检测技术不管在可靠性还是有效性方面都有显著提高,不过距离实用性还是有不少差距。因而今后的行人检测可以从以下几个方向研究:进行多特征融合的行人检测,有效地综合利用各种特征的优势[3];提高雨天、雪天等特殊天气下的行人检测的可靠性,可设计针对特殊环境的检测算法,自适应地调整选用合适的算法;通过多视角的视频监控或者提取更加深度的特征来解决行人被部分遮挡的问题。
总之,行人检测是当今机器学习、图像识别、计算机视觉非常重要的研究领域,对于实际的应用也有很好的前景。因而,这对于真实环境条件下行人检测问题的有效解决具有重大的理论意义。
[1]Ogale N A. A survey of techniques for human detection[J]. Master’s of Science Degree in Computer Science of the University of,2008.
[2]Gavrila D M. The Visual Analysis of Human Movement:A Survey[J]. Computer Vision & Image Understanding,1999,73(1):82-98.
[3]Varga D,Szirányi T. Robust real-time pedestrian detection in surveillance videos[J].Journal of Ambient Intelligence & Humanized Computing,2017,8(1):79-85.
[4]Felzenszwalb P F. Learning models for object recognition:Computer Vision and Pattern Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer Society Conference on, 2001[C].
[5]Gavrila D M, Giebel J. Shape-based pedestrian detection and tracking: Intelligent Vehicle Symposium,2002[C].
[6]Zhang S,Bauckhage C, Cremers A B. Informed Haar-Like Features Improve Pedestrian Detection:IEEE Conference on Computer Vision and Pattern Recognition,2014[C].
[7]Wu B,Nevatia R. Detection of multiple,partially occluded humans in a single image by Bayesian combination of edgelet part detectors:Tenth IEEE Intern mputer Vision,2005[C].
[8]Wu S,Laganière R,Payeur P. Improving pedestrian detection with selective gradient self-similarity feature[J]. Pattern Recognition,2015,48(8):2364-2376.
A Survey of the Methods in Pedestrians Detection in Video
Li Jinming1Qu Yi2Pei Yuhao1Yi Zejiang1
1. Graduate Management Team, CAPF of Engineering University, Shaanxi Xi’an 710086
2. Department of information engineering, CAPF of Engineering University, Shaanxi Xi’an 710086
Pedestrian detection is an active area in the research of computer vision. This strong interest can be driven by a wide of promising application in many areas such as virtual reality, smart surveillance and so on. This paper emphasizes on one major issue, the moving object classification and then discussed the pros and cons of different approaches. Finally,the paper gives the future work of the pedestrian detection.
pedestrian detection; smart surveillance; sport detection; object classification
TP391.41
A
1009-6434(2017)7-0119-02