TWSVMs在行人检测中的应用研究
2020-07-10李瑞帅
李瑞帅
摘 要:人体检测是计算机视觉与模式识别中一个重要的分支,在多个领域有着广阔的应用前景。引入一种双支持向量机TWSVMs,通过两个形如SVM的凸规则规划问题来构建两个非超平面,能将训练时间缩减,它具有SVM的优点,却对大规模数据具有更好的处理能力。
1.研究意义
人体检测是计算机视觉与模式识别中一个重要的分支,在智能监控、基于内容的图片和视频检索、视频标识、辅助驾驶、辅助生活、数字娱乐、高级人机交互、运动分析等领域有着广阔的应用前景。但是,因为人的姿态、衣着以及人所处的背景环境、光照强度等的千变万化,再加上观察者的视觉角度的不同,导致检测的环境非常的复杂,这对人体检测技术的研究者来说,是个不小的挑战。目前,人体识别主要有基于多模板匹配、基于边缘轮廓特征和基于运动特征等各种方法。然而,从实际效果来看, 目前最好的是 DALAL N 和TRIGGS B 提出的基于 HOG 特征的人体检测方法。 DALAL N 等人通过使用 16×16 大小的块在检测窗口中滑动,然后按一定方式统计块中的梯度向量直方图,将各个块的梯度向量直方图串联,组成特征向量。滑动窗口检测方法是使用一个滑动窗口,在图像的不同尺度上,从图像的左上角开始,逐列或者逐行地进行扫描,直到图像右下角的像素。通过这种扫描方式,来收集像边缘、片段、小波系数、颜色等特征,并把收集好的特征输入训练好的分类器进行分类判断。检测效果虽然理想,但耗时,难以达到实时性的要求。
2.國内外研究现状
人体检测与识别技术有着广阔的应用前景,也面临这一系列的挑战。作为计算机视觉与模式识别领域的一个非常重要的课题,近年来吸引了大批研究者的目光,也取得了长足的进步。在行人检测的领域内,国内外学者经过多年的研究,形成了几种比较流行的框架结果。可以把这些框架简单的划分为两类:第一类为基于视频中的运动信息的目标检测算法,例如背景减除,混合高斯模型(GMM),运动历史图像(MHI)等等。第二类为基于检测目标的特征,设计训练相应的分类器进行检测,例如利用纹理特征Haar、局部二值化模式特征进行检测,利用边缘特征梯度方向直方图(Histograme of Oriented Gradient,HOG,Edgelet等特征进行检测等。第一类算法主要利用图像帧差分的思想,构建运动前景图像,从而达到目标检测的目的。虽然该类算法比较单间,拥有很好的实时性,不过对于场景经常性变化、目标距离很近、目标间相互遮挡或者目标长时间没有显著运动的情况下,该算法的检测精度会下降的很大。第二类算法主要针对目标的表象、轮廓等选择响应的特征以及分类器进行训练,通过滑窗技术,把训练好的分类器应用于图像帧中检测用户感兴趣的目标。该类算法既可以应用的视频序列中,也可以应用于单帧图像,可以很好的解决目标距离很近或者目标长时间没有显著运动的情况下,目标无法检测的问题。但是因为该类算法采用的是分类器以及滑窗技术,检测无法达到实时的效果。
3.理论简介
支持向量机(SVM )作为神经网络的一个重要分支,与传统的机器学习方法相比,它具有全局优化、适应性强、理论完备、训练时间短、推厂性能好等优点,具有良好的潜在应用价值和发展前景。它可以在小样本空间中获得很好的推广能力,是一种优秀的学习方法。所以从理论上说将支持向量方法运用到图像分割中具有一定的优势。但由于运用SVM对样本分类时要解决二次规划的问题非常费时,为了避免训练时间过长的问题,引入一种孪生支持向量机TWSVMs(Twin Support Vector Machines),TWSVMs在形式上类似于传统的支持向量机不仅具有传统支持向量机的优点,而且对大规模数据具有更好的处理能力。TWSVMs为两个类各自得到一个分类平面属于每个类的数据尽量围绕在与之相对应的分类平面周围,然后TWSVMs通过优化一对分类平面来构建分类超平面。也就是说,TWSVMs需要解决一对QPP问题,而SVM则是解决一个QPP问题,从计算复杂度上来说其计算速度是传统支持向量机的4倍。
本文在对基于HOG特征的行人识别方法进行研究的基础上,为了提高检测的速度与性能,对分类器的选取、训练方法、结果融合等方面进行了研究。
4.总结
本文将双支持向量机法,应用到行人检测中,相对于传统算法其具有良好的推广能力,并速度较快。但由于双支持向量机理论的具体应用相对比较复杂,涉及的内容较多,本文的研究在很多方面还不够深入,有待于在今后的研究工作中继续改进和完善。