特征级联在车辆检测中的应用与研究
2016-11-17郭克友王艺伟郭晓丽
郭克友,王艺伟,郭晓丽
(北京工商大学 材料与机械工程学院,北京 100048)
特征级联在车辆检测中的应用与研究
郭克友,王艺伟,郭晓丽
(北京工商大学 材料与机械工程学院,北京 100048)
对现有的采用机器学习算法检测车辆进行研究,分析其存在的不足;表现在特征或者算法单一,对光照等条件变化鲁棒性不够;针对这些问题,提出一种融合LBP特征与HOG特征,并结合Adaboost与SVM的车辆检测算法;借鉴级联的思想,首先采用AdaBoost对训练样本提取LBP特征进行训练,得到的分类器用于初步筛选并将其分类结果作为下一层分类器的输入;然后采用SVM算法对训练样本提取HOG特征进行训练,得到的分类器用于二次筛选上一层分类器的分类结果;实验结果证明Adaboost-SVM相结合的办法检测结果精度高,准确率和召回率均达到95%以上,FPPW与FPPI的值均在5%左右;同时由于算法采用的特征对光照条件具有较强的鲁棒性,因此光照条件的变化对算法的识别结果影响较低;实时性方面,每帧图像的处理时间为75 ms,满足实时性要求。
LBP;HOG;AdaBoost;SVM;级联
0 引言
车辆检测作为安全驾驶的一个重要方面,在智能交通中扮演着重要的角色。能够准确的实时的对视频序列中的车辆进行稳定的检测,同时也是车辆防碰撞系统的基础部分。
车辆检测按照背景可以划分为静态背景下的车辆检测和动态背景下的车辆检测。其中这两种类型下如何能够在复杂的背景中分割出车辆部分成为了检测过程中最核心的部分。从静态背景中分割出运动的物体常用的方法有背景差分[1],通过将每一帧图像减去背景,可以很好的分割出运动的车辆,但是由于光照或者天气的变化,背景并不是一成不变的,因此背景也需要根据这些条件进行更新。对于从动态场景中分割出车辆,常用的办法有帧间差分和光流法。帧间差分[2]对背景的变换有很好的适应性,但是差分后的结果中不仅有车辆信息,同时还会存在一些其他的噪声,而且如果两帧图像之间的差别不是很大的话,差分时车辆的信息也会有一定的损失。光流法[3]能够在摄像机运动的前提下检测出运动场景中的车辆,但是光流法计算量大,同时如果视频序列中同样有其他运动的物体,会对车辆的分割造成干扰。
除了上述提出的方法,采用机器学习的手段对目标物体进行识别同样成为了研究热点。机器学习对目标物体进行识别,通常需要对目标物体提取有效的特征,进行恰当的训练得到合适的分类器对未知样本中的目标物体进行准确的识别。其中,文献《基于最小二乘支持向量机的车型识别算法的研究》中提取了曲线宽度、最大值、波峰数量、最小波谷值和波谷比组成车型识别模型的特征输入向量,采用最小二乘支持向量机训练分类器进行车辆的检测。《一种改进的基于视频的车辆检测与识别方法中》以及《融合多特征的路面车辆检测方法》通过对车辆的阴影区域、边缘分析以及对称性进行分析,但是这些特征极易受到光照的影响,因此检测结果无疑对光照的鲁棒性不高。
上述方法中,或者是采用了单一的特征[4],或者是采用了单一的训练手段[5],采用多特征多种训练手段[6-7]时,又会因为特征的选择不恰当,使得检测结果准确度不高。本文提出一种基于多特征多训练手段组合的方法进行车辆检测的方法。借鉴级联的思想,首先提取车辆的LBP特征,采用Adaboost算法对视频序列中的车辆进行前期检测,得到初步的检测结果。然后将LBP分类器得到的初步的结果作为HOG分类器的输入,进行二级检测。HOG分类器的训练采用支持向量机。实验结果表明,本文提出的方法检测结果相对于提取单一特征或者采用单一训练方法均有很大的提升,并且对光照条件有较强的鲁棒性。
1 LBP特征和HOG特征
1.1 LBP特征
LBP特征主要是将每个中心像素的灰度值于其邻域像素的灰度值进行比较,如果邻域像素的灰度值小于中心像素的灰度值,那么将其位置标记为1,反之标记为0。经过这样的处理之后,每个中心像素都会在其邻域内对应一个二进制的编码。该二进制编码即为LBP特征,LBP特征在提出之后进行了很多的改进,本文采用的是LBP等价模式。等价模式的提出,在不影响识别精度的前提下大大降低了LBP特征的维数,同时也减少了高频噪声带来的影响。
1.2 HOG特征
HOG特征的提出主要是用于行人检测。HOG特征通过将图像细分为block,cell,bin单元,统计单元内的梯度直方图,然后逆向整合这些直方图组成整幅图像的直方图作为该图像的特征。HOG特征由于在图像局部进行处理,因此相对于全局处理的特征,HOG特征对于图像在几何或者光学上的变化都有很好的不变形。但是由于HOG特征的维数较大,因此HOG特征分类器用于筛选LBP分类器筛选之后结果。
2 Adaboost算法和SVM算法
本文首先采用由Adaboost算法训练的LBP特征分类器进行初步的筛选。Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的弱分类器(弱分类器是指分类准确度在50%以上的分类器),同时计算每一个弱分类器的权重。最终的强分类器即为这些弱分类器的加权和[8]。Adaboost算法的原理决定了其不用进行特征筛选,无过拟合的现象,同时一定情况下,训练样本数量越多,其得到的分类器效果越好,因此本文将由Adaboost算法训练得到的LBP分类器[9]作为第一层筛选机制。
SVM解决非线性可分问题的方法是将低维输入特征向量非线性映射到一个高维特征向量空间中,从而将低维线性不可分问题转化成高维线性可分问题。SVM 是一种有效解决了小样本识别问题的分类器,在较少样本情况下仍能获得较高精度、较强的泛化能力,特别适合解决过程异常模式识别问题。因此本文将SVM训练的HOG分类器[10-11],并将其作为第二层筛选机制,用于识别LBP分类器筛选后的结果。
3 训练参数分析
分类器训练过程中正负样本的比例合适与否直接决定了分类器最终的检测结果,因此合适的正负样本比例是本文研究的首要因素。相对于Adaboost算法,SVM算法能够更有效的解决小样本识别问题。因为本文采用10 000张左右的正负样本训练LBP分类器,6 000张左右正负样本训练HOG特征分类器。
3.1 LBP分类器训练参数分析
训练LBP分类器时,正负样本的比例及具体数目如表1所示。
表1 正负样本比例及数量
通过对不同比例的样本进行训练,检测结果显示,对于由adaboost训练的LBP分类器,在一定的范围内,当负样本的数量增多时,每帧图像的检测时间呈下降趋势,同时检测结果中误检的数量随着负样本数量的增多在逐步减少,但是当负样本于正样本比例大于1时,会出现一定的漏检情况。图1是本文研究的5种比例的时间消耗情况,处理的图像为480×240。
图1 样本比例与处理时间关系图
研究过程中样本数量相对较大,同时城市道路交通中车尾变化情况相对简单,主要集中于家用轿车、公交等车型,因此5种比例下检测结果的TPR(检测精度)值基本为1。
(1)
其中:TP表示被模型预测为正的正样本,FN值为被模型预测为负的正样本。TRP值为1的原因为对于每种比例的分类器FN值基本为0,即所有分类器都能够正确的检测到正样本。
同时针对5种比例分别统计了每种比例1000帧图像中漏检数量和误检数量。
从图2中可得,当比例为1/1时漏检数量与误检数量均较低,因此本文选择比例为1/1的LBP分类器作为第一筛选机制。
图2 漏检误检数量图
3.2 HOG分类器训练参数介绍
HOG分类器的训练采用的是SVM算法,由于SVM算法是针对小样本进行训练,在实验室已有研究基础上,本文选择正负样本总数为6 000张左右同时比例为1:1进行HOG分类器的训练。
4 实验结果分析
4.1 实验视频
本文分别选用了晴天,雨天,过桥洞,阴天4种不同的天气状况进行检测。实验结果证明,本文提出的方法对这几种光照条件有很好的鲁棒性。图3为检测结果。
图3 检测结果示意图
4.2 样本检测精度分析
对于正样本的识别结果,采用F1-measure进行结果分析,其中F1值[12]的计算如公式(1)所示。
(2)
(3)
(4)
其中:TP值是指被模型预测为正的正样本的数量;FP是指被模型预测为为正的负样本;TN是指被模型预测为负的负样本数量,FN是指被模型预测为负的正样本[13]。在本文选用的3 208帧图像作为预测结果分析,具体数量如表2所示。
表2 样本检测结果
由公式(1)(2)(3)可得,各个指标的值如表3所示。
表3 正样本准确度
同时,对于误检结果,采用FPPW与FPPI两个指标进行分析。FPPW (False Positive per Window)是指给定一定数目N的负样本图像,分类器将负样本判定为“正”的次数FP,其比率FP/N即为FPPW。由表(3)可得FPPW的值为5.3%。
(5)
FPPI (False Positive per Image) 的计算方法为在每张图像上运行分类器,检测目标并得到位置p。然后,检查每张图像内的检测结果是否“击中”标定的目标:
1)若图像内无目标,而分类器给出了n个“目标”检测结果,那么False Positive 次数 +n;
2)若图像内有目标,则判断p是否击中L,若判断未击中,
则False Positive 次数 +1。
最后:
(6)
表4 正样本准确度
5 结论
本文采用两种特征,针对两种特征分别选用两种不同的训练手段训练分类器。处理的每帧图像大小为480×240大小,计算机硬件为内存3 G,主频为2.83 GHz,每帧图像处理时间为7 5 ms左右。实验结果显示,本文提出的方法对光照有较强的鲁棒性,同时检测结果的精确度和召回率均达到95%。但由于硬件条件的限制,当前方车辆相距较远时,车尾特征不清晰,因此无法正确检测出远距离的车辆,有待进一步研究。
[1] 卢章平,孔德飞,李小蕾,等. 背景差分与三帧差分结合的运动目标检测算法[J]. 计算机测量与控制,2013(12):3315-3318.
[2] 刘 鑫,刘 辉,强振平,等. 混合高斯模型和帧间差分相融合的自适应背景模型[J]. 中国图象图形学报,2008(4):729-734.
[3] 刘 洁. 基于光流法的运动目标检测和跟踪算法研究[D].徐州:中国矿业大学,2015.
[4] 杨先凤,杨 燕. 一种基于HOG-LBP的高效车辆检测方法[J]. 计算机工程,2014(9):210-214.
[5] 李文勇,陶汉卿. 基于最小二乘支持向量机的车型识别算法研究[J]. 公路交通科技,2010(1):101-105.
[6] 魏 武,龚树锋,龚树超. 一种改进的基于视频的车辆检测与识别方法[J]. 计算机测量与控制,2010,01:20-22.
[7] 沈 峘,李舜酩,柏方超,等. 融合多种特征的路面车辆检测方法[J]. 光电子.激光,2010(1):74-77.
[8] 曹 莹,苗启广,刘家辰,等. AdaBoost算法研究进展与展望[J]. 自动化学报,2013(6):745-758.
[9] 叶剑华,刘正光. 基于局部二值模式和级联AdaBoost的多模态人脸识别[J]. 计算机应用,2008(11):2853-2855.
[10] 马蓓蓓. 基于HOG特征的车辆检测技术研究[D].广州:华南理工大学,2015.
[11] 徐 渊,许晓亮,李才年,等. 结合SVM分类器与HOG特征提取的行人检测[J]. 计算机工程,2016(1):56-60.
[12] 黄 浩,徐海华,王羡慧,等. 自动发音错误检测中基于最大化F1值准则的区分性特征补偿训练算法[J]. 电子学报,2015(7):1294-1299.
[13] 袁 文. 基于稀疏表示的行人检测方法研究[D].南京:南京理工大学,2015.
Application and Research of Feature-Cascade in Vehicle Detection
Guo Keyou, Wang Yiwei, Guo Xiaoli
(School of Material Science and Mechanical Engineering, Beijing Technology and Business University, Beijing 100048, China)
Do researches on the existing machine learning algorithms of vehicles detecting and analyze the disadvantages, which lie in using single feature or single ML algorithms, or not robust enough of illumination and other condition changes. For these problems, a vehicle detecting algorithm is presented based on fusion of LBP and HOG features and combining the Adaboost and SVM. Referencing cascade thought, the algorithm first extracts LBP features of training samples by AdaBoost and the classifier is used for initial classification. Classification results act as the inputs of next classifier. Then HOG features of training samples are extracted by SVM and the resulting classifier is applied to classify the above results. Experiments show that AdaBoost-SVM method accuracy rate and recall rate both are above 95% and the value FPPW of FPPI are about 5%. At the same time the proposed method is robust to lighting conditions because of the selected features. In the aspects of real-time, each frame processing time is 75ms which meets the real-time requirements.
LBP; HOG; AdaBoost; SVM; cascade
2016-06-14;
2016-07-18。
交通运输部信息化科技项目(No.2012-364-835-110)。
郭克友(1975-), 男, 黑龙江人, 博士后, 副教授, 硕士生导师,主要从事汽车安全驾驶方向的研究。
1671-4598(2016)09-0080-03
10.16526/j.cnki.11-4762/tp.2016.09.022
TP311.1
A