基于多特征提取和SVM参数优化的车型识别
2018-06-22程淑红燕山大学电气工程学院河北秦皇岛066004秦皇岛中信戴卡股份有限公司博士后工作站河北秦皇岛066004
程淑红, 高 许, 周 斌(. 燕山大学 电气工程学院, 河北 秦皇岛 066004;2. 秦皇岛中信戴卡股份有限公司 博士后工作站, 河北 秦皇岛 066004)
1 引 言
汽车在日常生活及交通运输中发挥着重要作用,而交通管理却面临着严重的挑战。因此,智能交通系统[1~4]这一集多种先进技术于一身的全方位、高效率的综合交通管理系统成为交通管理部门的最佳选择。而车型识别[5,6]是智能交通系统中一个拥有很好应用前景的技术。Rao Y B[7]设计了多摄像机视频监控系统;王瑞[8]增加了声频传感器用来采集声频数据。虽然数据采集方式的改进能够优化数据源,但是单一方面的优化并不能有效地提高车型识别率。基于此,研究人员不得不从其他方面入手来提高车型识别率。被检测车辆的特征提取是整个车型识别过程中的关键步骤,所以又有许多学者通过改进特征提取的方法来提高车型识别率: Wang T T[9]提取了颜色直方图特征作为特征量参与车型识别;而 Liu S M[10]使用蛇模型提取完整的轮廓曲线特征。改进后的特征提取量不再是长度、面积等基本特征量,而是能够更加灵活、有效地代表汽车形状的新型特征量。然而他们仅仅在特征提取方面做了改进,形式单一,并没有涉及到其它方面的优化,这样虽然能够使车型识别率提高一些,但并不能取得很好的结果。Priyadharshini R A[11]使用Gabor和Log-Gabor两种算法同时对车型识别进行对比试验,最终验证Log-Gabor能够更好地完成车型识别,取得较高的识别率; Zhu G Y则使用了支持向量机(support vector machines,SVM)并对其进行优化[12],提出ε临近分类支持向量机,使得每个类权重不均匀的问题得到解决。算法和分类器的优化大大的提高了车型识别率,但是仅仅对算法或分类器进行优化而没解决特征量单一化的问题是无法很好地完成车型识别的,其识别过程也会存在抗干扰能力差、不稳定等问题,无法更加有效地从复杂的环境中识别出车辆的类型。
本文提出了一种基于多特征提取和SVM参数优化的车型识别方法:首先提取了多类特征量并进行融合;然后用粒子群算法对SVM参数进行优化;最后,将融合后的检测结果与单一特征量的检测结果相对比来说明本方法的优越性、高效性和可行性。
2 识别方法原理
2.1 几何特征提取
几何特征是最先观察到的特征,本文选取了周长、面积和长宽比作为几何特征来对车辆进行识别[13]。周长特征是将车辆所在区域的轮廓像素点总数量作为特征量;面积特征是将车辆所在区域的像素点总数作为特征量;长宽比是指车辆所在区域的最小矩形的长和宽的比值:
(1)
式中:f(x1)和f(x2)分别是运动区域最右侧和最左侧像素点与对应行第0列像素点之间的距离;f(y1)和f(y2)分别是运动区域最下面和最上面像素点与对应列第0行像素点之间的距离。
2.2 纹理特征提取
纹理特征能够表现出图像表面或结构之间的差异,是一种比较稳定的特征[14]。本文利用统计灰度直方图的方式,选择了均值、标准偏差、熵、平滑度和一致性作为车辆的纹理特征,分别用式(2)~式(6)表示为:
(2)
(3)
(4)
(5)
(6)
式中:L为灰度级总数;zi为第i个灰度级;p(zi)为灰度为zi的概率值;m为均值;μ和σ分别为标准偏差和方差;e为熵;S为平滑度;U为一致性。
2.3 局部特征提取
局部特征也是描述图像信息的一种常用方法,常用来表示局部特征的算子主要有:Harris算子、SURF(speed up robust feature)算子和HOG[15]算子等。本文采用HOG算子进行局部特征提取。
HOG是由Dalal等提出的一种表述图像局部信息的方式,提取图像HOG的过程为:将一幅图像分割成很多个小的区域,计算每个小区域内各个像素点的梯度直方图(histogram of oriented gradient,HOG),得到每个小区域的梯度直方图,再把所有小区域进行组合,得到一幅完整图像的HOG特征。提取HOG特征的流程如图1所示。
图1 HOG特征提取过程
可以看出,提取HOG特征需要经过5个步骤:
1)彩色空间归一化。在实际应用中只对灰度图像进行归一化处理即可;
2)梯度计算。 计算灰度图像中每个像素点的梯度值并得到整个图像的梯度信息。假设一幅图像为f(x,y),对于图像上的任何一个像素点的梯度可以用式(7)表示为:
(7)
式中:Gx和Gy分别为图像上任意像素点的水平梯度和垂直梯度。则该点的梯度的大小和方向分别用式(8)和式(9)表示为:
|
(8)
(9)
3)统计梯度直方图。如图2所示,将含有车辆的窗口区域分成多个块区域(block),再将每个块区域分成4个较小的区域(cell),把每个cell再被分割成8×8的最小区域,并计算最小区域内每个像素的梯度。在0°~180°区间上平均分成9个方向区间,则得到的每个区间的大小为20°,然后将cell中的全部像素点的梯度方向累加到相对应的区间上,每个cell均可获得一个9维的特征向量,将相邻的4个cell看成一个块区域,则任意一个块区域可获得一个36特征向量;
4)归一化处理。对块区域的梯度直方图进行对比度归一化处理;
5)HOG特征向量。把经过归一化之后的各块的全部直方图连接组成一整幅图像的HOG特征。
3 实验结果与分析
3.1 样本选择
本文主要对视频图像中的小轿车、小货车和面包车进行识别,如图3所示。样本采集是在真实的交通场景中完成的,相机用三脚架固定在桥梁上,从道路的正上方进行连续拍摄;初始样本视频每帧图像大小为720像素×480像素,帧速为25帧/s;测试样本视频每帧图像大小为1 280像素×720像素,帧速为25帧/s;实验软件平台为Matlab 7.0运行平台。对视频图像进行特征参数提取得到车辆样本,其中小轿车、小货车、面包车图像分别为140幅、60幅、60幅,将这些图像作为样本集,测试样本集和训练样本集各占二分之一。
图3 车辆类型
3.2 样本图像处理
将采集的3种车型的样本图片经过灰度化、二值化、中值滤波和双边滤波去除图片噪声、边缘提取和形态学处理等处理过程可得到如图4所示的处理结果图。
图4 样本图像处理结果
图4(a)为小轿车、小货车和面包车的灰度图像;对分割出来的二值化图像图4(b)和边缘图像图4(c)进行几何特征提取,可以获得车辆的周长、面积、长宽比、紧密度、矩形度;对图4(d)前景车辆进行纹理特征和HOG特征提取,从而得到车辆的几何特征、纹理特征和HOG特征参数,用于后期识别检测。
3.3 支持向量机参数优化
对于非线性的样本,支持向量机[16]可以实现将非线性样本转换到一个新的特征空间,在此空间可以将非线性样本转换为线性可分的样本。一般情况下,通过引入一个非线性变换函数K(xi,xj)来将非线性问题转换为线性问题进行处理,K(xi,xj)可以是核函数。
分类判别函数中只包含输入样本和支持向量的内积运算,所以,在特征空间进行内积运算就可以得到分类结果,即最优分类函数的输出。对于非线性的情况,可以选择合适的内积函数将样本映射到一个特征空间,再按照线性情况的方法进行求解,常用来表示内积函数的核函数有线性核函数、多项式核函数、径向基核函数和Sigmoid核函数,其表达式分别见式(10)~式(13)。有:
K(xi,xj)=xi·xj
(10)
K(xi,xj)=(xi·xj+c)d
(11)
(12)
K(xi,xj)=tanh(a
(13)
式中:xi,xj为2种点集或者两类训练样本;c为常数;d为正整数;σ为控制核函数高宽; <>代表内积运算;a为一个标量;r为位移参数。式(13)中,当a和r分别取不同值时,Sigmoid核函数有着不同的性质[17]。
支持向量机模型的好坏与惩罚因子、选择的核函数以及选择的核参数的大小有关,所以选择一个正确的核函数是至关重要的。本文选择了径向基核函数,因为与其它3种核函数相比较而言,线性核函数只是径向基核函数的一种特殊情况,适应范围比较小;多项式和Sigmoid核函数需要设置的参数比较多,使用起来比较繁杂且耗时较长;径向基核函数既能很好地服务于支持向量机,又只需要设置一个参数,简单实用且时效性好。
为了获得较高的分类准确率,除了选择合适的内积函数之外还需要对其核参数g和惩罚因子C进行优化,本文分别选用网格搜索法、遗传算法和粒子群算法对支持向量机的核参数g和惩罚因子C进行优化,结果如表1所示。
表1 SVM最优参数
运用表1中的最优参数优化支持向量机,并对样本进行分类识别,其样本分类准确率如表2 所示。对比3种方法得到的结果可知,采用粒子群算法识别准确率最高,而且网格搜索法需要遍历所有数据,当数据过多时,使用网格搜索法耗时太长,所以,本文选择粒子群算法对参数进行优化。
表2 样本分类准确率 (%)
3.4 试验验证
针对采集样本,分别提取车辆的单一特征及组合特征利用优化SVM进行车型识别,其识别准确率如表3所示。从表中的识别准确率对比可知,组合特征识别率高于单一特征的识别率,但是几何组合与纹理组合的车型识别率也并不理想。为了获得更高效准确的识别方法,在上述的组合特征中加入了HOG特征构建多特征组合矢量矩阵,其中各个特征的权重都相等,其识别准确率如表4所示。
表3 纹理及几何特征识别准确率 (%)
表4 多特征组合识别准确率 (%)
由表3和表4可知,利用几何、纹理和HOG特征组合能够更全面地描述车辆外在的信息,提高了车型识别准确率。为了进一步验证本文提出方法的优越性、高效性和可行性,使用相同的方法再次采集一组车辆样本测试数据进行实际分类和预测实验,其中利用粒子群算法对SVM参数进行优化后可得C=1.196 9,g=5.987 69。测试样本的实际分类和预测分类图如图5所示。
图5 测试样本的实际分类和预测分类
图5中给出了小货车、面包车和小轿车的预测和实际2种测试集分类图形。2种图形重合率越高,说明预测准确率越高。所以对图5进行数据统计可得到测试样本整体的识别结果,如表5所示。由表5和图5可以看出车型识别的准确率,其中小轿车的识别效果最好,小货车的识别效果最差。除此之外,3种车型总体的识别准确率为90.769 2%,比初始样本(表2)的准确率还要高出0.1%。
表5 测试样本识别结果
4 结 论
本文主要进行了基于视频图像的车辆检测和车型识别问题的研究,提出了一种基于多特征提取和SVM参数优化的车型识别方法。实验结果表明:1)单一种类的组合特征的识别准确率明显高于单一特征的识别准确率;2)多种类的组合特征的识别准确率高于单一种类的组合特征的识别准确率;3)与其他几种SVM参数优化算法相比,粒子群优化算法能够取得更好的效果。本文也有需要改进之处。比如:只考虑白天环境下的车辆检测而未考虑夜晚的情况;没有考虑两辆车相互遮挡时的情况;识别准确率没能达到100%。这些问题将在进一步的研究中得到解决。
[参考文献]
[1] 刘昕, 王殿海, 王新颖, 等. 基于IPv6的智能交通信息采集与处理方法[J]. 吉林大学学报(工学版), 2010, 40(5):1226-1229.
[2] Qin Y, Yuan B J, Pi S. Research on framework and key technologies of urban rail intelligent transportation system [C]//Proceedings of the 2015 International Conference on Electrical and Information Technologies for Rail Transportation (2nd). Zhuzhou:Springer Berlin Heidelberg, 2016:729-736.
[3] Ludanek H. Ludanek on ICT and intelligent transportation systems[J].EricssonReview, 2016, 93(1): 30-39.
[4] Moral-Munoz J A, Cobo M J, Chiclana F,etal. Analyzing Highly Cited Papers in Intelligent Transportation Systems[J].IEEETransactionsonIntelligentTransportationSystems, 2016, 17(4):993-1001.
[5] Zhao J, Liu Z J. Research on Vehicle Type Recognition based on Data surveying[J].ScienceandTechnology, 2016, 9(2):319-330.
[6] Wang Y, Zhou J L. Vehicle type recognition in WSN based on ITESP algorithm[C]//10th IEEE International Conference on Ubiquitous Intelligence and Computing (UIC 2013) and 10th IEEE International Conference on Autonomic and Trusted Computing (ATC 2013).Vietrisul Mare, Italy, 2013:668-671.
[7] Rao Y B. Automatic vehicle recognition in multiple cameras for video surveillance[J].VisualComputer,2015, 31(3):271-280.
[8] 王瑞, 王康晏, 冯玉田, 等. 复杂场景下声频传感器网络核稀疏表示车辆识别[J]. 西安电子科技大学学报(自然科学版), 2015, 42(4):115-120.
[9] Wang T T, Xiu C B, Cheng Y. Vehicle Recognition Based on Saliency Detection and Color Histogram[C]//27th Chinese Control and Decision Conference (CCDC 2015), Qingdao, 2015.
[10] Liu S M, Huang Y P, Zhang R J. On-Road Vehicle Recognition Using the Symmetry Property and Snake Models[J].InternationalJournalofAdvancedRoboticSystems,2013,10:1-9.
[11] PriyadharshiniR A, Arivazhagan S, Sangeetha L. Vehicle Recognition based on Gabor and Log-Gabor Transforms[C]//2014 IEEE International Conference on Advanced Communication, Control and Computing Technologies(ICACCCT 2014). Tamil Nadu, India, 2015.
[12] Zhu G Y, Huang D, Zhang P,etal. E-Proximal support vector machine for binary classification and its application in vehicle recognition[J].Neurocomputing, 2015, 161: 260-266.
[13] 王恒奎, 边耐欣, 王文, 等. 基于Trimmed NURBS 曲面几何特征的数字化自适应采样[J]. 计量学报, 2002, 23(4):272-275.
[14] 王崇文, 李见为, 林国清. 一种新的复合指纹匹配法[J]. 计量学报, 2004, 25(1):77-80.
[15] Li B, Huo G. Face recognition using locality sensitive histograms of oriented gradients[J].Optics,2016, 127(6):3489-3494.
[16] 孟宗,季艳,谷伟明, 等. 基于支持向量机和窗函数的DEMD端点效应抑制方法[J]. 计量学报, 2016, 37(2):180-184.
[17] 刘明. 支持向量机中Sigmoid核函数的研究[D]. 西安:西安电子科技大学,2009.