一种基于SVM的真伪车牌分类算法
2016-07-07焦伟超郑伯川袁秀芳
焦伟超 ,郑伯川,袁秀芳
(西华师范大学 数学与信息学院,四川 南充 637009)
一种基于SVM的真伪车牌分类算法
焦伟超 ,郑伯川,袁秀芳
(西华师范大学数学与信息学院,四川 南充637009)
摘要:车牌定位算法往往会定位出一些伪车牌候选区域,为准确区分出车牌候选区域中的真伪车牌,提出了一种基于支持向量机(SVM)的真伪车牌分类算法。该算法首先提取出车牌候选区域图像的纹理特征和几何特征,构成特征向量集;然后根据特征向量训练SVM分类器;最后利用训练好的分类器来实现对真伪候选车牌区域图像进行分类判断,得到真车牌区域。实验表明,算法对车牌候选区域分类准确率高达99.3%,且具有较强的抗干扰能力和鲁棒性。
关键词:支持向量机; 车牌定位; 真伪车牌; 特征向量; 核函数
0引言
车牌识别系统(LicensePlateRecognition,LPR)是智能交通系统中的一项重要研究课题。车牌识别系统主要由3部分组成:车牌定位、字符分割、字符识别。车牌定位技术是将图像中的车牌区域准确的定位、提取出来,它是车牌识别系统的前提,也是字符分割和字符识别的先决条件。常见的车牌定位算法流程如图1所示:
目前常用的车牌定位方法主要有:基于颜色特征的方法[1-2]、基于纹理特征的方法[3-4]、基于边缘检测的方法[5]、基于神经网络的方法[6]、基于形态学的方法[7]、基于小波变换的方法[8]等。实验表明:当车牌和车身的颜色相近,背景图像比较复杂,存在与车牌区域相似纹理特征区域时,这些定位方法容易定位出那些干扰性较强的伪车牌区域。因此,辨别真伪车牌也成了车牌识别系统中的一项重要技术。
在车牌定位算法中常用到的辨别真伪车牌区域的方法有:主连通域分析和颜色特征判断[9]、二值图像中的连通区域分析[10]、基于部件信息的分析方法[11]、面积和宽高比等先验知识判断[12]、底色像素数占总像素数的比例[13]等。以上这些方法大部分都是通过单一的某种特征(如纹理特征、几何特征或颜色特征)来区分真车牌和伪车牌区域。由于在自然条件下拍摄车牌图像时环境比较复杂,车牌候选区域的特征很容易发生改变,若只根据单一的某种特征往往不能准确的对真伪车牌区域进行判断。为了较好的解决这一问题,本文提出了一种基于SVM的真伪车牌分类算法,它利用车牌图像的多种特征对车牌候选区域图像进行训练和分类,最终准确的分类出真伪车牌区域。实验证明:该算法不仅能快速地对候选区域图像进行分类而且还具有较高的准确度和较广的适用性。
1SVM的基本原理
支持向量机(SupportVectorMachines,SVM)是由Vapnik首先提出的一种基于统计学习理论的机器学习方法。它以结构风险最小化为准则,主要适用于有限样本情况下的模式识别问题。它的基本思想是在样本空间或特征空间建立一个分类超平面作为决策曲面,使得正例和反例之间的隔离边缘被最大化,从而达到最大的泛化能力。
SVM算法最初是为二值分类问题所提出的,本文采用较常见的二分类支持向量机C-SVC模型。它的算法描述如下:
1)已知训练集:T={(x1,y1),…,(xl,yl)}∈(X×Y)l。其中,yi∈Y={1,-1}(i=1,2,…,l);xi为特征向量。
2)选取适当的核函数K(x,x′)和惩罚参数C>0 。其中,核函数的种类有:
①线性核函数:K(x,xi)=x·xi;
②d阶多项式核函数:K(x,xi)=(x·xi+1)d;
④具有参数k和θ的Sigmoid核函数:K(x,xi)=tanh(k(x·xi)+θ)。
3)构造并求解最优化问题:
(1)
4)计算b*。选取位于开区间(0,C)中的α的一个正分量,并据此计算阈值:
(2)
5)构造决策函数:
(3)
2SVM分类算法的实现
2.1特征提取
特征向量的选择和提取非常关键,它将直接影响分类器的设计、性能和分类结果的准确性。为了能准确的辨别出真伪车牌区域,本文分别从候选区域图像的纹理特征和几何特征两方面提取出了3个特征向量:波谷个数、相邻波谷间距的离散程度、图像的宽高比。
2.1.1纹理特征
我国车牌是由水平且等间隔排列的7个字符组成,其灰度纹理在垂直方向的投影存在峰—谷—峰规律性的跳变,且相邻波谷的间距相差均匀。
1)波谷个数特征。本文提出了一种水平线分割方法来求候选区域图像的波谷个数,具体步骤如下:
步骤1:对候选区域图像(如图2(a)所示)进行二值化处理,得到候选区域图像的二值图像BP(如图2(b)所示);
步骤2:根据公式(5)计算二值图像BP的垂直投影图VP(如图2(c)所示)。
(4)
其中,W和H分别表示候选区域图像的宽度和高度。
(5)
最后根据公式(7)画出垂直投影图像的分割线(如图3所示)。
BP(H-h+1,j)=1,j=1,2,…,W
(6)
步骤4:确定波谷个数。图3中分割线被垂直投影所分割的线段数即为所求波谷个数。
2)相邻波谷间距的离散程度特征。首先根据图3找出所有波谷的位置V={V1,V2,…,Vn},然后计算出相邻波谷间距Vk′=△Vk=Vk+1-Vk(k=1,2,…,n-1)。
本文选取波谷间距Vk′的标准差
由图2可以看出:根据车牌区域的纹理特征可以较准确的区分出与真车牌区域和相似纹理特征的伪车牌区域。
2.1.2几何特征
表1 候选车牌区域的几何特征
表2 不同核函数的比较结果
车前的排气栅格与车牌区域等间距分布字符的灰度纹理特征极为相似,仅通过纹理特征很难对其进行准确的分类。
宽高比特征。我国的标准车牌具有固定的宽度和高度,且宽高比约为3.14。根据先验知识:若车牌的宽高比满足(2.5,3.5)[1],可以认为是真车牌区域。结合车牌候选区域图像的纹理特征和宽高比特征,可以较好地辨别出真车牌区域和排气栅格伪车牌区域。表1给出了一些真伪车牌区域几何特征的比较结果。
2.2参数的选取
不同的参数取值会得到不同的分类结果,为了得到较好的分类模型,选取不同参数进行实验并比较分类结果。实验选取了600张候选区域图像,其中500张进行SVM训练,余下的100张用于测试。
1)不同核函数取C=1时的比较结果如表2所示。
通过表2的比较结果可以看出:对于提取的车牌候选区域图像的特征向量,采用线性核函数作为核函数时,分类结果的准确率最高且耗时也较少。
2)参数C的选取
惩罚因子C影响支持向量偏离边缘的程度,通常C的值是根据测试经验给定。本文选取线性核函数,分别取C=1,C=10,C=100,C=1 000进行实验,将得到的支持向量总个数、分类准确率进行比较(如表3所示)。实验表明:随着C值的增大,TotalSV减少,当惩罚因子C=10时,分类准确率趋于稳定最大值。
表3 不同C值的分类结果
2.3实验步骤与结果
本文算法在CPU2.67GHz,2.00GBRAM的环境下使用LIBSVM软件工具[14]。实验选取600张车牌候选区域图像,其中500张进行SVM训练,100张用于测试。具体步骤如下:
1)提取出训练样本图像的3个特征向量:宽高比、波谷个数、相邻波谷的间距;
2)对特征向量进行归一化处理,处理后的特征向量集作为分类器的输入;
3)选取线性核函数作为核函数,惩罚因子C=10对特征向量集进行训练;
4)输入测试样本图像,根据步骤3得到分类决策函数对其进行分类。
实验结果表明:SVM分类算法不仅可以快速地对车牌候选区域进行分类,且分类准确率高达99.3%,鲁棒性较好。
3结论
本文针对辨别真伪车牌候选区域这一问题,提出了一种基于SVM的真伪车牌分类算法。通过提取出候选区域图像纹理特征和几何特征中3个能较好的区分真伪车牌的特征,构成特征向量集。再利用SVM分类器对向量集进行训练,最终建立分类模型。实验表明:本文使用的SVM分类算法能准确的区分出候选车牌图像中的真伪车牌图像且具有较高的准确率,避免了使用单一特征造成的错误分类,具有较好的应用价值。
参考文献:
[1]李莹,高满屯.基于边缘颜色信息的车牌定位算法[J].计算机仿真,2009,26(08):262-265.
[2]覃丕七,吴志红.基于边缘颜色点对分布特征的车牌定位算法[J].计算机应用,2010,30(12):3321-3324.
[3]刘广起,郑晓势,张晓波.基于图像纹理特征提取的车牌定位算法[J].中国图象图形学报,2005,10(11):1419-1422.
[4]万燕,徐勤燕,黄蒙蒙.复杂背景中基于纹理和颜色的车牌定位研究[J].计算机应用与软件,2013,30(10):259-262.
[5]王剑书,樊养余,张辰锐.基于左上边缘点检测的快速车牌定位算法[J].计算机仿真,2013,30(11):143-147.
[6]姚德宏.基于神经网络的汽车牌照提取研究[J].计算机应用,2001,21(06):40-41.
[7]廖春生.基于数学形态学车牌定位算法仿真研究[J].计算机仿真,2011,28(12):353-356.
[8]许礼武,许伦辉,黄艳国.基于小波分解的车牌定位算法[J].计算机工程,2006,32(21):191-193.
[9]朱春满,房斌,尚赵伟,等.复杂背景下的多车牌定位技术研究[J].公路交通科技,2010,27(07):147-153.
[10]万燕,徐勤燕,黄蒙蒙.复杂背景中基于纹理和颜色的车牌定位研究[J].计算机应用与软件,2013,30(10):259-262.
[11]王永杰,裴明涛,贾云得.多信息融合的快速车牌定位[J].中国图象图形学报,2014,19(03):471-475.
[12]王义兴,黄凤岗,韩金玉,等.基于颜色搭配与纹理特征的车牌定位方法[J].中国图象图形学报,2009,14(02):303-308.
[13]盛曦,吴炜,杨晓敏,等.一种基于Adaboost的车牌定位算法[J].四川大学学报(自然科学版),2007,53(03):535-539.
[14]CHANGCHIHCHUNG,LINCHIHJEN.LIBSVM:alibraryforsupportvectormachines[J].AcmTransactionsonInlell:gentsystemandTechnology,2011,2(3):1-2.sofewareava:lableathttp://www.csie.edu.tw/~cjlin/libsvm/.
AnAlgorithmBasedonSVMtoClassifyTrueorFalseLicensePlates
JIAOWeichao,ZHENGBochuan,YUANXiufang
(CollegeofMathematicandInformation,ChinaWestNormalUniversity,NanchongSichuan637009,China)
Abstract:The license plate location algorithm always locates some pseudo candidate regions of license plates.To distinguish the true or false license plates accurately from candidate regions of license plates,in this paper, we propose a classification algorithm that is based on support vector machine (SVM).Firstly,the algorithm extracts license plate image texture and geometrical features of candidate regions to form an eigenvector set.Next,it trains the SVM classifier.Finally,it classifies the license plates′ candidate regions via the well trained classifier.Experimental results show that the algorithm can classify the license plates′ candidate regions with accuracy up to 99.3%,and has a strong anti-interference ability and robustness.
Keywords:support vector machines;license plate location;true or false license plate;eigenvector;kernel function
文章编号:1673-5072(2016)02-0233-04
收稿日期:2015-09-11
基金项目:西华师范大学校级创新团队项目(XTC2014-4);四川省科技创新苗子工程培育项目(2016045)
作者简介:焦伟超(1991—),男,河南漯河人,硕士研究生,主要从事数字图像处理研究。 通讯作者:郑伯川(1974—),男,四川自贡人,教授,博士,主要从事数字图像处理、机器学习、人工神经网络研究。 E-mail:zhengbochuan@126.com
中图分类号:TP391.4
文献标志码:A
DOI:10.16246/j.issn.1673-5072.2016.02.022