APP下载

基于Adaboost和SIFT—SVM的两阶段车牌检测

2015-10-09孙艳梅

科技资讯 2015年19期

孙艳梅

摘 要:车牌识别技术是智能交通系统中研究的重要课题之一,车牌检测是整个车牌识别系统至关重要的一步,决定着最终的识别率。该文主要研究了车牌检测技术,应用了一种分两阶段的方法来检测现实生活中的车牌图像。车牌检测(LPD)过程中,可能牌照的字符区域的初始集合,首先由第一级分类器分离,然后传递到第二级分类器来排除非字符区域。36个Adaboost分类器作为第一阶段分类。在第二阶段,从训练子窗口得到的SIFT特征描述符训练了SVM。结果得到了可观的准确率和召回率。

关键词:车牌检测 SIFTSVM Adaboost算法

中图分类号:TP39 文献标识码:A 文章编号:1672-3791(2015)07(a)-0014-02

随着我国经济的日益发展和现代化进程的推进,机动车投放量的迅速增长已经给车辆管理带来考验。通过高新技术来改进交通管理系统及运输系统才能从根本上改善道路的管理质量和通行状况。车牌是机动车唯一可靠的标识,车牌识别已经在高速公路的收费管理控制、道路车辆检查监控等场合得到广泛的应用。高效率的车牌识别系统可以有效改善路网的通行状况和服务质量并且降低人力的使用,它已经成为现代智能交通系统的重要组成部分。

车牌识别系统一般包括车牌检测和车牌字符的识别两大部分,车牌检测(LPD)是在任何自动车辆核查系统的重要一步。它是用来车牌识别之前搜索图像的车牌区域部分。如果没有检测到车牌区域或检测错误,车牌识别就不可能成功。

1 系统架构

车牌检测包括两个阶段,Adaboost组合分类器和SVM过滤器。最初,该研究者将灰度图像通过Adaboost组合分类进行字符检测。之后,得到一些检测窗口,传递到第二阶段的SVM过滤器除去所有非字符区域。最后,将得到过滤虚假图像后的最终结果。

2 算法

2.1 Adaboost字符检测

字符检测器多尺度和多位置横穿图像检测窗口。检测窗口被缩放为1.2,20×28(宽×高)的最小尺寸。该功能可通过当前尺度因子缩放基本窗口功能很容易确定,这种操作可以在相同成本的任何尺度来完成。最终检测输出包含每个车牌周围的多个车牌字符,因为LPD对检测到的小规模变化是不敏感的。对于检测到的所有的非车牌字符可以归类为假阳性。在系统中,扫描图像的每一个过程中,会获得一些假阳性;为了减少这样的假阳性,该研究者随后采用SVM去除假阳性。

2.2 SIFT- SVM去除误报

SIFT是一个位置直方图为基础的特征点,是不随图像缩放,旋转,仿射畸变,3D视图,噪音的变化和光照变化而改变。SIFT已经被证明是优秀的图像匹配。最近的研究表明,它也有利于物体识别。候选关键点高斯由差分与尺度空间图像卷积里检测局部极值确定。这些关键点通常包含进行匹配的独特信息。本文采用SVM作为分类器,由LIBSVM库提供。SVM是解决二元分类问题的线性感知。一些监督学习算法通常适用于找到一个最佳的N维超平面。使用SVM在第二阶段的目的是去除由第一阶段Adaboost算法分类器被错误地认为是字符的区域。使用SIFT与SVM去除误报,一组关键点从集合中的所有阴性样品获得,SVM训练所有关键点128 SIFT描述符。检测期间,从一个特定的子窗口得到SIFT特征,每个SIFT特征被传递到一个SVM训练器,得到它是一个字符区域的概率大小。最终计算子窗口概率由对每个关键点的概率求和,最终概率除以由子窗口关键点数。如果非字符区的概率高于它是字符区的概率,则去除。偏置值用来使其更容易得到正输出或负输出。如下,其中Prob(char)指它是字符区域的概率,Prob(nchar)指它是非字符区域概率:

(1)

3 结果和讨论

在该文中,该研究者采用径向基函数(RBF)作为支持向量机的核函数。在使用RBF内核时,需要确定两个参数:C和γ。在第一个实验中,模型选择被执行以搜索最佳C和γ通过使用交叉验证操作的网格搜索。最好的结果是观察到当C是32和γ为0.5的地方的交叉验证精度为88%的训练数据集上。

在第二个实验中,通过对从SIFT正常化特征值缩放的SVM的输入范围测试。从实验用不同的量程范围,比较训练有素的最好的C和γ参数SVM的命中率,和训练有素的默认值的SVM。

在第三个实验中,不同的比例因子进行测试及对查全率和精确率效应指出。本的比例因子用于在Adaboost算法人物检测调整大小检测窗口。

第四实验是找到最佳的偏置指的是式(1)中,对偏置-0.5直到0.4测试。其结果是随着0的偏差值,我们能够获得最佳的查全率和查准率。

从观察发现,文字比20x28小未能通过第一阶段检测器检测,因为训练样本具有20x28的最小分辨率。并且,由于36分类器在第一阶段检测器使用时,检测速度不够快(约5秒)。另外,由于扫描子窗口的比例是固定的,也有可能在与那太窄或太宽字符处理是问题。最后,由于窗口扫描方法的性质,这些太旋转字符不能被检测到。对于第二个阶段的分类,缩放范围为SIFT描述符被证明是非常重要的。它扩展到0和1之间会造成严重的信息损失,降低了检测的准确性,如表1所示。

最后,表2示出了Adaboost算法和两级分级之间的比较。结果表明,该系统能够通过使用两级分级以除去更多的假检测。

4 结语

该文在做LPD时,使用Adaboost训练检测车牌字符,SVM训练SIFT描述排除从前一阶段获得的虚假检测的子窗口。实验表明,Adaboost算法能够检测几乎所有车牌字符,但假阳性比较高,经过第二阶段,SVM训练SIFT排除非车牌字符。未来工作中,单一的Adaboost分类器训练所有36个字母数字和字母,而不需要单独的36分类的Adaboost,以减少运行时间。

参考文献

[1] A.Kuranov,R.Lienhart, et al.,“Empirical analysis of detection cascades of boosted classifiers for rapid object detection”,Lecture Notes in Computer Science,Springer-Verlag,Heidelberg,2003:294-304.

[2] 刘永春.基于SVM的车牌字符识别算法研究[J].四川理工学院学报(自然科学版), 2012(4):46-49.

[3] 李国立. 汽车牌照定位与字符分割的研究及实现[D].武汉:中南民族大学,2009.

[4] 赵健.基于AdaBoost及支持向量机的车牌识别系统的研究[D].杭州:浙江师范大学,2014.