APP下载

基于 Trace 变换和支持向量机的车牌字符识别新方法

2014-08-07

微型电脑应用 2014年2期
关键词:字符识别车牌字符

张 博

基于 Trace 变换和支持向量机的车牌字符识别新方法

张 博

为了提高车牌上的字符识别准确率,提出一种结合 Trace 变换和支撑矢量机(SVM)的字符识别方法。在字符识别方面,以 Trace 变换方法提取字符特征,并运用支持向量机对字符进行模式分类。将算法应用到实际的车牌字符识别中,识别结果表明,这种方法在提高识别速度的同时,有效提高了字符的识别精度。

车牌识别系统;字符识别;Trace 变换;支持向量机;特征提取

0 引言

车辆牌照识别系统是计算机视觉与模式识别应用的重要研究课题之一。车牌字符识别的准确和高效成为整个识别系统的关键。目前常用的车牌字符识别方法有模板匹配,神经网络]2[]3[等。模板匹配是根据字符的直观形象抽取特征,用相关匹配原理进行识别。对于有变形、位移、旋转的待识字符,模钣匹配方法很容易产生误识。神经网络虽然具有较强的模式分类能力,但算法的收敛数度较慢,且无法保证其全局最优。基于统计学习理论]4[的支持向量机,在解决小样本,非线形及高维数等模式识别问题中表现出许多特有的优势,成为近年来机器学习领域新的研究热点,并在模式识别领域得到广泛应用。但SVM 也有其缺点,比如对于复杂问题的分类精度不是很高,训练样本混叠严重时 SVM分类面过于复杂产生过学习情况,对于有些复杂情况由于支持向量集较大而导致决策速度较慢等。

基于常用算法的不足,改进了SVM算法并提出了一种基于 Trace 变换和支持向量机相结合的车牌字符识别新方法。引入 Trace 变换这种具有旋转、平移、尺度不变性的特征提取方法,并将其提取的特征作为特征向量输入支持向量机进行识别,增强了对各种前期处理不理想的字符的识别适应性,提高了识别率。

1 支持向量机

SVM 算法[5]的基本思想是根据结构风险最小化原理[6]的统计学习理论,通过最优超平面的构造使泛化误差的上限最小化。它通过选择训练一组成为支持向量(Support Vectors)的特征子集,使得对支持向量集的划分等价于对整个数据集的分割。

1.1 最优分类超平面的选取

在训练集线形可分时,支持向量机就是要构造一个最优超平面,如公式(1):

其中,w是权向量,b是最大裕量。

利用 Lagrange 乘子法构造范函如公式(3)

约束条件为公式(5):

求解最优化问题,可得最优超平面的形式为公式(6):

相应的,问题变为使下式最小为公式(8):

同样可将此优化形式改为极大化形式,结果几乎完全相同,只是约束条件变为公式(9):

其中,C是事先选定的,它反映了在复杂性和不可分样本所占比例之间的折中。

1.2 多分类支持向量机

支持向量机是从二分类问题发展而来的,将其延伸到多类分类问题,最常采用的是“一对一”或“一对多”方法。“一对多”方法往往在实际应用中识别率不高,且容易会出现拒判情况。“一对一”方法进行识别时,各分类器对给定的测量向量均给出分类结果进行“投票”,最终把“得票”数量最多的一类作为最终的分类结果。该方法在实际应用中效果较好,且性能稳定,所以文中采用“一对一”方法,并选用径向基(RBF)核函数作为支持向量机的核函数。

用支持向量机对进行识别时,需要提取车牌字符的特征作为特征向量,输入支持向量机。由于车牌字符的提取质量不如印刷体字符,往往有字符轻微倾斜,大小不一、甚至字符残缺的缺点,因此,特征向量的提取应不受这些因素的影响或影响较小。

本文提出了一种种优秀的特征提取方法:Trace 变换,这种方法具有在图像旋转、平移、尺度变换下保持不变的性质,有较好的适应性。

2 Trace 变换

2.1 Trace 变换的特征提取理论

Trace 变换,也称为广义的 Radon 变换,它是沿着直线计算图像函数的某个泛函值来描述一幅图像。首先,定义一系列穿过图像的直线,每条直线l由参数φ和 p 定义如图1所示:

Trace 变换借助于沿直线 l的参数 t计算一个泛函T ,通过泛函T对每条直线计算一个数值,即对每一组计算一个数值,把这些数值画在以为参数的坐标系中就是 Trace 变换结果。用所有方向的直线扫描一幅图像,用Λ表示这些直线所构成的域。在T 的作用下,Trace 变换是一个定义在Λ中的函数g,此时的图像函数被看作是参数t 的函数。如果表示坐标系C 中的直线,Trace变换的定义如公式(10)所示:

最主要的问题是如何选取这3个函数。在确定之前先定义两类函数:不变性泛函数和位置敏感性泛函数。

(1)不变泛函(Invariant Functional)[7]

不变泛函通常具有下列性质:

性质一:当自变量的比例系数为a时,泛函的比例系数为 )(aA ,即:

(2)位置敏感泛函(Sensitive to Displace Functional)[7]

结合(13)式和(性质一)式得到性质

2.2 不变量的构造

其中泛函Φ,P分别是圆周泛函和直径泛函,T是进Trace 变换是所选用的泛函表达式。假设原始图像所在的系统记做,失真系统记做。当系统经过旋转 θ- 角度、以参数ν对图像进行尺度缩放、以向量平移后,得到的系统即为。设一幅二维的图像函数F从系统中观察记为从系统中观察记为可以看作将以角度进行旋转、ν为比例系数进行尺度缩放和以向量为平移参数进行平移得到的。原始图像上的直线在失真坐标系统中仍然显示为一条直线,即线性坐标系保持直线不变。当对图像进行线性变换时,沿着直线上的像素点的灰度值不会变化。所以从原始图像和失真图像中存在的直线考虑:假设坐标系中存在某条直线,其参数为坐标系中该条直线的参数记为则同一条直线不同坐标系的参数关系如公式(15)、(16)、(17):

对于同一幅图像F要想使得构造出的三重特征向量具有旋转、尺度和平移不变性,只需要使得三重特性值在坐标系 1C 和 2C 中满足公式(18):

选择相同的泛函表达式 Φ , P ,T ,根据公式(14)替换(18)得出公式(19)

根据三重特征值的定义如公式(20):

将公式(15)、(16)和(17)代入公式(21):

这里选择Τ为不变泛函,根据不变泛函的定义式和性质一,推出下式成立公式(22):

选择泛函Ρ为不变泛函,根据不变泛函的定义式、性质一和性质二,推出下式成立公式(23):

选择泛函Φ为不变泛函,根据不变泛函的定义式和性质二,推出下式成立公式(24):

用以κ和λ为参数的指数形式表示,则公式(25)(26):

将公式(26)代入公式(24),最终推出公式(27)(28):

公式中的各个参数均与选择的泛函 Φ ,P,T 的表达式有关。若要满足三重特征具有旋转、尺度和平移不变性,满足公式(18),只需要使得下式成立公式(29):

现在假设函数T、Φ是不变性函数,函数P是敏感性函数,且T满足不变泛函性质一,P满足位移泛函性质三,Φ满足不变泛函性质二。由于P是不变性函数且满足位移

泛函性质三,所以(22)式可简化为公式(30):

最后,由于Φ是不变性函数且满足不变泛函性质二,则公式(31):

同样地,可以写成公式(32):

从上式可以看出,只要满足公式(33):

Trace 特征就对旋转、平移和缩放比例失真不变。

但是,式(33)的限制过于严格。可以将三维特征总结为公式(34):

因此,三维特征可以归一化为:

式(33)可以改写为公式(35):

这样的一对特征的比率就构成了一个不变量。

基于以上的特性,我们可以对T、P、Φ函数进行选择组合以满足不变特性,从而利用其不变性进行车牌字符图像的特征提取。

3 字符特征提取

首先选择不同的T 、P、Φ函数组合构造不变量组合,如(I6,I1,I5)/(I6,I1,I4),(I3,S3,I4)/(I3,S3,I5),(I3,I1,I6)/ (I3,I1,I7)等,根据式(35)计算特征量。

4 实验结果及分析

实验选取从采集到的车牌图片中分割出的车牌常用的34 个汉字字符,24 个英文字符以及 10 个数字字符分别进行训练和识别。用 Matlab 7.0 仿真实现该算法,对不同字符进行识别的实验结果如表1所示:

表1 不同类型字符识别效果比较

本文的基于 Trace 变换的方法平均识别率为 98.3 %,识别的平均速度为 0.16s。

将在倾斜校正和字符分割中处理不理想(校正后仍存在倾斜或分割后字符有缺损)的字符送入SVM分类器进行识别,实验结果如表2所示:

表2 正常字符与不理想字符识别效果比较

由表2 可见,由于 Trace 变换具有平移、旋转、尺度不变性,因此对存在倾斜和缺损的字符有较好的适应性。

将本文方法与模板匹配和神经网络方法的识别结果进行比较,结果如表3所示:

表3 不同识别方法效果比较

由表3可见,用相同的样本进行训练和识别,本文提出的方法比模板匹配和神经网络方法有了较大的提高,且提取的特征向量的性质好于用小波分解提取的特征向量。

5 总结

本文以 Trace 变换方法提取字符特征,并运用支持向量机对字符进行模式分类,实验结果表明,本文提出的车牌字符识别算法识别率更高,且对于存在倾斜、大小不一和不完整的字符有较好的适应性,具有良好的识别能力和推广能力。

[1] 马俊莉,莫玉龙,王明祥.一种基于改进模板匹配的车牌字 符 识 别 方 法 [J].小 型 微 型 计 算 机 系 统 ,2003,24(9): 1670.

[2] 王敏,黄心汉,魏武,等.一种模板匹配和神经网络的车牌识别方法[J].华中理工大学学报,2001,29(3):48.

[3] 杨晓敏,吴炜,黎涛,等.基于 Gabor 变换和支持向量机的车牌字 符 识 别 算法[J].四川大学学 报 :工程科学 版 , 2005,37(5):130.

[4] Vapnik V.统计学习理论的本质[M].北京:清华大学出版社,1999.

[5] 边肇祺,张学工.模式识别[M].第 2 版.北京:清华大学出版社,2000.

[6] Burges J C.Autorial on support vector machines for pattern recognition [J].Data Mining and Knowledge Discovery,1998,2(2):1~47.

[7] MARIA P,KADYROV A. Affine parameter estimation for the trace transform[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006, 28(10):1631-1645.

[8] 马腾飞,郑永果,赵卫东.基于边缘检测与 Hough 变换的 车 牌 字 符 分 割 算 法 [J]. 系 统 仿 真 学报,2006,8(18):391~392.

[9] 潘梅森,郭国强.基于图像矩的车牌号码倾斜校正[J].计算机辅助设计与图形学学报,2007,19(8):1041~1045.

[10] Sahoo P.K., Arora G., A thresholding method based on two-dimensional Renyi’s entropy[J],Pattern Recognition, 2004, 37(6):1149~1161.

[11] 迟晓君,孟庆春.基于投影特征值的车牌字符分割算法[J].计算机应用研究,2006,23(7):256~257.

[12] 李旻,吴炜,杨晓敏等.基于独立分量分析的车牌字符识别[J].四川大学学报(自然科学版),2006,43(6):42~46.

[13] 廉飞宇,付麦霞,张元.基于支持向量机的车辆牌照识别的研究[J].计算机工程与设计,2006,27(21): 4033~4035.

[14] BAO QIAN, GUO PING. Comparative studies on similarity measures for remote sensing image retrieval[J]. IEEE International Conference on Systems, Man and Cybernetics, 2004:1112-1116.

[15] R R GALIGEKERE,D W HOLDSWORTH,M N S SWAMY, et al. Moment Patterns in Radon Shape[J]. Opt. Eng, 2000,39(4):1088-1097.

[16] C.KOTROPOULOS,I.PITAS. Nonlinear Model-Based Image/Video Processing and Analysis[J]. Wiley-Interscience, 2001:3-14.

[17] Seetharaman V, Sathyakhala A.License plate recognition system using hybrid neural networks[C]//IEEE Annual Meeting of the Fuzzy Information, 2004: 363- 366.

[18] Huang Yo- Ping, Lai Shi- Yong, Chuang Wei- Po.A template- based model for license plate recognition[C]//IEEE International Conference on Networking, Sensing and Control, 2004: 737- 742.

[19] Wu Wei, Yu Yanmei, Liu Dayu,et al. Recognition of license plate character based on hausdorff distance[J].Application Re-search of Computer,2004,21(2):258~260.

[20] Wang Xuewen, Ding Xiaoqing, Liu Changhong. Gabor filters based feature extraction for robust chinese charater recognition[J].Acta Electronica Sinica,2002,9:1317~1321.

A New License Plate Character Recognition Method Based on the Trace Transform and SVM

Zhang Bo
(Electronic Information Engineering Department, Changsha Normal University, Changsha410100, China)

To improve the recognition accuracy of the characters on car license plate, a novel method based on the Trace Transform and support vector machine (SVM) was proposed. In character recognition, the trace transform method is chosen to extract character features, and SVM classification is used as the method to identify characters. The result of vehicle license plate recognition demonstrated that this algorithm can offer higher prediction accuracy and less decisive time compared with other methods.

License Plate Recognition System;Character Recognition;Trace Transformation;Support Vector Machine;Feature Extraction

TP391.4

A

1007-757X(2014)02-0009-05

2013.12.15)

2013 年度湖南省教育厅科学研究项目资助(编号:13C1070)

张 博 (1980-),男,长沙师范学院电子信息工程系,讲师,硕士,研究方向:图像处理与模式识别、信号处理、计算机信息安全理论,长沙,410100

猜你喜欢

字符识别车牌字符
字符代表几
一种USB接口字符液晶控制器设计
图片轻松变身ASCⅡ艺术画
数字图像处理技术在车牌识别系统中的应用
HBM电子称与西门子S7-200系列PLC自由口通讯
第一张车牌
基于MATLAB 的车牌识别系统研究
一种基于OpenCV的车牌识别方法
仪表字符识别中的图像处理算法研究
基于CUDA和深度置信网络的手写字符识别