改进的车牌相似字符分级分类识别算法研究
2013-07-03常庆丽王永昆李梦露
瞿 中,常庆丽,王永昆,李梦露
(1.重庆邮电大学 计算机科学与技术学院,重庆 400065;2.重庆邮电大学 移通学院,重庆 401520)
0 引 言
一个完整的车牌字符识别系统(license plate character recognizer,LPCR)通常包含字符图像预处理、字符特征提取和分类器判决[1],[2]三个阶段。在这三个阶段中,选取何种字符特征和字符识别方法进行字符判决将影响整个识别系统的识别率。目前,关于车牌字符图像的识别方法很多,最常用的是基于神经网络的识别方法和基于模板匹配的识别方法[2]。神经网络方法[3-5]计算量大,算法复杂,实时性不高;而模板匹配方法[6-8]实现简单,其实时性相对而言要高很多。除此以外,神经网络识别方法不易区分相似字符,如B和8、D和0、2和Z等;而模板匹配方法虽然较神经网络方法易识别相似字符,但是准确率并不高。综合考虑到模板匹配方法的优劣,通过研究模板匹配方法算法思想和针对相似字符的特点,并结合分级分类思想,本文针对单一使用模板匹配车牌字符识别算法识别准确率低的缺点进行改进,并对实际抓拍的车牌图像进行自动识别测试。实验结果表明,该字符识别算法准确率达到了系统的要求标准,并具有良好的鲁棒性和实时性。
1 字符识别系统设计
本文设计的LPCR 系统分为模板部分和测试部分,其中模板部分主要是建立一个完整的字符模板库,为字符系统的识别做准备工作;测试部分主要是将分割得到的字符图像经过处理,然后与字符模板库进行匹配,得到置信度最大的模板,从而输出识别结果。系统设计流程如图1所示。
图1 系统流程
在测试部分,二值化处理可能使得字符图像信息有不同程度的丢失,对于整个系统的识别结果会产生很大影响。为了使得图像信息丢失最少,阈值的选取尤为重要。本文采用由Ying Wen[2]等提出的一种改进的Bernsen算法对字符图像进行二值化处理。
2 改进的相似字符识别方法
经过预处理得到的车牌字符图像并非都是清晰、标准的,可能出现噪声、断裂、粘连等图像[8-9]。选择的字符识别方法必须对这样的图像有一定的鲁棒性。因此,基于实际应用中的系统要求,本文采用模板匹配方法作为基本的字符识别方法,并结合分级分类思想以及相似字符集的特点,提出一种改进的分级分类车牌相似字符识别算法。该方法首先需要建立一个标准的模板库,为识别做好准备。
2.1 模板的建立
对模板匹配识别方法来说,模板库建立的好坏至关重要,会直接影响到识别率。因此,在建立字库之前,要搜集完整的字符集样本,然后进行滤波、二值化、归一化等预处理,使得图像的有用部分得到加强,最后提取出字符特征作为匹配模板。
传统的字符分类模板库主要分为汉字模板库、字母模板库、数字字母模板库、数字模板库。对于大多车牌字符的识别,传统字符分类模板库是适用的,但随着车主自主选择和自编车牌号的盛行,车牌的最后三个字符不再仅仅局限在数字模板库,而可能出现字母,甚至教练车、警车等的车牌最后是汉字[10]的情况。
车牌编排的灵活性使得传统的模板库[11]分类不再适用,因此,本文对模板库进行改进以适应当前各种灵活编号的车牌。针对车牌的七个字符重新设计了汉字模板库、字母模板库、数字字母模板库、数字字母汉字模板库四个模板库。传统的模板库分类和本文改进的模板库分类对比如图2所示。
图2 新旧模板库对比
选取典型测试样本进行测试,对第五和第六个字符对应的模板库进行了更新,更新前后的匹配效果如图3所示,同时对第七个字符对应的模板库也进行了更新,更新前后的匹配效果如图4所示。
图3 第六个字符对比效果
图4 第七个字符对比效果
从图4和图5可以看到,更新后的模板库可以有效地识别新型车牌号码。
2.2 改进的相似字符识别算法
在成功提取字符特征、构建模板库后,接下来进行待识别字符的匹配。针对单一使用模板匹配算法对相似字符识别率低的缺点,本文在通用模板匹配识别的基础上,利用局部特征区域对相似字符进行二次识别,达到了很好的效果。具体识别算法步骤如下:
(1)首先对字符图像进行二值化处理、去噪处理和归一化处理;
本文将字符图像和模板按照边框比例缩放,将大小归一化为16×20;
(2)对归一化后的各二值图像进行特征提取,将提取的特征向量与模板库中各相应模板特征向量[12]进行比较得到相似度;
本文考虑到归一化后的图像信息仅包括320个像素值,为了使匹配结果更加准确,采用320维的特征向量;
(3)采用通用模板匹配方法对各字符图像进行第一次识别,预处理后得到P个归一化后的二值图像为
{fI(i,j),i=1,2,…,m,j=1,2,…,n},I=1,2,…,P
模板库中各模板为
{TK(i,j),i=1,2,…,m,j=1,2,…,n},K=1,2,…,Q
其中fI(i,j),TK(i,j)分别表示(i,j)点处待识别图像和模板图像的像素值,为了计算简便,字符有效区域像素值取值“1”,字符背景区域像素值取值“0”,最终得到匹配系数τk,如式(1)所示
其中,ΔTk统计模板图像Tk中白色像素点的个数,如果τk的最大值为τq,那么输入图像{fI(i,j)}是τq所对应的图像;
(4)判断步骤(3)得到的识别结果是否在特征上属于某个相似字符集合;
例如本文将“A”、“4”作为一个相似字符集合,将“B”、“S”、“8”作为一个相似集合等;
(5)如果第一次的识别结果属于某个相似字符集,就在该相似字符集内采用局部特征匹配方法,相应地选取相似字符特征中差别最大的区域作为特征区域与模板库中的各模板字符对应区域进行匹配运算。相似字符的差异定义标准[11]是将待识别字符以几何中心为原点分为四部分,分别对这四部分进行分析排查,找出相似度差别较大的特征区域与模板的对应区域进行匹配;
例如,字符“8”和“B”的最大差别区域如图5(a)所示。字符“D”和“0”的最大差别区域如图5(b)所示。
图5 相似字符最大局部特征对比
(6)如果第一次的识别结果不属于任何相似字符集,那么直接输出识别结果。
改进的车牌图像相似字符识别算法处理流程如图6所示。
本文对相似字符的误识别处理改进进行实验测试。测试结果如图7所示,传统的模板匹配将字符“0”识别为字符“D”,改进后则可正确的识别。
3 实验结果与分析
本文字符识别系统的开发环境为VS2008+OpenCV2.1。
实验选择两组车牌图像,第一组包括500张大小为200万像素的高速卡口车牌图像,定量评估本文改进模板库对车牌后三个字符处理的改进效果。
不同情况下典型的4张车牌图像测试结果如表1所示。
从表1的测试结果可以看出,第一组车牌号属于常规车牌,因此两种方法的识别结果都是准确的;第二组车牌号属于新型车牌号,传统模板库将后三个字符和数字模板库进行匹配,导致第五个字符“B”被误识为“8”,而改进的模板库可以正确识别;第三组车牌号以及第四组车牌号和第二组一样,改进的模板库可以准确识别。对车牌号码后三个字符出现字母,或最后一个字符出现汉字的情况,采用改进的模板匹配算法可以准确识别各类新型车牌。
第二组实验测试图像包括不同环境下1030 张大小为200万像素的高速卡口车牌图像,定量评估对相似字符处理的改进效果,样本中常见的相似字符车牌实验结果分析如表2所示。
表2 相似字符测试结果
综合上述两个实验,本文算法在改进模板库的同时,还对相似字符做了二次识别处理,本文字符识别系统综合性能比较如表3所示。
表3 系统综合性能比较结果
由表3可以看出本文算法识别率较改进前有了明显提高。实验中,对1030张测试样本进行识别时间的测试,每个字符图像的平均识别时间为0.78125ms,达到了实际应用中字符识别系统的实时性要求。
4 结束语
针对单一使用模板匹配车牌字符识别算法识别准确率低下的缺点,本文综合考虑到模板匹配方法的优劣,以及车牌字符集自身的特点,结合分级分类的思想,并通过研究模板匹配算法和相似字符容易误识别的特点,采用一种基于模板匹配算法的改进车牌相似字符识别方法使得字符识别系统识别率较传统方法提高了10.1%。本文对字符识别系统综合性能进行了比较,测试结果表明,该字符识别方法准确率达到了系统的要求,并具有良好的鲁棒性和实时性。
[1]Wijnhoven R G J,De With P H N.Identity verification using computer vision for automatic garage door opening[J].IEEE Transactions on Consumer Electronics,2011,57(2):906-914.
[2]WEN Ying,LU Yue,YAN Jingqi,et al.An algorithm for license plate recognition applied to intelligent transportation system[J].IEEE Transactions on Intelligent Transportation Systems,2011,12(3):830-845.
[3]Anagnostopoulos C N E,Anagnostopoulos I E,Loumos V,et al.A license plate recognition algorithm for intelligent transportation system applications[J].IEEE Transactions on Intelligent Transportation Systems,2006,17(3):377-392.
[4]ZHAO Huihuang,ZHOU Dejian,WU Zhaohua.SMT product character recognition based on BP neural network[C]//Yan-tai,Shandong:6th International Conference on Natural Computation,2010:589-593.
[5]Caner H,Gecim H S,Alkar A Z.Efficient embedded neural network based license plate recognition system[J].IEEE Transactions on Vehicular Technology,2008,57(5):2675-2683.
[6]ZHANG Zhijia,LI Yuan,YUAN Weiqi.Meter character recognition method based on gray template matching[C]//29th Chinese Control Conference,2010:2987-2990.
[7]Myers V,Fawcett J.A template matching procedure for automatic target recognition in synthetic aperture sonar imagery[J].Signal Processing Letters,IEEE,2010,17(7):683-686.
[8]DUAN Qichang.SONG Na.A method of vehicle license plate de-noising and location in low light level[C]//WASE International Conference on Information Engineering,2010:194-198.
[9]LI Yuchen,TIAN Zhen,YOU Jia.Character feature extraction method and its effectiveness evaluation[C]//Hongkong:2012 2th International Conference on Intelligent System Design and Engineering Application,2012:197-200.
[10]WANG Jianxia,ZHOU Wanzhen,XUE Jingfu,et al.The research and realization of vehicle license plate character segmentation and recognition technology[C]//Qingdao,Shandong:Proceedings of the International Conference on Wavelet Analysis and Pattern Recognition,2010:101-104.
[11]Wakabayashi T,Pal U,Kimura F,et al.F-ratio based weighted feature extraction for similar shape character recognition[C]//10th International Conference on Document Analysis and Recognition,2009:196-200.
[12]CHEN Zhenxue,LIU Chengyun,CHANG Faliang,et al.Automatic license-plate location and recognition based on feature salience[J].IEEE Transactions on Vehicular Technology,2009,58(7):3781-3785.