基于垂直投影的车牌字符分割方法
2012-10-27冉令峰
冉令峰
(中国空空导弹研究院,河南 洛阳 471009)
0 引言
车牌识别系统[1]是现代化智能交通系统中重要的部分,有较好的应用前景和研究价值。
车牌识别系统通常分为3部分:车牌定位[2]、字符分割和字符识别[3]。字符分割准确与否直接决定最终识别的结果,因此车牌字符分割是车牌识别系统中的重要环节。
在此利用车牌字符的垂直投影来对车牌字符进行分割,进而可以完成对车牌识别的后续处理。
1 车牌图像预处理
实际生活中车牌难免会受到噪声、褪色或者污渍的影响,这样对车牌字符分割影响很大,进而车牌识别率也会相应下降。因此要对车牌图像进行预处理[4],主要包括对车牌图像的灰度化、灰度拉伸和中值滤波等。
1.1 灰度化
图像灰度化[5]处理是将彩色 RGB图像转化为只有黑白2个颜色的灰度图像,便于对图像进一步处理。这里采用加权平均值法进行车牌图像的灰度转化处理,如图1所示。
加权平均值法[6]是根据实际图像来分配的像素点红色R、绿色G、蓝色B值的权值[7],然后将3个值进行相加处理,如式(1)所示:
式中,Wr、Wg、Wb分别为R、G、B的权值。权值的选取不同,会产生不同的效果。根据式(2)得到灰度化图像。
图1 彩色图像灰度转化
1.2 灰度拉伸
灰度拉伸变换是指依据图像灰度直方图的分布趋势,将某一段灰度区间进行拉伸,即线性变换处理,增强图像的对比度,变换函数如式(3)所示。
由图2可以看出,(x1,y1)和(x2,y2)是灰度直方图中2个变换点的坐标。通过灰度拉伸变换将[x1,y1]线性变换到[x2,y2],增强图像对比度,其他部分进行压缩处理。
图2 灰度拉伸原理
由图3可以看出,对灰度图像进行灰度拉伸处理可以使原灰度图像的黑白色彩更加突出,更容易区分,图像对比度更强,更加便于后续车牌字符分割处理。
图3 灰度图像和灰度拉伸
1.3 中值滤波
在实际路况中,车牌图像难免会受到一些噪声的影响,如果不对噪声进行处理,对后续的字符分割将有很大影响。
对车牌灰度图像进行中值滤波处理的目的是降低噪声对车牌图像的影响,去除对图像影响较大的椒盐噪声,同时也将灰度图像的边缘信息得到进一步的增强。
中值滤波是用把灰度图像中的一个像素点的值用该点的一个邻域中各点的中值来代替,从而消去孤立的噪声像素点。中值滤波效果如图4所示。
图4 中值滤波后的效果
2 字符分割
车牌的主要信息除了边框,就剩下的数字、汉字和字母共同组成的7个字符,它们的高、宽、高宽比在一定的范围内,每个字宽45 mm,字高90 mm,间隔符宽10 mm[8-10]。根据以上车牌的固有特征,这里提出垂直投影法对车牌字符进行分割。
2.1 垂直投影法原理
对车牌灰度图像进行灰度垂直投影,可知车牌区域的垂直投影可以清晰地看出7个区域,即车牌的7个字符灰度图像的垂直投影,如图5所示。通过垂直投影图的特征,分割字符就转化为只需得到每个区域的左右边界即可。
图5 车牌垂直投影
2.2 垂直投影法的具体算法
算法是在车牌字符的垂直投影图上的横向从左侧到右侧依次检测每1个坐标的投影数值,将检测到的投影数值出现第1个不为零时,那么将这个投影数值所属的像素点即看做是第1个投影区域的左边界限。然后继续向右检测,将检测到的投影数值出现第1个为零时,那么将这个投影数值所属的像素点即看做是第1个投影区域的右边界限。根据此算法可以得出其余6个投影区域的左右界限。垂直投影算法流程图如图6所示。
由于雨雪污泥等会使车牌受到污渍的影响,字符也会出现粘连或者断裂的情况。
依据算法经过处理得到的字符投影块数目等于7,同时每个字符投影块都在标准字符宽度的阈值范围内,那么即可进行分割车牌字符;若当检测到的投影块数目小于 7,可知车牌的字符有粘连,则需进一步分割投影块,直至投影块数目为 7,同时满足字符宽度的阈值范围;如果投影块数目大于 7,可知车牌的字符有断裂,则需进一步对投影块进行合并处理,直至投影块数目为 7,同时满足字符宽度的阈值范围。图7为无粘连和断裂字符的分割图。
图6 算法流程
图7 无粘连和断裂字符分割
2.3 粘连字符的分割
根据实际情况可知,一般车牌字符的通常在投影块中心区域出现粘连。通过对投影图的投影值检测,可知在出现粘连处的投影值比其他部分小,因此可设置区域阈值来得到投影图中的最小值,进而可得到投影图中出现粘连的部位。算法如下3步:
1)计算出投影图中投影块的数目。
2)若投影块数目小于字符数目7个,那么计算每一个投影块的宽度Kn,若Kn大于一定阈值,那么在第n个投影块的中心区域可以检测出投影值的最小值,并在此进一步分割该投影块。
3)重复进行步骤 1)和步骤 2)直至投影图中的投影块的数目等于7,同时每个投影块的宽度Kn均满足字符宽度的阈值范围。
2.4 断裂字符的分割
当车牌处于非理想状态时,通常也会有的字符断裂或者连续性不好,加之一些左右结构的汉字如辽、浙和川等连续的不好,易受到影响出现字符断裂的情况,这样无疑增加了字符分割的难度。
参考车牌每个字符宽度是 45 mm,每相邻两个字符的中心线之间的间距也是不变的值,可先检测出投影图中每相邻两个投影块之间的间距。若间距小于一定阈值,那么说明这两个投影块分别为一个字符投影图的左右两个部分,即这个字符出现了断裂,执行块合并过程。算法如下3步:
1)计算出投影图中投影块的数目。
2)若投影块数目大于字符数目7个,那么计算每一个块的中线坐标,进而算出每相邻两投影块中线之间的最小距离 Lm。若 Lm小于字符的宽度,那么将第m和m+1投影块进行合并,同时将投影块的个数减少一个。
3)重复进行步骤 1)和步骤 2)直至投影图中的投影块的数目等于7,同时每个投影块的宽度Kn均满足字符宽度的阈值范围。
3 实验与分析
随机选取100幅车牌图像,运用程序对车牌预处理和字符分割,有效分割出93幅车牌字符,有效率达到93%。
在对图像做灰度拉伸处理时,两个变换坐标分别选取(50,30)和(200,220),如图8所示,依据实际情况也可对界面坐标参数进行调整,达到图像增强的效果。
图8 灰度拉伸参数坐标
选取的100幅车牌图像中有15幅车牌部分受污泥的影响较大,出现某个字符或者某几个字符的笔画被遮挡的现象,通过算法处理提高了字符分割的效率。由于部分车牌采集时遇到了雨雪天气,这样车牌难免会受到恶劣天气的影响,如图9所示车牌中“黑”和“5”字符的部分受到污泥影响,通过处理已经可以将其与相邻字符分割出来。
图9 断裂字符的分割效果
4 结语
首先对车牌图像进行预处理,通过灰度化、灰度拉伸和中值滤波将彩色图像转化为便于处理的灰度化图像,这是数字图像处理的首要步骤。然后用垂直投影图法对车牌字符进行分割,其他研究者主要研究了识别理想状态车牌,但文中却处理非理想状态车牌即字符出现粘连或断裂情况,提出了关键算法,解决了粘连字符和断裂字符的问题。通过实验可知,该算法可以根据实际车牌字符的状态,有效地分割了车牌字符,为未来的智能车牌识别系统弥补了车牌字符分割的不足。结合车牌出现更复杂的状态如字符受到光或噪声的严重污染,还需要做进一步的研究,提出更完善的解决办法。
[1]SIRTHINAPHONG T.The Recognition of the License plate for Automatic System[J].Processing of the Fifth International Symposium on Signal Processing and Its Applications.1999,23(01):455-457.
[2]刘晓薇.基于聚类分析的车牌定位算法研究[J].通信技术,2008,41(12):265-267.
[3]PARISI R.Car Plate Recognition By Neural Networks And Image Processing[J].Proceedings of the IEEE International Symposium on Circuits and Systems.1998,30(05):195-198.
[4]江少梅.车牌图像预处理研究[J].中国科技信息,2009,5(02):264-265.
[5]周波,王绪本.复杂环境下的汽车牌照的定位方法[J].电脑与信息技术,2002,4(03):10-11.
[6]何捷.基于图像处理对汽车牌照识别系统的研究[D].四川:四川大学, 2004:18-19.
[7]张怡,冯飞,宋冠群.基于 FPGA的图像预处理缩放算法[J].信息安全与通信保密,2007(01):77-78,81.
[8]罗洪刚,王士林,倪佑生,等.一种用于网络动画过滤的文字提取方法[J].信息安全与通信保密,2007(11):66-67,70.
[9]顾晨勤,葛万成.基于模板匹配算法的字符识别研究[J].通信技术,2009,42(03):220-222.
[10]闫兵,张海朝.改进的基于投影的车牌字符分割算法[J].通信技术,2010,43(05):184-186.