互信息算法在车牌识别中的应用研究

2014-03-29谢宇周学礼胡岳

常熟理工学院学报 2014年4期

关键词：字库字符识别互信息

谢宇，周学礼，2，胡岳

（1.常熟理工学院物理与电子工程学院，江苏常熟 215500；2.上海大学通信与信息工程学院，上海 200072）

互信息算法在车牌识别中的应用研究

谢宇1，周学礼1，2，胡岳1

（1.常熟理工学院物理与电子工程学院，江苏常熟 215500；2.上海大学通信与信息工程学院，上海 200072）

将医学图像配准中的互信息算法移植到车牌识别系统，首先基于颜色信息快速定位车牌并校准分割出待识别的车牌字符，然后计算分割字符与字库字符的互信息值，互信息值的大小反映了图像之间的相似程度，最后通过比较互信息值的大小确定最终结果.实验证明，互信息算法相对其他车牌识别常规算法能更准确反映出图像之间的相似度，从而得到更精确的识别效果.

图像配准；互信息；车牌识别

在交通管控系统发展中，智能化是必然趋势，作为智能交通管控系统中的重要一环，车牌识别系统发挥着越来越重要的作用.完整的车牌识别系统[1]主要包括车牌定位和字符识别两个部分，字符识别的正确与否关系到整个系统的成败，是车牌识别系统的关键所在.目前在将字库模板与提取字符比较这方面，大多采用模板匹配法，由于在字符分割时会产生一些误差以及模板字符不够标准，此方法往往在细节方面有所缺欠，识别准确度不足.本文将互信息算法引入车牌识别系统，通过精确测量图像之间的互信息，找出相似度最高的字符.实验表明该算法相较于通常使用的灰度特征统计法更为精确高效.

1 车牌识别流程

车牌识别的总体流程为：读取图像，图像预处理，字符识别，输出识别结果四部分，图1为车牌识别的整体流程图.

在读取待处理图像后，预处理时本文针对车牌的蓝色特征，采用检测图像中蓝色像素点的方法，快速定位出车牌位置.然后通过Radon变换对车牌进行倾斜校正，由于校正后的图像中仍然存在干扰区域，故用自适应阈值函数对图像进行擦除处理，并将图像二值化，本文采用的模板字库是白底黑字，还要通过擦除反色来保持字符特征的一致性.再通过对图像的Y方向处理后采用垂直投影对字符进行分割，最后分别计算并比较分割字符和字库字符的互信息值，找出与分割字符相似度最高的字库字符，最后以文本格式输出.

2 车牌图像预处理

2.1 车牌定位

目前我国大多数省、市、自治区车牌均为蓝底白字，本文采用蓝色像素统计法对车牌进行快速定位.首

先对蓝色像素进行筛选，大致确定车牌区域，然后统计蓝色积累像素点最多的行和列，找出车牌的上下边界和左右边界.同时为了避免同一幅图中包含多块蓝色区域导致程序的错误识别或无法运行，本文对已确定区域的白色像素进行统计来确认该区域是否为车牌区域.图2为待识别图像，图3为定位后的车牌图像.

2.2 车牌校正和分割

在本处理环节，首先对图像进行倾斜校正，直线通常对应重要的边缘信息[2]，提取图像的直线边缘并记录直线的倾斜角度，多用于Hough变换.本文考虑到其处理相对比较繁杂，采用了更为简便的Radon变换，计算图像在某一指定角度射线方向上的二维投影数据和投影角度[3]，而后将图像按记录的倾斜角旋转，如图4所示.然后通过最大类间方差法自行寻找合适的阈值并对图像进行擦除处理，将车牌边框之外的干扰消除.图5为噪声消除后的效果.

本文采用的模板字库字符是白底黑字，故需要进行擦除反色处理，处理结果如图6所示.反色擦除后将车牌的灰度像素沿垂直方向累加，因为字符域是黑色，字符之间为白色，所以车牌投影在字符处为波谷，在字符间为波峰，通过寻找峰值点即可对其进行分割[4].字符分割结果见图7.

3 互信息算法的分析

3.1 互信息理论

互信息[5]是信息理论中的一个基本概念，通常用于描述两个系统间的统计相关性，或者是一个系统中所包含的另一个系统中信息的多少，它可以用熵来描述，图像的熵用来描述图像的概率分布.

将两幅待比较的图像A和B的灰度值看成两个随机变量A和B，其概率分布可以分别用它们的熵，即H（A）和H（B）来表示：

它们的联合信息熵可以表示为

随机变量的互信息可以表示为

其中a∈A,b∈B,PA(a)和PB(b)分别是系统A和B完全独立时的的概率分布.PAB(a,b)是系统A和B的联合概率分布.

令图像A和B的互信息为I(A,B)，将式（1）、（2）、（3）分别代入式（4），即可得到图像互信息的计算公式：

在车牌识别系统中，虽然分割字符图像和字库字符图像来源不同，但它们都是基于共同个体的同一位置的解剖信息[6]，所以当两幅图像的互信息值越大，就说明它们像素所对应的灰度点重叠越多，即两幅图像的相似度越高，通过比较互信息值的大小来筛选出字库字符中与分割字符最相似的字符.

虽然互信息测度在相似性度量方面有着成功的应用，但由于两幅图像重叠部分的大小对互信息测度有着较大的影响，互信息值跟两幅图像重叠部分的大小成正比，重叠部分增加，参与统计互信息的像素增加，使互信息值增大，所以最大互信息值并不能保证相应字符的准确识别.因此，Studholme等提出了一个归一化互信息测度，归一化互信息能减少对图像重叠部分的敏感性，计算精度更高.归一化线性函数转换如下：

其中x、y分别为转换前、后的值，max Value、min Value分别为样本的最大值和最小值.

在互信息测度中加入归一化处理后，可以使得该算法具有更强的稳定性.

3.2 车牌字符识别实现

在实现车牌字符识别时，首先在读入图像a和图像b时应当注意图像文件的维度.本文使用的字库中的图像虽然只有黑白两色，但仍然有RGB三个通道，要预先用rgb2gray函数处理.接着使用归一化直方图来计算联合信息熵.本模块核心代码如下：

然后通过计算两幅图的联合信息熵H（ab）以及本身的信息熵H（a）、H（b），可以得出两幅图的互信息值为MI=H（a）+H（b）-H（ab）.

相较于常用的模板匹配法以及其他一些方法如SSIM算法[7]等关于“2”和“Z”混淆，“0”和“D”混淆的情况，互信息算法更具有优势，笔者以上文图中数字“2”为例，分别计算了其与模板中“2”和“Z”的互信息值为0.7373和0.3448，两结果相差较大，即使图像有一定的噪声，也能准确识别，不需要像SSIM算法等再对其角点进行分析作二次处理.

4 实验结果及分析

利用上述车牌识别算法对车牌进行识别实验分析，本文算法运用MATLAB仿真工具实现，计算程序采用MATLAB R2009，在P4 2.39 GHz、内存2 GB的计算机上仿真实现，实验步骤如下：

a）采用蓝色像素统计法对车牌进行快速定位；

b）利用Radon变换车牌倾斜校正；

c）通过最大类间方差法寻找合适的阈值对图像进行擦除处理，消除车牌边框之外的干扰；

d）进行擦除反色处理以适合本文白底黑字模板字库；

e）基于互信息算法进行字符识别，完成车牌自动识别全过程.

实验结果如图3～8所示，其中图8为车牌识别结果，很明显，该算法可以正确识别车牌.

笔者选用了1000幅全国共23省蓝底图像测试该算法的普遍适用性，结果准确识别了987幅，成功率98.7%.对于黄色底纹和白色底纹的车牌，只需要将运行代码中表示蓝色像素点的数字范围修改为黄色像素范围和白色像素范围即可.

为了验证互信息算法的优越性，本文对1000副车牌图像分别采用互信息算法和模板匹配法进行处理，其中互信息算法准确识别了987幅，模板匹配法准确识别了903幅，模板匹配法典型识别错误是：如果英文字母与数字图像相近则易识别错误，如“0”与“D”、“2”与“Z”“5”与“G”.

实验结果如图9所示：从实验结果可以发现模板匹配法将图9中的“0”误识别为“D”，而互信息法则能准确识别.由此可见互信息算法的精确度更高且具有较强的鲁棒性.

5 结束语

本文将医学图像配准中的互信息算法融合到车牌识别系统中，通过实验可以看出，相较于模板匹配法，互信息值算法在细节方面更有优势，可以更精确地识别车牌，且不需要二次处理，取得了令人满意的效果，证明该算法高效、稳定，且易于实现.

[1]Choudhury A,Rahman,Wael Badawy,et al.A Real Time Vehicle’s License Plate Recognition System[C].Proceedings of the IEEE Conference on Advanced Video and Signal Based Surveillance,2003∶163-166.

[2]赵小川.MATLAB数字图像处理实战[M].北京：机械工业出版社，2013：94.

[3]刘刚.MATLAB数字图像处理[M].北京：机械工业出版社，2010：82.

[4]陈希.车牌识别技术研究[D].北京：北京交通大学，2011.

[5]陈显毅.图像配准技术及其MATLAB编程实现[M].北京：电子工业出版社，2009：142-149.

[6]冯林.基于互信息的医学图像配准技术研究进展[D].大连：大连理工大学，2005.

[7]王晨，丁辉.基于SSIM的车牌识别算法研究[D].北京：首都师范大学，2013.

Application of Mutual Information Algorithm in License Plate Recognition

XIE Yu1,ZHOU Xue-li1,2,HU Yue1
(1 School of Physics and Electronic Engineering,Changshu Institute of Technology,Changshu,215500,China; 2.School of Communication and Information Engineering,Shanghai University,Shanghai 200072,China)

The mutual information algorithm in this paper is transp lanted from medical image registration into license plate recognition.First,the color of the license plate character information is used to locate the license plate quickly,and calibrate,split out the character to be identified.Then themutual information is calculated between segmented character and font character,and mutual information value reflects the degree of similarity between images.Finally,the final result is determined by comparing the size of the mutual information.The experiment has proved that mutual information algorithm can more accurately reflect the sim ilarity between images compared with other conventional algorithms,thus a more ideal and accurate identification is achieved for license plate recognition.

image registration;mutual information;license plate recognition

TP391.41

1008-2794（2014）04-0078-05

2014-03-01

江苏省自然科学基金项目“高灰阶低干扰LED显示驱动芯片关键技术研究”（BK 2011366）

周学礼，副教授，博士，研究方向：计算机图形学及医学图像处理，嵌入式系统设计，E-mail∶zhouxueli@163.com.