基于MATLAB的汽车牌照自动识别技术研究
2022-06-21张松兰
张松兰
(芜湖职业技术学院 电气与自动化学院,安徽 芜湖 241006)
随着城市化进程的不断推进,汽车保有量也在急剧增加,截至2019年6月,全国机动车保有量达3.4亿辆[1]。如此众多的汽车对城市道路交通和高速公路系统都会造成巨大的交通压力,对交通车辆的高效管理已成为交通行业和城市建设关注的问题,因此,建设智慧城市和智能交通系统已成为城市发展的主流方向。而车牌自动识别系统是智能交通系统的核心环节,在高速公路交通管理和城市道路交通管理等方面占据着非常重要的地位。
车牌自动识别系统[2-3]包括车牌图像采集、车牌定位、字符分割和字符识别等4个典型的环节。系统首先由采集监控设备采集到含有车牌信息的图像,经计算机图像处理定位到汽车车牌,然后由车牌分割技术将车牌上的字符分离出一个个独立的模块图像,最后运用模式识别技术判断汽车车牌的具体字符信息,并合成一个完整的车牌号码。本文以常用的民用车牌为研究对象,借助MATLAB平台设计出车牌识别系统。
1 车牌图像预处理
1.1 原始图像
在图像采集过程中,由于受天气和光线等多种因素的影响,常采用较高分辨率的摄像设备来提高图像的质量,高分辨率的图像给系统识别带来了存储和运算速度方面的压力[4-5]。本文取图1作为车牌自动识别系统的原始图像。
图1 原始图像
1.2 边缘检测
图像处理和计算机视觉中常用边缘检测来提取图像的特征,边缘检测利用图像中某一局部像素灰度有显著变化的区域来体现图像中的边界。我国现有的汽车车牌的底色和字符颜色差异较大,车牌区域内有汉字字母和数字组成的多个字符,图像的边缘具有比较规则的纹理特征,因而采用边缘检测算子结合车牌的矩形特点来提取图像中的边缘区域可实现车牌的定位。常用的边缘检测算子有Roberts、Prewitte、Sobel、Canny、LOG、DOG等。本文采用Roberts算子进行边缘检测,原始图像的二值化图像利用Roberts算子检测后的图像如图2所示。
图2 利用Roberts算子检测后的图像
经边缘检测提取的汽车图像的边缘信息包括有用的车牌信息及众多无用背景的边缘信息。为保留有用的边缘信息而去除无用的边缘信息,本文采用图像形态学方法来提取图像有用的边缘信息。对二值化图像利用一定的结构元素进行腐蚀运算,去除汽车图像中的部分背景物体,处理后得到的图像如图3所示,图3中明显消除了汽车的一些边界点,去除了大部分无效的背景信息,得到物体的边界呈点状形式。然后再用一定大小的矩形结构元素对图像进行闭运算,经闭运算后得到如图4所示的图像,图4中各物体的面积和形状基本保持不变,其总体轮廓与图3一致,图3中呈点状形式,而图4中边界的内部已被填充成白色区块,并把区块邻近的小物体连接起来平滑了物体的边界。根据我国车牌的面积特点,对图4中的图像,移除不符合车牌特征的小对象后得到含有车牌区域的图像如图5所示。图5中除了车牌区域外还包括了面积类似的少部分无关连通域,这部分在后面车牌的定位中利用定位算法去除。
图3 腐蚀后的图像
图4 闭运算后的平滑图像
图5 移除小对象后的图像
2 车牌定位
车牌的定位是车牌自动识别系统的重要环节,根据车牌的矩形特点,对前面处理后的图像统计其横向的蓝色背景像素点,得到其行方向的存在区域,再对纵向统计其背景像素点得到定位后的车牌图像如图6所示。
图6 定位后的车牌图像
因为彩色图像占据较多的存储空间,所以需将其转换成灰度图,在灰度图上可明显地看到图中有两个铆钉图像,为消除铆钉图像,设置适当的阈值后将灰度图转换成二值图,二值图中仍存在铆钉的背景噪声,本文采用中值滤波滤去图像中的噪声信息,然后再根据图像面积大小进行腐蚀或膨胀处理,处理后的图像如图7所示。
图7 滤波后车牌的定位图像
3 字符分割
已完成定位的车牌图像有7个组合字符,对这一整体的字符图像进行分割,分离出7个独立的单个字符图像模块,为后续的字符识别使用。如果在汽车图像的拍摄过程中由于采集设备或车牌本身倾斜等因素造成车牌整体的倾斜,需要对车牌进行校正,可采用Hough变换或Radon变换[6]得到车牌倾斜的角度,修正好车牌图像后进行分割字符,如车牌不存在倾斜问题,直接采用垂直投影法完成字符分割。根据本研究的特点,直接采用垂直投影法完成字符分割,字符分割具体方法为:(1)过滤噪声信息。首先设置合适的阈值对二值车牌图像进行扫描,统计出相应的像素值,排除图像中的干扰区域。(2)确定字符区域。由于字符有效信息所在区域的像素值为1,非有效区像素值不为0。a)当水平方向扫描时统计像素和与设定的阈值相比较,记录下字符所在的纵坐标;b)当垂直方向扫描时统计其像素和与设定的阈值相比较,记录下字符所在的横坐标。由此确定出第一个字符的起始和终止位置。再根据车牌字符的特点设置相应的阈值从左到右逐个切割其余6个字符,分割后的7个字符如图8所示。
图8 分割后的字符
4 车牌识别
字符识别是车牌识别系统的最后一个环节,其识别算法有基于模板匹配的方法、统计字符特征的方法及机器学习方法。其中,基于模板匹配的方法是最常用的方法[7],其识别方法为:先将分割出的字符大小缩放至与模板库字符大小一致,再将分割字符的图像与模板库中的图像逐一进行比对,选择模板库中相似度最大的字符作为最终识别字符。汽车的通行识别是按车牌号码来区分的,我国民用车牌号码主要按省市进行标识,首字符是汉字,代表各省或自治治区、直辖市;第2个字符是字母,表示该省、自治区内各城市或直辖市内各区县;第3个及以后字符是字母或数字。模板库的组成也对应为汉字、字母和数字3个部分。为提高识别系统的实时性,在模板比对时,按分割出的从左到右顺序将首字符与汉字模板库比对,将第2个字符与字母模板库比对。经字符分割后识别出来的“苏”字的二值图像如图9所示,本文采用模板匹配法识别汽车图像的车牌字符结果如图10所示。
图9 “苏”字的二值图像
图10 字符识别结果
5 结束语
车牌识别系统的实现涉及图像处理、模式识别、计算机视觉等多方面的知识。本文以民用的蓝底白字汽车牌为研究对象对车牌自动识别系统中的车牌预处理、车牌定位、车牌分割和车牌定位4个方面进行了阐述,对每个环节的图像处理过程及算法分别进行了介绍,并给出了每个典型环节的图形,为车牌识别技术的研究提供了有价值的参考。