卷积神经网络在车牌识别中的应用实现
2024-12-31陈明洋代红王思彤陈禹含
摘要:随着交通管理、智慧城市等领域的快速发展,车牌识别技术逐渐成为一种关键技术。卷积神经网络作为一种强大的图像处理和特征提取方法,被广泛应用于车牌识别领域。文章采用机器学习、字符分割等技术以提高车牌识别的高效性和准确性。系统涵盖了多种情况下的车牌图像并对图片进行精密的预处理。在车牌分类识别方面,文章除了运用字符分割与关键字识别技术,还设计了具有针对性的卷积神经网络模型,对其进行训练并在多组对比实验后,对模型的识别准确率进行评估。结果表明:卷积神经网络具有较好的识别准确率和一定的实用性和价值性,可应用于智能停车场的车辆识别。
关键词:卷积神经网络;车牌识别;机器视觉
中图分类号:TP183;TP391.41" 文献标志码:A
基金项目:辽宁科技大学省级大创训练项目;项目名称:停车场智能分析与预测。
作者简介:陈明洋(2003— ),女,本科生;研究方向:数据科学与大数据技术。
*通信作者:代红(1975— ),女,教授,硕士;研究方向:网络安全及无线传感网,数据挖掘与分析。
0" 引言
传统的人工车牌登记和识别方式效率低下,前期须要投入大量的人力物力进行停车场搭建,后期须要投入大量的成本进行维护[1],造成耗时长、错误率高、花销大等问题。随着技术的发展,计算机视觉、图像处理、模式识别和深度学习等技术为车牌识别提供了强有力的技术支持。基于卷积神经网络的车位、车牌识别研究通过车牌的自动识别和信息采集,减少了人工介入,提高了车辆登记、收费、处理等业务的效率和准确性,降低了管理成本和交通管理压力,同时,也可以实现停车场的自动计费和车辆的快速进出,提高了停车场的运营效率和服务质量,为车主提供了更好的停车体验。
卷积神经网络(Convolutional Neural Networks,CNN)通过自动学习输入图像中的层级特征表示,能够捕获到车牌图像中的复杂模式。这种能力能够使CNN在车牌识别任务中相较于传统方法具有更高的识别准确率。车牌图像在实际应用中常受到光照变化、遮挡、污损、倾斜、尺寸不一等多种因素的影响。CNN通过其强大的特征提取能力和深度学习模型的泛化能力,在一定程度上克服以上不利因素的影响,提高了车牌识别的鲁棒性。传统的车牌识别系统通常包含多个独立的处理步骤,如车牌定位、字符分割、字符识别等,每个步骤都须要精心设计算法和参数。而基于CNN的车牌识别系统可以将这些步骤集成到一个统一的框架中,通过端到端的学习自动完成车牌的识别任务,从而简化了处理流程,降低了系统的复杂性和维护成本。随着计算能力的提升和CNN模型优化算法的发展,基于CNN的车牌识别系统已经能够实现较高的处理速度,满足实时性要求。这对于智能交通系统、停车场管理系统等需要实时车牌识别的应用场景具有重要意义。车牌识别作为计算机视觉和模式识别领域的一个重要应用,其研究成果和技术进步可以推动相关领域的发展。在不同国家和地区,车牌的格式、颜色、字符集等存在差异。CNN的灵活性和可训练性使其能够适应这些差异,通过调整网络结构和训练数据,实现对不同国家和地区车牌的有效识别。CNN在车牌识别领域推动了相关技术的发展和应用场景的拓展,为智能交通系统、公共安全等领域的发展提供了有力支持。
1" CNN理论简介
CNN是一类包含深度卷积计算且具有深度结构的前馈神经网络,一般包含输入层、卷积层、池化层、全连接层和输出层[2]。CNN作为一种常用的深度学习模型,在图像识别领域具有广泛的应用。经过大量的数据训练,该算法可以持续使用,减少冗余操作,通过车牌照图像数据集训练多种神经网络,寻找用于车牌照识别的最佳网络结构和最终识别模型,进而提高可视化技术分析模型的有效性及可靠性。
输入层作为CNN的第一层,主要工作是输入图像等信息。对于输入图像,首先要将其转换为对应的2维矩阵,该二维矩阵由图像中每个像素的像素值组成,计算机读取以像素值组成的二维矩阵存储的图像。卷积层主要用于提取图像特征,通过滑动卷积核提取车牌照图像中的局部特征,能够捕获到不同文字、数字和字母等关键信息。池化层主要用于处理特征选择和信息过滤卷积层输出的特征图。池化层用于解决过渡拟合问题的中间层,能够压缩图像确保CNN算法执行不至于陷入过度拟合状态[3]。通过卷积、非线性和池化等操作,CNN可以从低级特征中分层挖掘出高级特征,捕获到不同尺寸、方向和位置等关键信息,从而获得更好的分类识别学习能力。输出层通常是一个全连接层,全连接层完整地连接当前层和前一层的所有特征平面神经元,由于卷积层和下采样层是二维特征平面,而全连通层输出一维向量,所以网络中首个全连接层需要将二维特征平面转换为一维向量形式。全连接层通常采用多层感知器网络来实现,最后输出识别类别[4],其可将前几层输出的特征图或者一维向量经过计算后得到识别结果。该计算过程既可能是线性的,又可能是非线性的。在多分类问题中,输出层会输出每个类别的概率值,代表识别为当前类别的概率。模型最终会选择概率最大的类别作为识别结果。在训练过程中,CNN通过调整参数来优化模型的准确率,使得识别结果更加准确。最后一层输出层可视为分类器,预测输入样本的类别。
2" 设备端模块设计与实现
本文利用计算机视觉技术和图像处理技术,对摄像头捕捉到的车位图像进行分析。目前,图像纹理特征提取方法可以分为以下几类:基于统计的特征、基于结构的特征、基于几何的特征和基于信号处理的特征。采用的纹理特征是基于局部二值模式提取的[5]。从停车场图像中提取车位的关键点信息,如车位的边界、大小、位置等。图像中车位菱形点的位置通过鼠标点击即可方便实现。将图像获取的像素分为每4个1组,存入配置文件,每个车位的像素点单独存放。本研究首先将车牌图像提取在小框之中。由于场景越简单传入CNN框架后图像处理就越轻松,图像最终被定位到一个较小的范围内。在进行上下采样时,图像的特征信息才不会存在较大的损失。首先,本文对车牌照片的大小进行修正,将照片转化为灰度图,处理的方法主要采用加权平均值法,如式(1)所示。
R=G=B=(R×WR+G×WG+B×WB )/3(1)
其中,WR、WG、WB分别为R、G、B的权值。当WR=0.298,WG=0.587,WB=0.114时,可得彩色图像的最合理灰度图像。本文对二值图像进行边缘检测计算。边缘检测是图像处理和计算机视觉中获取图像特征的一种有效手段,利用图像中像素点的对" 比度来判别图像中的边界区域。一般用于图像某一局部区域内像素灰度存在显著变化之处。我国现有车牌包括蓝底白字、黄底黑字以及白底黑字等,这些汽车车牌区域中的字符颜色和车牌底色均有较大的差异;而我国汽车车牌首字符一般为汉字,其后为字母和数字的组合,字符边缘呈现规则的纹理特征,因而采用边缘检测方法来突出图像中的车牌区域实现车牌的定位[6]。本文根据字符的边界将字符框选并分割出来,使用该方法分割出来的字符边缘非常准确。
本研究中测试集使用的车牌照数据来自2个部分:第一部分来自数据集test_images,该数据库收录了38个图片集;第二部分来自train_images,该数据库收录了识别到各种形态的车牌字符图像灰度图。在图像采集过程中,本文充分考虑了车牌不同角度和光线因素。由于不同车牌在不同角度和光线下呈现不同的特征,为了验证所提方法的有效性,提高模型的鲁棒性,确保样本的多样性和覆盖范围,本研究收集的车牌字符包括沪、A、9等不同字符的车牌灰度图并用了7752.8 kB二值图构建训练集和验证集。实验图像共5539张,其中包括3298张字母灰度图图像、987张数字灰度图图像和1254张文字灰度图图像。这种方式划分是为了确保模型在面对不同省份、发牌单位、字符的车牌时能够获得相对准确的分类结果。该实验以97%的图像作为训练样本,3%的图像作为验证样本。
为对比改进前、后每个车位中梯度的总量变化以及车位识别速度,本文实验将所有车位分为2组,每组测试30个车位。实验结果证明了改进方案的有效性,梯度总量对比如图1所示,检测速度对比如图2所示。
由图1、2可知:采用改进后的方案,梯度的计算总量能够明显减少,车位的检测速度能够有效提升。
3" 结语
本文利用CNN、机器视觉、图像预处理、字符分割识别等技术,识别正确率达到97%。实验结果表明:利用CNN模型的车牌检测系统在多种环境下均能保持较高的识别率,这对于提高车牌识别的稳定性和可靠性具有重要意义。同时,研究人员可以结合机器视觉、图像预处理、字符分割识别等技术来优化检测效果。通过训练CNN模型来学习车位的不同状态,如" 空车位、有车车位的特征,系统既能够准确判断车位的占用情况,又能够应对各种复杂场景下的车位检测任务,提升车牌的检测速度,实现自动化的车位检测和管理。这对于提高停车场的管理效率、降低运营成本具有重要意义,为交通管理和智能城市建设提供更加有力的支持。
参考文献
[1]王栋辉.基于AI视觉的智能停车场信息感知方法研究[D].吉林:吉林大学,2021.
[2]刘靖钰,刘德儿,杨鹏,等.基于CNN网络的带遮挡车牌识别[J].测控技术,2021(2):53-57.
[3]童朝娣.卷积神经网络在车牌字符识别中的应用[J].电子技术与软件工程,2019(1):68.
[4]刘华春.卷积神经网络在车牌识别中的应用研究[J].计算机技术与发展,2019(4):128-132.
[5]张一杨,姚明林.局部纹理特征改进空闲车位智能检测算法[J].机械设计与制造,2021(2):223-226.
[6]张彩珍,李颖,康斌龙,等.基于深度学习的模糊车牌字符识别算法[J].激光与光电子学进展,2021(16):259-266.
(编辑" 王雪芬)
Implementation of convolutional neural networks for licence plate recognition application
CHEN" Mingyang, DAI" Hong*, WANG" Sitong, CHEN" Yuhan
(University of Science and Technology Liaoning, Anshan 114000, China)
Abstract: With the rapid development of traffic management, smart city and other fields, the license plate recognition technology has gradually become a key technology. The convolutional neural network, as a powerful image processing and feature extraction method, is widely used in the field of license plate recognition. Meanwhile, this study also uses machine learning, character segmentation and other techniques to improve the efficiency and accuracy of licence plate recognition. The system covers license plate images in various situations and performs sophisticated preprocessing of the images. For license plate classification and recognition, besides using character segmentation and keyword recognition techniques, a targeted convolutional neural network model is designed and trained. The recognition accuracy of model is evaluated after the multiple sets of comparison experiments. The convolutional neural network is applied to vehicle recognition in intelligent parking lots in this study, which has good recognition accuracy and certain practicality and value.
Key words: convolutional neural network; license plate recognition; machine vision