基于卷积神经网络的车牌识别
2020-09-04汪孟杰
彭 洋,汪孟杰
(1.武汉理工大学 计算机科学与技术学院,湖北 武汉430070;2.武汉理工大学 汽车工程学院,湖北 武汉430070)
1 引言
随着经济的发展,汽车已经普及到千家万户。作为汽车最直观的识别标志,车牌识别技术也成为了研究热点问题。通常情况下,车牌识别分为车牌定位、字符分割、字符识别三个主要步骤。由于车牌字符间距较小,区别度较小。目前车牌识别技术已经广泛运用于停车场、高速公路收费站等场所。但由于拍摄环境和拍摄角度多变,基于全连接神经网络的车牌识别需要大量的训练数据提取特征,而且性能不稳定。而最近几年兴起的基于卷积神经网络的字符识别方法相比于传统字符识别技术,能够克服字符识别率较低、识别速度慢等技术困难,其识别率可达到99.7%。
2 技术优势
卷积神经网络具有局部连接、权值共享、下采样三大特性[1]。局部连接即在进行图像识别时,不需要处理整个图像,只需要关注图像中某些特殊的区域,在识别车牌时,按照不同的特征将车辆分成不同的区域,这样就可以只关注车牌区域,使处理图像的时间和效率大大提高。卷积层的另一大特征是权值共享,一个[i][i]的卷积核,则一共有i*i个参数,而通过权值共享,则能够分区域进行卷积,检测到相同的特征,不同的卷积核会有不同的权值参数,每个参数用来训练不同的特征。卷积神经网络三大特性如图1所示,使用权值共享的方法,总共产生了[i]个不同的权值参数,而局部连接则会产生[j]个参数,那么总共有i*j个参数,使用权值共享的方法后,仅仅需要i个权值,更进一步地减少了参数的数量,使训练的时间和效率进一步提高。而下采样则使图像变小,但并不会影响图像识别,处理得更加方便。
3 基于卷积神经网络的车牌识别
3.1 车牌定位
车牌定位主要分为基于图形图像学的定位方法和基于机器学习的定位方法。依靠图形图像定位的方法,在识别时,外界会有很多干扰图形、干扰颜色和干扰边缘,而传统的滤波方法很难消除图形图像干扰,因此使用基于图形和图像的定位方法时,很容易造成定位失败,假如给一个处理该误差的算法,那么会选定很多非车牌区域,处理速度慢,难度大。基于机器学习的定位方法分为基于特征工程的方法和基于神经网络的定位方法,前者训练车牌识别时速度和效率都很低,所以基于神经网络的定位方法则是目前主流的定位方法。基于神经网络的定位方法可以分为全神经网络和卷积神经网络,相比于全神经网络,卷积神经网络具有的局部连接、权值共享、下采样三大特性,使得图像识别和定位的效率大大提高。由于卷积神经网络具有平移不变性,在学习过程中可以辅以候选区域,并对候选区域进行分类。正确分类的候选区域即为目标定位的位置。此类方法有较多实现模型,如RCNN、faster-RCNN、SSD等[2]。
图1卷积神经网络三大特性
3.2 字符分割处理
在进行车牌字符识别时,通过百度AI实训平台——AI Studio进行识别训练。首先,导入characterData.zip文件夹,里面包含了0~9、A~Z以及各省简称。由于国内没有公布车牌信息的网站,所以在采集信息进行训练时,对0~9、A~Z、各省简称字符分割,方便对车牌上的字符进行重组,以便进行大量的训练。车牌字符分割如图2所示。
3.3 字符识别
字符分割之后,便开始对字符进行识别训练。训练步骤如下:①查看当前挂载的数据集目录,该目录下的变更重启环境后会自动还原;②导入需要文件包;③解压原始数据集,将src_path路径下的zip包解压至data/dataset;④生成数据列表并存放所有类别的信息;⑤对车牌图片进行处理,识别出车牌中的每一个字符并保存。模型的训练结果如图3所示,识别无误。
图2车牌字符分割图
图3模型的训练结果
3.4 模型训练
基于卷积神经网络的车牌识别技术优势之一是可以高速、高效率地进行大量模型训练,在对分割字符进行上万次的排列组合后,也进行了上万次的训练识别[3]。累积训练时间如图4所示,从中可以看出,随着训练次数的增多,识别的速度也逐渐增大,在经过上千次的训练之后,几乎可以准确无误进行高速识别。训练累积识别失误率如图5所示,可以看到,随着训练次数的增加,车牌识别的失误率在慢慢降低,最后几乎可以达到零失误。
4 结论
本文基于卷积神经网络算法对车牌信息进行识别,通过百度AI实训平台——AI Studio进行识别训练,相较于传统的车牌识别方法,不需要对干扰图形和干扰颜色进行滤波,卷积神经网络算法在车牌定位、字符分割、字符识别方面都有着十分高的效率[4]。而卷积神经网络通过大量的训练,识别速度和识别准确率等方面得到很大提高。而目前存在的问题就是无法获得较多实际车牌信息,无法得到切合实际的训练效果,但是由于本文在字符切割进行了高效率的处理,因此在字符切割方面不存在过大的问题。
图4累积训练时间
图5训练累积失误率