基于改进卷积神经网络的车号识别算法
2016-05-14王欣蔚
王欣蔚
摘要:动车车号识别是动车安全自动监测系统的一项重要内容。由于光照不均、运动失真等因素,动车车号的可靠识别困难较大。论文研究了基于深度网络的识别算法,通过设计卷积神经网络,以减少资源占用为出发点,获得99.20%的识别正确率。与LeNet-5卷积网络进行对比实验,减少了近6倍的训练时间,并且识别率有所提高。
关键词:字符识别 卷积神经网络 复杂光照 深度学
中图分类号:TP391.4 文献标识码:A 文章编号:1007-9416(2016)07-0126-01
1 相关背景
近两年,深度网络[1]正成为模式识别与人工智能领域的一个重要方向,其中又以卷积神经网络(Convolutional Neural Networks, CNN)[2]等为热点,应用于目标检测、人脸识别等领域。它通过卷积层和下采样层两个特殊结构来实现特征提取过程。能解决传统算法对夜间车号图像识别困难的问题。
然而,其复杂度高、系统资源的需求大,训练需要海量的数据,实际应用不具有以上条件。本文通过研究,在提高识别率的同时,明显降低系统资源的消耗,为深度网络的实际应用探索新的思路。
2 卷积神经网络的车号识别
针对降低网络系统资源消耗、在适度规模的数据集下训练的实际需要,不同的应用主要需要考虑卷积层个数、每层特征图个数、下采样层池化区域大小以及网络的深度。
卷积层的作用是探测上一层特征的局部连接,而下采样层的作用是把相似的特征合并起来。卷积过程要设计卷积核大小,针对样本数据进行调节,如果核的尺寸过大,会增加运算量;如果过小,则不足以提取到有效结构特征。此外,卷积核个数过少会使特征提取的不充足导致识别率低,过多会导致运行时间大大增加。下采样过程需要确定合适的池化区域大小。考虑到信息的损失情况,池化矩阵不应过大,一般为2×2的大小。经以上考虑,本文卷积神经网络结构如图1所示。
由于动车车号应用统一的字体设计,字体结构没有LeNet-5应用场景改变大。因此两个卷积层的设计已满足特征提取的需要,从而大大减少了耗时。由图1可见,首先输入归一化为32×32的像素大小,并以灰度图的形式输入第一层C1。第一个卷积层C1是形成8个经卷积的特征图,得到像素大小为28×28的特征图。之后经过2×2邻域的平均池化,在下采样层S2生成了8个14×14像素的特征图。C3存在20个10×10像素大小的特征图,可生成20个图像大小为5×5像素的S4层。卷积层核的大小均为5×5。接下来的F5层和S4层为全连接,有20×5×5=500个节点,相当于用含500×21=10500个参数的分类器对向量进行分类,因而具有更强的描述能力。
最后,输出层为21个单元,由径向基函数(RBF)组成。对应待测动车车号字符样本库中21个不同的数字和字母。网络的训练过程,通过BP算法[3]由前到后逐层学习的方式。
3 实验结果与分析
实验用的字符样本均来自实际应用环境中获取的动车车号图像。为了提高网络的泛化性能,将原始样本经过仿射变换、添加椒盐噪声和乘性噪声的处理,扩充样本库数量。训练数据集与测试数据集之间没有重叠,部分样本如图2所示。训练数据集包含10500张图像,测试数据集包含2250张图像。所有实验仿真平台为Matlab2012b。
将本文提出的卷积神经网络(记Proposed),与典型的卷积神经网络LeNet-5[3]以及应用BP算法的普通神经网络(记NN)进行识别正确率的实验比较。其中网络的学习率设置均相同。实验结果如图3所示。
因为卷积神经网络相比于普通的神经网络具有更好的鲁棒性,所以两卷积神经网络识别率均高于普通网络8%。而本文的网络比LeNet-5的识别率高0.8%左右。
与LeNet-5在复杂度方面的对比实验,结果如表1所示。
由表可见,本文网络在三种指标上均有优势。由于LeNet-5多一次卷积操作,并且含120个特征图,使复杂度大大提高,致使训练时间比本文提出的网络多出近6倍。
4 结语
传统的方法对图片质量较敏感,对动车车号夜间采集图像识别性能差。本文经过对卷积神经网络的应用研究,在提高识别率的同时,明显降低了系统资源的消耗。结果表明,本文的卷积神经网络识别率达到99.20%,高于LeNet-5,同时缩减了约6倍的训练时间,在内存占用方面占优势。
参考文献
[1]LeCun Y,Bengio Y,Hinton G.Deep Learning[J].Nature,2015, 521(7753):436-444.
[2]LeCun Y,Kavukvuoglu K,Farabet C.Convolutional networks and applications in vision[C].IEEE International Symposium on Circuits and Systems (ISCAS),2010,253-256.
[3]LeCun Y, Bottou L, Bengio Y,at el.Gradient-based learning applied to document recognition [C]. IEEE,1998.USA: IEEE,1998: 2278-2324.