APP下载

卷积神经网络在纸币冠字号识别中的应用

2017-06-24张志文赵楠楠

辽宁科技大学学报 2017年2期
关键词:字号纸币字符

张志文,赵楠楠

(辽宁科技大学电子与信息工程学院,辽宁鞍山114051)

卷积神经网络在纸币冠字号识别中的应用

张志文,赵楠楠

(辽宁科技大学电子与信息工程学院,辽宁鞍山114051)

基于卷积神经网络能够直接从训练样本中提取特征并且具备权值共享等优势,本文提出了利用两级卷积神经网络实现纸币冠字号的识别方法。在字符分割过程中,考虑到待识别对象因破损、脏污等情况而引起的问题,提出了窗口移动配准法。实验表明,识别率可达99.99%以上,识别时间能控制在5 ms以内。

卷积神经网络;权值共享;冠字号

冠字号作为纸币识别的唯一标志,其对于纸币防伪、收兑残缺纸币、加强人民币的监督管理等方面都有着重要的作用。针对冠字号的识别,文献[1-2]中基于最近邻和支持向量机算法以及基于字符结构特征对冠字号的识别做了分析并给出了改进方法。虽然这些方法达到了一定的准确率,但识别速率并不理想。文献[3]中研究了结合模板匹配法与Hopfield神经网络的识别方式,没有考虑到被污染纸币的识别问题。文献[4]针对此问题采用了多层神经网络对识别速率进行改进算法的研究,取得了不错的实验结果,但这些方法在实际应用中识别效率并不是很高。

卷积神经网络(Convolutional Neural Network,CNN)在图像识别过程中对视觉模式的获得是从原始图像中直接获得的,预处理少,较一般神经网络更加高效,其独特的权值共享使得网络结构更加简单,同时也增强了网络适应性并加快了网络的识别速度。目前,CNN在人机交互系统的手写字体识别、汽车车牌号识别、人脸识别、路牌识别、身份证号码识别等领域得到了广泛应用[5-8]。

为了保证被污染纸币图像的识别效率,本文在投影法的基础上提出了窗口移动配准法,提高了算法的适用性,也为之后利用卷积神经网络进行识别奠定了基础。

1 卷积神经网络

CNN在本质上是一种输入到输出的映射,不需要任何输入和输出之间精确的数学表达式就能够学习大量的输入与输出之间的映射关系,只要用已知的模式对网络加以训练就可以使其具有输入与输出间的映射关系,进而识别的速度也得到了一定的保障。

1.1 网络结构

CNN是为识别二维形状而特殊设计的一种多层感知器,典型的卷积神经网络结构[9]如图1所示。每层有多个二维平面组成,而每个平面由多个独立神经元组成。这种网络结构对图像的各种变化有着很强的适应性。

该CNN模型是由两个卷积层和两个子采样层交替构成。在CNN中,图像的一小部分也就是局部感受区域作为层级结构的最低层的输入,信息再依次传输到不同的层,每层通过一个数字滤波器去获得观测数据的最显著的特征[10]。这个方法能够获取对平移、缩放和旋转不变的观测数据的显著特征。由于图像的局部感受区域允许神经元或者处理单元可以访问到最基础的特征,冠字号码图像上的主要特征是边缘和角点,因此非常适合采用CNN的方法进行识别。

图1 卷积神经网络结构Fig.1 Structure of convolution neural network

1.2 网络的训练

假设第l层是卷积层,第l+1层为下采样层。第l层第j个特征图的计算式为

第l层的第j个特征图的残差计算式

其中up(x)是将第l+1层的大小扩展为和第l层大小一样。

误差对b的偏导数式为

误差对w的偏导数式为

2 号码图像的分割处理

在对字符进行识别之前,对采集到的冠字号码图像需要进行预处理,具体包括图像的倾斜校正、二值化、单个字符定位、单个字符大小归一化。

字符的分割[11-13]是对其进行识别的关键所在,冠字号中每个字符精确的分离是识别的保障。一般情况下,对二值化后的图像进行三次投影,确定每个号码所在的上下左右位置。其中,第一次进行水平方向投影,确定号码所在的行;第二次进行垂直方向投影,确定每个号码所在的左右方向位置;第三次是对每个小图进行水平方向投影,确定每个号码所在的上下方向位置。这个方法对于大多数纸币的单个号码分割都能取得良好的效果,但是对于冠字号码图像上有脏污,字符与字符之间存在粘连的纸币效果较差,尤其是对三个或三个以上字符的粘连,几乎分割不开。

为了克服这一困难,提出了窗口移动配准法。因为采集的冠字号码大小分辨率固定,每个字符大小固定,每个字符之间的间距也固定,窗口的设计可以根据纸币上冠字号码的间距设计,如图2所示。窗口在垂直投影图上水平移动,窗口内的黑点数总和最小值所对应的位置,即为冠字号码左右方向分割的最佳位置。由于该识别算法最终要结合到实际应用中,所以准确性和快速性都要满足。设计窗口时,脉冲之间的宽度根据号码图像之间的间隔设计。经过测试,该方法完全能够满足纸币清分机实时性和准确性要求。分割效果图如图3所示。

图2 窗口设计图Fig.2 Window design

图3 分割效果图Fig.3 Segmentation effect chart

最后对单个号码图像的大小进行归一化,这里需要归一化的图像是单个号码图像的灰度图像,归一化的缩放算法采用双线性插值算法。归一化后效果如图4所示。

图4 归一化图Fig.4 Normalized graph

3 字符识别

将预处理完成后的单个字符图像送入卷积神经网络训练,经实验验证,并不能达到很好的识别效果,准确率只能达到80.3%。存在的主要问题是不能很好地区分开一些相似的字符,比如8和B、5和S、2和Z等。考虑到冠字号是由字母和数字结合组成的,而部分字母与字母、字母与数字之间存在相似性不好区分,本文最终确定采用二级分类的卷积神经网络。在第一级分类时针对所有的字母与数字,第二级分类针对第一级分类中的部分进行细分类。此时,一级分类的类别数量可以根据分类的需要和设置习惯等进行设置,如果一级分类设置不当的话可能会导致二级识别时还会出现相似字符区分不准的情况,综合各种实验情况,本文最后选取了一级分类23类方式。

3.1 网络设置

第一级分类最后设置为:A 4,B 8,C G 6,O D Q,E L F,H,K,M,N,P,R,S 5,T J(J为2005版及一切版本的人民币),U,W,X,Y,Z 2,1,3,7,9,J(J为2015新版人民币)。

第二级分类是分别对A 4,B 8,C 6 G,O D Q,E L F,S 5,T J,Z 2的分类。

综上,此次二级CNN分类算法一共涉及到9个神经网络的模型。本文以第一级分类的CNN模型为例,具体的一级网络结构设置如图5。

(1)输入层:切割归一化后的单个识别字符图像,大小为14×14;

(2)C1层:第一个卷积层,6个特征图构成,经3×3卷积核卷积后,大小为12×12;

(3)S2层:第一个降采样层,经2×2降幅运算后,大小为6×6;

(4)C3层:第二个卷积层,6个特征图构成,经3×3卷积核后,大小为4×4;

(5)S4层:第二个降采样层,经2×2降幅后,大小为2×2;

图5 网络结构图Fig.5 Structure of first level network

(6)C5层:对S4层的简单拉伸,变成一维向量;

(7)输出层:输出个数为分类个数,与C5层组成全连接结构。

3.2 实验结果

本文采用两级卷积神经网络对人民币冠字号进行了识别,在DM642芯片上对实际采集到的10万张人民币冠字号图像进行测试,识别率达到99.99%,识别速度为5 ms。由表1可知,本文中采用的方法较现有的算法在识别率与识别时间上都取得了很大的改进。而且在识别过程中,对于纸币表面有污渍类的图像也取得了很好的识别效果。

采用模板匹配或是支持向量机进行字符识别,其识别率相对于现有的算法低,主要是没有考虑到个别污染纸币的识别问题。而BP神经网络考虑到了这一问题,且识别率有所提高,但仍然不能满足对纸币识别的高精度要求。利用字符结构特征识别达到了理想的识别率,但字符结构特征算法的维护性差。基于CNN或其他神经网络的识别算法对大量样本集进行训练与学习使得其具有较好的适应性和扩展性,因此广泛应用于模式识别领域。

表1 不同识别方法的识别率与识别时间Tab.1 Recognition rate and recognition time of different methods

4 结论

本文提出了一种基于卷积神经网络的纸币冠字号快速识别算法,在对冠字号图像预处理过程中针对被污染的纸币号码采用窗口移动配准法,保证了污渍类图像分割的准确性。考虑到个别相似字符不好区分,引入了二级识别,保证了识别的准确性,识别率达到99.99%。本文提供的方法比现有技术中的常规算法运算速度快,能够很好地在ATM、验钞机等设备上使用,也能很好的解决纸币污损、残缺等对识别带来的问题。

[1]张晴晴.人民币冠字号码的图像识别技术研究[D].南京:南京理工大学计算机科学与工程学院,2013.

[2]宋普庚,李开宇,程卫平.纸币冠字号识别率改进算法[J].自动化技术与应用,2014,33(11):74-78.

[3]陈正伟,朱建华,周律,等.人民币纸币冠字号码字符识别方法研究[J].浙江科技学院学报,2014,26(6):415-418.

[4]苑玮琦,金灿.基于结构特征的纸币号码识别方法[J].计算机工程与应用,2014,50(8):118-121.

[5]王强.基于CNN的字符识别方法研究[D].天津:天津师范大学计算机与信息工程学院,2014.

[6]陆璐.卷积神经网络的研究及其在车牌识别系统中的应用[D].合肥:合肥工业大学计算机学院,2006.

[7]卢宏涛,张秦川.深度卷积神经网络在计算机视觉中的应用研究综述[J].数据采集与处理,2016,31(1):1-17.

[8]宋波,王启春.卷积神经网络在路牌识别中的应用[J].公路交通技术,2015,10(5):114-128.

[9]HINTON G E,OSINDERO S,THE Y-W.A fast learning algorithm for deep belief nets[J].Neural Computation,2006,18(17):1527-1554.

[10]HUBEL D H,WIESEL T N.Receptive fields,binocular interaction,and functional architecture inthe cat’s visual cortex[J].Journal of Physiology,1962,160(7):106-154.

[11]苑玮琦,张昱.纸币号码识别中分割方法的研究[J].计算机测量与控制,2005,13(8):827-829.

[12]刘鹏.复杂背景下车牌定位与字符分割算法研究[D].大连:大连理工大学控制科学与工程学院,2007.

[13]马婉婕.车牌识别系统中字符分割的研究与实现[D].上海:复旦大学计算机与信息技术系,2009.

Application of convolution neural network in banknote serial number recognition

ZHANG Zhiwen,ZHAO Nannan
(School of Electronical and Information Engineering,University of Science and Technology Liaoning,Anshan 114051,China)

Based on the advantages that convolution neural network can directly extract characters from the training sample and weight sharing,a method of using the two levels CNN is proposed to recognize the RMB serial number.In the process of character segmentation,the method of window moving is proposed,considering the problems caused by the damage and smirch of the object to be identified.The experiment shows that the recognition accuracy can reach at least 99.99%and the recognition time can be limited to less than 5 ms.

convolutional neural network;weight sharing;serial number

November 21,2016)

TP183

A

1674-1048(2017)02-0133-05

10.13988/j.ustl.2017.02.010

2016-11-21。

张志文(1994—),女,甘肃武威人。

赵楠楠(1975—),女,四川广安人,副教授。

猜你喜欢

字号纸币字符
寻找更强的字符映射管理器
黄山徽字号雕刻有限公司
实施农产品质量提升行动 擦亮晋字号特优农业品牌
规范“消字号”产品 增强用药安全
字符代表几
一种USB接口字符液晶控制器设计
消失的殖民村庄和神秘字符
消失的纸币
关于企业字号权及其保护的法律思考
猜纸币