基于NDRAM算法的联想记忆网络在车牌汉字识别中的应用
2015-05-08周俊鹏王连明
林 青,周俊鹏,王连明
(1.电子科技大学图书馆,四川 成都 611731;2.国家电网四川乐山供电公司,四川 乐山 614000;3.东北师范大学应用电子技术研究所,吉林 长春 130024)
基于NDRAM算法的联想记忆网络在车牌汉字识别中的应用
林 青1,周俊鹏2,王连明3
(1.电子科技大学图书馆,四川 成都 611731;2.国家电网四川乐山供电公司,四川 乐山 614000;3.东北师范大学应用电子技术研究所,吉林 长春 130024)
提出了一种基于NDRAM算法的车牌汉字识别方法.分别采用基于外积法和伪逆法的Hopfield网络和NDRAM算法对加有不同噪声水平的椒盐噪声的车牌汉字和具有不同程度缺失的车牌汉字进行了仿真识别.结果表明,NDRAM方法具有更高的识别率和更强的自适应性.
NDRAM;联想记忆;模式识别;汉字;车牌
车牌识别在交通领域具有广泛的应用需求.目前我国使用的车牌由汉字、字母、数字组成,由于汉字结构复杂,因此是车牌识别中的难点与重点.在实际应用中,由于污损或光照等因素影响,待识别车牌汉字通常带有一定的缺损或噪声,要求识别系统具有一定的容噪能力.传统的汉字识别的方法主要有人工神经网络、模板匹配、特征识别、支持向量机等[1].
人工神经网络在模式识别应用中属于比较成熟、有效的工具,除了最为广泛使用的BP神经网络外[2],还有SOM神经网络、MLP网络、RBF神经网络等也被用于模式识别.BP神经网络通常采用多层结构,所使用的神经元数量较多,[3]它用于汉字识别时,首先需要提取汉字特征对神经网络进行训练,因此处理过程相对复杂,识别效果也主要取决于所提取的特征是否合理,同时BP神经网络对干扰比较敏感,容易陷入局部极小值.
NDRAM是近年来提出的递归人工神经网络算法[4],它具有无监督学习、容噪能力强、容量大等特点[5].根据车牌识别中对容噪能力的要求,本文应用NDRAM算法具有联想记忆的特性对车牌汉字进行识别.此外,使用NDRAM算法进行处理,还具有无须对字符进行特征提取,生成的吸引子位于全局最小值等优点[6],克服了人工神经网络容易陷入局部极小值的缺陷.
1 NDRAM算法
NDRAM(Nonlinear Dynamic Recurrent Associative Memory)是2005年由Sylvain Chartier提出的算法[7],其作用函数为非线性的S型函数,并可记忆双极型{-1,1}和非双极型吸引子.在网络结构上,作为全互联的单层神经网络,通过权值的连接,所有神经元的输出都将反馈用做下一次的输入,网络迭代直至收敛,形成一个动态的递归网络.
该算法可实现联想记忆,对加噪或缺失的模式进行恢复,从而达到识别的目的.网络的输出由输入、权值、作用函数、迭代次数共同决定.该算法实现分为学习、回忆两大阶段.学习阶段根据记忆模式生成权值,回忆阶段对输入进行识别.
图1为NDRAM网络的结构,其中W为n×n对称矩阵,代表权值矩阵,n为神经元个数,W的对角线不为零,具有自反馈.Xi(i=1,2,…,n)代表第i个神经元;X(t)代表t时刻神经元的状态.
图2为NDRAM神经元结构,第i个神经元第t+1时刻的状态Xi(t+1)由权值、其他神经元的上一时刻状态Xi(t)、作用函数、权值共同决定.Wij代表第i个、第j个神经元之间的连接权值,是权值矩阵W中第i行第j列的分量.网络运行中,神经元采用并行更新的方式.
图1 NDRAM网络拓扑结构
图2 NDRAM神经元结构
NDRAM神经元的作用函数如公式(1)所示,其函数曲线如图3所示,NDRAM神经元作用函数的域值范围为[-1,1].其中,当自变量为[-1,1]时,对应的映射部分为非线性.作用函数在网络的学习阶段与回忆阶段均需使用,δ为传递参数,通常δ=0.1.该作用函数保证了算法的收敛,使其生成的吸引子为渐进稳定点[8].
(1)
NDRAM神经网络的学习过程如图4所示.在学习阶段,输入记忆模式,初始权值为0,根据记忆模式与神经元迭代后状态的差值进行学习并更新权值.
图3 NDRAM作用函数
图4 NDRAM学习过程
最终权值大小由记忆模式、迭代次数共同决定,如公式(2)和(3)所示.
(2)
X(p)=f(W×X(p-1)).
(3)
其中:X(0)表示神经元的初始状态,即需要记忆的模式;X(p)代表通过作用函数的p次迭代后的神经元状态;η为学习参数,通常η=0.01,控制权值对差值的学习速率.
在回忆阶段,输入为待识别对象,将输入送入网络,各神经元状态将随时间变化,经过数次迭代后收敛到该动态系统的吸引子,网络将输出相应的记忆模式,完成模式的识别.
2 车牌汉字识别仿真实验
噪声定义:类比实际应用的噪声情况,我们使用随机位置的椒盐噪声.噪声水平决定了噪声像素点的总量.在确定噪声水平后,随机地将相应数量的像素取相反值.
本文使用我国车牌中常用的37个汉字作为记忆模式,记忆模式全部取自实际车牌的截图.图片大小为32像素×16像素,使用{-1,1}作为神经元状态.将模式由矩阵变换为向量,向量的每个分量对应一个神经元,共512个神经元.
类比实际应用的缺损情况,以不同边长的方阵作为缺损噪声,边长代表噪声水平,方阵中所有像素值为1,噪声随机分布于待识别对象中.
记忆的标准模式、加不同噪声水平的椒盐噪声后的待识别车牌和带缺损噪声后的待识别车牌见图5—7,图片上方的数字代表了相应的缺损噪声边长.
图5 记忆的标准模式
图6 带椒盐噪声的待识别对象
图7 带缺损噪声的待识别对象
相同噪声水平下,为去除随机性的影响,共进行20次实验,取错误率代表当前噪声下的网络识别水平.当输出与相应记忆模式完全相同时视作正确识别.错误率定义为
(4)
其中:ep为错误率,取值范围为[0,1];xerrors为当前噪声水平下所有模式进行加噪实验中未正确识别的次数;ysum为当前噪声水平下所有模式进行加噪实验的总次数.
离散Hopfield网络是递归神经的典型代表,其权值可利用外积法、伪逆法等生成,输出的作用函数使用符号函数.因此,将NDRAM结果与离散Hopfield网络的识别结果进行对比,其结果见图8—9.
图8中横轴代表椒盐噪声的像素总量,纵轴代表相应算法时的网络识别错误率.图9中横轴代表缺损噪声边长,纵轴与图8相同.
图8 加椒盐噪声时3种算法识别的错误率
图9 加缺损噪声时3种算法识别的错误率
基于外积法的传统离散Hopfield网络运算简单,然而,样本间是否两两正交,每个样本中各分量取(1,-1)的概率、各样本间差异等因素与网络表现密切相关[9].在实际应用中,由于样本不能完全满足以上要求,导致网络容量与吸引域大大减小,因此,外积法设计的网络不适于大容量的联想记忆网络[10].
基于伪逆法的传统离散Hopfield网络,权值非对称,当记忆模式线性相关时,外积法存在的问题用伪逆法依然无法解决.由于存在求逆运算,过程较繁琐.当神经元个数、记忆模式数较多时,计算有困难.此外,该算法的权值不能由网络学习生成,识别过程中容噪能力不高.
由图8和9可知,NDRAM在识别过程中的容噪能力明显高于基于外积法和伪逆法的传统离散Hopfield网络,当椒盐噪声总量低于181像素、缺损噪声边长小于11像素(总量低于121像素)时,网络能完全正确地进行识别.NDRAM具有自适应性、识别率高、运算较为简单等优点.
3 总结与展望
NDRAM是近年来针对递归神经网络提出的识别效果较好的算法,具有无监督、容噪能力强的特点.为了改进车牌汉字的识别效果,本文应用NDRAM算法进行识别,对该系统进行了深入的分析,通过仿真实验验证了该算法的容噪能力,充分说明了其优越性.
在后续的研究中,将尝试采用NDRAM对倾斜字符进行识别,并通过改进算法,进一步提高识别率.
[1] 陈海霞,崔茜.基于Gabor小波和PCA的人脸识别[J].东北师大学报(自然科学版),2014,46(4):77-80.
[2] 孟繁静,王连明.视频人脸识别系统中的最佳人脸捕获[J].东北师大学报(自然科学版),2015,47(3):90-95.
[3] 石伟,孙永荣.BP神经网络在车牌识别技术中的应用[J].工业控制计算机,2010,23(4):17-19.
[4] 丛爽. 面向MATLAB工具箱的神经网络理论与应用[M].合肥:中国科学技术大学出版社,2009:118-158.
[5] 阎平凡,张长水.人工神经网络与模拟进化计算[M].北京:清华大学出版社,2005:360-381.
[6] HÉLIE S. Energy minimization in the nonlinear dynamic recurrent associative memory[J]. Neural Networks,2008,21(7):1041-1044.
[7] CHARTIER S,PROULX R. NDRAM nonlinear dynamic recurrent associative memory for learning bipolar and nonbipolar correlated patterns[J]. Neural Networks,IEEE Transactions on,2005,16(6):1393-1400.
[8] HÉLIE S,CHARTIER S,PROULX R. Are unsupervised neural networks ignorant? sizing the effect of environmental distributions on unsupervised learning[J]. Cognitive Systems Research,2006,7(4):357-371.
[9] SUN R,HÉLIE S. Psychologically realistic cognitive agents taking human cognition seriously[J]. Journal of Experimental & Theoretical Artificial Intelligence,2013,25(1):65-92.
[10] HENRI COHEN,CLARIE LEFEBVRE. Handbook of categorization in cognitive science[M].Netherlands:Elsevier,2005:794-814.
(责任编辑:石绍庆)
Recognition of license plate Chinese character based on associative memory of the NDRAM algorithm
LIN Qing1,ZHOU Jun-peng2,WANG Lian-ming3
(1.Library of University of Electronic Science and Technology of China,Chengdu 611731,China;2.Power Supply Company of Leshan,State Grid Corporation of China,Leshan 614000,China;3.Institute of Applied Electronics,Northeast Normal University,Changchun 130024,China)
This paper proposes a method based on the NDRAM algorithm to recognize the Chinese characters on the license plates. After adding different levels of salt and pepper noise and different levels of partial loss on the Chinese characters,Hopfield neural network using Hebb rule,pseudo-inverse method and NDRAM are applied to recognize respectively.Simulation results show that comparing with the other two methods,NDRAM exhibits higher recognition rate and greater adaptability.
NDRAM;associative memory;pattern recognition;Chinese character;license plate
1000-1832(2015)04-0064-05
10.16163/j.cnki.22-1123/n.2015.04.014
2013-12-06
吉林省科技发展计划项目(20130103028JC).
林青(1989—),女,硕士研究生;通讯作者:王连明(1972—),男,博士,教授,主要从事智能信息处理及嵌入式系统研究.
TP 391.1 [学科代码] 520·6040
A