基于BP神经网络的有价证券序列号识别
2015-06-29刘晓雅
刘晓雅
摘要:有价证券快速鉴伪一直是金融领域重点研究课题,本文针对有价证券序列号识别速度慢、效率低的问题,提出了一种基于BP神经网络的有价证券序列号模式识别算法。算法首先通过中值滤波降噪、二值化等等方法将光学传感设备获得的有价证券原始图像进行预处理,然后采用基于网格的八方向梯度特征对序列号进行特征提取,最后通过训练后的BP神经网络对有价证券序列号图像进行识别,得到有价证券序列号。仿真结果对比表明了该方法的有效性。
关键词:径向基,神经网络,特征提取,有价证券识别
中图分类号:G64 文献标识码:A 文章编号:1672-3791(2015)05(c)-0000-00
1引言
随着我国经济快速发展,有价证券在日常经济活动中的流通也更加频繁,如何对有价证券进行快速鉴伪越来越重要。每张有价证券都具有独一无二的序列号,是每张有价证券的“身份证”,金融领域常采用有价证券序列号来进行有价证券的鉴伪,因此,如何对有价证券序列号进行快速识别是有价证券鉴伪工作的关键,也成为图像识别与人工智能领域研究的热点问题[1]。
传统的有价证券序列号主要采取人工识别,人工识别不但浪费大量的人力成本,而且识别效率低,已经不能适应快速发展的经济活动需求。随着计算机技术与自动验钞技术的发展,有价证券序列号自动识别系统引起了广大学者的广泛关注,新的算法与技术不断涌现出来。有价证券序列号识别主要为序列号图像特征的提取与分类两个阶段,其中分类器算法的设计是整个识别过程的关键。目前分类器算法主要采取模式匹配法。模式匹配算法是一种数字统计方法,在识别过程中由于有价证券自身的残缺、特征提取不够明显的前提下,会出现错识别现象,影响了整个系统的识别精度。同时模式匹配算法也缺乏智能性,无法适应整个清分系统的发展需求[2]。近年随着人工智能算法的不断发展,在不同领域得到了广泛应用,其中人工神经网络更是在模式识别算法中得到了重要应用,也为有价证券序列号识别提供了新的解决思路。
本文基于人工神经网络算法,提出了一种快速的有价证券序列号模式识别算法,并运用模拟仿真与模式识别算法进行了对比分析。
2 有价证券序列号码识别流程
有价证券序列号识别系统通常有硬件部分与软件部分组成。硬件部分包括计算机、光学图像传感器与数字信号处理单元,软件部分包括图像预处理、序列号特征提取与序列号识别等[3]。本文算法主演研究软件部分,识别系统如图1所示。
图1 有价证券序列号识别流程图
3 有价证券图像预处理与序列号特征提取
3.1有价证券图像预处理
图像预处理是机器视觉实际应用中非常重要的一个环节,能有效提高有价证券序列号的识别准确率。预处理包括对图像进行噪声抑制、信号增强及目标提取等。
有价证券放入验钞机后,通过CIS采集序列号正反两面图像,通常序列号的透射图像与反射图像位置信息基本一致,但由于有价证券在流通过程中会不可避免出现磨损、污染、缺损等现象,加上图像传感器本身存在的噪声源,因此图像采集过程中噪声会加载到原始图像上而影响后期处理。抑制噪声通常采用滤波操作,本文采用中值滤波法去除图像噪声。中值滤波法是基于邻域的算法,不仅可以有效清除脉冲噪声,同时能较好地保护图像边沿。其核心思想是为待处理像素点选取一个邻域,然后将邻域中所有的像素点按灰度级排序,再取中间值作为该点输出的像素。中值滤波的效果通常由邻域的空间范围和中值计算中所涉及的像素个数决定。去噪后的图像采用基于占空比的二值化方法对序列号图像进行二值化,同时利用Hough变换对序列号码图像进行了倾斜校正[4]。
基于有价证券图像特征,采用垂直投影法对字符上下边界及左右边界进行了准确定位与切分。切分好的序列号图像采用线性归一化方法,通过最近邻域插值法缩放成32x48的字符图像。
3.2有价证券序列号特征提取
特征提取是整个字符识别系统中十分重要的步骤,其基本任务是从原始数据中找到最能代表同类数据的特征及同类数据中的差异,从而有效提高识别率[5]。通过对比分析,本文采用基于网格的八方向梯度特征作为序列号字符的识别特征,网格特征能有效降低图像的维度并具有较好地区分性能,而梯度信息能反映出图像的轮廓信息。
4基于BP神经网络的有价证券序列号识别
人工神经网络是由许多神经元的节点相互连接构成,通常采用基本的BP(Back Propagation)神经网络或其衍生网络。BP神经网络是单向传播的多层前馈网络,第一层为输入节点,最后一层为输出节点,中间有一层或多层隐藏节点。一般中间层采用Sigmoid传递函数,而输出层一般采用线性变换函数。BP神经网络的特点是各神经元仅与相邻层神经元有连接而与本层神经元无连接,如图2所示。
图2 BP神经网络结构图
根据BP神经网络的特性,其初始值与激励函数对模型的识别性能有较大的影响。初始值选取不当可能造成神经网络的早熟或不收敛。本文采用遗传算法确定BP神经网络初值,激励函数采用经典Sigmoid函数,其模型如下式:
其中Θ为阈值,T为网络温度常数。
本文针对有价证券序列号包含字符与数字的特征,采用的神经网络结构如表1所示,识别基本步骤如下:
1) 按照3.1所示方法对有价证券图像进行预处理;
2) 按照3.2所示方法对有价证券序列号图像进行字符分割与特征提取;
3) 对特征向量采取BP神经网络进行训练,建立有价证券序列号识别模型;
4) 对待识别有价证券序列号模型进行识别,输出结果。
5仿真分析
为验证BP神经网络在有价证券序列号识别中的有效性,选择了500张有价证券进行仿真测试,其中450张用于学习建模,50张用于测试,检验模型性能,运行结果表明,该方法能够很好对有价证券进行识别。该仿真采用PC机配置为:CPU PⅣ 2.4G,内存为2G,操作系统为Windows XP,编程语言Matlab,调用Matlab人工神经网络工具箱。同时以识别率和耗时最为指标对识别模型进行评估,并与模式匹配算法和向量机作为对比算法[6],样本测试结果如表2所示。
从表2结果分析,采用BP神经网络算法正确率达到96%,高于其他两种算法的识别效果,识别速度也有较大的提升,更加符合有价证券序列号的在线、实时识别,结果表明了算法的有效性。
6 结论
本文以图像处理技术为基础,提出了一种基于BP神经网络的有价证券序列号识别算法。首先通过中值滤波降噪、二值化等技术对图像预处理,然后采用基于网格的八方向梯度特征对序列号进行特征提取,最后采用BP神经网络对其进行识别,并运用MATLAB进行仿真分析。仿真结果表明,本文算法具有识别准确率高,识别速度快的优点,验证了算法的有效性。
参考文献
[1]胡学娟阮双琛等.基于改进梯度方向直方图的有价证券识别.深圳大学学报理工版.2014(9)Vol.31
[2]涂豫.神经网络的有价证券序列号识别算法.计算机仿真.2011(12)
[3]刘洋.有价证券纸币号码识别算法的研究.辽宁工程技术大学.2012
[4]朱雪娇.图像清分的有价证券序列号码识别关键技术研究.南京理工大学2014
[5]盖杉刘鹏等.新的纸币图像特征提取方法.通信学报.2010(4)
[6]盖杉罗立民.基于退化四元小波变换的纸币识别.数据采集与处理.2014(9)