纸币冠字号提取的方法研究
2016-06-25周恋玲
周恋玲
摘 要 纸币冠字号的提取作为光学字符识别的一个重要研究方向,能够准确地识别出纸币中的冠字号具有重要意义,本文主要利用HALCON软件对纸币冠字号的提取方法进行探究,实验结果表明本文方法能够准确提取出纸币冠字号。
关键词 冠字号 HALCON 字符识别
中图分类号:TP391.43 文献标识码:A
0引言
人民币上的冠字号是指纸币左下角的一串编码,冠字号可以作为每张纸币的“身份”信息。目前大多数银行的ATM机上,可以实现对100元面额人民币冠字号的查询,通过自动识别检测对纸币进行判定,将给人们的生活带来便利。由于纸币在流通过程中存在易损的特性,提高纸币冠字号识别的准确性,将是一个重要的研究方向。
1 HALCON介绍
纸币冠字号的自动检测,作为机器视觉的一部分研究内容,具有较为广泛的意义,本文利用HALCON软件完成纸币冠字号检测的方法探究。HALCON是一套标准的机器视觉算法包,利用这款软件可以实现对图像分析的快速开发。与MATLAB相比,这款软件更适合于图像处理,也更具有针对性。HALCON支持多种操作系统环境,支持多种编程语言访问函数接口,并且为大量图像获取设备提供了硬件接口,目前这款软件已经广泛地应用于医学图像、遥感探测、监控等各类自动化检测中了。
2纸币冠字号提取方法
2.1均衡化处理
用于纸币清分系统获取的图像通常都是灰度图像,由于光照条件不同,以及纸币在流通中存在损耗等外界因素的影响,获取的原始图像会存在亮暗不一的情况,因此,通常需要对获取的灰度图像进行预处理。改善图像亮度的处理方法有很多,经过实验对比发现,本文利用直方图均衡化处理就可以得到比较理想的结果。
2.2改进的OSTU阈值二值化处理
为了能够对纸币图像中的冠字号进行提取,首先需要对灰度图像进行二值化处理。在对图像进行二值化的过程中,阈值的选取将对结果产生较大影响,目前比较通用的阈值选取方法是大津法(OSTU),该方法简单稳定。
经过实验发现,如果直接采用OSTU阈值进行二值化,对于较新的纸币效果较好,但是对于存在污点、褶皱的纸币效果并不是非常理想。通常用旧的纸币存在图像整体偏暗的现象,因此选取的阈值应该更低,以便更好地将字符区域进行分割。本文在OSTU阈值的基础上,提出用该值乘以一个比例系数,比例系数的值以整体偏暗的纸币图像的OSTU阈值平均值与整体偏亮的纸币图像的OSTU阈值平均值进行相比。实验结果表明此方法效果较好。
2.3利用面积阈值进行去燥处理
由于纸币出现的字符区域较多,机器在识别冠字号区域时,其他区域的字符将会造成较大干扰。通常情况下,纸币的冠字号区域位置是固定的,这也为我们识别冠字号提供了方便,本文采用固定区域划分来识别冠字号的区域,即选取左下角区域。
另一方面由于冠字号字符的大小通常差异不大,本文采集的图像尺寸为1344€?67像素,设定连通区域的面积阈值在30-300像素之间,以此来有效地排除其他区域的干扰,这样左下角图像的“100”字符可以被有效地排除在所检测的区域之外,并且可以有效地消除毛刺噪声的干扰。
2.4对图像进行闭操作
进行二值化后的图像,对于有些字符,中间存在断裂的现象,如果用面积阈值进行处理后,字符就不是一个完整的字符,必然会导致误识别,此时需要考虑进行膨胀操作;另一方面,对有些字符,由于存在噪声,也会导致误识别,比如:字符K可能中可能带有一些细纹,就会被误识别为M,此时需要考虑进行腐蚀操作。因此,本文考虑采用闭操作来进行处理,此方法能够消除间断和长细的毛刺,并且消除小的空洞,填补断裂。
3结论
在经过上述的步骤处理后,首先计算连通区域的个数,然后逐个对区域进行处理,利用字符库,对提取到的区域图像进行模板匹配,识别图像中的字符,并进行标识,最终得到的结果如图2所示:
根据上图的提取的结果可以看出,采用本文介绍的方法步骤,可以准确地识别出纸币上的冠字号,测试结果较好。
参考文献
[1] 伯特霍尔德·霍恩.机器视觉[M].中国青年出版社,2014:109.
[2] 苑玮琦,邱凯,等.点钞机纸币冠字号图像采集系统[J].仪表技术与传感器,2013:9.
[3] 房爱东,胡学刚,等.纸币序列号的快速识别方法研究[J].计算机工程,2012:12(38).
[4] 李昌海,叶玉堂,等.人民币OCR中的号码区域快速定位新方法[J].光电工程,2012:9(39).