APP下载

钱联网技术智能定位系统的研究

2022-05-30李园园

科学技术创新 2022年17期
关键词:字符识别流程图字符

陈 煜 李园园

(1、商丘学院 计算机工程系,河南 开封 475006 2、中国联合网络通信有限公司开封市分公司,河南 开封 475004)

电子支付的使用范围和支付方式在不断增加,并且不断地冲击着市面上纸币的流通量,但是由于人民币纸币本身的独特性和国内当前使用人民币纸币群体的特殊性,纸币仍然在国内占据相当大的支付比例。人民币在交易和保存的过程中会造成褶皱磨损和污染等等,如果相关机构采用传统人工的方式对大量的人民币冠字码进行识别和统计稍有操作不当往往可能会对纸币造成二次破损,效率不仅非常低下而且容易出现错误,甚至会导致银行资金周转困难等问题的发生,鉴于以上因素人工识别纸币冠字码的方法几乎不可能实施。

我们采用对人民币冠字号码的追踪识别定位的方法,建立“钱联网”更好的掌握其流向。通过识别人民币冠字号码,可以实现对人民币冠字号码的追踪,建立人民币流通管理数据库。通过数据挖掘和大数据分析技术[1],能够从宏观上掌握地区的资金流向,利于宏观上对市场经济进行调控。我们主要从图像采集、图像预处理、冠字号码定位、字符分割、字符识别等几个方面进行详细的描述对人民币冠字号码识别从而实现对人民币的追踪过程。

1 人民币冠字号码的识别

人民币是中国大陆境内法定的流通货币,我们使用的每张纸币都由两种类型的字符组成,主要是通过随机的挑选2 个英文字符和8 个十进制数字随机的组合生成一系列数字。冠字号码位于人民币正面的左下角位置,每张纸币都有唯一的一系列不重复的字符串组成,由于其本身的独特性和唯一性,可以用于纸币的追踪、管理和鉴伪。识别过程预处理的整体流程图如图1 所示。

图1 人民币预处理流程图

1.1 人民币冠字号码的预处理

人民币在使用过程中存在不同程度的褶皱、磨损和污染等各种不确定因素造成纸币的不完整和纸张模糊等,以上不确定因素对人民币字符串序列的识别与提取会造成不同程度的影响,所以为了减少外界不确定因素的影响我们首先需要相应的处理。其中WR,WG,WB 分别代表R, G, B 的系数。经过大量的数据实验比对和测试可以得出,当WR=0.30,WG=0.59,WB=0.11 时,即

F(i,j)=0.3R+0.59G+0.11B (1)

时,可以得到最合理的灰度图像。图2 为原始图像,图3 为灰度处理结果图。

图3 为灰度处理图

1.2 目标区域的提取

为了得到人民币冠字号码,我们需要对灰度化处理后的目标区域中的字符串进行作进一步的处理,使复杂的图片简单化。我们对图像进行二值化使目标区域特征明显化。紧接着对图像进行边缘检测使目标区域从背景当中凸显出来。边缘检测的方法很多通过对不同算法的比对,Roberts 算子是一种利用局部差分算子寻找边缘的算子,它采用对角线方向相邻两像素之差近似梯度幅值检测边缘[2]。因此本课题使用了Robert 算子,图像处理如图4 所示。

图4 边缘检测效果图

为了更进一步的对目标区域的识别和有效信息的提取我们对得到的边缘检测效果图像进行相应的腐蚀膨胀处理[3-4]。利用它可以消除小而无意义的部分。其效果图如图5 所示。为了减少在处理过程中产生的噪声将腐蚀膨胀之后的数据进行相应的滤波处理其效果图如图6所示。

图5 腐蚀膨胀后的图片

图6 平滑处理

1.3 冠字号码的定位

将原图像预处理后,采用水平垂直双向投影法,将图像分别投影到X、Y 坐标轴,然后分别沿X、Y 轴扫描图像[5]。得到的扫描图像如图7 所示。为了得到黑底白字的二进制数据我们对彩色数据进行相应的处理得到的效果图如图8 所示。

图7 冠字号定位图

图8 目标字符串

1.4 字符分割

字符的分割与归一化的流程图,如图9 所示。

图9 字符分割与归一化流程图

本文在此基础上提出了一种基于文本的连续块的算法,当文本的长度超过设置的临界点时,可以将其划分为两个字符。该系统通过对所分割的文字进行标准化,得到的文字图像尺寸达到40*20,符合该模板中的文字图象尺寸。如图10 所示。

图10 字符图像

本系统的模板匹配的字符识别基本过程流程图如图11 所示。

图11 为自动匹配流程图

在进行了大量的文字辨识和其他文字的比较之后,我们得出了一个结论:“或”是一种更好的识别方式,它可以在模版中找出最接近的字母,并将对应的文字显示出来。通常情况下,中国货币的冠词编号共有十个,首位为英文,后九个为英文和数字混合组成。本系统的数据模板库是由26 个大写字母和10 个数字构成。匹配模板库如下所示。

首先提取模板库中的文字,然后将所要辨认的文字与所对应的模板进行比对,最后得出的数字为0,则对应的概率就会更高。将每个相加得到的0 数值的数目保留下来,作为所辨识的结果,并将其存储到对应的文档中。在图12 中显示了一个字符标识图。

图12 为字符识别

2 系统的设计与实现

本系统的人民币冠字号码自动识别是基于MATLAB图形用户界面环境(GUI),通过窗口、选单、按钮、文字说明等对象构成一个美观的界面,用户可利用鼠标或键盘方便地实现操作。本研究利用GUI 设计了一个友好的界面,实现对人民币冠字号码处理,方便直观,便于用户操作。在运行界面中,点击“输入图片”按钮,可以将原始图片输入到系统中,再点击“图像处理”按钮,这一系统将依次运行图像预处理、冠字号定位、字符分割、字符识别四大部分并将其结果在GUI 界面中演示,最后点击“退出系统”按钮退出本系统[6]。系统在GUI 界面中演示设计图和演示结果图分别如图13、14 所示。

图13 演示设计图

图14 演示结果图

3 结论

该研究主要基于MATLAB 对人民币冠字号码号码序列识别和人民币的定位综上所述具备了准确识别冠字号码的技术,如果将所有验钞机进行联网,就可以追踪到每张钞票的踪迹。冠字号码的识别和联网,在反贪、抓逃等方面都能起到难以想象的作用。

猜你喜欢

字符识别流程图字符
云的识别指南
论高级用字阶段汉字系统选择字符的几个原则
字符代表几
一种USB接口字符液晶控制器设计
图片轻松变身ASCⅡ艺术画
一种程序源代码的标准化流程图转化方法∗
融合字符及字符排列特征的铭牌识别方法
一种基于OpenCV的车牌识别方法
基于MATLAB的图片中字符的分割与识别