APP下载

改进的BP神经网络在字符识别中的应用

2019-10-21冯彩英刘龙飞

科学导报·科学工程与电力 2019年41期
关键词:预处理BP神经网络

冯彩英 刘龙飞

【摘  要】为改善传统BP神经网络缺陷,本文对传统BP神经网络进行改进并用于字符识别研究。首先采集来自互联网数据集建立样本库,选择合适的BP网络参数,并对样本库数据进行BP神经网络训练;接着,对待测样本进行预处理操作;最后,采用训练好的网络对待测样本进行识别。实验表明:改进算法对字符识别正确率达到了95%以上。

【关键词】预处理;字符识别;BP神经网络;改进BP神经网络

中国分类号:TP301        文献标志码:A

0 引言

在人们的日常生活中,有很多的数字化信息需要进行人工录入,由于耗时较长并且长时间工作会引起疲劳而不可避免地发生一些意外,这个问题自然而然成为妨碍信息化发展和生产力发展的主要问题。怎样使人们不再受这种烦琐而简单的重复劳动的困扰,成为识别领域中的一个关键问题。手写数字识别是光学字符识别技术的一个分支,目前大多采用BP神经网络进行识别,但BP神经网络存在局部极小值、学习速度慢、结构选取上无确定准则三方面缺陷,影响其识别效果。为了解决传统BP神经网络存在的缺陷,本文对传统算法进行改进。

1 传统BP神经网络

当前神经网络模型中BP神经网络是用最广泛的模型之一,它是一種多层前馈人工网络,在训练过程中采用的是误差逆向传播算法。它的学习规则是最速下降法,首先,输入学习样本,在训练过程中通过误差反向传播来不断调整网络的权值和阈值,使网络的误差最小。具体步骤如下:

Step1:初始化,随机给定所有权值和阈值;

Step2:采集得到训练样本,并给出期望输出数据;

Step3:计算实际输出y

(1.1)

式(1.1)中,f函数为Sigmoid函数:

(1.2)

Step4:调整权值向量,使用反向传播算法不断调整训练网络的权值和误差;

(1.3)

式(1.3)中,为大于零的增益,为节点j的误差,误差的计算根据节点j的形式不同,由公式(1.4)分别计算:

(1.4)

Step5:返回第3步重复,直至误差达到要求结束训练。

不难看出,δ学习规则利用迭代运算求解权值问题,但其收敛速度慢且容易陷入局部极小。

2改进的BP神经网络

针对第1章提到的传统BP神经网络的缺陷,本章对传统BP神经网络进行改进。首先采集得到训练样本和期望输出,并给出一组固定的随机自由权值作为输出层和隐含层之间的权值;然后,采用传递函数计算隐含层的实际输出,再直接将目标输出作为等式的右边,而将输出层与隐含层之间的权向量作为未知量放于等式左边建立方程组,从而将求得的方程组的解作为神经网络的权向量。具体步骤如下:

Step1:初始化,随机给定所有权值;

Step2:采集得到训练样本,并给出期望输出数据;

Step3:计算实际输出,根据输入输出模式对计算隐含层、输出层各单元实际输出;

Step4:计算输出层与隐含层之间的权向量,将目标输出作为等式的右边,而将输出层与隐含层之间的权向量作为未知量放于等式左边建立方程组,从而将求得的方程组的解作为输出层与隐含层之间的权向量;

Step5:迭代调整权值向量,神经网络最后训练的权值向量为第4步求得的权向量加上随机固定的隐含层与输入层的权值。

Step6:返回第3步重复,直至误差达到要求结束训练。

3基于改进的BP神经网络字符识别的实现

由于字符经过光电扫描或印刷时字符的质量和纸张的质量的影响会产生一些噪声,这些噪声的存在给字符特征的提取带来了困难,为了提高识别的准确性,在进行字符识别之前,要对带有干扰的字符图像进行预处理操作。具体流程,如图(3.1)所示:

对字符识别采用改进的BP神经网络算法进行实现,主要过程为字符的预处理、网络的训练、调整各层权值和最后识别完成。具体步骤如下:

Step1:对字符图像进行预处理操作;

Step2:网络训练,根据第2章的改进算法进行权值初始化、权值向量调整等来反复训练网络,使网络达到要求;

Step3:字符识别,将处理后的待识别字符图像送入训练好的网络进行识别;

Step4:输出识别结果。

图3.1预处理流程

4 实验结果

为了检验改进的BP神经网络字符识别的整体效果,网络训练的数据集来自互联网,样本大小为13G左右,测试数据集来自网络随机挑选的35张印刷体字符图片,图片字符包括数字和大小写字母。在进行网络训练时,为了使训练达到一定精度,设置初始迭代次数为1000次。实验中,首先训练网络,然后对待识别字符图片进行预处理操作,最后将处理完成的图片输入网络进行识别测试,每次读取一张含有单个或一串字符的图片进行实验。实验结果如图4.1-4.3所示。

图4.1训练过程

(a)字符图像灰度化             (b)字符图像二值化

(c)原始图像             (d)去噪后字符图像

(e)字符分割

图4.2预处理结果

4.3识别结果

本次实验一共输入35张图片,错误识别一张,识别正确率为97.14%。实验结果表明,改进算法可以顺利处理单行的字符图片;字符处理时间短,基本上在1s以内;系统对图片去噪能力良好;可以允许字符产生一点点形变。

5 结论

改进算法对印刷体字符识别正确率达到了95%以上,但是算法在识别一些字形比较相近的字符时,由于分割算法无法对字符进行分割后的排列,导致识别算法出现错误。进一步改进分割算法以提高字符识别正确率将是下一步的研究重点。

参考文献:

[1]张国福,岳晓峰.基于神经网络的字符在线视觉识别研究[J].光学技术,2018(1).

[2]饶志双,黄宗珊.基于BP神经网络的数字识别[J].科技视界,2018(7).

[3]邓介一,刘黎志,谭培祥.基于神经网络的数字字符识别系统设计与实现[J].软件导刊,2017,6(5):47-50.

[4]史兴宇,邓洪敏,林宇锋等.基于人工神经网络的数字识别[J].计算机应用,2017,37(s1):187-189.

[5]饶志双,黄宗珊.基于BP神经网络的数字识别[J].科技视界,2018(7).

[6]Zhao Z,Yang Z,Ling L,et al.Disease named entity recognition from biomedical literature using a novel convolutional neural network:[J].Bmc Medical Genomics,2017,10(Suppl 5):73.

基金項目:

2019年校级教育教学改革研究与实践项目(2019JGXM25).

作者简介:

冯彩英(1987-),女,河南商丘人,硕士,主要从事计算智能与模式识别研究.

刘龙飞(1995-),男,河南平顶山人,本科,主要从事模式识别研究.

(作者单位:商丘工学院信息与电子工程学院)

猜你喜欢

预处理BP神经网络
菌剂预处理秸秆与牛粪混合对厌氧发酵产气的影响
手术器械预处理在手术室的应用
种养废弃物预处理技术可行性分析与实践
液化天然气技术及其应用探析
就bp神经网络银行选址模型的相关研究
碱预处理提高香蕉茎秆厌氧消化产气性能的研究
基于DEA—GA—BP的建设工程评标方法研究
浅谈C语言中预处理
复杂背景下的手势识别方法
BP神经网络在软件质量评价中的应用研究 