基于神经网络的手写体数字识别

2016-11-02陈园园袁焕丽石齐双

智能计算机与应用 2016年3期

关键词：手写体数字图像特征提取

陈园园，袁焕丽，石齐双

（周口师范学院物理与电信工程学院，河南周口　466001）

基于神经网络的手写体数字识别

陈园园，袁焕丽，石齐双

（周口师范学院物理与电信工程学院，河南周口466001）

本文重点解决以图像方式存在的手写体数字识别问题，首先对图像进行预处理，其次对结构特征进行提取，最后利用神经网络模型对前面两步得到的样本数据进行学习和训练。通过MATLAB进行仿真，神经稀疏编码算法应用在手写体数字识别中能够得到比较好的识别率。

手写体数字识别；预处理与特征提取；神经稀疏编码算法；MATLAB

0　引言

近年来，模式识别获得了迅猛发展和学术界的广泛关注，并且在人工智能研究的高端构建与创新中发挥着基础性的推动作用。当前，模式识别也依然存在着众多问题有待改进与完善：输入样本表达的选择、分类器的选择、采集数据、处理数据、选择数据和样本集对识别器的优化训练。

模式识别中的一个核心组成就是数字识别。而基于时下需求，数字识别中的重点分支—手写体数字识别已经成为当前瞩目的技术热点和焦点研究内容。虽然在手写体数字识别上已经取得了一定成果，识别率基本上不会低于96%。但是手写体数字识别技术却仍然呈现出若干不足，由此而成为文字识别中的关键难点之一。

得益于神经网络和模糊逻辑技术的发展，手写体数字识别正是应用了人工神经网络这一方法，才获得可观和长足进步。因为神经网络具有推广能力、记忆力、非线性和自学习能力以及高速运算能力。综上可得，本文即针对基于神经网络的手写体数字识别给出了研究设计完整过程技术论述。

1　手写体数字识别的预处理

数字识别的第一步便是图像预处理。图像的预处理过程能够显著压缩信息的冗余度，将数字图像中的噪声有效降到最低，从而使得到的点阵规范化、标准化，为后续数字识别提供必备和完备基础［1］。

预处理过程包括3个步骤：平滑去噪、二值化、归一化及细化。其中，平滑去噪技术能够降低灰度图像中出现的黑白噪声，原因则出自人们的手写体数字经常发生断笔、连笔等非预期的理想状况。其后，将图像中的像素依据研究设计准则转换成2种颜色，从而成为图像的二值化。黑白两种颜色则是依据图像的灰度值处理演化形成的。此时，若要将二值化后的图像能完整、逼真地恢复原初数字，主要处理内容包括空白点不在笔画中出现，并且二值化的笔画还得保持最初的文字的结构特征。因而，阈值的选择对于数字图像的二值化具有现实重大作用。同时，归一化就是使数字图像经由某算法的效果设置而达到同一宽度、同一尺寸、同一高度，具体来说，第一是得到原来图像的宽度与高度；第二是将不同要求的宽度与高度比较；第三就是计算得到符合变换要求的参数；第四是算出原图的每个像素点在归一化后所处的新位置；第五是计算出处理后的每个数字图像中的像素值［1］。最后，细化将是对二值化数字点阵进行处理后所形成一个只存在图像像素宽度的数字图形。细化不仅能够显著减少工作的处理量，并且能够保留将原图像的真实可见特征，利于其后开展的特征提取［2］。

2　手写体数字识别的特征提取

数字图像的特征提取关键在于寻求到一种变换，将多维的模式类别转化到低维特征空间。特征提取对于降低计算复杂度表现出了高效及实用价值。与此同时，更加精准的图像分类函数的描述可以应用到训练样本上，从而形成先进、可信的分类规则［3］。

对于结构特征的提取是对预处理过后的图像进行分割，效果呈现如图1所示。

图1　分割图像Fig.1 Split image

由图1可知，图像分割的实现流程为：

1）记录细化后的数字图像，取3条纵向垂直线依次分布在一定的距离处，并标记其与手写体数字的笔段的相交的点数。

2）再将与1）中垂直相交的3条直线依次取位在1/3处，同时分别记下这3条线与数字笔段的交点数。

3）最后取2条直线，并且也将其和数字笔段的交点的个数记录下来。

至此可得，图像结构特征提取的算法描述如下：

1）确定像素值并且要按照一定的方式去扫描。

2）计算出图像的像素与端点的数字N。

3）端点从1逐次递增。

4）从1）～3）依次进行循环操作。

3　基于神经稀疏网络的数字识别模型

研究可知，人类的大脑中获取其他的神经元信息是通过具有精细结构的无数的树突。具有电活性的脉冲是神经元经过一个长长细细的轴突而发出的。轴突后端可以分化成无数个分支，而在所有的分支的末端，轴突的电作用是借由突触的结构将电活性激发演变而来的。经过如上过程后，其他的神经元就会受到兴奋或者抑制。

基于此，学习行为的发生就是因为兴奋输入比抑制输入要更为强大，因而导致了轴突的有效性获得了明确变化。而若辅助以参数调节，就可以达到最佳完美性能。研究实现的学习方式可以概括为：监督学习、非监督学习和再励学习。

首先定义训练样本，假设P为输入矢量，T为目标矢量

实验数据部分综合了10张不同的测试图像，每张图像分别有5个0～9，并对每个数字进行识别。识别后的数据结果可作如下阐释分析：

数字“0”和“1”的识别结果最好，都达到了80%；其次，数字“2”、“5”、“6”、“7”和“8”的识别精度也都达到70%以上；数字“4”的识别结果未臻理想，识别精度要低于60%，4被误识为6的次数较多。

使用MATLAB语言实现本研发系统，设计效果实现可分别列示如下。读入图像，其中有多组测试图片可以用来测试，选定其中一张［4］。读入图像的用户界面如图2所示。

图2　挑选待测图片Fig.2 Choose the picture to be measured

接下来，利用MATLAB中图像处理工具箱读入bmp文件，并将其转化为二值数据，过程中使用了imread、im2double、rgb2gray、mat2gray、im2bw等函数［5］。由此可取得单个的数字图像文件，使用imcrop函数进行剪裁。选取图片中的任意数字，比如5，如图3所示。

经过平滑去噪、二值化、规范化、细化等过程处理以后，即可识别出选取数字。

图3　数字5的各种形状Fig.3 Various shapes of number 5

4　结束语

当前的手写体数字识别的基础是数学建模，不仅难于建立，其应用范围也稍显片面。本文研发设计关键即在于运用神经网络代替了原来的数学建模。首先通过2个重要过程：图像预处理；图像的特征提取。然后基于神经网络的手写体数字识别，用稀疏自编码方法去实现0～9这10个手写体的数分类。最后运用MATLAB实验仿真后可以得知：基于选用定制结构模型和知识库的识别方法对规范手写体数字识别具有高度可行性和现实针对性。并且研究重点利用了神经稀疏自编码网络使手写体数字识别的应用更趋广阔、广泛领域空间［6］。

［1］蔡元明.神经网络识别手写体数字预处理后样本空间凸集性研究［D］.北京：中国科学院半导体所，1995.

［2］崔屹.图像处理与分析—数学形态学方法及应用［M］.北京：科学出版社，2002.

［3］金忠，胡钟山，杨静宇，等.手写体数字有效鉴别特征的抽取与识别［J］.计算机研究与发展，1999，36（12）：1484-1489.

［4］BERNHARD R C，SHI Y.Evolving artificial neural networks［C］// Proc of 1998 Int’l Conf.on neural networks and brain.Beijing，P.R. China：IEEE，2013，26（18）：145-152.

［5］HU J，YAN H.A model-based segmentation method for handwritten numeral strings［J］.Computer Vision and Image Understanding，1998，70（3）：383-403.

［6］丛爽.面向MATLAB工具箱的神经网络理论与应用［M］.合肥：中国科学技术大学出版社，2009.

Handwritten digit recognition based on neural network

CHEN Yuanyuan，YUAN Huanli，SHI Qishuang
（School of Physics and Electromechnical Engineering，Zhoukou Normal University，Zhoukou Henan 466001，China）

This paper focuses on handwritten numbers recognition problems in image way.Firstly，the image pretreatment，followed by the structural features are extracted.Next，The neural network model is used to study and train the sample data obtained from the previous two steps.Through MATLAB simulation，neural sparse coding algorithm can be used in handwritten numeral recognition to get better recognition rate.

handwritten digit recognition；pre-processing and feature extraction；neural algorithm for sparse coding；MATLAB

TP391

2095-2163（2016）03-0140-02

2016-06-05

国家自然科学基金（61401526）；河南省科技厅资助项目（152102210368）；河南省科技厅重点科技攻关项目（162102310607）。

陈园园（1986-），女，硕士，助教，主要研究方向：信息处理、计算机技术。