APP下载

基于神经网络的图像识别系统的研究

2015-12-21李承昊蔡晨阳

科技传播 2015年21期
关键词:字符识别图像识别字符

李承昊,蔡晨阳,李 锐

沈阳理工大学,辽宁沈阳 110159

基于神经网络的图像识别系统的研究

李承昊,蔡晨阳,李 锐

沈阳理工大学,辽宁沈阳 110159

在社会生活发展的过程中,图像识别技术有着十分重要的作用,随着计算机技术、图像处理技术、模式识别理论的发展与进步,产生了一种新型的图像识别技术——神经网络图像识别技术,通过此种技术的应用,提升了图像识别的准确性及有效性。在本文中,以神经网络为基础,研究和设计了图像识别系统。

神经网络;图像识别;系统设计

随着信息技术的发展,人们已经进入信息时代,作为人类感知世界的视觉基础,图像中蕴含了大量的信息。当前,神经网络已经发展的比较成熟,并在图像识别领域中有着比较广泛的应用,在神经网络的作用下,运算量大大的减少,运算精度显著的提升,同时,高容错性的功能允许图像中某个局部存在残缺或背景模糊,有效的提升了图像识别的准确性。

1 基于神经网络的图像识别系统设计概述

在进行本图像识别系统设计时,以图像中的数字为基础,通过对图像一系列的处理之后,将图像中包含的数字清晰的显示出来。作为一个图像识别系统,既可以单独使用,同时还可以在其他的识别系统中作为核心的软件应用,具有比较高的灵活性及通用性。具体的系统运作流程如下:系统启动完成后,将需要识别的图像输入到系统中,接着利用图像预处理系统对图像进行相应的处理,之后进行字符分割、特征提取,最后进行字符识别,完成之后图像识别结束。

总的来看,首先进行图像预处理,再进行神经网络文字识别是图像识别系统的流程,因此,图像预处理、特征提取、神经网络识别是图像识别系统重要的三个模块,各个模块的具体功能如下:在图像预处理模块中,主要是对上传到系统中的图像进行预处理,并对图像中包含的字符进行分割;在特征提取模块中,包含的提取方法比较多,主要功能是对图像字符的网格特征、水平和垂直特征、像素百分比特征进行提取;在神经网络识别模块中,识别字符的方法为优化之后的BP算法,主要功能包含网络训练、数据读取、字符判定、结果输出。

2 程序设计

2.1 图像预处理模块

第一,读取图像数据。图像数据是图像分析和处理的基础,因此,预处理工作的第一步就是读取图像的数据,包含宽、高以及各个像素点的颜色值[1]。图片在进行存储时,格式比较多,比如JPG、GIF等,为了使运算的数据量减少,本系统在存储图片时,选择256色BMP格式。利用微软图像函数库的dibapi.h及dibapi. cpp进行图像数据读取工作。

第二,预处理图像。首先进行灰度化,2256色位图调色板的内容非常复杂,在进行图像处理时,大部分的算法都无法应用,因此要对图像进行灰度处理,彩色图像中,像素点中的R、G、B值各不相同,通过赋予这三点各自一个加权系数,使各点分量的值相同,从而实现灰度化[2]。其次对灰度图像进行二值化,灰度图像像素的灰度值位于0~255之间,灰度值越大时,图像越亮,为了提升图像处理的便利性,进行二值化处理,依据自适应阈值法,将灰度图像的像素分化为黑或白两种颜色。

第三,图像分割。首先,调整图像的整体倾斜度,按照由下至上的顺序,扫描图像,记录下第一个遇到的黑色的像素点,随后,改变扫描的方向,变为由上而下,同样将第一个遇到的黑色像素点记录下来,这两个点之间的距离就是图像大致的高度范围。其次,进行图像分析,从左至右对图像进行扫描,发现第一个黑色像素点之后,将此点作为图像分割的起始部位,接着进行扫描,无黑色像素点时停止,同时,图像分割结束。

第四,图像的归一化处理。扫描完成之后,图像中的字符可显示出来,但各个字符的大小不一,影响识别的标准性及准确率,因此,要对字符的尺寸进行调整,使其尺寸相同。对比系统要求高度与字符高度,将需变换的系数计算出来,依据此系数进行相应的高度变换,宽度也按照此方法进行变化[3]。按照插值的方法,将新图像里的点映射到原图像中,完成尺寸统一。

第五,图像的紧缩重排。尺寸相同之后,字符在图像中的位置不定,影响特征提取的精确性,通过紧缩重排,形成新的图像字符。

2.2 特征提取模块

经过图像预处理模块的处理之后,图像中的字符变成大小相同、排列整齐,接着,对能够代表字符特点的特征向量进行提取。将图像字符带入BP网络中,开展网络训练工作,从而将样本中的待识别的特征向量提取出来,随后,进行字符识别工作。

2.3 BP神经网络的图像识别模块

模式识别是BP神经网络的重要用途,在进行此模块的设计时,重点在于训练出一个可行、高效的BP网络,以便于精准的识别0~9这十个数字。图像预处理及特征提取完成之后,就需要利用该模块进行训练和识别。

3 系统实验结果

利用数码相机拍摄多个车牌,并以BMP的格式存储图像,随后,将图像输入到本文设计的图像识别系统中,通过图像预处理之后,形成灰度图像,并对车牌中的数字进行规范,随后,利用特征提取模块对其特征向量进行提取,最后,利用BP神经网络的图像识别对车牌中的数字进行识别。识别结果显示,本图像识别系统可准确的识别出车牌中的数字。

4 结论

在基于神经网络的图像识别系统设计中,图像预处理、特征提取、BP神经网络的图像识别是系统中重要的三个模块,通过三个模块协同作用的发挥,有效而又准确的进行图像识别。但本文中设计的图像识别系统还不完善,选择的样品数量有限,而这也成为日后研究工作的主要方向。

[1]张坤艳,钟宜亚,苗松池,等.一种基于全局阈值二值化方法的BP神经网络车牌字符识别系统[J].计算机工程与科学,2010(02):88-90+134.

[2]杨永,骆霞军,王莉利.基于神经网络的汽车车型图像自动识别系统的设计与实现[J].微计算机应用,2010(02):56-60.

[3]金健,林宗桂,金龙.一种基于特征的人工神经网络数字识别系统模型[J].南京气象学院学报,2014(06):828-835.

[4]王振,高茂庭.基于卷积神经网络的图像识别算法设计与实现[J].现代计算机(专业版),2015(20):61-66.

TP3

A

1674-6708(2015)150-0070-01

李承昊,本科,电子信息工程专业在进行BP网络设计时,关键在于确定BP网络3层的神经元数目[4]。在此模块中,第一步的工作就是利用已知训练样本对BP网络进行训练,图像预处理之后,特征的维数就是输入层的节点个数;而在隐层,节点个数并没有硬性的规定,通常,此层所包含的神经元数目越多,BP网络的精神程度越高,促使训练时间延长,不过,神经元的数目不宜过多,避免出现负面影响。标准输出设定的方式决定了输入层的节点数,也就是说,通过目标期望的编码方式来确定输入层的节点数量。神经元数目确定完成之后,需要进行字符识别,通过BP网络训练之后,将权值保存的形式定为文件形式,训练完成之后,开始字符识别工作,将隐层节点个数、最小均方误差、相关系数以及训练步长的参数输入进去,训练之后得到字符识别结果。

猜你喜欢

字符识别图像识别字符
寻找更强的字符映射管理器
字符代表几
一种USB接口字符液晶控制器设计
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
消失的殖民村庄和神秘字符
图像识别在物联网上的应用
图像识别在水质检测中的应用
一种改进深度学习网络结构的英文字符识别
仪表字符识别中的图像处理算法研究