基于二维Gabor滤波与机器视觉的字符图像识别算法∗
2018-01-04杜媛
杜 媛
(西安职业技术学院 西安 710077)
基于二维Gabor滤波与机器视觉的字符图像识别算法∗
杜 媛
(西安职业技术学院 西安 710077)
为了解决字符识别算法在噪声、文本旋转下出现识别不准确的问题。论文提出了基于二维Gabor滤波与机器视觉的字符识别算法,从图像预处理和特征提取分析这两个模块展开分析。首先,搭建视觉采集硬件平台,采集原始字符图像。然后通过邻域像素灰度信息迭代,有效降低噪声,以提高字符图像质量,通过霍夫直线检测完成图像旋转角度计算和图像校正,达到准确定位字符区域的目的。然后,通过二维Gabor滤波得到字符图像的纹理特征,采用欧式距离构建分类标准,达到准确识别字符的目的。实验测试数据表明:与当前识别机制相比,在面对噪声与文本旋转干扰条件下,论文算法具有更高的识别准确率与鲁棒性。
字符识别;计算机视觉;Gabor滤波;图像校正;霍夫直线检测;欧式距离
1 引言
以科技驱动经济,以技术领先市场已经成为各行业的共识,特别是计算机视觉技术更是众多先进技术的聚焦[1]。视觉领域广泛,其中应用最广泛的就是文字识别,因为文字识别本身是人类社会文明的基石,如何利用计算机技术代替人眼实现文字识别,提高社会效率,已经成为当下推动经济前进的关键技术[2~3]。文字识别已经应用很多场合:身份证自动识别、名片文本自动读取器、火车票识别系统等等。但是当字符背景存在噪声干扰、图像角度旋转时,往往导致算法不能准确定位字符,甚至识别错误[4]。国内科技公司也相继推出基于计算机视觉的字符识别系统,但是当碰到以上干扰时,往往会大幅度影响系统准确度和稳定性,本文基于这样的背景,从改善图像质量,提高定位成功率,达到准确识别字符目的。
在字符识别方面,国内研究人员已经将计算机视觉技术引入到该领域中,对其展开研究,如肖诚求[5]提出了基于稀疏编码直方图的TSM识别场景文本算法,构建以稀疏编码直方图(HSC)为底层特征的基于部件的树结构模型(HSC-TSM)识别场景文本,将K-SVD学习字典用于计算稀疏编码,逐像素地将稀疏编码聚合成HSC,描述文字的局部外观信息,通过奇异值分解对HSC进行降维,避免信息丢失,达到字符识别目的。但是,此技术未充分考虑图像源存在噪声和角度不正干扰,往往在此情况下影响了识别效果。刘勇华[6]提出了以主观线索为特征的主观性文本识别,提出以主观线索为特征的主观性文本识别方法,选取关联词、情感词以及指示性动词、感叹词、程度副词、带有情感色彩的标点符号等6种主观线索特征作为主观性文本识别依据,建立主观线索特征词表,用朴素贝叶斯分类器,达到了字符识别目的。但是,此技术未充分考虑选取特征的客观性,往往存在识别率很低的问题。
本文提出了基于二维Gabor滤波与机器视觉的字符识别算法,首先,(对存在噪声、角度干扰的图像展开分析,通过区域信息迭代降噪方法、霍夫直线检测达到字符图像质量提高和校正目的。然后通过二维Gabor滤波器提取纹理特征,基于欧式距离公式完成字符分类。最后,整合算法,编程验证,测试了本文算法的字符识别性能。
2 本文字符识别算法
图1 本文字符识别算法的样本与过程
本文算法对带有字符的卡片材料进行识别,采用工业相机采集图像,环形光源正面打光,底部载盘为快速转盘,以传感器触发相机完成图像采集,硬件结构如图1(a)所示。系统软件架构分为:基于图像预处理的字符图像定位、基于特征提取分析的分类识别。字符定位:采用邻域像素灰度信息迭代,达到去噪目的;采用霍夫直线检测,达到旋转角度计算和图像校正目的;采用形态学闭运算对二值图像进行线性处理,达到字符图像精定位目的。识别模块:采用Gabor提取字符图像纹理特征(均值、方差、能量、熵、惯量和相关一致性),经过欧式距离公式计算,达到字符识别的目的,系统软件架构如图1(b)所示,采集到的图像如图2所示。
图2 待处理图
2.1 基于预处理的字符定位
在图像数据采集中,难免混入椒盐噪声,噪声来源光电转换自带噪声和电机转盘高速运转产生磁场噪声。首先需要对图像进行降噪处理,为了充分消除噪声,本文提出邻域信息迭代降噪技术,通过噪声点的八邻域相似性,加权滤波去噪,当噪声点八邻域信息不满足去噪条件时,该噪声点不处理,在后续迭代中,邻域信息满足条件时再处理。八邻域如下所示:
Ω ={(k,l)|X(k,l)≠ X(i,j),|k-i|≤ 1,|l-j|≤ 1}(1)式中X(i,j)为噪声点,Ω代表噪声点的八邻域,以八邻域中的八个点为中心建立3*3窗口,其分别与(i,j)为中心建立的3*3窗口比较[7]。接着引入下式评价块与块之间的相似性:
KL(a||b)=aloga/b+(1-a)log(1-a)/(1-b)(2)
该式基于相对熵提出,a、b代表待评价相似度的两个邻域块,两个邻域块越相似,值越小,以计算出的相似度为权值,每个邻域乘以自身权值累加求和后替代噪声点[8]。如图2所示为带有噪声的原图,经过本文降噪处理后如图3所示,可见噪声已被有效去除。得到降噪图像后,需要对字符图像进行旋转较正,本文以霍夫直线检测得到字符卡片边缘角度,霍夫变换是利用两个坐标空间之间的变换,将问题由检测任意形状转换为统计峰值问题,主体任务是将直角坐标系下的直线方程中系数和变量交换,即完成直角坐标到极坐标的转换,霍夫直线检测模型如下:
式中极坐标(p,θ)将多条直线相交于一点,如果是同一直线上点,满足直线条件的可以检出,得到直线取直线上两点计算斜率,以此作为旋转校正角度,如图4所示,检出直线用绿色标注,同时图像旋转较正。接着进行字符区域精定位,在二值化的基础上,引入闭运算,填充目标内部狭窄的裂缝和长细的窄沟,消除小的空洞[9],采取集合方法描述如下:
式中A为原图,B为形态学结构分子(5*5单位矩阵),图像中像素被平移的结构元素B覆盖时的公共点,突出字符边缘区域,经过处理如图5(a)所示,可见准确定位字符区域,以此提取字符区域,如图5(b)所示,作为后续特征提取的基础数据。
图3 去噪效果图
图4 角度旋转校正效果图
图5 目标图像中的字符提取
2.2 基于特征分类的字符识别
提取字符区域后,开始特征提取,本文主要从纹理特征、出发分析,因为单纯依靠字符结构特征和统计特征,不足以区分字符,为了进一步增强系统细分性能,本文采取基于Gabor的纹理特征提取,二维Gabort特征提取可以达到空间域和频率域的局部最优化。Gabor滤波器函数如下:
式中G为二维Gabor滤波器函数,f为图像函数,由于Gabor具有非常好的时域局部特征,且适用于人的视觉通道。二维Gabor滤波在纹理分析中广泛使用[10],接着以字符图像与二维Gabor滤波器进行卷积处理:
式中I(x,y)代表字符图像函数,G代表Gabor函数,此输出可以描述图像字符纹理特征,他们是均值、方差、能量、熵、惯量及局部统一性[11~12]。
均值公式如下:
u为均值,I为经过Gabor卷积处理的结果,m,n为图像长宽[11]。方差公式如下:
σ为方差,I为经过Gabor卷积处理的结果,m,n为图像长宽。能量公式如下:
Eg为能量,G为Gabor滤波器,m,n为图像长宽。熵公式如下:
Et为熵,G为Gabor滤波器。惯量公式如下:
J为惯量,G为Gabor滤波器。局部统一性公式如下:
H为局部统一性,G为Gabor滤波器。最后采用欧式距离公式作为特征分类器,欧式:
式中(X,Y)代表特征标准,(x,y)代表待确定的特征,根据最近原则,将字符特征分类,并计入分类器结果。经过处理,如图6所示,可见本文方法识别正确。
图6 字符识别结果图
3 实验与讨论
本文机制采用带有图像预处理与特征提取分析的字符识别算法,同时搭建硬件系统(工业相机、镜头、光源、转盘和传感器)对字符进行取像。本文将软硬件系统都进行实现,并选取目前字符识别性能较好的文献[5]、文献[6]两种技术做实验对比,待处理原图为7。实验参数:噪声比(0.8)、结构分子(3*3单位矩阵)、均值(87)、方差(0.9)。
图7 待处理原图
本机制采用客观的相机采集,精确的图像处理算法,对每一个字符进行自动降噪,去噪结果如图8所示,可见达到了去噪目的。本文采用霍夫变换定为字符材料直线边缘,并校正图像,如图9(a)所示,可见达到了补偿旋转角度,把字符摆正的目的。利用字符形态学,采用闭运算,提取字符区域,达到定位字符目的,如图9(b)所示。最后提取纹理特征,经过欧式距离分类器,得到准确的识别结果,如图9(c)所示。
而利用文献[5]对图7进行识别时,因此技术未充分考虑图像源存在噪声和角度不正干扰,往往在此情况下影响了识别效果。如图10(a)所示,字符定位错误,如图10(b)所示,识别功能无效。
图8 去噪效果图
图9 本文算法的字符识别结果
图11 文献[6]算法的字符识别测试
利用文献[6]对图7进行识别时,此技术未充分考虑选取特征的客观性,往往存在识别率很低的问题。如图11(a)所示,字符定位勉强满意,如图11(b)所示,识别错误。
4 结语
为了实现用计算机视觉自动识别字符材料,从而改善传统字符识别抗干扰性能差、识别不稳定的问题。本文首先对硬件打光进行检讨,采集出完整的字符图像。然后设计出基于邻域信息迭代降噪方法、基于霍夫变换的图像校正技术、基于Gabor的字符纹理特征提取技术、基于欧氏距离的分类器识别,并用编程实现。实验结果表明:与传统机制相比,本文机制具有更好的识别精度和鲁棒性。
[1]Meng-Han Hu,Qing-Li Dong,Pradeep K.Malakar.Deter⁃mining Banana Size Based on Computer Vision[J].Inter⁃national Journal of Food Properties,2015,18(3):508-520.
[2]杨美妮.不规则文本中商品名称识别的特征选择[J].计算机工程与科学,2015,11(17):96-99.YANG Meini.Feature selection of commodity name recog⁃nition in irregular texts[J].Computer engineering and sci⁃ence,2015,11(17):96-99.
[3]W.Y.Liu,J.L.Jiang.A new Chinese character recogni⁃tion approach based on the fuzzy clustering analysis[J].Neural Computing and Applications,2014,25(2):421-428.
[4]Álvarez D.,Fernández R.,Sánchez L.Stroke-based intel⁃ligent character recognition using a deterministic finite au⁃tomaton[J].Logic Journal of IGPL,2015,23(3):463-471.
[5]肖诚求.基于稀疏编码直方图的TSM识别场景文本算法[J].计算机工程与设计,2016,23(2):171-176.XIAO Chengqiu.TSM scene text recognition algorithm based on sparse coding histogram[J].Computer engineer⁃ing and design,2016,23(2):171-176.
[6]刘勇华.以主观线索为特征的主观性文本识别[J].计算机工程与设计,2016,18(15):42-47.LIU Yonghua.Subjective text recognition based on subjec⁃tive cues[J].Computer engineering and design,2016,18(5):42-47.
[7]屈亚运,程英蕾,邱浪波.改进的八邻域搜索提取建筑物立体特征方法[J].计算机工程与应用,2015,23(4):66-69.QU Yayun,CHENG Yinglei,QIU Langbo.Improved eight neighborhood search method for building stereo feature[J].computer engineering and applications,2015,23(4):66-69.
[8]Evans Gary W.The mediating roles of Neighborhood char⁃acteristics and physical activity[J].Social Science&Med⁃icine,2012,75(3):477-81.
[9] Huiling Hou,Cunsuo Pang,Hualing Guo.Study on high-speed and multi-target detection algorithm based on STFT and FRFT combination[J].Optik-International Journal for Light and Electron Optics,2016,127(2):713-717.
[10]M.N.Sumaiya,R.Shantha Selva Kumari.Gabor filter based change detection in SAR images by KI thresholding[J].Optik-International Journal for Light and Electron Optics,2016,130(2):114-122.
[11]霍光.基于二维Gabor滤波的虹膜特征表达及识别方法研究[D].长春:吉林大学,2016:26-29.HUO Guang.Iris feature representation and recognition based on 2D Gabor filtering[D].Changchun:Jilin Uni⁃versity,2016:26-29.
[12]Fei He,Yuanning Liu,Xiaodong Zhu.Multiple local fea⁃ture representations and their fusion based on an SVR model for iris recognition using optimized Gabor filters[J].EURASIP Journal on Advances in Signal Process⁃ing,2014(1):1-7.
Research and Application on the Character Recognition Algorithm Based on Machine Vision and Two-Dimensional Gabor Filter
DU Yuan
(Xi'an Vocation and Technology College,Xi'an 710077)
In order to solve the character recognition algorithm in noise,identify inaccurate problem under text rotation.Char⁃acter recognition algorithm based on computer vision is proposed in this paper,from the image preprocessing and feature extraction and analysis of the two analysis module.First of all,visual acquisition hardware platform is created,the original character image is collected.Then through iterative neighborhood information noise reduction the quality of character image is improved,by hoff straight line detection the image rotation angle calculation and correction are completed to achieve the purpose of accurate position⁃ing character area.Then,by 2D Gabor filter to get the texture feature of character image,the classification criteria of Euclidean dis⁃tance was used to construct and achieve the purpose of accurate identification character.Experimental test data show that compared with the traditional recognition mechanism,this mechanism has higher recognition and robustness.
character recognition,computer vision,Gabor filter,image correction,hof line detection,euclidean distance
Class Number TP391
TP391
10.3969/j.issn.1672-9722.2017.12.041
2017年6月8日,
2017年7月30日
杜媛,女,硕士,讲师,研究方向:图像处理,目标识别,计算机应用。