APP下载

一种特征加权模板匹配的钢板喷印字符识别方法

2015-05-08张靖娅刘丽萍

沈阳理工大学学报 2015年6期
关键词:字符识别字符投影

张靖娅,刘 昶,刘丽萍

(沈阳理工大学 信息科学与工程学院,辽宁 沈阳 110159)

光学字符识别(Optical Character Recognition,OCR)是模式识别和人工智能领域的一个重要研究方向,是模式识别、图像处理与文字处理技术相结合的一种技术。光学字符识别技术已经被应用在产品检测中,文献[1]采用特征加权模板匹配与结构特征相结合的多级识别算法对钢坯字符图像进行了识别;文献[2]将细化后的钢坯字符进行投影变换,然后根据投影变换结果,将字符转换为电子显示的标准字符,针对电子字符编码来实现钢坯字符识别;文献[3]采用Mean shift对复杂场景图像进行抑制,采用多级分割滤波与聚类处理突出并找出字符串目标兴趣区域,通过最小二乘法自适应修整倾斜角度,进而完成了钢坯字符串目标精准定位;文献[4]采用提取字符特征向量并设定不同加权因子的特征模板匹配方法对宽、厚板喷码进行了字符识别。

本文对传统的模板匹配方法进行改进,提出了一种有针对性的钢板喷印字符识别方法,采用高斯滤波和中值滤波去除钢板喷印字符图像中的噪声,采用顶帽变换去除钢板喷印字符图像中亮度不均的背景;采用OTSU最大类间方差法进行图像二值化;采用投影法结合钢板喷印字符图像的宽、高等先验信息进行钢板喷印字符分割;采用本文提出的特征加权模板匹配算法进行字符识别。特征加权模板匹配方法首先提取字符笔画特征,然后给字符笔画分配不同的权重,位于字符笔画中心的像素权重最高,而位于字符笔画边缘的像素权重最低。最后采用本文提出的特征加权模板匹配识别钢板喷印字符,通过实验证明此方法提高了识别钢板喷印字符的正确率。

1 钢板喷印字符识别方法

1.1 钢板喷印字符图像的预处理

图1为钢板喷印字符图像,其中左上角存在明显的光斑,字符区域存在亮度不均的问题。由于工业现场中噪声大、光照不均,导致采集的钢板喷印字符图像噪声大、亮度不均;又由于钢板表面光滑、易生锈、字符喷印不均和字符拖尾等情况时有发生,这些给钢板喷印字符的识别工作带来了困难。因此,在对钢板喷印字符图像识别之前,需通过图像预处理去掉钢板字符图像中的噪声、消除亮度不均的图像背景。

本文图像预处理首先利用高斯滤波和中值滤波对钢板喷印字符图像进行去噪;然后采用顶帽变换[5]对不均匀亮度背景的灰度图像进行处理,达到消除亮度不均的图像背景的目的。设f(x,y)为滤波后的钢板喷印字符图像,用线性结构元素b对钢板喷印字符图像f进行灰度腐蚀记为fΘb;用结构元素b对钢板喷印字符图像进行膨胀记为f⊕b;用结构元素b对钢板喷印字符图像f的开运算记为 f·b,定义 f·b=(fΘb)⊕b为;从滤波后的钢板喷印字符图像减去开运算后的钢板喷印字符图像的过程,称为对钢板喷印字符图像进行的顶帽变换。针对亮度和喷印不均的钢板喷印字符图像(如图1所示),经过滤波和顶帽变换处理得到字符图像如图2所示。可以看出钢板喷印字符图像的光斑被去除了,字符图像亮度不均的背景也被去除了。

1.2 钢板喷印字符图像二值化

经过图像预处理,钢板喷印字符图像的噪声和亮度不均的背景被去除了。本文利用OTSU最大类间方差法[6]对钢板喷印字符图像(如图2所示)进行二值化。假定二值化阈值为k,采用OTSU方法计算阈值k。

式中:n是钢板喷印字符图像的像素总数;nq是灰度级为rq所对应的像素数目;L是钢板喷印字符图像所有可能的灰度级数。C0是一组灰度级为[0,1,…,k-1]的像素集,C1是一组灰度级为[k,k+1,…,L-1]的像素集。OTSU最大类间方差法是计算当最大类间方差取最大值时的阈值k,最大类间方差定义为式(2)。在式(3)和式(4)的约束下,求取最大值时所对应的k,此时k即为钢板喷印字符图像的分割阈值。

式中:ω0为钢板喷印字符图像背景所占比例;ω1为钢板喷印字符图像前景所占比例;μ0为钢板喷印字符图像背景像素的平均灰度值;μ1为钢板喷印字符图像前景像素的平均灰度值;μT为钢板喷印字符图像总体的平均灰度值。采用OTSU最大类间方差法对经过图像预处理的钢板喷印字符图像进行二值化的结果如图3所示,可以看出该方法能够将钢板喷印字符从钢板喷印字符图像背景中有效分离出来。

图3 钢板喷印字符二值图像

图4 钢板喷印字符二值图像的水平投影图

1.3 钢板喷印字符的行定位与行分割

钢板喷印字符图像的行定位是确定钢板喷印字符图像区域水平方向的具体位置,并将包含钢板喷印字符的子图像从整个钢板字符图像中提取出来的图像处理过程。由于钢板喷印字符具有实际意义,第2行钢板的炉号和板号、第3行钢板的厚度、宽度、长度信息尤为重要,因此本文重点识别第2行和第3行的前14位字符。钢板喷印字符行定位与行分割过程如下:

(1)对经过二值钢板喷印字符图像(如图3所示)做水平投影Hp(y),投影图如图4所示。设定水平阈值为KHp,图4中KHp=0,当水平投影值小于KHp时设定投影值为0,目的是消除字符区域以外的图像噪声,从而更准确地定位字符区域;

(2)从钢板字符图像第一行起对水平投影Hp(y)按从上到下的顺序进行遍历,当Hp(y)≠0时,标记此行为定位上边界top;

(3)从钢板字符图像最后一行起对水平投影Hp(y)按从下到上的顺序进行遍历,当Hp(y)≠0时,标记此行为定位下边界bottom;

经过(1)~(3)从水平方向定位钢板喷印字符图像区域如图5所示。从图5可以得出,通过采用投影法并结合设定阈值,本文可以从水平方向定位钢板喷印字符区域。

(4)对钢板喷印字符图像行定位后,进行钢板喷印字符的行分割。钢板喷印字符行分割的过程是从按水平方向定位的钢板喷印字符图像中将钢板喷印字符按行分割出来。由于钢板喷印字符按水平方向排列,因此,将钢板喷印字符图像按水平方向平均分为四份,即可实现钢板喷印字符的行分割,得到四行钢板字符图像。提取出第3行钢板喷印字符图像如图6所示。本文经过(1)~(4)步完成了钢板喷印字符图像的行定位与行分割。

1.4 钢板喷印字符的列定位与列分割

钢板字符列定位是从行分割后的钢板喷印字符图像中分割出独立的钢板喷印字符图像的过程。本文采用投影法及钢板喷印字符的宽、高等先验信息进行钢板喷印字符的列分割。以第3行钢板喷印字符图像的分割为例,具体介绍钢板喷印字符图像列定位与列分割过程。字符列定位与列分割过程如下:

(1)首先做第三行钢板喷印字符图像的垂直投影Vp(x)(如图7所示)。设垂直阈值为kVp,图7中kVp=0,当垂直投影值小于kVp时设定投影值为0,目的是消除字符区域以外的图像噪声,从而更准确地定位钢板喷印字符区域;

图7 第二行钢板喷印字符图像垂直投影图

图8 列定位后的第三行字符图像

(2)从第三行钢板字符图像的第一列起对垂直投影Vp(x)按从左到右的顺序进行遍历,当Vp(x)≠0时,标记此列为定位左边界left;

(3)从第三行钢板字符图像的最后一列起对垂直投影Vp(x)按从右到左的顺序进行遍历,当Vp(x)≠0时,标记此列为定位右边界right;

经过(1)~(3)步从垂直方向定位钢板字符图像区域如图8所示。从图8可以看出本文采用投影法并设定阈值,能够从垂直方向上准确定位钢板喷印字符图像。

(4)将钢板喷印字符图像列定位后,进行钢板喷印字符图像的列分割。将投影值为0的位置作为分割点,分割出独立的钢板喷印字符图像,同时将字符切割为最小范围字符图像(如图9所示);

(5)利用钢板喷印字符图像宽度和高度等先验信息,对切割好的钢板喷印字符图像进行判断。若切割字符图像的宽度与高度之比小于0.75,则认为钢板字符图像被切割正确。否则需要调整切割位置,将切割的字符图像进行合并再次切割,直到字符图像最终被切割准确为止。本文采用基于边框的位置归一化方法将钢板喷印字符图像归一化,经过归一化处理后的钢板喷印字符图像如图10所示。

1.5 字符识别

针对钢板喷印字符的识别问题,本文提出了一种基于特征加权模板匹配的方法进行钢板喷印字符识别。具体思路为提取钢板喷印字符的笔画特征,给钢板喷印字符笔画分配不同的权重,位于字符笔画中心的像素权重最高,位于字符笔画边缘的像素权重最低。钢板喷印字符图像任意一点像素的权重根据其周围八个点的像素确定,任意一点像素的权重为W(i,j)

本文将首先对待识别的钢板喷印字符图像利用式(5)进行特征加权处理,模板字符图像也利用式(5)进行特征加权处理;然后将特征加权处理后的钢板喷印单字符图像与特征加权处理后的模板字符图像进行模板匹配[7]相关度计算,将相关度最大值所对应的模板字符图像作为待识别的钢板喷印字符图像的识别结果。相关度计算公式如式(6)所示。

式中:I为特征加权后的钢板喷印字符图像;M为特征加权后的模板字符图像;H为钢板喷印字符的高度;W为钢板喷印字符的宽度。

2 实验结果

本文采用提出的钢板字符图像定位方法与分割方法,对工业现场采集的210幅钢板喷印字符图像进行了定位与分割。共获得5690个独立的钢板喷印字符图像,其中包括数字字符图像0~9,英文字符图像“A”、“B”、“K”、“L”、“X”和“Z”,共16种字符图像。字符识别方法采用本文提出的特征加权模板匹配方法实现。为了证明本文字符识别方法的有效性,将本文字符识别方法与模板匹配方法[7]和基于特征加权模糊模板匹配的字符识别方法[8]进行比较。采用本文的字符识别方法、模板匹配方法和基于特征加权模糊模板匹配的字符识别方法对分割获得的5690个独立的钢板喷印字符进行识别,对比实验结果如表1所示。

表1 对比实验结果 %

由表1可以看出,采用本文提出的特征加权模板匹配识别方法对钢板喷印字符进行识别的正确率可达98%,而基于特征加模糊模板匹配方法和模板匹配方法的识别率分别是97.17%、97.10%。证明了本文提出的基于特征加权模板匹配的字符识别算法对钢板喷印字符识别的正确率较高。

3 结束语

针对亮度和喷印不均的钢板喷印字符的识别问题,提出了一种有针对性的识别方法。采用高斯滤波和中值滤波去除了钢板喷印字符图像的噪声;采用顶帽变换方法消除了钢板喷印字符图像亮度不均的背景;采用OSTU最大类间方差法进行了图像二值化,有效地将钢板喷印字符区域从钢板喷印字符图像背景区域中分离出来;采用投影法并结合钢板喷印字符的宽、高等先验信息实现了钢板喷印字符图像的分割;采用本文提出的特征加权模板匹配算法完成了钢板喷印字符图像的识别。通过特征加权模板匹配实验,识别字符的正确率达98.00%,此结果证明了本文方法的有效性,本文方法也可以应用到其他类似的字符识别问题中。

[1]杨义军,洪汉玉,章秀华,等.重轨生产线钢坯字符识别方法[J].武汉工程大学学报,2012,34(5):64 -67.

[2]洪汉玉,朱浩,魏和洪,等.基于字符结构特征的钢坯字符电子显示识别[J].武汉理工大学学报,2013,35(2):176-179.

[3]俞枯俊,洪汉玉,章秀华,等.生产线复杂场景钢坯检测识别的定位方法研究[J].光电工程,2012,39(1):54-61.

[4]李潘,误少波,王丽娜,等.基于机器视觉的宽厚板喷码自动识别系统[J].冶金自动化,2013,37(4):12 -15.

[5]陈箫枫,潘保昌,郑胜林,等.用顶帽变换估计并消除图像背景[J].计算机学报,2007,30(6):979 -985.

[6]何友金,毛剑英,谭伟.海面岛礁背景下舰船红外自动识别技术研究[J].光电技术应用,2010,25(4):31 -34.

[7]梁琎,包志强.人民币冠字号码的提取与识别[J].现代电子技术,2013,36(11):70 -73.

[8]朱颢东,李红婵.基于特征加权模糊模板匹配的字符识别[J].兰州理工大学学报,2013,39(2):68 -71.

猜你喜欢

字符识别字符投影
解变分不等式的一种二次投影算法
基于最大相关熵的簇稀疏仿射投影算法
字符代表几
一种USB接口字符液晶控制器设计
图片轻松变身ASCⅡ艺术画
找投影
找投影
HBM电子称与西门子S7-200系列PLC自由口通讯
一种改进深度学习网络结构的英文字符识别
仪表字符识别中的图像处理算法研究