APP下载

形态学处理在光学字符识别中的应用研究

2016-11-30郭昊冉黎小琴

传感器世界 2016年8期
关键词:字符识别字符形态学

郭昊冉 黎小琴

一、引言

在产品外观上的字符印刷过程中容易出现字符漏印、字符不完整、字符混乱、字符之间粘连和断裂等问题,给机器视觉处理带来一定的困难。

本文通过研究形态学处理技术在字符识别中的应用,解决字符识别中的字符不完整、粘连和断裂等问题,提高字符识别的准确性,通过德国MvTec公司的图像处理软件Halcon软件实现字符识别的过程。

二、形态学处理一般方法

数学形态学[1,2]进行图像处理的基本思想是:用结构元素对原图像进行位移、交、并等运算,然后输出处理后的图像。最基本的形态学算子有:膨胀、腐蚀、开启、闭合。用这些算子及其组合来进行图像形状和结构的分析及处理,可以解决抑制噪声、特征提取、边缘检测、形状识别、纹理分析、图像恢复与重建等方面的问题。

腐蚀是一种消除边界点,使边界向内部收缩的过程。设二值图像为F,其连通区域设为X,结构元素为S,当一个结构元素S的原点移到点(x, y)处时,我们将其记作Sxy。此时图像X被结构元素S腐蚀运算可表示为:

膨胀是将与目标区域接触的背景点合并到该目标物中,使目标边界向外部扩张的处理。设二值图像为F,结构元素为S,当一个结构元素S的原点移到图像的(x,y)处时,我们将其记作Sxy。此时图像X被结构元素S膨胀的运算可表示如下:

使用同一个结构元素对图像先腐蚀再进行膨胀的运算称为开运算[3]。在结构元素S下的开运算定义如下:

开运算通常用来消除小对象物、在纤细点处分离物体、平滑较大物体的边界的同时并不明显改变其面积。

使用同一个结构元素对图像先膨胀再进行腐蚀的运算称为闭运算。在结构元素S下的闭运算定义如下:

闭运算通常用来填充目标内细小空洞、连接断开的邻近目标、平滑其边界的同时并不明显改变其面积。

图1所示为一个边长为20个像素单位的方形,图2 为其原形,下面对其进行腐蚀和膨胀实验。

经过1次腐蚀运算,结果如图3所示。从图3中可以看出,细小的连接被消除,多余的噪声点被去掉,边缘也有一定的腐蚀效果。

对上述一次腐蚀结果进行膨胀后得到图4。从图4中可以看出,图像在一定程度上被扩大了,图中的孔经过膨胀后变小,边缘也有一定的膨胀效果。

对图4进行二次膨胀运算得到图5,可以从图5中明显看出,图中的缝隙消失,小孔消失。因此,腐蚀和膨胀结合使用可以进行图像平滑。

三、形态学技术在字符识别中的应用

1、图像预分割

图像预处理[4,5]的主要目的是消除图像中无关的信息,更凸出需要的信息,增强有关信息的可检测性和最大限度地简化数据,从而改进特征抽取、图像分割、匹配和识别的可靠性。

本文主要使用阈值处理来提取有用信息,白色为目标区域,黑色为背景区域。图6为实验原始图片,通过调试和观察发现当阈值95时为分割效果最佳,最佳阈值分割效果如图7所示。

2、去除伪目标

图像分割的结果是二值图像,从图7中可以看出,目标图像中存在英文字符等伪目标。首先利用半径为2.5的圆形的结构元素对图7进行开运算,清除干扰项,得到图8所示的二值图像。

开运算关键代码为:opening_circle(RemovedNoise,ThickStructures, 2.5)。

3、消除字符粘连

如图8所示,可以看到在图像中,0与1之间有粘连,这会导致无法准确识别字符,所以必须要截断粘连。首先要进行填充区域洞,避免截断我们所需的字符。其关键代码为:fill_up_shape(RawSegmentation,RemovedNoise, ‘area’, 1, 5)。填充区域洞得到的结果如图9所示。其次,利用矩形的结构元素对图9进行开运算,截断粘连,得到结果如图10所示,其关键代码为opening_rectangle(Solid,Cut, 1, 7)。最后利用intersection函数取区域交集得到目标区域,如图11所示。

4、特征提取进一步提取目标

经过形态学图像处理,增强了目标字符特征,再利用特征直方图提取目标字符,结果如图12所示。齐关键代码为select_shape(NumberCandidates, Numbers, ‘area’, 300, 9999)。

5、字符识别

本文使用Industrial_0-9A-Z.omc OCR训练字符对字符进行识别。并利用for循环识别每个字符,并将得到的字符串显示在窗口上,如图13所示。

四、结论

本文利用德国的机器视觉软件Halcon,通过开运算和闭运算等形态学处理相关知识来实现对于光学字符的准确识别。通过对图像的预处理,利用灰度直方图对图像进行阈值处理减少干扰获得所需区域,利用开运算和闭运算形态学处理相关知识解决图像粘连、模糊、断裂等问题,最终通过OCR训练字符对其进行识别。

图2 原图

图3 1次腐蚀结果

图4 1次膨胀结果

图5 2次膨胀结果

图6 原图

图7 阈值处理后图像

图8 利用圆形结构特征开运算

图9 填充区域洞后图像

图10 利用矩形结构特征开运算

图11 填充前和开运算后交集图

图12 提取目标字符

图13 实验结果

猜你喜欢

字符识别字符形态学
字符代表几
一种USB接口字符液晶控制器设计
图片轻松变身ASCⅡ艺术画
HBM电子称与西门子S7-200系列PLC自由口通讯
一种改进深度学习网络结构的英文字符识别
仪表字符识别中的图像处理算法研究
医学微观形态学在教学改革中的应用分析
基于CUDA和深度置信网络的手写字符识别
数学形态学滤波器在转子失衡识别中的应用
巨核细胞数量及形态学改变在四种类型MPN中的诊断价值