基于OCR技术的金属阀门表面字符识别
2019-10-21张忍
张忍
摘要:字符识别技术作为自动化领域的热门话题,在很多行业都发挥着重要的作用。OCR技术的一般由图像预处理,字符分割,识别三个主要部分组成。然而,此技术在金属阀门表面的字符识别的应用还很少。对于金属阀门而言,表面字符的作用是用来标识阀门型号,序列号等重要信息;在生产过程中,对表面字符的检测构成其生产制造的重要环节。本文中使用图像处理和OCR技术相结合的方法,实现了金属阀门表面的字符识别。首先使用工业相机和光源搭建光学系统来拍摄阀门原图像。之后对获取的图像进行预处理,剔除有字符缺陷的阀门。最后基于卷积神经网络完成字符识别算法。实验结果表明,用CNN可以实现字符的高识别率。
关键词:字符识别;光学系统;图像预处理;CNN
1.光学系统设计
1.1光源设计
辅助光源是机器视觉系统关键组成部分之一[7],直接从源头上影响到输入图像的质量。图像的过暗或过亮都会给处 理及识别带来很大影响,虽然可以通过图像增强等方式对其进行改善,但有时原图的曝光不当会直接导致原始信息的缺失,以及图像局部过亮或过暗的情况,都很难在图像处理过程中得以校正。由于金属表面的反光特性,通常所成的图像都会存在明暗不均的问题,因此选择合适的辅助光源是至关重要的一步。辅助光源的作用主要在于使物体表面均匀曝光,从而提升原始图像的质量。根据光源照射形式的不同,主要可以分为面阵光源、条形光源以及环形光源等,如图2-1所示。
1.1.1打光效果分析
在进行光学实验时要考虑金属阀门自身的特点:
(1)圆柱形物体,字符信息分布在曲面上。
(2)金属表面反光。
两种打光方式拍摄的图像如图 2-1-1所示。图中A为条光打光效果;B為平行面光源打光效果。
图A是条形光在侧面打光的方式。因为字符在曲面上,所以才造成了光线反射到相机的强度不一致,在图像上则呈现出明暗不均。这会对字符识别造成干扰。图B是采用面光源从阀门的正上方进行打光,光线是以一种平行于物体表面的方式打亮阀门工件的表面。可以看出图像不会出现明暗不均的问题,并且一个面光源就可以覆盖整个曲面。实验结果表明,采用一个面光源从阀门正上方进行打光的方式可以拍摄到均匀性较好的图像。
1.2光学系统
经观察阀门表面有12个字符信息,经过分析论证,决定采用3个面阵相机进行图像的采集。通过对各种打光方式的对比,最终选用一个面光源由上至下进行垂直打光。
2字符识别算法
2.1图像预处理
通过实验,发现使用尺寸为3×3的中值滤波器可以有效地去除背景噪声。不同类型的字符图像及滤波结果如图2-1所示。图1(a)-(c)显示了:表面划痕,局部凹坑,表面钢印,3种字符图像。在每种情况下,A为原始图像,B为滤波后的图像,C为提取到的字符信息。
2.2字符分割
将图像预处理阶段提取到的字符信息先进行二值化等处理,之后通过垂直投影法进行分割。
本文中主要通过改变训练集的字符数量,测试对识别结果的影响。实验结果统计如表1:
实验结果表明,改进的LeNet-5卷积神经网络手写数字识别模型,在训练集数据足够多的情况下,进行金属阀门表面的字符识别时可以达到99%的识别率。
参考文献:
[1]郝辉,哈力木拉提·买买提,乔萨础拉,等.字符识别研究现状和发展趋势计量分析[J].现代电子技术,2018,41(22):154-158.
[2]王文华.浅谈 OCR 技术的发展和应用[J].福建电脑,2012,28(6):56+92.
[3]陈利.基于深度学习的车牌识别系统设计[J].计算机技术与发展,2018,28(6):85-89.
[4]王志瑜.基于 OCR 成绩单录入系统的设计与实现[D].吉林大学,2015.
[5]索玉秀.基于 OCR 技术的名片识别方法研究[D].哈尔滨理工大学,2015.