基于OCR 的标签字符质检算法*
2021-06-29高翔李根陈程王高峰周颖
高翔 李根 陈程 王高峰 周颖
(长安民生物流股份有限公司,重庆 400020)
1 背景概述
质检是一个有助于健康管理机构、医院、科研机构减少生产错误,进而提高生产效率的一个工序。广义上讲这是一种凡是有缺陷的物品都能被检测并筛选出来的机器设备。狭义上讲这是一种能处理生产印刷问题的智慧方法。
质检的方案随着电子学、计算机技术的发展,进入到前所未见的高速发展阶段。其中印刷的质检需求已越来越大,随着数字化的发展,其技术也越来越成熟。但自动化的印刷质检仍面临着巨大挑战:(1)耗能将进一步下降。在现有的耗能范围内进行更多的检测或保持现有的检测能力而降低能耗。(2)增加在芯片固定区域的元件数量,使得能在芯片面积上进行更复杂化的信号处理,或保持元件数量不变而进一步使芯片变小,并且其检测速度将会进一步上升。(3)将来的技术可以将微小的机械装置与电子元件一起蚀刻在芯片上,称为微电子机械系统。将此技术运用于印刷质检系统,可能有助于减小印刷质检系统的体积和能耗。(4)印刷质检系统的选配制作已有了新设想,如可以通过超声影像扫描技术进行三维成像。由此就可代替常规的扫描式技术完成缺陷的检测。
传统印刷质检在工业应用中都是由人工肉眼检测完成,因为其不具备由计算机自动发现缺陷的功能,随人工智能发展,印刷质检自动化技术越来越成熟,其应用也广泛起来,其中药盒印刷字符的质检尤为突出。要进行质量检测,首先就需要对印刷字符进行识别,印刷字符识别属于工业现场字符识别,因为工业现场环境的原因,拍摄到的图像与传统的文本图像有比较大区别。
药品包装上的说明,是有明确要求的,对印刷的字体的清晰度可辨识度有很高要求。并且,印刷的说明,不能有错字漏字等情况,以免错误用药造成难以挽回的后果。药盒上的印刷字符图像会出现不清晰,存在噪声或有粉尘遮挡字符等现象,并且印刷过程字符有时会出现粘连、扭曲甚至倒置或瑕疵杂点等情况,如图1 所示。传统的字符分类方法往往只对完整清晰的字符图像有效,对于印刷字符图像的识别精度较低。不同功能用途的药盒,其外观形状与其标识都不相同,这也为自动识别带来了难度,如何采用相应的图像识别算法和优化方案进行质量检测,是迫切需要解决的问题。
图1 标签模糊的字体Fig.1 Fonts with fuzzy labels
2 研究方案
深度学习在计算机视觉主流领域已经应用的很成熟,但是在工业领域,还有很多存在这真空区域。比如产品表面缺陷检测,近几年,深度学习的多个神经网络框架,已经在产品表面缺陷检测的中进行应用,从CNN到YOLO,SSD,甚至到语义分割的FCN相关论文,通过一些技术,对框架进行轻量化,对缺陷进行分类或检测。不过,逃不出一个基础:一定要有缺陷样本可供训练,而且数量不能太少。并且稀疏编码、字典学习、稀疏自编码等对表面缺陷进行检测,这类方法很有局限性,主要针对那些有周期性背景纹理的图像,比如丝织品等。
本文提出一种基于OCR的方法,只依据已有的正常表面图像样本,通过一定的技术手段对缺陷样本进行检测。首先对图像进行均值滤波。然后通过GAN完成缺陷数据集的补充,最后通过CNN网络进行判断,是否存在字符缺陷。本文选用的分类主干网络为AlexNet。其网络结构如图2所示。
图2 AlexNet 网络结构Fig.2 AlexNet network structure
AlexNet是一个非常经典的深度学习卷积网络框架。网络的每一层都是一个卷积网络,传统的方式是使用Sigmod作为激活函数。为了解决梯度弥散问题,我们使用ReLU替代了Sigmod,在很多网络层数较深的网络中,起到很好的效果。其中ReLU公式如下:
我们将药盒上印刷的说明书,通过光学传感器转化为数字图像,传入AlexNet模型,在模型中进行前向传播。最后形成一个一维向量。该向量,代表文字的清晰程度,是对印刷质量的判断。我们在每一层网络中都加入了池化层,可以将图像的干扰模糊化。我们也通过加入LRN层,增强模型的泛化能力。我们使用印刷的说明进行测试,其检测效果,如图3所示。
图3 检测效果Fig.3 Detection effect
我们使用该模型进行实验,其质量判定结果,正确率达到了80.2%,证明我们的方法确实有效,并且有应用于工程的可能性。
3 结语
药盒包装上的说明书,本身是有很高的质量要求。但印刷过程中,存在诸多问题,我们针对文字印刷质量问题,以AlexNet为骨干网络,设计模型,对印刷的文字进行位置检测和质量判定。实验表明该方法有很好的效果,能够较好地解决质量检测的问题。代替人工完成文字的检测。本文仅针对字符是否印刷有误进行判断,在未来,我们会针对标签规范进行检测。