产品外包装点阵喷码字符识别研究
2020-11-10上海理工大学许旭萍陈景华黄一翔郭晓岩胡海川
文/上海理工大学 许旭萍,陈景华,黄一翔,郭晓岩,胡海川
点阵喷码技术已广泛应用于饮料的包装印刷中,通过在产品外包装上喷印产品批号、生产日期等标识,可使每一件产品均具可追溯性,便于企业的质量管理。在饮料的包装流水线中,墨水喷码机是实施点阵喷码的常用设备,喷码运用非接触方式,使非常微小的墨滴从喷头中喷出,由软件控制将墨滴落在被喷印物的表面上形成所需喷印的文字和数码[1]。喷码机产生的喷印故障主要有:光电感应器灵敏度偏差或充电电极对墨滴充电不充分引起的喷印字符遗漏;墨水粘度的变化或产品输送带抖动等导致的喷印字迹模糊不清、缺少笔画以及断字现象。倘若带有喷印故障的饮料流入市场,就会给消费者在选购时由于“生产日期”信息不正确而带来麻烦,由此也连带给企业造成了一定的信誉与商业问题。因此,在生产中有必要对产品批号、生产日期等标识加以检测。
一、喷码字符识别需要解决的问题
对饮料瓶盖表面喷码字符检测的关键,是对所获取图像中包含的信息数字正常与否的判别,如图1所示的是饮料瓶盖表面的喷码点阵字符。通常,对连续笔画构成的字符识别,比较容易实现,而对于采用点阵喷印形成的字符识别,难度则较高。因为构成数字笔画本身的点阵的离散性,往往与字迹模糊不清、缺少笔画以及断字等现象纠合在一起,使计算机的自动判别实施,面临诸多困难。
图1 瓶盖表面喷码点阵字符
当产品批号、生产日期等标识出现字迹模糊不清、缺少笔画以及断字等现象时,对于连续笔画构成的字符,由于其与正常字符的摸板区别显著,因而计算机的识别相对比较容易。而对于点阵喷印的字符,由于其正常字符模板本身也是离散点阵构成的,对一般的计算机判别方法来说,区别并不显著,因此特别容易出现缺陷字符漏识、正常字符判误等问题[2]。 针对这种情况,首先应在字符判别特征的选择与提取上作恰当的考虑。
二、基于高斯核RBF神经网络拓扑结构
神经网络拓扑结构的设计采用什么原则是关键,直接影响其效果。可选择的方法有模板匹配法、神经网络法、基于规则推理法等。针对点阵喷印的字符,当出现字迹模糊不清、缺少笔画以及断字等现象时,特别容易出现缺陷字符漏识、正常字符判误等问题,考虑采用对数据分布要求不高的神经网络法。
运用比较方便的首推BP神经网络,但BP神经网络在学习训练中,存在陷入局部最小点的不足。因此,考虑选用高斯核的RBF神经网络。基于高斯核RBF神经网络的逼近能力、分类能力和学习速度较高,能够以任意精度逼近任意连续函数,而且可避免神经网络在学习训练中陷入局部最小点的不足[3-5]。
高斯核BRF神经网络拓扑结构如图2所示,其拓扑结构为三层,即输入层、中间层和输出层。设输入向量(即待识别样本)为E;输出向量为F;输入层与中间层之间的权值为Aj、Bj;中间层与输出层之间的权值为Gj;输入层单元数为m;输出层单元数为p。
第一层是完成数据信息传递的输入层,该层接收待识别样本信息(即输入向量)E。第二层是中间层,该层神经元的作用函数,采用高斯函数对由第一层接收的外部信息向量E实施映射变换。第三层是对输入向量E作出响应的输出层,该层神经元的作用函数,采用线性函数对中间层的输出信息实施线性加权后,就可得到高斯核RBF神经网络的输出向量F。
图2 高斯核BRF神经网络拓扑图
饮料瓶盖表面点阵字符识别实现的基本过程是,首先利用训练集所包含相关信息,通过学习训练确定网络中的权系数,使得网络输出方差小于给定值。
三、喷码字符判别特征的选择与准则函数
判别字符时首先观察与分析各种特征的有效性,进而提取出最有代表性的特征。计算机判别可以充分发挥其抽取数学特征的强大能力,典型的方法有统计平均值、相关系数、协方差阵等。特征的选取与提取,对后续的分类器设计及性能影响较大。若不同类别样品特征的差别足够大,较高性能分类器的设计就比较容易实现。否则,分类器的设计就很困难且性能较差。
由于字符不一定每次都落在6×6元素模板中的同样位置,因此,必须采用包含各种情况的样本构件统一数字的摸板类。如此,将得到很多相近的特征选择样板,如图3所示。
图3 喷码点阵字符6×6元素模板
接下来的任务是特征提取。根据识别需要,建立合适的映射关系,通过适当增减、重组前述选择的特征向量中的分量表述,从而使新的特征描述维数降低,便于运算;或者使新的特征描述更加切题,提高识别准确度。
常用的线性判别函数形式为:
将待测样本E的m个特征值作为判别函数的自变量,代入到K个线性判别函数(1)式中,可分别求得其计算结果。待测样本E属于哪一个类型,则由计算结果中最大的值来决定。这里,K个判别函数一般表示成bi(E)。如果第i类决策域与第j类决策域相邻,则二者边界上存在bi(E)=bj(E),称为决策面方程。判别函数b(E)的确定包括函数类型的选择与最佳参数的求取。最佳参数的求取,一般是由迭代优化的学习过程实现的。
接着,就是分类器的设计了。分类器的设计就是在给定样本集和集合内各样本所属类别条件下,确定判别函数的各项系数。此时,按需要确定准则函数J,求取其达到极值时G的具体数值,从而确定判别函数,完成分类器的设计。比较便捷的准则函数为误差平方和准则。
对分属于g1,g2,...,gM类的M个样本,设有Mi个样本的gi类,均值为:
对应所选的分类划分,定义误差平方形式的准则函数为:
所选的分类划分,必须是能够使得准则函数J最小。
四、 RBF神经网络训练所要确定的参数和待识别样本的识别
(一)RBF神经网络训练所要确定的参数
RBF神经网络的权值Aj、Bj、Gj是训练所要确定的参数。首先进行训练确定输入层与中间层之间的权值Aj、Bj。然后进行训练确定中间层与输出层之间的权值Gj。
具体过程为,根据获取的M=36个训练样本,设输入层单元数m=20,构成E= [e1,e2,...,em]T。取输出层单元数p=16,构成F=[f1,f2,...,fp]T;期望输出向量Q=[q1,q2,...,qp]T。
然后在中间层到输出层中,初始化连接权值Gk,这里Gk=[gk1,gk2,...,gkp]T,则:
式中:min k——第k个输出神经元的所有预期输出的最小值。
Max k——第k个输出神经元的所有预期输出的最大值。
进一步则是对中间层的各神经元的中心参数Aj进行初始化。这里Aj=[aj1,aj2,...,ajm]T,中间层神经元的总个数为q。则:
式中;min i——第i个输入待测样品的最小值。
Max i——第i个输入待测样品的最大值。
对宽度向量Bj进行初始化,则是Bj=[bj1,bj2,...,bjm]T,且:
式中:by——取值小于1的宽度调节系数。
中间层第j个神经元的输出值zj应为:
式中:Aj——中间层第j个神经元的中心向量,Aj=[aj1,aj2,...,ajm]T。
Bj——中间层第j个神经元的宽度向量,Bj=[bj1,bj2,...,bjm]T。
输出层神经元的输出F应为F=[f1,f2,...,fp]T,且:
式中:gkj——调节权重参数,调节范围是中间层第j个神经元与输出层第k个神经元之间。
采用便捷易行的梯度下降法,通过迭代计算可使调节权重参数、中心和宽度参数自适应调节到最佳值。
BRF神经网络的评价函数为:
式中:Qlk——在第l个输入样本中第k个输出神经元的期望输出值。
flk——在第l个输入样本中第k个输出神经元的网络输出值。
按照以上学习训练算法对神经网络实施初始化,并给定迭代终止精度值。计算网络输出的方差为:
(二)待识别样本的识别
学习训练完成后,将待识别样本输入到网络中,即便该待识别样本是局部数据,该网络还可以产生比较完整的数据输出。这对于解决点阵字符的辨识,有针对性优点。待识别样本的识别过程为:
1. 输入待识别样本E=[e1,e2,...,em]T,其中各个分量分别作为输入层网络节点的m个输入。
2. 计算输出层神经元的输出F=[f1,f2,...,fp]T。
3. 将所获得的输出F,与各个字符标准样本比较,选择最接近的确定为该类字符。
采用高斯核构成RBF神经网络算法,在完成学习训练后,对待识别样本实施判别简捷可靠。即使待识样本是带有喷印故障的字符(即喷印字符遗漏、喷印字迹模糊不清、缺少笔画以及断字现象),也能得出正确的识别结果。
五、检测装置结构设计
瓶盖顶面喷印的点阵数符的检测装置结构示意图如图4所示。由喷码机在瓶盖上喷印“生产日期”信息,距喷码机后面一定距离,设置一个带有卸件机构的检测工位,检测工位的正上方安装CCD图像传感器。当饮料瓶输送到检测工位时,通过CCD图像传感器获取饮料瓶盖表面的点阵字符图像,由计算机识别软件来判别其正确性。如果检测到字迹模糊不清、缺少笔画以及断字等现象,则发出声光报警,并启动传送带上的卸件机构动作,卸件推手将饮料瓶推移到传送带一侧的卸件箱内;若检测结果正常,即喷码机喷印的数字正确,卸件机构不动作,传送带将合格的饮料瓶输送到下一个规定的工位。
图3 检测装置结构示意图
六、实验检测
为了验证基于高斯核的RBF神经网络的喷码点阵数字的识别有效性,进行了如下实验。选取印有“生产日期”字符的瓶盖80个,并获取其数字图像,分别用基于高斯核的RBF神经网络判别法和模板匹配法进行测试比较,两种方式的正确识别率结果如表1所示。
表1 两种方式的正确识别率比较
七、结语
针对喷码点阵字符辨识的困难,采用基于高斯核的RBF神经网络分类算法,重点实现样本分类训练模型与分类器设计。通过实验验证了该方法与模板匹配法相比,有效地提高了识别的准确度。因此,该识别方法对点阵字符的自动检测与识别,有很好的适应性。