APP下载

基于多特征模糊识别的烟叶品质分级算法

2020-12-14戴建民曹铸孔令华

江苏农业科学 2020年20期

戴建民 曹铸 孔令华

摘要:烟叶品质等级大多是由人工通过触摸手感及视觉感官主观地进行判断。以烟叶为研究对象,设计了一种基于机器视觉的烟叶自动分级系统。首先通过机器视觉采集B2F、B3F、C2F、C3F、X2F、X3F各等级烟叶图像,再将图像进行中值滤波法预处理。提取烟叶的长度、长宽比、圆形度、纹理等几何特征;提取烟叶RGB(red,green,blue)颜色空间及HSV(hue,saturation,value)颜色空间各通道的颜色特征。利用多特征模糊识别方法进行烟叶自动分级,选用Matlab平台进行编程运行,得到烟叶各项特征值数据及分级结果。系统验证试验表明,分级正确率可达到烟叶分级标准。

关键词:烟叶分级;烟叶外表特征;模糊识别;Matlab

中图分类号: TS47  文献标志码: A  文章编号:1002-1302(2020)20-0241-06

烟叶分级是烟草公司产业运作中的一个至关重要的环节。随着烟草行业的不断发展,人们对烟叶品质的要求也不断提高,而烟叶分级的准确与否直接影响着后期生产的卷烟品质。为了解决人工烟叶分级存在的主观性、模糊性与低效率等问题,市场急需一套可以进行烟叶智能分级的设备。“中国制造2025”概念的提出,在工业发展趋势的探索之路上,点燃了一盏明灯。随着机器视觉技术的发展在烟草行业越来越受到重视,检测产品的质量可以满足客观、精准等要求。

庄珍珍应用机器视觉提取烟叶的外观特征,采用梯形和半阶梯隶属函数计算各个外观特征对烟叶等级空间的隶属度,利用最大隶属识别算法进行烟叶自动分级[1]。陈朋利用图像处理技术进行烟叶分级,值得一提的是其基于Gabor小波变换对烟叶表面纹理进行分析研究,提取纹理平均值和标准差,最后基于支持向量机一对多的思想进行烟叶的自动分级模型的搭建[2]。赵世民等对比了常用的颜色模型特点,分析得到HIS颜色空间更贴近人的视觉原理,同时可以一定程度上避免彩色信息的影响。其中3个分量相互独立、互不影响[3]。从上述的各项研究来看,目前在烟叶分级检测技术上有着许多研究成果,但是不足之处仍存在;采集烟叶图片是在一个密闭的空间里,其中的光照系统强度需要进行实时调整使其一直处于最佳状态。相机的标定以及焦距的调整也会影响烟叶图片的质量,尤其是在动态的生产线上,获取精准优质的烟叶图像较困难[4]。为解决这类问题需要更精准的烟叶定位及算法的优化,以期待能早日应用于实际生产。

1 研究对象及图像处理算法

1.1 研究对象

6级烟草样本(共计121份)由福建武夷烟叶有限公司在2018年提供。样品如下:B2F、B3F、C2F、C3F、X2F、X3F。其中训练样本60件,测试样本61件,试验中的选择遵循随机选取的原则。本研究设计采用高分辨率工业数字CCD摄像机(MV-CA050-20GM型)拍摄烟草图像。选用光源型号为MV-ML182×17-V的4个白色条形光源,选用SV-AP2U4CH四路光源控制器,用于调节所需的光照强度。选用PIXCIELIDB采集卡装插在计算机上,将相机与计算机连接起来,实现实时拍照获取烟叶图片。

1.2 图像的预处理

采集图像的过程中,由于环境中光照因素的影响以及图片扫描的过程本身就会引入噪声。在图像数据进行传输过程中也会引入噪声。而噪声会影响烟叶特征值的提取,可能存在较大误差,影响分级结果。为了保证特征值提取的有效性,有必要进行图片的去噪预处理。

1.2.1 中值滤波法 中值滤波法以非线性的方法将图像中一个像素点的值用该点的周围领域各个像素点的中值替代[5]。中值的定义如下:一组数据x1,x2,…,xn,把n个数按值的大小顺序排列:x1≤x2≤…≤xn。

1.2.2 自适应滤波法 自适应滤波法是将图像中某一个区域方差调整其输出值。当区域方差大时,平滑效果较差;当区域方差小时,滤波器的平滑效果较好。像素的区域矩阵和方差:

从以上几幅试验图形可以很明显地看出中值滤波法更适合于本研究,经过滤波的烟叶图形条理更加清晰,更有利于后期的烟叶特征的提取。本研究选用中值滤波的方法进行图像的预处理。

1.3 烟叶形态特征及颜色特征的提取

本研究根据福建武夷烟叶有限公司技术中心清选车间分级要求和国家烟叶分级标准,对烟叶质量进行分级。

烟叶的形态结构特征包括烟叶长度、宽度、长宽比、周长、面积、圆形度,都可提取作为烟叶分级的重要特征。根据国家烟叶分级标准在主组中,分为上部、中部、下部。在特殊情况下,部位的划分可以通过脉相,叶型为依据。其中上部的烟叶脉相较粗,较显露至突起;叶面稍折皱至平坦,可以通过烟叶的纹理特征值进行部位的区分,使其更具说服力;叶型较宽或较窄都比较极端,叶尖部较锐说明角度较小成锐角,可以通过提取烟叶叶尖的边缘曲线所成的角度特征值来区分烟叶的部位。中部烟叶叶脉较上部烟叶略细一些,只能略微清晰看到大致脉络,叶尖处微微弯曲;叶面较皱缩;叶型一般较宽,叶尖部较钝说明边缘曲线的角度较大。下部烟叶较上、中部更纤细,叶型较宽圆;叶面较平坦。

综上所述,须要提取的烟叶形态特征值有长度、宽度、长宽比、周长、面积、圆形度、纹理特征值等。

1.3.1 烟叶长度、宽度和长宽比的提取 然而在烟叶分级生产线上,烟叶经过传送带传入视觉检测装置时,并不能完全保证烟叶是水平放置在载物台上,所放位置和烟叶主叶脉方向均有所不同,增加特征提取的难度,要求能够提取摆放任何角度的烟叶的长度特征。本研究采用最小外接矩形法进行长度和宽度的特征提取。

首先得到烟叶图像边界线的点集,通过Matlab 的convhull()函数得到点集的多边形凸包,计算凸包的所有边与相邻边的夹角θ,选取其中一条边作为起始边,寻找距离该边最远点,重合该边且过该点计算最小外接矩形,保存矩形4个端点坐标和面积;逆时针旋转θ到相邻边,用相同的方法計算重合该边的最小外接矩形,保存矩形4个端点坐标和面积;将凸包的所有的外接矩形求出存入1张表,再将表中的面积进行比较,选取最小值作为最小面积外接矩形[6]。同时将对应的最小面积外接矩形的坐标输出。该方法可以解决烟叶不同摆放位置,也可计算出准确的长宽值。设输出的最小面积矩形的4个端点坐标分别为(x1,y1)、(x2,y2)、(x3,y3)、(x4,y4),长度、宽度计算公式为若A>B,则规定A为烟叶的长度值,B为烟叶的宽度值;若A 1.3.2 烟叶周长、面积和圆形度的提取 烟叶周长指烟叶的边界长度,本研究用边界线上每个像素之和作为周长,f(x,y)为烟叶图像边界的坐标像素,公式如下:

1.3.3 烟叶的纹理特征提取 烟叶纹理的量化是一种重要的区域描述方法。而烟叶在做部位分级时可以通过叶面的平坦、皱缩的纹理特征准确区分上中下部,为烟叶的准确分级提供了一种可行的方法。本研究的纹理特征提取利用统计法[8],统计法是基于图像的灰度直方图的特征来描述纹理。灰度均值m的n阶距可以用下式来计算:

式中:L为图像可能的灰度级数,zi为表示灰度的随机数,p(zi)为区域灰度直方图。μ2表示方差;μ3表示直方图的偏斜度;μ4则描述了直方图的相对平坦性。纹理的统计度量有:

1.4 烟叶颜色特征的提取

我国烟叶分级标准是采用部位、颜色2个分组因素对烟叶进行分组,根据烟叶在烟株上的着生位置不同,分为上部(B)、中部(C)、下部(X)3个部位组,划分依据因素是外观叶片结构特征。根据烟叶颜色分为柠檬黄(L)、橘黄(F)、红棕(R)。烟叶颜色是非常直观的外观特征,不同颜色的烟叶通过肉眼便可非常容易区分出来。因此,把颜色作为划分烟叶质量等级的重要分组因素。在人工烟叶分级中,通过肉眼观察对烟叶颜色进行定性描述。而要通过视觉检测技术实现烟叶自动化分级,则需要对烟叶的颜色特征进行定量化描述,进而提取烟叶颜色特征值。

1.4.1 RGB通道 自然界的各种颜色光都可以由红、绿、蓝(R、G、B)这3种颜色的光按不同比例合成[9]。通过配色公式可配出任意颜色,公式如下:

1.4.2 HSV通道 颜色模型是一个三维坐标系统,表示一个彩色空间。采用不同的基本量来表示颜色就可以得到不同的颜色模型,不同的颜色模型都能表示同一种颜色,因此它们之间可以相互转换的。利用以下算法可以实现RGB通道与HSV通道之间的转换。H、S、V分量可以由r、g、b表示为在研究中,采集的烟叶图像是RGB颜色通道和HSV颜色通道的数字图像。

2 基于模糊识别的烟叶分级系统

2.1 模糊模式识别算法

提取和量化信息是利用计算机进行模式识别的前提,在计算机中具有时空分布的信息,在形式上表现为向量或数组,向量或数组中的序号可以对应时间与空间,当然也可以对应其他的标识[10]。

人类生活中,常常使用一些含义模糊的语言表述,正如烟叶的颜色特征常用的表述有偏黄、偏红等。应用模糊数学都可以得到较好地表达。模糊识别是在模糊数学理论的基础上,结合特殊的数学方法解决分类的问题,在特征空间的各个模式之间不存在明确的边界[11]。本研究采用模糊模式识别算法实现烟叶分级系统识别,选用择近原则识别法实现烟叶分级。

2.1.1 贴近度 贴近度是通过比对2个模糊子集,统计相似的部分计算相似的百分值[12]。设A、B为U上的2个模糊子集,它们之间的贴近度定义为理想的贴近度应当具备以下性质:σ(A,A)=1;σ(A,B)=σ(B,A)≥0;若对任意的x∈U,有μA(x)≤μB(x)≤μC(x)或μA(x)≥μB(x)≥μC(x),则σ(A,C)≤σ(B,C)。

2.1.2 择近原则识别法 设U上有n个模糊子集A1、A2、…、An及另一模糊子集B,若貼近度则称B与Ai最贴近,则B属于Ai类。在该方法中样本和类都用模糊子集来表示,取值范围U中的每个元素代表了一个特征维度。

2.2 基于模糊识别算法的烟叶分级试验

2.2.1 建立等级标准库及各参数权重的确定 通过大量的试验观察得到影响各标准的以下特征量更适合烟叶的分级,分别为长度值、长宽比、纹理特征的均值、标准差、RGB分量、HSV分量。将这些特征量分别用X1、X2、X3、X4、X5、X6、X7、X8、X9、X10来表示。通过对60个训练样本进行试验得到烟叶的标准模型库见表1。

由于各项特征参数影响该标准的程度不同,所以在实际操作中,其权重也不同[13]。分配权重如下:长度权重为 0.08,长宽比权重为0.12,纹理特征均值、标准差权重分别为0.10、0.09,RGB分量权重分别为0.11、0.12、0.09,HSV分量权重分别为016、0.06、0.07。权重矩阵为 ω=[0.08,0.12,0.10,0.09,0.11,0.12,0.09,0.16,0.06,0.07]。

2.2.2 标准库数据、待测样本数据归一化处理 由于各特征向量的量纲不同,为方便计算,对表1中的

3 结果与分析

分别采集6个等级的烟叶样本,其中每个等级有10张,提取各个等级烟叶的长度、长宽比、圆形度,求出10张烟叶的长度、长宽比均值,即为该等级烟叶的长度、长宽比均值。图3、图4分别为提取的烟叶长度、长宽比均值。

从烟叶长度均值直方图可以看出,从部位上中下来看,长度在逐渐减少,其中C2F数据存在较大误差。因此,在已确定主组的情况下,通过烟叶长度来划分等级有非常好的效果。

从烟叶长宽比均值直方图可以看出,上部位烟叶与中部位和下部位的长宽比均值差距明显,上部位烟叶长宽比均值明显大于中部位和下部位。上部位的长宽比均值范围是4.54~5.53,中部位的长宽比均值范围是3.05~3.27,下部位的长宽比均值范围是3.33~3.53。因此,通过烟叶长宽比均值划分上部位与中部位、上部位与下部位,有非常好的效果。

同理统计纹理特征的均值、标准差平均值见图5。

从纹理特征直方图可以看出,同一主组烟叶,等级越高,其纹理均值越高,特别是上部位烟叶和中部位烟叶,这个规律较明显;上部位、中部位各等级烟叶的纹理均值都低于下部位的,这对于区分出下部位烟叶有效果。

同理求出RGB分量均值直方图,如图6所示。

由于HSV分量数据较其他分量的数据差距较大,放在一张直方图中不方便进行分析,故将其分成2张分量,分别见图7、图8。

从RGB分量直方图可以看出:一是在各主组烟叶中,各等级的R和G通道颜色特征值依次递减,相邻等级之间数值变化梯度大;二是上部位烟叶的R和G通道颜色特征值均小于中部位和下部位。因此,R和G通道颜色特征值对划分部位都是有帮助的,它们能将上部位烟叶划分出来,且在已划分好主组的情况下,R和G通道颜色特征值还对划分等级有明显效果。

从HSV分量直方图可以看出:中部位烟叶的H通道颜色特征值均明显小于上部位和下部位的,即可通过H通道颜色特征值把中部位烟叶有效地划分出来,因此认为H通道颜色特征值对划分部位是有帮助的,考虑把它作为后续训练烟叶质量等级分类模型的重要参数。在各主组烟叶中,各等级的S通道颜色特征值依次递减,相邻等级之间数值变化梯度非常大。因此,在已劃分好主组的情况下,S通道颜色特征值还对划分等级有明显效果,将它作后续训练烟叶质量等级分类模型的重要因素。分析V通道颜色特征均值直方图可得到2个明显的规律:一是在各主组烟叶中,各等级的V通道颜色特征值依次递减,相邻等级之间数值变化梯度大;二是上部位烟叶的V通道颜色特征值均小于中部位和下部位。因此,V通道颜色特征值对划分部位都是有帮助的,它们能将上部位烟叶划分出来,且在已划分好主组的情况下,它还对划分等级有明显效果。在后续训练烟叶质量等级分类模型时,考虑把V通道颜色特征值作为重要因素。

4 结论

通过机器视觉采集B2F、B3F、C2F、C3F、X2F、X3F各等级烟叶图像,将图像进行自适应滤波法等预处理。提取最优几何分级特征:长度、长宽比、圆形度、纹理等几何特征;提取烟叶颜色特征:RGB颜色空间分量和HSV颜色空间分量。采用模糊识别择近原则法进行烟叶分级,通过训练试验表明,分级正确率可达到烟叶分级标准。

参考文献:

[1]庄珍珍. 基于机器视觉的烟叶自动分级方法研究[D]. 重庆:西南大学,2016.

[2]陈 朋. 烟叶纹理表面的视觉检测技术研究与应用[D]. 贵阳:贵州大学,2017.

[3]赵世民,王 惠,董昆乐,等. 颜色模型在烟叶自动分级中的应用[J]. 科技视界,2017(1):35-36.

[4]马文杰,贺立源,徐胜祥,等. 基于烤烟透射特征的烟叶图像分割研究[J]. 农业工程学报,2006,22(7):134-137.

[5]刘华波. 基于计算机视觉的烟叶自动分级研究[D]. 武汉:华中农业大学,2009.

[6]胡厚利. 图像处理技术与支持向量机在烟叶分级中的应用研究[D]. 昆明:昆明理工大学,2014.

[7]殷苏民,朱锦萍,王祖声,等. 基于顶帽变换和最大类间方差法的图像分割方法研究[J]. 科学技术与工程,2014(7):60-64.

[8]臧 帅. 基于模糊规则的烟叶分级方法研究[D]. 郑州:郑州大学,2015.

[9]杨晓娟. 基于最近邻的烟叶智能分级研究[D]. 郑州:郑州大学,2015.

[10]刘 鹏. 无损检测技术在食品品质检测中的应用[J]. 现代食品,2016,5(9):43-44.

[11]Blu T. Iterated filter banks with rational sampling factors:links with discrete wavelet transforms[J]. IEEE Transactions on Signal Processing,1993,41(12):3232-3244.

[12]Kumar A,Pang G K. Defect detection in textured materials using optimized filters[J]. IEEE Trans on Systems,Man and Cybernetics Part B,2002,32(5):553-570.

[13]刘自远,刘成福. 综合评价中指标权重系数确定方法探讨[J]. 中国卫生质量管理,2006,13(2):44-46,48.罗 巍,陈曙东,王福涛,等. 基于深度学习的大型食草动物种群监测方法[J]. 江苏农业科学,2020,48(20):247-255.