基于频谱特性和自适应虫孔定位的小麦识别
2018-12-25王周璞何小海吴小强董德良李晓亮
王周璞,何小海,吴小强,董德良,李晓亮
(1.四川大学 电子信息学院,四川 成都 610065;2.中储粮成都储藏研究院有限公司,四川 成都 610091)
0 引言
小麦是我国三大粮食作物之一,面积和产量均占全国粮食作物的1/4左右,小麦产量和小麦的质量对稳定国内粮食供给,保障粮食安全具有至关重要的作用。小麦不完善粒主要是指受到损伤的颗粒。按照国标规定,小麦的不完善粒种类主要包括破碎粒、生虫粒、生病粒(赤霉病粒和黑胚粒)和发芽粒。
对于不完善粒的检测,目前国家粮食管控部门在收粮时采取的仍然是传统的人工检测方法,这种方法具有工作强度大、对技术人员专业技能要求高、人工检测速度缓慢等不可忽视的缺点。近些年来国内外专家也都不断聚焦于这个领域的研究,以期能实现小麦不完善粒检测的自动化,如利用声音科学来检测的方法[1]、基于高光谱技术的检测方法[2]、基于卷积神经网络(Convolutional Neural Network,CNN)模型的检测方法[3]。虽然这些方法都能实现自动化检测的功能,但还是存在很多缺点。例如,利用声音科学的方法使用麦克风来采集声音,非常容易受到环境音和噪声的干扰;基于高光谱技术[4]的检测方法图像采集设备价格昂贵且不能实现多种不完善粒品种混合检测;基于CNN模型的深度学习检测方法所需样本量大,且识别时间长。
目前,传统机器学习的方法被广泛应用于物体识别、图像分割、风险预估等关系国计民生的实际应用中[5]。为了解决上述方法中存在的不足,本文提出利用支持向量机(Support Vector Machine,SVM)分类器以及利用小麦自适应虫孔定位和频谱特性来提取特征的识别方法。该方法能实现快速、准确地对小麦不完善粒分类,并显著提升小麦不完善粒的识别率。
1 识别方法
1.1 原料和识别方法
本研究使用的所有训练、测试及建库小麦均是由中储粮成都储藏研究院有限公司提供。所有样本的原始分类标签均是由中储粮成都储藏研究院有限公司的质检人员检测确认,确保标签准确。本研究选择使用扫描仪扫描录入小麦图像,分为上、下两个方向,各类型小麦以互不粘连的随机朝向置于扫描仪的载物板上,图片以BMP格式保存。扫描完成后,进行小麦的定位、麦粒分割、麦粒精分割、特征提取、识别等步骤完成小麦识别和分类过程[6]。
1.2 自适应虫孔特征提取
在不完善粒识别方法的研究中,识别率较低的类别之一就是虫孔类不完善粒,因其存在虫孔位置难以确定、虫孔与背景难以区分等问题。通过研究发现,在最大类间方差法(Otsu)获取最佳分割阈值的基础上,能够较好地针对每幅小麦图像自适应定位虫孔位置并提取虫孔特征参数[7]。其流程图如图1所示。
图1 自适应虫孔特征提取
自适应虫孔特征提取方法利用最大类间方差法针对分割后的单粒小麦图像自适应寻找最佳分割阈值。其原理为:设有小麦图像G(x,y),大小为w×h,小麦和背景色的分割阈值记作t,小于阈值t的像素值为目标色,其个数记作G0,其加权平均灰度值为c0;大于阈值t的像素值为背景色,其个数记作G1,其加权平均灰度值为c1。首先,对每幅小麦图像自适应寻找最佳分割阈值,可得下式:
(1)
(2)
c=b0×c0+b1×c1
(3)
t=b0×(c0-c)2+b1×(c1-c)2
(4)
式中,b0为小于阈值t的像素值与整幅图像的比例;b1为大于阈值t的像素值与整幅图像的比例;c为整幅图像的平均灰度值;迭代后得到的最大t值即所求最佳分割阈值。再使用阈值分割的方法,将大于阈值的像素值置为255,其余部分置为0。
从图2的阈值分割图中可以看出,小麦图片边缘存在很多细小的凸起,且在部分区域存在明显的纤细连接。消除小物体后,计算虫孔面积作为特征参数读入。结果表明,这种方法能够极大提升小麦虫蚀粒的识别率。
图2 生虫粒处理效果图
1.3 基于频谱特性的特征提取
在不完善粒识别方法的研究中,识别率较低类别中还有一类是发芽类不完善粒。这类小麦对小麦品质有较大影响。研究发现,发芽粒因其在小麦胚部形状和灰度值过渡上与正常粒和破碎粒有较明显区别,在频域上此种区别表现得更为明显。如图3所示,图(a)为发芽粒原始图和发芽粒频域图,图(b)为正常粒原始图和正常粒频域图。可以明显地看到发芽粒的亮点和暗点分布有明显的角度分布特性。
图3 发芽粒和正常粒频谱对比图
发芽粒分割图如图4(a)所示,正常粒分割图如图4(b)所示。
图4 发芽粒和正常粒频域分割图
提取频谱图分别在0°、45°、90°、135°方向的熵、能量、对比度和逆差矩[8]的特征参数。
熵是图像中所蕴含信息的随机性度量。如图5(b)所示,这里描述的熵值表示图像白点分布的复杂性和规律性。研究发现,发芽粒的熵值在各个方向上的数值均小于正常粒,这表明发芽粒在频谱图上是一种较规则、白点数较少、图像较简单的分布。引入式(5)来定义熵值:
(5)
能量也是矩特征中的一个重要维度。能量能够定量地反映图像中纹理的细致与否,应用到频谱图上,反映的则是频谱图白点分布的密集程度。研究发现,发芽粒在各个方向上能量的数值均大于正常粒,这表明发芽粒在频谱图上是一种较均匀和较规则的纹理变化。引入式(6)来定义能量值:
(6)
对比度用于度量矩阵值的分布。该维度可以反映图像的清晰度和凹槽的纹理。引入式(7)来定义对比度:
(7)
其中,f(i,j)表示图像中某一点处的灰度逆差矩,在频谱图上可以反映图像局部变化的剧烈程度。图5(a)为方向标示图;图(b)中1、2、3、4分别为发芽粒等分为4个局部的图像;图(c)中5、6、7、8分别为正常粒等分为4个局部的图像。在0°、90°、135°三个方向上发芽粒的图像变化大于正常粒。
图5 基于频谱特性的特征提取示意图
基于频谱特性的特征和其他维度特征共同作用,能极大提高发芽粒的识别率。
1.4 SVM模型
SVM分类思想本质上与线性回归LR分类方法相似。先使用一组训练集数据来训练SVM中的权重系数,然后对测试集进行验证和分类。
通过训练,可以得到一个分割超平面。在样本空间中,可以使用以下等式来描述超平面的划分:
wT+b=0
(8)
其中,w=(w1;w2;…;wd)为法向量;b为位移项。样本空间中任意点x到超平面(w,b)的距离可表示为:
(9)
两个异类支持向量(support vector)到超平面的距离总和为:
(10)
称为“间隔”。
得到具有“最大间隔”的划分超平面,即:
s.t.yi(wTxi+b)≥1,i=1,2,…,k
(11)
2 结果与分析
由于没有公共的小麦图像数据库,本文建立了自己的数据库。分别选出3 000粒正常粒小麦、1 000粒破碎粒小麦、1 000粒虫蚀粒小麦、1 000粒病斑粒小麦、1 000粒发芽粒小麦作为训练样本。使用SVM分类器,提取自适应虫孔特征、基于频谱特性的特征、面积、周长、RGB三分量、HSV三分量、最小外接圆面积等共计89维特征。
使用本文叙述的识别方案对80粒正常粒、80粒破碎粒、80粒生虫粒、80粒生病粒、80粒发芽粒分上下图进行判别,结果如表1所示,得出5种不完善粒的平均识别率为96.90%。由于特征重叠的影响,5类小麦都出现了一定程度的误判现象,但仍保持了较为不错的识别正确率。考虑在实际粮食收购中,人们对于正常粒和异常粒的区分最为关注,因此表1着重展示正常粒和异常粒混合的识别率。
对比表1和表2,将本文提出的基于自适应虫孔和频谱特性的小麦不完善粒识别方法与未使用本文提出特征的识别结果相比较。可以得出,对于生虫粒,识别率由82.50%提升至93.02%;对于发芽粒,识别率由87.50%提升至96.25%。
将本研究所使用的测试数据使用ANN、Adaboost和Radom trees分类器进行识别。使用原始测试集来验证每个模型的准确性,可以得到表3所示的结果。
表1 混合类别识别结果
表2 未使用本研究提出特征的识别结果
表3 不同方法识别结果对比
对比表3和表1可以看出,本文所采用的基于SVM的小麦不完善粒识别方法比经典的Adaboost等方法识别率平均提高了20%左右。
3 结论
基于自适应虫孔和频谱特性的小麦识别方法对小麦提取包括基于自适应的虫孔特征、基于频谱特性的特征、以及面积、周长、RGB三分量、HSV三分量、最小外接圆面积等共计89维特征。在各维度特征的综合作用下,小麦不完善粒识别率得到了显著提高。本研究在SVM分类器的基础上提出了针对正常粒、破碎粒、生虫粒、生病粒、发芽粒的有效特征,尤其是针对大部分算法无法精确分类的发芽粒和生虫粒提出了更有效的特征。本文所描述的识别方法具有模型训练时间短、对前端采集设备采集图片质量依赖低、能批量化识别以及识别速度快等优点,有利于小麦不完善粒的实际应用场景检测识别。
目前,由于没有公共的小麦图像数据库,因此本文构建了数据库。本文实验用小麦均是单一品种的白麦。因此,研究能广泛适用于实际小麦收粮现场的更有效的适合多品种小麦识别[9]的算法是下一阶段需要解决的问题。其次,图片的采集方案仍然是基于扫描的静态方法,人工布样时间长。因此,对动态实时采集的识别方案的研究也是下一阶段需要解决的问题。最后,本文提出的特征提取方法需要采集89维特征参数,继续研究特征降维[10]问题也是需要进一步关注的重点。