基于改进的Fisher准则玉米种子果穗检测方法
2018-05-07康智强袁朝辉程瑞锋
康智强, 袁朝辉, 程瑞锋
1.西北工业大学 自动化学院, 陕西 西安 710072; 2.西安建筑科技大学 机电工程学院, 陕西 西安 710055; 3.西北工业大学 航海学院, 陕西 西安 710072
玉米是粮食、饲料、工业原料兼用型作物。据统计,2013~2014年全国玉米总产量约20亿吨。全国玉米种植面积2014年为35 000万公顷,2016年我国的玉米播种面积3 676万公顷,产量超过21 955万吨;国储2.4亿吨。据USDA统计,近几年世界玉米使用量超过7亿吨,并有逐年递增的趋势。我国玉米面积和总产都居世界第二位[1]。玉米生产在国家粮食生产和粮食安全中占有极重要战略地位,玉米种子更重要,研究证明[2]玉米优良种的推广使我国玉米增产40%,种子质量直接关系到玉米产量高低及玉米质量和品质的优劣[3],而推广优良的杂交种需要大量优质种子。因此,中国玉米产业的发展史同时也是玉米种子的优化史。
据有关部门的研究推算,玉米新品种的推广利用在玉米增产总额中发挥40%的作用。在未来玉米种植面积增速将总体趋缓的背景下,玉米产量持续增长将主要依赖于良种开发带来的单产提高。玉米种子企业的核心竞争力取决于企业拥有的产品品种优势。纵观玉米种业发展历史,耐密植、综合抗性好、籽粒品质优良、早熟以及抗倒性强逐渐为品种推广潜力的重要条件。近年来,玉米品种的申报和审核数在各类品种中占绝对优势,但从增长速度来看,国审玉米品种的增速明显低于其他大田作物,下降趋势明显,这也预示现阶段玉米种子“真正”的匮乏。 我国玉米种子种植地每年采摘的玉米果穗都需要先除玉米穗子皮,才烘干脱粒。这些工作主要是依靠人工筛选,人工检测玉米果穗依靠人眼分辨,效率低、准确性差,易疲劳等缺点,如果将有玉米穗子皮的玉米进入烘干机很难快速烘干颗粒,或者会将不合格的玉米穗子进入烘干机等,这些都将会导致大量损失。
1 玉米种子果穗检测要求
植物新品种测试是对申请保护的植物新品种进行特异性、一致性和稳定性的栽培鉴定试验或室内分析测试的过程(简称DUS测试),根据特异性、一致性和稳定性的试验结果,判定测试品种是否属于新品种,为植物新品种保护提供可靠的判定依据。
根据参考文献[4]对玉米种子品种鉴别方面的研究结果,不同类型的籽粒特征在识别中作用不同,其识别效果次序为:大小类、形状类、纹理类、颜色类特征。种子颜色在玉米品种识别中的作用非常明显。大小类、形状类、纹理类、颜色类、后3类组合、全部4类组合等模型的品种检出率分别为25%、33%、39%、95%、95%和95%,平均籽粒拒真率分别为90%、90%、86%、45%、47%和42%,认伪率为92%、92%、88%、46%、48%和43%,且后2个误判率高度正相关(r=0.83~0.91)。机器视觉检测具有成本和速度上的优势,能够用于大数目玉米品种的真伪鉴定,形状+纹理+颜色组合模型最佳,经改进技术识别率可以进一步提高。本文主要通过图1系统的机器视觉分析处理。
图1 玉米种子果穗检测图
实验样本共测定46个形态特征指标,其中,反映种子大小的有长度、宽度、长轴长、短轴长、周长、等面圆直径、侧投影面积等7个指标;反映种子形状的有矩形度、椭圆度、凹凸比、圆形度、短/长轴长比、紧凑度、相对质心的纵坐标与横坐标等8个指标;反映种子纹理的为7个统计不变矩,种子纹理变量反映种子图像灰度值的次数分布特点。反映种子颜色的有24个特征指标,分别由RGB与HSV色彩空间的R、G、B、H、S 和V分量的均值、方差、偏度和峰度组成。
根据参考文献[5]在DUS测试中,对寻找新的果穗性状并评价它们单独鉴别品种能力的研究结果,采用4大类形态特征共计145个性状,逐一性状对品种进行判别分析(以性状的品种识别率表示性状鉴别品种的能力大小),单一性状的品种识别率变化在0.244~0.634之间,在前17个高鉴别力性状中,果穗长宽比等具有与指南性状同等的甚至更高的品种区分能力。
4大属性的鉴别力从大到小依次为形状类、纹理类、颜色类、大小类。
表1 玉米种子果穗图像特征汇总
图2和图3是根据表1要求给出的合格和不合格样本。
图2 合格玉米种子果穗
图3 不合格的玉米种子果穗
2 Fisher准则原理和分析
判别分析法是根据所研究个体的观测值来构建一个综合标准用来推断个体属于己知种类中的哪一类的方法[6],这种统计方法在自然科学和社会科学的研究中会经常用到。因为所采用的标准有很多种,所以判别分析也有多种方法,logistic回归线性判别分析,感知机准则,最小二乘(最小均方误差)准则。
本文将玉米果穗检测分类器的设计,通过对比线性分类器中的权值向量发现:
1)感知机准则的优点是简单、便于实现,缺点是结果不唯一,在线性不可分情况下不收敛。
2)最小二乘准则是基于最小二乘法求线性组合的权值,优点是回归结果与坐标选择无关,缺点是对于异常值非常敏感。
Fisher判别法的数学思想方法是将多维空间中的点投影到一维直线Y上,使得由总体θ1和θ2产生的y尽可能分开,然后再利用距离判别法建立判别准则,进而达到判别个体所属群体的一种统计方法[7]。采用Fisher线性判别根据阈值选择投影方向可以达到很好的预期分类效果。Fisher线性判别是把线性分类器的设计分为2步,一是确定最优方向,二是在这个方向上确定分类阈值;感知机则是通过不断迭代直接得到完整的线性判别函数。
假设θ1和θ2为二维总体,如图4所示“·”为θ1的点,“∘”为θ2的点,按原来的横坐标x1和纵坐标y1,难以将这2个总体的点分开,但是如果将这些点朝直线y上投影,形成一维空间集合的点,则能较容易分开。
图4 θ1和θ2在Y方向的投影图
显然,直线y是x1和y1的线性组合,即y=c1x1+c2y1。一般地,设在p维空间里,x的线性组合为y=αTx。其中:α为p维实向量,设θ1和θ2的均值分别为μ1和μ2,它们有共同的协方差阵Σ,那对应线性组合y=αTx的均值为:
μ1y=E(y|x,y∈θ1)=αTμ1
(1)
μ2y=E(y|x,y∈θ2)=αTμ2
(2)
对应的方差为:
var(y)=var(αT(x,y))=αTSα
(3)
由图4可知,使得μ1y和μ2y的距离越大,线性组合越好,考察以下比值:
(μ1y-μ2y)2var(y)=[αT(μ1-μ2)]2αTΣα
(4)
确定参数α,设x为p维随机向量,当α=cΣ-1(μ1-μ2)(c为非零常数)时,(4)式取值最大。当c=1时函数
y=αTx=(μ1-μ2)TΣ-1x
(5)
则(5)式为Fisher线性判别函数。将图像投影到玉米种子果穗上,矩阵W包含来自N个对象的所有特征向量,即
W=[W1,…,Wi,…,WN]
(6)
对于第i个类的pi个训练图像i=1,2…,N,将图像投影到玉米果穗空间上,即:
Wi=[wi,1,…wi,j,…wi,pi]∈RL×pi
(7)
式中,每个向量是一个大小为L×1的列向量,在训练阶段第i类由向量空间wi表示,称为每个对象的预测器。根据Fisher准则,本文求类间重建误差(BCRE)与类间重建误差(WCRE)比值来寻找最优投影。优化后找FC-LDRC算法要最大化给定的目标函数,表示为:
maxUJ(U)=maxUEBCEWC
(8)
J(U)=EBC/EWC=
1M(c-1)∑Mi=1,j=1∑cj≠l(xi)‖yi-‖21M∑Mi=1‖yi-‖2
(9)
J(U)=
=tr(UTEbU)tr(UTEωU)
(10)
式中,Eb和Eω分别表示为LRC得到的类间重建误差矩阵和类内重建误差矩阵:
(11)
(12)
由LRC引起的内部类重建误差的每个类的样本数通常小于样本空间的维度,(8)式中定义的目标函数变换为:
argmaxJU(U)=argmaxUUTEbUUTEωU
(13)
argmaxJU(U)=argmaxUUTEbUUTEωU=
(14)
等价可求最大特征值对应的特征向量:
λmax[(UW)-1Eb]
(15)
式中,λmax为标量,最佳投影方向U为(UW)-1(EBC-EWC)。
3 实验与检测结果
本文采用机器视觉自动检测玉米种子果穗,在计算测量实验中发现,仅仅依靠图像简单的衡量玉米果穗种子的合格是非常有限而且不能满足检测的效率。在数字图像处理的基础上结合Fisher准则能够快速有效的区分合格和不合格种子。根据玉米种子果穗检测要求,创建如图5所示的一个包含简单玉米果穗种子数据集。采用basler工业相机acA1300-60工业相机,分辨率1 280×1 024。镜头采用35 mm广角光学镜头,分别应用Fisher准则、感知机准则和最小二乘法准则对检测结果的以下几个方面进行对比区分:
图5 玉米种子果穗样品
1) 颜色检测学习
颜色是成品检测的第一关,通过玉米果穗的整体颜色、玉米果穗上的杂色、异色所占比率和玉米果穗两头穗轴色可初步完成成品检测。颜色检测主要包括区分穗整体颜色、粒顶主、次颜色、和行间颜色3个子类颜色,RGB与HIS等2个颜色空间,R、G、B、H、I、S等6个分量的均值、标准差、偏度和峰度以及各类颜色的比例,检测方法为:根据玉米果穗上的杂色、异色所占比率,找出杂色异色区域进行分析,结果如图6所示。
图6 玉米种子果穗颜色取值
2) 形状检测学习
通过图7所示的玉米种子果穗形状提取,分析比较穗缘角、长宽比、凹凸比、相对质心纵横坐标、紧凑度、矩形度、圆形度、离心率、球面度、球体度等特征。
3) 大小检测学习
通过图8所示的玉米种子果穗大小取值的提取,进行穗长与有效长、穗粗与众数粗、椭圆长与短轴长、周长与面积及凸形面积、表面积与体积、等面圆与等面球及等体球的直径的比较分析。
图7 玉米种子果图8 玉米种子果 穗形状取值 穗大小取值
4) 纹理检测学习
纹理是客观世界存在的,是图像分析中常用的概念,也是图像的基本特征。从广义上说,纹理反映了图像灰度模式的空间分布,包含了表面信息以其与周围环境的关系,兼顾了图像的宏观结构与微观结构。目前关于纹理具有代表性定义主要有:①纹理构成了一个宏观的区域。它的结构可归结为某种重复模式,其元素或者基元按照某种放置规则排列。②图像纹理是抽象的和细胞化的。一个图像纹理可以用它的所有基元的类型和数目以及基元的空间组织构架来描述。对于许多平滑的灰度表面,存在某一尺度,在此尺度下,表面不具有纹理,而当分辨率增加时,它的精细纹理就会显现,反之就是粗纹理。③如果函数的局部统计性质或其他局部性的属性集是恒定的,缓慢变化的,或者具有近似的周期性,则图像的某一区域就具有某种不变纹理。7个统计不变矩、穗行数与穗行角、亮度均值与标准差及偏度、均匀度与粗糙度及熵、傅里叶变换的峰值位置与均值及方差。
结合纹理特征,根据图9所示的玉米种子图像纹理的提取进行纹理检测。
图9 图像纹理的提取
通过图6~图9所示的对玉米种子果穗图像的预处理和分析,选取其中20种处理结果,如表2所示。从这些特征数值中可以简单分析出玉米种子果穗的优劣,但是单从一种特征很难区分,例如能量和熵,因此本文采用Fisher方法[9]对数据进行二次分析。
表2 实验数据集
由于在分类问题上,有些方法不像支持向量机等方法[10]可以通过核函数映射到高维空间再用超平面进行分类,而只能将多维特征投影到一维直线上,把分类问题转化成寻找分界点问题进行处理[11]。但在高维空间里,采用这种方法把它们投影到任意一条直线上,有可能使不同类别的样本混淆在一起,无法有效区分样本[12]。为此,采用Fisher算法在方向选取方面的优势,根据类间离散度矩阵与总类间离散度矩阵之比的最大值来确定投影方向,选取对样本投影最好的直线方向;并通过对样本间离散度的选取,实现最好方向投影的变换。将样本映射到最好方向向量的变换原则为:在该向量上,不同样本间离散度矩阵尽量大,而同种样本间离散度尽量小。
为此,本实验通过重排像素值,将PCA降维作为玉米种子果穗的特征向量,通过Fisher学习分类来训练样本集。实验首先将所有玉米种子果穗转化为灰度,对于每个条件,为了减少识别结果的变化,计算了平均识别精度作为最后的识别精度。在此基础上,对抽取的20种玉米果穗采用Fisher算法和线性判别分析、感知机准则和最小二乘法的识别率对比,结果如表2所示。
表3为Fisher方法和其他的一些方法线性分析对比。
表3 几种线性分类方法结果对比
4 结 论
本文采用机器视觉自动检测玉米种子果穗,根据检测要求主要检测玉米种子果穗的大小类、形状类、纹理类、颜色类,本文对其中的23种处理结果,从这些特征数值中可以简单分析出玉米种子果穗的优劣,但是单从一种特征区分度不是很高。而且这些检测玉米果穗种子方法非常有限而且不能满足检测的效率。
本文在检测中参考很多文献,每一种检测方法都有自己的优点和缺点,本文检测的玉米种子果穗要求很高,单纯的一种方法不能满足检测要求,但是几种方法融合可以很好地满足检测要求。
本文通过自己编写的算法结合Fisher准则根据类间离散度矩阵与总类间离散度矩阵之比的最大值确定投影方向,通过大量实验数据证明能够高效率高精度的分拣玉米果穗种子。
参考文献:
[1] 王玉亮. 基于机器视觉的玉米种子品种识别与检测研究[D]. 泰安:山东农业大学,2008:1-5
Wang Yuliang. Research on Identification and Detection of Maize Seed Varieties Based on Machine Vision[D]. Taian, Shandong Agricultural University, 2008 (in Chinese)
[2] 张超良, 王斌. 玉米种子纯度检验的方法及其评价[J]. 作物杂志,1998(1):12-16
Zhang Chaoliang, Wang Bin. Method and Evaluation of Purity Test of Maize Seed[J]. Crop Science, 1998(1): 12-16 (in Chinese)
[3] 高荣岐,张春庆. 作物种子学[M]. 北京:中国农业科技出版社,2010
Gao Rongqi, Zhang Chunqing. Plant the Seeds[M]. Beijing, China Agricultural Science and Technology Press, 2010 (in Chinese)
[4] 史中辉. 玉米种子品种智能识别系统研究[D]. 泰安:山东农业大学,2011,6: 27-48
Shi Zhonghui. Research on Corn Seed Varieties Intelligent Identification System[D]. Taian, Shandong Agricultural University, 2011, 6: 27-48 (in Chinese)
[5] 杨锦忠, 张洪生,郝建平,等. 玉米果穗图像单一特征的品种鉴别力评价[J]. 农业工程学报,2011, 27(1): 196-200
Yang Jinzhong, Zhang Hongsheng, Hao Jianping, et al. Discrimination Evaluation of Single Feature of Maize Ear Image[J].Trans of the Chinese Society of Agricultural Engineering, 2011, 27(1):196-200 (in Chinese)
[6] 黄利文. 改进的Fisher判别方法[J]. 福州大学学报:自然科学版,2006, 34(4): 473-474
Huang Liwen. Improvement Fisher Discriminant Analysis Method[J]. Journal of Fuzhou University, Natural Science, 2006, 34(4): 473-474 (in Chinese)
[7] 李建军,丁正生,张海燕. 常用判别分类方法分析[J]. 西安科技大学学报,2007,27(1):138-139
Li Jianjun, Ding Zhengsheng, Zhang Haiyan. The Analysis of a Few Discriminances[J]. Journal of Xi′an University of Science and Technology, 2007, 27(1): 138-139 (in Chinese)
[8] 曾贤灏,李向伟. 基于Fisher准则改进线性判别回归分类的人脸识别[J]. 计算机应用与软件,2014,31(9):184-186
Zeng Xianhao, Li Xiangwei. Improving Face Recognition with Linear Discriminant Regression Classification Based on Fisher Criterion[J]. Computer Applications and Software, 2014,31(9):184-186 (in Chinese)
[9] 王明合,张二华,唐振民,等. 基于Fisher线性判别分析的语音信号端点检测方法[J]. 电子与信息学报,2015,37(6):1343-1349
Wang Minghe, Zhang Erhua, Tang Zhenmin, et al. Voice Activity Detection Based on Fisher Linear Discriminant Analysis[J]. Journal of Electronics & Information Technology, 2015,37(6):1343-1349 (in Chinese)
[10] Civicioglu P, Erkan B.A Conceptual Comparison of the Cuckoo-Search, Particle Swarm Optimization, Differential Evolution and Artificial Bee Colony Algorithms[J]. Artificial Intelligence Review, 2013,39(4):315-346
[11] Wang H Z, Zhang H C,Wang Z Y,et al. Extended Multivariate Public Key Cryptosystems with Secure Encryptron Function[J]. Science China-Information Sciences,2011,54(6):1161-1171
[12] Niu Y Q. Detecting the Community Structure in Complex Net-Works Based on Quantum Mechanics[J]. Physica A:Statistical Mechanics and Its Applications, 2008, 387: 6215-6224