APP下载

玉米品种识别的集成极端学习机方法

2017-02-22魏英姿赵祉淇

沈阳理工大学学报 2017年1期
关键词:隐层学习机玉米种子

戴 敏,魏英姿,赵祉淇

玉米品种识别的集成极端学习机方法

戴 敏1,魏英姿1,赵祉淇2

(1.沈阳理工大学 信息科学与工程学院,沈阳110159;2.盘锦市高级中学,辽宁 盘锦 124010)

不同品种的玉米种子外观上存在细小差异,利用计算机视觉进行快速、客观、准确的品种检测和识别,是实现农业生产自动化的必要手段。利用玉米品种之间存在的差异性,提取玉米种子的几何、纹理、颜色等特征参数,采用差异演化算法优化极端学习机的初始参数,构建集成极端学习机,学习不同玉米的特征数据,以识别玉米品种,进行分类精度判断。对京粘一号、绿色超人、雪糯88等3个玉米品种进行分类测试,实验结果表明,集成极端学习机可有效提高玉米品种识别的准确率。

差异演化算法;极端学习机;集成极端学习机

玉米种子品种分类问题是近年来研究热点之一。分类细小的玉米种子品种存在工作量大,准确率低等问题。随着计算机视觉技术的发展,利用计算机视觉对玉米种子品种进行无损检测分类,不仅可以保持玉米种子的品质,避免人工分类的弊端,而且可以提高分类效率和准确率。单隐层前馈神经网络(SLFNs)的学习能力很强,被应用于模式识别、自动控制及数据挖掘等众多领域[1]。玉米种子品种识别问题可以归入模式识别问题的范畴,将玉米种子品种识别问题建立于神经网络模型之上,可提高识别的效率以及准确率。以BP为代表的一般的前馈神经网络已经应用于模式识别中[2]。而一般的前馈神经网络存在学习速度过慢,参数需多次调整,泛化性能较差,极端学习机(Extreme Learning Machine,ELM)[3]克服了学习过程效率低下、参数反复调整以及容易陷入局部最优等问题。极端学习机在学习的过程中,其隐藏层模块的参数随机产生,虽然学习效率大大提高,但是随机选择输入权向量和隐层节点的偏置值,极有可能产生较大的输出层权向量,进而影响神经网络的泛化性能。基于上述问题,将差异演化算法(Differential Evolution,DE)[4]引入到ELM的学习过程中,搭建集成极端学习机使算法拥有更好的准确性和泛化性能。

针对玉米种子品种分类问题,采集京粘一号、绿色超人、雪糯88等玉米品种的图像样本,提取各个玉米品种的多种特征,并将优化后的集成极端学习机应用于玉米种子品种分类中,力图探究集成极端学习机的实用性。

1 极端学习机算法

极端学习机是一种运算速度快、泛化性能好的新型单隐层前馈神经网络模型[5],与一般的神经网络(如BP,SVM)相比,不需要复杂的迭代过程,不容易出现局部最小值问题[6]。极端学习机求解学习网络的输出权向量只需要简单的方程求解。假设有N个不同的训练样本(X,Y),X为输入向量,Y为实际输出向量。对于输入训练样本X,ELM模型有H个隐层单元,激活函数为g(·),那么ELM模型的输出向量,如式(1):

(1)

式中:whi表示该网络模型输入节点与第i个隐层节点之间的输入权向量;WOi是该网络模型第i个隐层节点与输出层之间的输出权向量;bi为该网络模型第i个隐层节点的偏置值。对于训练样本(xi,yi)而言,极端学习机的学习过程即为寻求最佳的wh、b,使得‖oj-yj‖最小。将输出向量写成如下矩阵形式:

RWO=Y

(2)

(3)

(4)

式中R为网络模型隐层的输出矩阵。在训练开始前,随机给定输入权向量whi,隐层节点的偏置值bi。通过广义逆理论,即可解析求得输出权向量:

WO=R+Y

(5)

式中R+表示R的Moore-Penrose 广义逆。

2 集成极端学习机

差异演化算法DE主要包括变异操作、交叉操作、选择操作。首先,将NP个父代群体中两个不同的个体向量(Kr1,Kr2)相减得到差异化向量Dr1,2,差异化向量与群体中随机选择的个体矢量Kr3相加,生成变异向量Vr,即

Vr=Kr3+F×Dr1,2

(6)

式中:F∈[0,2]为Dr1,2的调节参数。

然后,将生成的变异向量Vr与群体中的目标向量Kr进行交叉操作,产生新成员Ur,其交叉操作的方程为

(7)

式中:CR表示交叉概率参数,且CR的取值范围为[0,1];rand(j)为均匀分布于[0,1]中的随机数;p为1,2,…,D中的随机整数,其中D代表维数。

最后,比较Ur与Kr的适度值G(·),选择适度值最优的作为子代。其评价函数为

(8)

差异演化算法在求解非线性函数优化问题方面表现出极强的稳定性,在同样的精度要求下,其收敛速度快[7]。引入差异演化算法的集成极端学习机算法执行过程如下:

1)初始化种群数目Np,调节参数F,交叉概率参数CR,最大迭代次数L。

2)新种群的每个个体Zi=[wh1,wh2,…,whh,bi]是由ELM的输入权向量whi及偏置值bi构成。对于每一个个体,通过Moore-Penrose 广义逆计算出输出权向量,并求出均方根误差

3)将种群个体依次经过DE算法的变异、交叉、选择操作,选取最优个体。其中在选择操作的过程中,以均方根误差E作为每个个体的适度值。

4)重复步骤(2)、(3),达到最大迭代次数,完成最优种群的选择。

5)得到最优种群后,通过广义逆理论,解析求得输出权向量WO。

3 玉米种子特征提取

玉米品种在几何特征、颜色特征、纹理特征[8]等方面会有细小差异。因此,提取周长、面积、圆形度、RGB各分量均值[9]、HU不变距[10]、纹理特征值等特征参数作为极端学习机的输入向量。

玉米种子特征提取步骤为:

(1)将采集到的玉米种子图像进行灰度化、中值滤波、二值化处理。利用边缘检测提取二值化图像中玉米种子轮廓,进而提取玉米种子的周长、面积、圆形度特征。

(2)提取玉米种子的最小外接矩形,通过最小外接矩形,对玉米种子进行分割。通过分割后的彩色玉米种子提取RGB各分量的均值作为3个颜色特征参数。通过二值化分割后的图像,检测每一个玉米种子的轮廓,提取每个玉米种子的周长,面积、圆形度、HU不变距、纹理特征。以京粘一号为例,其分割后的玉米种子彩色图像如图1所示。

图1 分割后的玉米种子彩色图像

周长、面积、圆形度是描述玉米种子最基本的几何特征值。采用共生矩阵描述纹理状况,从共生矩阵中导出能量、熵、惯性矩、相关性的均值和标准差作为8个纹理特征参数。利用二阶和三阶中心距构造了7个HU不变矩,其旋转、缩放、平移不变性能使得HU不变距能很好地描述物体的形状特征。

4 实验仿真

本文以京粘一号、绿色超人、雪糯88三个玉米品种为研究对象,采集到的各个品种的部分图像如图2所示。

图2 三个品种的部分玉米种子

选取240粒京粘一号、240粒绿色超人、120粒雪糯88三个品种的玉米种子进行试验,将各个品种的玉米粒的21个特征值进行归一化处理。随机选取样本数量分别150粒、150粒、80粒,共380粒玉米种子的特征值作为ELM 的训练样本,选取剩余的220粒玉米种子的特征值作为ELM的测试样本。分别对极端学习机及本文优化后的集成极端学习机进行精度测试。京粘一号样本归一化后的部分几何、颜色特征值如表1所示。

表1 京粘一号样本归一化后的部分特征值

由于极端学习机随机选择输入权向量和隐层节点的偏置值,在利用Matlab仿真软件仿真时,只需要选择隐层单元这一个参数。本文选择sigmoid函数为集成极端学习机的激活函数,从20个隐层单元开始,每次增加10个,验证不同的隐层单元对集成极端学习机的影响(如图3)。由图3可知,隐层单元的选取影响集成极端学习机的测试精度,当隐层单元个数为80个,此时集成极端学习机的分类效果好,随着隐层单元个数的增加,其分类效果缓慢增加。

不同品种的玉米种子差别不大,因此提取更多特征值以提高分类精度。当差异演化算法中CR=2、F=0.5、L=50,试验使用ELM与DE-ELM两种算法,分别在加入HU不变距、纹理特征值与不加的情况下对玉米种子进行分类识别。本文将样本分别训练、测试10次,训练精度、测试精度、训练时间、测试时间取10次的平均值,其中时间为ELM进行训练、测试时CPU的运行时间。ELM、DE-ELM分类精度对比结果如表2所示。

图3 隐层单元的个数对集成极端学习机分类性能的影响

结果表明:不同品种的玉米种子细小相似,差别不大,在选择算法相同的情况下,加入HU不变距与纹理特征值后,测试精度与训练精度都有明显提高,因此,提取更多的特征值能够提高玉米种子分类精度。在选取多特征值相同的情况下,DE-ELM的训练平均精度为94.31%,测试平均精度为95.77%。与ELM相比,DE-ELM的训练平均精度、测试平均精度有了明显的提高,且DE-ELM的测试精度大于训练精度,因此其泛化能力优于ELM。由于提取更多特征值以提高分类精度,以及优化ELM的差异演化算法复杂,这都使得DE-ELM时间成本大大加长。

表2 应用不同特征值变量的ELM、DE-ELM分类精度对比结果

5 结束语

利用计算机视觉,对细小玉米种子品种进行无损检测分类。由于极端学习机随机选择输入权向量和隐层节点的偏置值,极有可能产生较大的输出层权向量的缺陷,将差异演化算法和极端学习机相结合,应用到玉米种子分类中。提取不同玉米种子的21个特征值,建立集成极端学习机的数据集,验证了集成极端学习机对玉米种子分类的有效性,并且分类精度高、泛化性能好。集成极端学习机为玉米种子无损检测分类方法提供一个有力的参考。

[1]邓万宇,郑庆华,陈琳,等.神经网络极速学习方法研究[J].计算机学报,2010,33(2):279-287.

[2]王杰,毕浩洋.基于正则极限学习机的烟草病毒病预测[J].郑州大学学报:理学版,2013,45(4):58-62.

[3]Tiago Matias,Francisco Souza,Rui Araújo,et al.Learning of a single-hidden layer feedforward neural network using an optimized extreme learning machine[J].Neurocomputing,2014,129(129):428-436.

[4]周江嫚,黄清秀,彭敏放,等.基于差分进化优化ELM的模拟电路故障诊断[J].计算机工程与应用,2014,50(8):221-225.

[5]ChenWei Deng,GuangBin Huang,Jia Xu,et al.Extreme learning machines:new trends and applications[J].Science China Information Sciences,2015,58(2):1-16.

[6]Guang-Bin Huang,Qin-Yu Zhu,Chee-Kheong Siew.Extreme learning machine:Theory and applications[J].Neurocomputing,2006,70(1-3):489-501.

[7]卢青波,张学良,温淑花,等.差异演化算法改进与应用[J].农业机械学报,2010,41(2):193-197.

[8]王玉亮,刘贤喜,苏庆堂,等.多对象特征提取和优化神经网络的玉米种子品种识别[J].农业工程学报,2010,26(6):199-204,389.

[9]高旭.基于图像识别技术的玉米种子品种识别研究[D].保定:河北农业大学,2012.

[10]孙浩,王程,王润生.局部不变特征综述[J].中国图象图形学报,2011,16(2):141-151.

(责任编辑:王子君)

Study on Extreme Learning Machine for Variety-identification of Maize Seeds

DAI Min1,WEI Yingzi1,ZHAO Zhiqi2

(1.Shenyang Ligong University,Shenyang 110159,China;2.Panjin senior middle school,Panjin 124010,China)

Different varieties of maize seeds have small differences in the appearance,so detecting and identifying the variety rapidly,objectively and accurately is a necessary means to realize the automation of agricultural production by using computer vision.In order to identify maize varieties and conduct classification accuracy judgment,the differences are harnessed among different maize varieties,extracting geometry,texture,color and other characteristics parameters from maize seed,then differential evolution algorithm to optimize initial parameters in extreme learning machine is adopted,which constructs and integrates extreme learning machine to learn the characteristic data of different maize.Classification test is conducted on three maize varieties,jingnianyihao,lvsechaoren,and xueru88,and experimental results show that integrated extreme learning machine can effectively improve identification accuracy of maize varieties.

differential evolution algorithm;extreme learning machine;ensemble extreme learning machine

2016-05-23

国家自然科学基金资助项目(61373089);辽宁省自然科学基金资助项目(2014020083);辽宁省农业攻关及成果产业化项目(201404236)

戴敏(1992—),女,硕士研究生;通讯作者:魏英姿(1973—),女,教授,博士,研究方向:模式识别,机器人学等。

1003-1251(2017)01-0051-05

TN911

A

猜你喜欢

隐层学习机玉米种子
不同条件下对济宁地区玉米种子萌发特性的研究
基于RTD可编程逻辑门的n变量函数实现算法
影响玉米种子发芽率的因素及对策
基于BP神经网络学习算法的图像压缩技术研究
基于RDPSO结构优化的三隐层BP神经网络水质预测模型及应用
极限学习机综述
代价敏感正则化有限记忆多隐层在线序列极限学习机及图像识别应用
基于极限学习机参数迁移的域适应算法
分层极限学习机在滚动轴承故障诊断中的应用
玉米种子生产存在的问题及管理办法