基于BP网络的小麦腥黑穗病害分类诊断
2011-06-01邓继忠袁之报黄华盛
李 敏,邓继忠,袁之报,黄华盛,王 张
(1.华南农业大学工程学院,广东广州 510642;2.海南出入境检验检疫局热带植物隔离检疫中心,海南海口 570311)
小麦腥黑穗病是毁灭性的检疫对象,一般发病田块的小麦将减产10% ~20%,严重的减产50%以上,甚至绝收[1]。小麦的网腥、印度腥和矮腥等3种黑穗病常混入进口小麦原粮中,而且它们的冬孢子形态特征比较相似[2],采用显微镜人工观察方式进行检疫是较为繁琐且困难的。针对小麦腥黑穗病害的显微图像,结合图像分析与模式识别技术对其进行分类诊断,不但能够实现检验检疫的自动化,也将有助于提高病害检测的客观性与稳定性。文中设计了一个BP神经网络分类器,将其用于3种小麦病害的分类。
1 小麦腥黑穗病的BP网络分类器设计
1.1 BP神经网络基本结构
BP神经网络是一种分层型网络,其结构如图1所示。从左至右的圆圈分别代表输入层、隐含层和输出层的神经元,相同层次间的神经元之间没有连接,不同层次之间的神经元形成全互连连接。输入单元的状态代表输入到此网络中的原始信息,隐含单元的状态取决于输入单元的状态及该输入单元与隐含单元之间连接的权值。输出单元的状态取决于隐含单元的状态及隐含单元和输出单元之间连接的权值[3]。
图1 含有1个隐含层的BP网络模型
1.2 输入层与输出层设计
小麦的网腥黑穗、印度腥黑穗及矮腥黑穗等3类病害都有自己独特的图像特征。图2所示为通过图像处理技术分离出的小麦病害孢子图像。孢子图像的特征,可以通过提取图像的形状与纹理特征加以定量描述。经过分析,选择了描述孢子图像的长轴、短轴、等价椭圆短轴、面积、周长及惯性矩[4]等6个参数作为描述3类病害的典型特征参数。由此,BP网络分类器的输入层由6个进行了归一化处理的特征向量构成,即输入层的神经元数为6维;输出层根据应用BP神经网络的目的而定,文中的目的是为了能区分出病害类别,所以可以将输出层设定为一维,即只有一个输出,但为了更好地实现病害的分类,文中对目标期望输出进行编码。其中,“1”代表网腥,“2”代表印度腥,“3”代表矮腥。对于输出“1”,用目标输出向量(0,0,0,1)来表示;对于“2”,用(0,0,1,0)表示;同理,对于“3”,用(0,1,0,0)表示。由此可以确定输出层的神经元数目为4,即输出层的向量维数为4。
图2 提取的小麦病害孢子图像
但通过后续实验发现,当采用目标输出向量(0,0,0,0)的时候,BP网络无法收敛,因为采用的传递函数的输出永远不能达到0或者1,而只能接近。所以,需要纠正目标输出向量。对其重新编码后,最终编码方案如下:
1 的编码:0.1,0.1,0.1,0.9
2 的编码:0.1,0.1,0.9,0.1
3 的编码:0.1,0.9,0.1,0.1
1.3 初始权值
由于系统是非线性的,初始权值与学习是否达到局部最小、是否能够收敛以及训练时间的长短关系很大。如果初始权值太大,则使得加权后的输入落在激活函数的饱和区,从而使调节过程几乎停滞。所以,一般总是希望经过初始加权后的每个神经元的输出值都接近于零,这样可以保证每个神经元的权值都能够在它们的激活函数变化最大处进行调节。因此,选取初始权值在(-0.5,0.5)之间的随机浮点数。
1.4 隐含层设计
网络训练精度的提高,可以通过采用不增加隐含层,而增加其神经元个数的方法获得。这在实现上,要比增加隐含层简单得多。在具体设计时,通过对不同隐含层神经元数个数的网络进行训练比较、对比,然后加上适当余量。研究采用一个隐含层,隐含层的神经元数通过式(1)计算得到。
其中,N为输入层神经元数;M为输出层神经元数[5]。文中选取隐含层为10层。
1.5 传递函数
传递函数也叫激活函数,传递函数必须可导。本研究的传递函数选定为S形的Sigmoid函数,表达式如下
1.6 学习速率
学习速率决定每一次循环训练中所产生的权值变化量。过大的学习速率可能导致系统不稳定,但过小的学习速率将导致训练时间较长,收敛速度很慢。所以,一般情况下,倾向于选取适中的学习速率以保证系统的稳定性。学习速率的选取范围0.01~0.8。经过比较试验,该分类器的学习速率最终设定为0.1。
图3所示为设计的用于小麦腥黑穗病诊断的BP神经网络分类器模型图。
图3 用于小麦腥黑穗病诊断的BP网络分类器模型
2 验证与分析
2.1 小麦腥黑穗病害的BP算法
利用BP网络对小麦腥黑穗病害分类的算法步骤[6]如下:
Step1:把训练样本的特征向量归一化到(0,1)范围内。
Step2:设置输入向量 Xk=[xk1,xk2,xk3,xk4,xk5,xk6],k=1,2,…,N,N为训练样本的个数。
权值向量Wij(n)、Wjp(n),i代表输入层,j代表隐含层,p表示输出层。
输出向量 Yk(n)=[yk1(n),yk2(n),yk3(n),yk4(n)],k=1,2,…,N;表示第n次迭代时网络的实际输出;令学习速率η=0.1,最大迭代次数n=200 000,动量项α=0.9,期望误差=0.01。
Step3:随机初始化权值,为(-0.5,0.5)之间的随机浮点数;迭代次数n=0。
Step4:输入训练样本,计算BP网络每层神经元的输入信号u和输出信号v。
Step5:由期望输出和Step4求出的实际输出计算误差Err,判断其是否满足最小平均误差要求,若满足转至第8步,不满足转至Step6。
Step6:判断是否达到最大迭代次数,若大于转至Step8,否则对输入样本反向计算每层神经元的局部梯度δ;
Step7:按式(5)计算权值修正量Δω,并按式(6)修正权值;n=n+1,转至Step4。
Step8:判断训练样本是否学习完毕,是则结束,否则转至Step4。
2.2 试验结果表示方法
由于BP网络的输出为四维,文中用向量的相似度表示分类结果。即将BP网络的4个输出层看作一个4维向量。相似性函数是用函数的方法来表征两向量相似的程度。文中采用夹角余弦法计算待测病害样本和3类标准样本输出向量的相似度,用其表示输出结果。其计算公式为
其中,x,y是用于度量的向量;n表示向量的维数;i=1,2,…,n。sim(x,y)取值越大表明两向量夹角越小,两者越相近。
2.3 试验结果
试验用原始显微图像均由海南省出入境检验检疫局提供,分辨率为2 048×1 536 pixel、jpg格式。从显微图像中提取包括小麦矮腥黑穗病、小麦网腥黑穗病及小麦印度腥黑穗病共48个病害孢子样本图像进行了分类诊断的初步试验,其中15个作为训练样本集,另外33个样本作为测试集输入BP网络,测试结果如表1所示。可以看出,对这3类病害的平均识别率可以达到81.8%,且有一定的准确性;对印度腥、矮腥分别有1个和3个样本不能正确识别,原因在于:训练样本太少,由此提取的各类特征数据典型性不足;不能识别的测试样本图像不够清晰,因而提取的特征数据被削弱。
表1 3类病害分类诊断测试结果
3 结束语
将图像分析技术与模式识别技术应用于小麦腥黑穗病害的分类诊断,对于提高出入境植物病害检验检疫工作的自动化程度具有实际意义的。通过分析与比较,选择小麦矮腥、印度腥及网腥病害图像的长轴、短轴、等价椭圆短轴、面积、周长及惯性矩等6个形状和纹理特征作为分类的典型特征,构成BP网络的输入向量,按照分类目标,选择输出向量的维数为4,由此构建了含一个隐含层的BP网络分类器。通过对15个样本进行训练,对33个样本进行了分类测试,平均正确识别率达到81.8%,结果表明,采用BP网络作为分类器对小麦腥黑穗病进行诊断具有一定的准确性,今后可通过分析各类病害样本,提取更加典型的特征,并增加BP网络的训练样本量,能够进一步提高识别的准确性。此外,获取更为清晰的显微图像,更准确地提取其中的孢子区域都有助于提高后续分类诊断的准确性。
[1]中国农业网.小麦腥黑穗病防治技巧.[EB/OL][2010-04-10](2011 -05 -11)http://www.zgny.com.cn/ifm/tech/2010 -4 -10/101504.shtml.
[2]梁再群,郭翼奋,朱颖初,等.根据统计分析冬孢子形态特性区分小麦矮腥黑穗病和网腥黑穗病的方法[J].植物保护学报,1982,9(4):243 -250.
[3]BURKS T F,SHEARER S A,GATES R S.Backpropagation neural network design and evaluation for classifying weed species using color image texture[J].Transactions of the A-merican Society of Agricultural Engineers,2000,43(4):1029-1037.
[4]贺夫昌.基于图像分析的出入境小麦病害诊断方法研究[D].广州:华南农业大学,2010.
[5]常俊.基于特征提取及神经网络的图像分类识别与目标跟踪[D].西安:西安电子科技大学,2008.
[6]高隽.人工神经网络原理及仿真实例[M].北京:机械工业出版社,2007.
[7]彭淑敏,王军宁.基于神经网络的图像识别方法[J].电子科技,2005,18(1):39 -42.
[8]姚慧娟,栾晓明.改进的BP网络算法在图像识别中的应用[J].电子科技,2010,23(9):90 -92.