APP下载

基于支持向量机的水稻叶面积测定

2018-09-10孙玉婷杨红云王映龙周琼孙爱珍杨文姬

江苏农业学报 2018年5期
关键词:叶面积支持向量机

孙玉婷 杨红云 王映龙 周琼 孙爱珍 杨文姬

摘要:本研究探讨了水稻叶长、叶宽与叶面积之间的关系。应用改进网格搜索算法参数优化后的支持向量机对计算机图像处理技术测量所得到的样本数据进行训练,以水稻叶片长度(L),叶片最大宽度(W)、叶面积回归拟合值(S)作为输入变量对水稻叶面积进行预测。结果表明,在不同的水稻品种下,相比于其他模型本研究提出的支持向量机Ⅲ模型预测结果的均方根误差和平均相对误差最低,均方根误差分别为1.882 1(两优培9),1.387 3(金优458)和1.348 2(中早35),平均相对误差分别为2.901 4%(两优培9),5.273 5%(金优458)和4.929 3%(中早35)。该模型能较真实地反映水稻叶面积的实际大小,满足农业科学研究的需求,为植物叶面积的预测提供了一种新的方法。

关键词: 叶长;叶宽;叶面积;网格搜索算法;支持向量机

中图分类号:TP751

文献标识码:A

文章编号: 1000-4440( 2018)05-1027-09

植物叶片是植物进行光合作用和蒸腾作用的重要器官,其叶面积的大小决定了植物光合面积的大小,对植物的生理生态、作物栽培、作物产量都具有十分重要的意义。传统的叶片面积的测量方法主要有网格法,复印称质量法、系数法和叶面积仪器测量法等。但是上述方法存在破坏植株生长,费工费时或价格昂贵等缺点,不利于相关工作的开展。不少学者为能简便、准确、迅速地测量植物的叶面积做了大量研究,分别对蓝莓、番茄、香梨、木菠萝和节瓜等植物叶面积进行了回归分析,得到了相关叶面积的拟合方程。随着计算机技术的高速发展又衍生出了基于数字图像处理技术的测量方法,杨劲峰等通过平台扫描仪获得叶片数字图像并建立了运用数字图像处理测定蔬菜叶面积的方法,并与目前较为常用的叶面积测量方法进行比较分析,得到图像处理方法与上述方法测定结果显著的线性相关。赵英等利用数码相机获取杧果叶片的数字图像,并利用Photoshop图像处理软件计算其叶面积,测定结果与传统的方法结果差异不显著。高君亮等通过3种不同的方法(方格法、称质量法和数字图像处理法)对3种杨树(小叶杨、新疆杨和二白杨)的叶面积进行测定,分析得到数字图像处理法与其他2种方法的测定结果具有显著正线性相关。崔世钢等采用基于Photoshop图像处理法对数码相机所获取得油菜叶片图像进行分析测定,将所得到的油菜叶面积与叶面积仪测定法、方格法的测量结果进行回归分析,结果存在极显著线性相关。虽已有人对水稻的叶面积指数进行了大量的研究,但是利用机器学习方法预测单株水稻叶面积还鲜见报道。本研究通过机器学习的方法建立水稻叶长、叶宽及叶面积回归拟合值与叶面积的模型,探求一种方便、快捷、误差小且不影响水稻植株生产的测量方法,从而实现简便、快速、正确估算水稻叶面积,为研究水稻高产栽培技术和生产管理提供参考。

1 材料与方法

1.1 试验设计

水稻田间试验于2015 - 2017年在江西农业大学农学试验站和江西省成新农场进行,供试品种为籼型两系杂交稻品种两优培九(LYP9),籼型三系杂交水稻品种金优458(JY458)、常规稻品种中早35(ZZ35)。分别采集两优培九水稻品种l 360组叶片,金优458水稻品种720组叶片以及中早35水稻品种680组叶片作为观测样本。

1.2 数据获取与分析

1.2.1 水稻叶片数字图像获取水稻取样后,扫描4种不同施氮水平下水稻样品的顶三叶的数字图像。选择平板扫描仪MRS-9600TFU2,分辨率设置为600 dpi,缩放比例为100%,RGB格式进行扫描,并以JPG格式存储于计算机中。植株活体剪下叶片取样后,整齐地平放在扫描仪工作台面上,尽快扫描避免水稻叶片因蒸腾水分變形造成误差。

1.2.2 图像预处理 由于多种因素的影响,图像在生成、传输和变换的过程中会造成图像质量下降,为了避免图像的分析误差,首先对图像进行增强处理,然后将其转化为二值化图像。采用开运算和闭运算去除二值化图像上由于光照过强所形成的光斑,最后对图像进行边缘提取,得到水稻叶片的轮廓。

1.2.3 水稻叶片长度和宽度的获取 采用mIn-boundrect函数可以得到水稻叶片最小外接矩形的4个顶点(c1r1),(C2,r2),(C3,r3),(C4,r4),根据2点间的距离公式,可以获得水稻叶片的长Ln,宽Wo。

将水稻叶片长、宽的像素值与真实值之间进行转换。转换公式如下。

公式(3)、(4)中,Ln、Wo分别为叶片长、宽的像素值,L、W分别为叶片长、宽的真实值。

1.2.4 水稻叶面积的获取数字图像由许多像素点组成,每个像素点代表一定的实际面积值,为了确定扫描仪采集的样本图片像素代表的实际面积大小,在扫描图片时引入了一个已知面积大小的参考物。

公式(5)中S1为水稻的叶面积,S2为参照物的实际面积(本研究中S2定为2.5cmx2.5cm),P1为水稻叶片图像所包含的像素点,P2为参照物图像所包含的像素点。

1.3 数据预处理

为了提高运行效率和建模的精度,将不同量纲的数据归一化至区间,采用的归一化原理如公式(6)。

公式(6)中x表示样本数据,Xmax和Xmin分别表示样本数据中的最大值和最小值,y表示归一化后的数据,),ymax和)ymin分别表示归一化后数据的最大值和最小值。

1.4 改进网格搜索算法

支持向量机是建立在统计学习理论的VC维理论和结构风险最小原则基础上的新型机器学习方法。它在解决小样本、非线性和高维模式识别问题中表现出许多特有的优势,并在一定程度上克服了“维数灾难”和“过学习”等问题。支持向量机应用于实际问题时能否取得良好的预测结果,取决于能否成功地设置该算法的关键参数,其主要参数为惩罚系数c和核函数参数g。网格搜索算法的原理是让c和g在一定的范围划分网格并遍历网格内所有点进行取值,对于选定的c和g利用K-CV方法得到此组c和g的预测误差,最终选择使训练集交叉验证分类准确率最高的那组c和g作为最优参数组合。传统的网格搜索算法搜索对于较小的步距会影响寻优效率,而对于较大的步距容易陷入局部最优。本研究采用改进的网格搜索算法优化支持向量机不仅具有良好的效果,还能大幅度减少参数的寻优时间。其算法原理是先在较大范围内采用大步距粗搜获得局部最优参数组合,再在这组参数附近选择一个小区间,采用传统的小步距进行二次精搜,得到最后的最优参数组合。

2 结果与分析

2.1 水稻叶长、叶宽误差

以试验观测到的两优培九水稻数据为分析样本,随机选取20组,采用人工和计算机图像处理技术对水稻叶长、叶宽进行测量,其测量结果对比见表1。

从表l可以看出,与人工测量相比,采用计算机图像处理测量水稻叶长最大相对误差为0.97%,平均相对误差为0.40%,而水稻叶宽最大相对误差为5.88%,平均相对误差为3.10%,能够满足本研究的要求。

2.2 不同寻优方法优化支持向量机参数

以试验观测到的两优培九水稻的1 360组数据为分析样本,对样本数据进行归一化处理,选择其中1 020组数据为训练集.340组数据为测试集,水稻的叶长和叶宽为模型的输入变量,水稻叶面积为模型的输出变量。

采用改进的网格搜索算法对惩罚系数c和RBF核参数g寻优,设定初始网格搜索c和g的范围均为[2-8,28],搜索步距均设为l,采用K-CV方法对训练集进行测试,其中K=5,得到局部最优参数组合,在得到的局部最优参数附近重新定义搜索范围和步距,其c和g搜索范围均为[2-2,22],搜索步距均为0.1。二次寻优的结果如图l、图2所示。

选择好最优参数组合[c,g]后,对训练集進行训练,模型回归结果显示相关系数为0.979 942,表明该模型的回归能力较好,为了进一步测试该模型的精度,对测试集进行预测,本研究分别采用了传统网格搜索算法,与改进网格搜索算法进行比较,包括最终模型参数、均方根误差(反归一化后)以及寻优时间的相关系数,其对比结果见表2。

由表2可知,采用改进的网格搜索算法寻优时间约为传统网格搜索算法的1/53,但由于其在二次寻优的区间选择上含有较多的经验成分,所以均方根误差略低于传统网格搜索算法。牺牲了一点均方根误差而节省了大量的寻优时间是可以接受的,因此应用改进的网格搜索算法建立水稻叶面积模型是有效可行的。

2.3 不同水稻品种叶面积的预测

本研究以试验观测到的3种不同水稻叶片数据为依据,采用参数优化后的支持向量机算法对水稻叶面积进行训练和预测。采用归一化法将观测数据处理到(0,1)区间,两优培九水稻品种选取1 020组数据为训练样本,340组数据为预测样本。金优458水稻品种选取540组数据为训练样本,180组数据为预测样本,中早35水稻品种选取510组数据为训练样本,170组数据为预测样本。

2.3.1 两优培九水稻品种叶面积的预测 以试验观测到的两优培九水稻的1 020组数据为分析样本,以叶长、叶宽为自变量,以图像处理所得到的叶面积为因变量进行回归分析(图3),回归方程达到显著水平(P<0.05),水稻的叶长、叶宽与叶面积呈线性关系,其回归方程为:

SLYP9= -45.370 1+1.336 6/+26.664 7W

(7)

公式(7)中,L为叶长,W为叶宽,s为叶面积,回归方程的决定系数为0.960 5。

将水稻叶长、叶宽的观测值代入公式(7)中,求出对应的叶面积回归拟合值(S),将水稻叶长(L)、叶宽(W)、叶面积回归拟合值(S)作为模型的三维输入变量,水稻叶面积作为模型的输出变量,其样本训练如图4所示。

图4显示,水稻品种的模型在样本训练过程中表现出了良好的数据泛化能力,在训练集上验证模型的回归效果,结果显示平方相关系数为98.017%.根据训练后获得的最优模型参数,并对剩余的340组样本数据进行预测,其预测结果如图5所示,为了对比本研究提出的模型在叶面积测量上的效果,分别用其他3种不同的模型对相同的数据进行叶面积预测,其一以水稻叶长(L)、叶宽(W)为二维输入变量,叶面积为输出变量建立支持向量机模型,其二以水稻叶长(L)、叶宽(W)、叶长叶宽乘积(/x W)为三维输入变量,叶面积为输出变量,建立支持向量机模型,其三以水稻叶长(L)、叶宽(W)为二维输入变量,叶面积为输出变量,建立线性回归模型。为了定量分析4种模型的预测效果,本研究引入均方根误差和平均相对误差2个评价指标,评价结果如表3所示。

通过比较分析,4种模型的预测精度均比较高,本研究提出的支持向量机Ⅲ模型均方根误差和平均相对误差均小于其他3个模型,考虑到不完全抽样的性质,本研究需要进一步对差异进行显著性检验,原假设为配对样本无显著性差异,本研究利用SPSS软件对上述4种模型的预测结果进行Wilcoxon检验,得到结果如表4所示。

从Wilcoxon检验结果来看,除了支持向量机I(L、W)一支持向量机Ⅱ(L、W、Lx W)与支持向量机I(L、W)-支持向量机Ⅲ(L、W、S),其他配对样本的检验结果显著性P值均小于给定的显著性水平0.05,拒绝原假设,判定模型之间存在显著性差异。

2.3.2 金优458、中早35水稻品种叶面积的预测为了验证本研究提出的模型的普适性,采用另外2种不同的水稻品种金优458和中早35进行验证。分别取试验观测到的金优458的540组数据以及中早35的510组数据为分析样本,均以水稻叶长、叶宽为自变量,以图像处理所得到的叶面积为因变量进行回归分析(图6、图7),回归方程达到显著水平(P<0.05),水稻的叶长、叶宽与叶面积呈线性关系,其回归方程为:

SJY458= -21.333 6+0.781 9/+18.455 9W (8)

S2235= -22.496 0+0.904 6/+17.775 W (9)

公式(8)、公式(9)中,L为叶长,W为叶宽,S为叶面积,JY458水稻品种回归方程的决定系数为0.951 6.2235水稻品种回归方程的决定系数为0.967 5。将水稻叶长、叶宽的观测值代入公式(8)、公式(9)中,求出对应的叶面积回归拟合值(S),将水稻叶长(L)、叶宽(W)、叶面积回归拟合值(S)作为模型的三维输入变量,水稻叶面积作为模型的输出变量,其样本训练如图8、图9所示。

从图8、图9可以看出,2种水稻品种的模型在样本训练过程中表现出了良好的数据泛化能力.2种水稻品种的叶面积均稳定在0—60,基于参数优化后的支持向量机回归对于2种不同水稻品种训练样本的平方相关系数分别为97.15%(JY458)和98.62%(2235),根据训练后获得的最优模型参数,对剩余的180组(JY458)、170组(2235)样本数据进行预测,其预测结果如图10、图11所示,为了对比本研究提出的支持向量机Ⅲ模型在叶面积测量上的效果,分别用其他3种不同的模型对相同的数据进行叶面积预测,其一以水稻叶长(L)、叶宽(W)为二维输入变量,以叶面积为输出变量建立支持向量机模型,其二以水稻叶长(L)、叶宽(W)、叶长叶宽乘积(L×W)为三维输入变量,以叶面积为输出变量,建立支持向量机模型,其三以水稻叶长(L)、叶宽(W)为二维输入变量,以叶面积为输出变量,建立线性回归模型。引入均方根误差和平均相对误差2个评价指标定量分析4种模型的预测效果,其评价结果如表5所示。

通过比较分析,2個水稻品种在本研究提出的支持向量机Ⅲ模型预测下,其结果的均方根误差和平均相对误差均小于其他3个模型,考虑到不完全抽样的性质,本研究需要进一步对差异进行显著性检验,原假设为配对样本无显著性差异,利用SPSS软件对上述4种模型的预测结果进行检验,2种水稻的显著性检测结果如表6、表7所示。

从Wilcoxon检验结果来看,金优458水稻品种中除了支持向量机I(L、W)-支持向量机Ⅱ(L、W、Lx W)与支持向量机I(L、W)-支持向量机Ⅲ(L、W、S),其他配对样本的P值均小于给定的显著性水平0.05,拒绝原假设,判定其他模型之间存在显著性差异。而在中早35水稻品种中,除了线性回归一支持向量机Ⅱ(L、W、L×W)和支持向量机Ⅱ(L、W、L×W)-支持向量机Ⅲ(L、W、S),P值小于给定的显著性水平0. 05,模型间具有显著性差异,其他模型间显著性差异不明显。

3 讨论

本研究建立的4种叶面积模型均可以实现水稻叶面积的快速、无损测定。通过改进网格搜索算法参数优化后的支持向量机建立水稻叶面积模型并预测叶面积,模型的输人参数为水稻叶长(L)、叶宽(W)以及回归拟合值(S),试验样本为3种水稻品种的数据。结果表明,水稻叶长、叶宽、回归拟合值与叶面积之间存在显著的相关性,模型预测结果误差小,可以较好地应用于叶面积的测定,具有较好的使用价值和应用前景。

目前关于图像处理以及支持向量机方法应用于农产品的研究已有一些进展。程洪等使用图像处理技术以及传统网格搜索算法参数优化后的支持向量机建立树上苹果早期模型,模型的预测效果较好。鉴于前期研究成果得到利用图像处理技术对水稻叶片面积的计算误差小于5%,本研究通过图像处理技术求取目标物的最小外接矩形以获得水稻叶长、叶宽,叶长的平均相对误差为0.40%,叶宽的平均相对误差为3.1O%。本研究还采用了改进的网格搜索算法对支持向量机参数进行寻优,虽然牺牲了均方根误差,但大大缩减了大量的样本空间下支持向量机参数寻优的时间,为模型的预测提供了一定的实时性。

水稻叶面积是水稻株型研究通常需要测量的形态指标。关于植物叶面积的测量方法较为常见的有:复印称质量法,长宽矫正法,叶面积仪测定法等。这些方法各有利弊,尤其对于野外测量,需要消耗大量的时间与精力,而且操作复杂影响测量精度。本研究通过图像处理技术对水稻叶片进行简单测量,采用多元线性回归和改进网格搜索算法参数优化的支持向量机建立模型预测水稻叶面积。3种水稻品种基于支持向量机预测水稻叶面积模型的均方根误差和平均相对误差均小于多元线性回归方法,且其中2种水稻品种(两优培9、金优458)基于支持向量机的模型与线性回归模型之间具有显著差异(P<0.05),表明支持向量机模型能更好地预测水稻叶面积,具有较强的预测精度。

模型变量的选择会影响模型的精度和复杂性。不少研究通过图像处理技术对植物叶片进行长、宽、面积的测算,发现叶面积与叶长、叶宽、长宽乘积显著相关。本研究不仅证明了上述结论,还利用支持向量机模型对叶面积进行预测,预测效果良好。本研究还提出了一种新的思路,通过多元线性回归建立数学模型,得到3种水稻品种的叶面积回归方程,将水稻叶片长宽的实测值代入回归方程中得到叶面积回归拟合值,并将拟合值与叶长、叶宽构成一个三维输入变量,建立支持向量机模型预测水稻叶面积,模型的预测效果良好,相比于其他模型,对于两优培9、金优458、中早35 3种水稻品种,本研究提出模型的均方根误差和平均相对误差均为最低。Wilcoxon检验结果表明,在统计学意义上,本研究提出的支持向量机Ⅲ模型与其他2种支持向量机模型的预测结果具有较高一致性,显示本研究提出的支持向量机Ⅲ模型具有较强的适用性和有效性,与支持向量机Ⅱ相比,显著性差异明显,说明本研究提出的支持向量机Ⅲ模型预测水稻叶面积更为准确,为水稻叶面积的测定提供了一种新的方法。

猜你喜欢

叶面积支持向量机
不同施肥管理模式对水稻产量的影响
不同时期喷施生长调节剂对苏玉29抗逆增产的影响
积温对春玉米叶面积和产量的影响分析
洛阳市13种绿化树种叶面积的回归测算
基于改进支持向量机的船舶纵摇预报模型
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究