APP下载

南疆红枣病虫危害等级识别模型的研究与实现

2014-08-12周鹏郭颂牛晓太等

江苏农业科学 2014年6期
关键词:支持向量机主成分分析

周鹏+郭颂+牛晓太+等

摘要:南疆红枣病虫害成为制约南疆红枣产业发展的主要因素,因而红枣内在品质成为评判优质等级的关键。首先利用光谱技术提取南疆红枣相关参数,分析红枣在460~2 260 nm波长范围内的光谱特性参数。运用主成分分析法分析黑斑病红枣一、二阶微分光谱的前10个主成分解释的变异百分比,比对光谱特征参数和重采样光谱对红枣病害等级识别的影响因素。最后以光谱参数为径向基网络输入量,分析确定核函数和分类函数,构建南疆红枣病虫害等级识别支持向量机模型。结果表明,运用主成分分析法和带惩罚系数及核参数的支持向量机技术构建的支持向量机模型对南疆红枣病虫危害等级识别正确率为98.8%,实现了对南疆红枣病虫害进行精确的等级识别。

关键词:新疆红枣;病虫害等级;光谱技术;主成分分析;支持向量机;等级识别

中图分类号: S126文献标志码: A文章编号:1002-1302(2014)06-0354-04

收稿日期:2013-09-26

基金项目:国家自然科学基金(编号:61162018);河南省基础与前沿技术研究项目(编号:132300410422);河南省科技攻关计划(编号:132102210049)。

作者简介:周鹏(1969—),男,河南信阳人,硕士,教授,从事嵌入式系统、模式识别、遥感监测和物联网工程研究。E-mail:zpzqxy@163.com。南疆地处欧亚大陆的腹地,降雨量少,蒸发量大,空气干燥,光热资源丰富,根据红枣的生物学特性,非常适合发展红枣产业。近年来,随着南疆红枣种植面积不断增加,病虫害也逐年严重。南疆红枣病虫害除造成产量损失外,还造成红枣内在品质的下降,甚至产生对人体有毒、有害的物质,红枣病虫害的发生越来越成为制约南疆红枣产业发展的主要因素。以南疆红枣原始光谱、对数光谱、一阶和二阶微分光谱等光谱数据形式为研究对象,筛选对南疆红枣病虫害胁迫响应敏感的光谱区域和波段。运用主成分分析法和带惩罚系数C的支持向量机技术,构建南疆红枣病虫危害等级识别模型。

1材料与方法

1.1检测的仪器设备

本次检测使用的是美国ASD(Analytical Spectral Device)公司制造的便携式Field Spec Pro FR 2500光谱辐射仪,测试的波段范围为350~2 500 nm。当采样间隔为1.4 nm时,要求检测的波段为350~1 000 nm,光谱分辨率为3 nm;当采样间隔为2 nm时,检测的波段为1 000~2 500 nm,光谱分辨率为10 nm;模拟光源与光谱辐射仪配套的150 W卤素灯,探头视场角25°。

1.2光谱采集方法

试验前设计一个简易南疆红枣样品高光谱批量快速采集遴选装置(图1),其中转台和光纤多角度调节架是测试装置的主要部件。在转台的水平上呈圆形结构上的星形虚线部位为添加红枣的卡槽,方便对红枣进行固定;图中的椭圆形阴影为待检测的红枣,三维光学调节台采用的光纤调节支架,能够根据需要改变二者之间的距离与测试的角度。光源发射光照射在红枣后,红枣吸收部分光线,会在红枣的内部发生漫反射出的光线。根据测试需要,可以调节光纤支架的测量距离和角度,调节反射光线的角度,并将反射光线漫反射至光纤接收并将其输送至光谱辐射仪,也有利于减少红枣皮或枣核对反射光线的影响,方便光谱辐射仪进行分析。在检测过程中,通过缓慢移动改变光纤支架的距离和角度来获取不同状态的测量光谱信息,根据光谱的变化情况来分析红枣内部的变化情况,通常采用选取样品的漫反射或漫透射光谱平均值作为测量结果。

采用批量采集检测装置和便携式光谱辐射仪联合测试,通过对红枣进行旋转,方便对红枣病虫害开展具体实施的操作分析[1]。其中z轴表示红枣的吸光度,x轴为光谱的波数,y轴为检测的时间。随着时间变化,对红枣的检测光谱进行分析,形成测试红枣不同部位的三维光谱图。发生不同病虫害的红枣由于结构发生变化,吸收光线的能力不一样,这样就形成两侧的糖度和内部结构有明显不同。由于红枣直径一般约2~3 cm,整体的结构差异较小,糖度差异较小,在测试时,做3次扫描糖度,就能够满足测试的要求。

1.3吸收光谱特征的提取

枣锈病、枣疯病、黑斑病、缩果病危害等级不同的南疆红枣,其内在品质的各成分含量和吸收光谱有所不同,根据发生病虫害的红枣对光谱的吸收,可以确定红枣光谱的化学成分,能够有效确定病虫害的类型。通过吸收光谱的吸收深度和吸收面积,可以有效分析病虫害的主要特征。采用包络线消除法对获取的光谱数据进行处理,能够有效压抑背景光谱,提高吸收光谱的特征,便于进行详细的分析。在光谱提取前,要求对光谱的吸收数据进行归一化处理,提高数据的分析精度,采用光谱波长为480、560、760、850、1 250、1 450 nm,图2为发生黑斑病的红枣的光谱反射率信号并通过数据归一化处理后的光谱反射数据图。

图2中红枣样品的光谱反射率曲线由离散样点组成,形成一个连续、完整的曲线,获得近似表示样本反射率包络线,通过曲线可以分析红枣的黑斑病情况。由于采用相同的光谱波段值,所得的分析结果即为该波段去包络化后的归一化光谱值,其值为[0,1],即为红枣黑斑病的特征离散曲线。根据归一化光谱值计算方式和处理方法,确定红枣的吸收深度(Depth)和病虫害红枣光谱吸收面积(Area)之间的关系,相应的计算公式为:[2]

Depth=1-min(Rc)Iλ2λ1(1)

其中:Rc为归一化光谱曲线值,λ1、λ2为吸收光谱特征的波段范围,Area为光谱吸收峰到包络线之间的积分面积。通过Area可以分析红枣黑斑病发生的程度,即轻度、中度、重度、特重度,表1为波段在660 nm附近的红枣光谱的吸收深度、吸收面积。

黑斑病红枣的光谱吸收深度(Dept)和吸收面积(Area)

样本数轻度中度重度特重度DepthAreaDepthAreaDepthAreaDepthArea10.52159.150.57173.660.66196.890.74226.3520.53162.150.57173.450.66205.010.75227.75290.52158.640.64193.890.67202.280.74225.42300.52158.630.64193.880.67202.290.74226.85

1.4红边光谱特征值的提取

发生病害红枣的红边光谱特征参数[红边位置Rep和红谷位置Lo]代表红枣的叶绿素含量。其中红边光谱特征参数测试采用光谱微分技术,通过吸收光谱可以进行红边光谱特征值的提取,便于对发生不同程度病害红枣的区别。对轻度、中度、重度、特重度4个不同级别的黑斑病红枣在光谱波长480~760 nm进行光谱测试,表2为在光谱反射率取值达到最大时,红边位置(Rep)波段和红谷位置(Lo)的波段。

黑斑病红枣的红边位置(Rep)和红谷位置(Rep)光谱

样本数轻度中度重度特重度RepLoRepLoRepLoRepLo170175270175269875270175127027556997536977527017522969975569975269775269975130698754699752698751701751

1.5红枣指数的提取

由于红枣指数是由红枣在光谱吸收、反射与背景之间的关系决定,通常由多种指标构成。通过分析轻度、中度、重度、特重度4个不同级别黑斑病红枣,在光谱波长460~2 260 nm范围内获得的光谱数据,发现红枣的红边波长集中在680 nm波段范围,利用式NDVI_m=|Rl-Rm|Rl+Rm(式中l表示固定的红边波长,m表示检测红枣的红边波段,Rl表示红枣固定光谱反射率值,Rm表示相应的红枣光谱反射率值) 进行归一化处理,得到的相关数据见表3。

归一化红枣光谱指数值

等级数据黑斑病红枣样品数12…2930轻度NDVI-10.048 820.044 49…0.052 050.052 07NDVI-20.667 510.650 14…0.653 450.653 46 NDVI-60.013 220.012 26…0.014 010.014 04中度NDVI-10.051 770.048 21…0.056 960.056 97NDVI-20.630 880.667 29…0.668 180.668 19 NDVI-60.011 110.011 42…0.011 850.011 88重度NDVI-10.745 380.733 03…0.761 050.761 06NDVI-20.058 270.046 78…0.051 140.051 15 NDVI-60.010 770.008 92…0.009 330.009 33特重度NDVI-10.745 390.733 04…0.761 060.761 06NDVI-20.058 270.045 77…0.051 170.051 16 NDVI-60.010 780.00 891…0.009 350.009 36注:NDVI-1至NDVI-6入选波长分别是460、550、680、730、1 200、1 860 nm。

2结果与分析

2.1发生病虫害红枣的光谱主成分及等级识别相关度分析

在保证红枣的光谱信息的前提下,对光谱的相关信息进行主成分分析,解决分析过程中出现的高光谱波段过多、谱带重叠的问题[3-5]。利用波段选择法确定主要成分的波段,结合PCA的波段选择算法为等级识别提供变量因子,其中表4和表5分别表示基于PCA黑斑病红枣一阶和二阶微分光谱的前10个主成分解释的变异百分比。在确定主成分后,并进行分类处理,保证原始图像的相关信息没有任何改变。表4发生病害红枣一阶微分光谱的前10个主成分所占比重(%)

主成分枣锈病红枣枣疯病红枣缩果病红枣黑斑病红枣460~850 nm851~1 450 nm460~850 nm851~1 450 nm460~850 nm851~1 450 nm460~850 nm851~1 450 nmPC180.41356.28647.16843.28961.01652.65991.59147.202PC27.03818.41237.31226.57120.41312.4623.39129.491PC33.0799.3494.28814.0563.819.7511.01113.431PC42.1325.2492.8295.7562.9813.0280.7526.251PC51.8953.7212.0534.0221.7762.1280.7381.648PC61.0682.1590.8912.1861.1421.8830.4850.785PC70.8131.5380.6010.9050.8421.6990.3860.461PC80.4060.4980.5010.4810.7291.6350.3450.279PC90.3610.3980.4130.4490.6481.2770.2530.101PC100.2990.2890.3570.3680.5561.2460.1760.082总和97.50497.89996.41398.08393.91387.76899.12899.731

发生病害红枣二阶微分光谱的前10个主成分所占比重(%)

主成分枣锈病红枣枣疯病红枣缩果病红枣黑斑病红枣460~850 nm851~1 450 nm460~850 nm851~1 450 nm460~850 nm851~1 450 nm460~850 nm851~1 450 nmPC147.11251.93928.50843.78745.07274.33466.77160.159PC211.88325.40218.88927.04214.12818.3596.38122.374PC310.1216.4786.2918.6917.0382.7225.0726.324PC47.0725.9294.5034.5194.4811.1684.0963.437PC54.6682.5164.0462.7083.7410.3883.2562.501PC62.6761.4013.4142.1491.8350.3482.7211.742PC72.1481.2693.0911.7791.6780.3032.0830.962PC81.9681.0582.8461.4151.4970.2531.7160.697PC91.4290.5882.5071.1751.3510.2381.4480.407PC101.2680.5592.2571.0191.2120.1981.2790.352总和90.34597.13976.35294.28482.03398.31194.82398.955

2.1.1光谱特征参数与发生病害红枣危害等级识别相关度分析采用线性和多项式拟合相结合的方法进行光谱特征参数与不同等级病害红枣相关性分析,确定模型构建参数[4]。光谱特征参数与不同等级病害红枣相关性见表6。

光谱特征参数与红枣病虫等级的相关性

特征参数线性拟合多项式拟合相关系数误差相关系数误差Rep0.924 80.2910.913 80.245Lo0.721 10.5730.569 60.545Depth0.789 80.5050.802 70.374Area0.700 60.5020.808 90.371NDVI-10.431 50.7830.238 60.779NDVI-20.679 80.5810.633 50.583NDVI-30.763 50.5150.948 80.198NDVI-40.699 80.5390.616 60.535NDVI-50.158 10.8330.061 50.823NDVI-60.347 80.7980.098 80.779

2.1.2基于重采样光谱PCA-RBFN不同病害等级的识别分析在对红枣的原始光谱进行合适的重新采样后,仍有196个波段,如果采用全部数据输入径向基网络RBFN(radial basis function neural network),数据的计算量十分庞大。图3为经过光谱仪进行重采样光谱的第一主成分(PC1)在检测的波段范围内的载荷图。PC1与波长738~1 299 nm的光反射值具有负向比例的关系,在可见光(<713 nm)和短波红外(>1 343 nm)波段范围内的相关性较弱。但是,当Spread为0.000 5时,光谱仪测试结果的RMSE为65.1%,对红枣检测的观测值和模拟值的相关系数为0.141。这说明,经过重采样光谱进行压缩处理后,对红枣病虫害的等级识别,还不能满足检测的要求。

2.2南疆红枣病虫危害等级识别模型

2.2.1模型构建设X为模型的判断输入空间,X={xi}∈Rn,Rn为n维数据特征空间值,Y为模型的输出域,矩阵的判断主要由2类点组成数据方阵,Y={-1,+1}。对于n维数据特征样本值组成的样本集合S=[(x1,y1),…,(xn,yn)](X×Yn),构建一个分析病虫害的数据目标函数,将非线性不可分的输入空间映射到高维空间,通过形成的数据映像,可以有效地形成一个数据平面,使得训练集中的点距离满足线性要求,经过归一化后,对于红枣光谱2类线性不可分数据样本集(xn,yn)的分类超平台应满足:

yi(<ω·xi>+b)-1+ζi≥0(3)

相应的数据处理,就转化为分类数据的间隔1/‖ω‖最大值等价于‖ω‖2最小,红枣优化平面的数据问题可以转化为约束优化问题[6]:

φ(ω,b,λ)=12‖ω‖2+C∑ni=1ζi-∑ni,j=1λiλj{yiyj[K(xi,xj)+b]-1}(4)

最终求出最优解为:

ω=∑ni=1λiyixi,b=1-ωxs(5)

其中:φ代表Lagrange的函数值,病虫害的识别模型转变为对ω和b求φ函数的极小值和特征差异值。公式(5)代表垂直于红枣分类超平面的法向量,代表数据的分类阈值,为病虫害光谱值有效范围,采用相应的计算公式可以求得;xi为红枣病虫害识别模型的输入向量;C为惩罚系数;ζi为函数的松弛因子。

从表6中看出光谱特征参数Rep、Lo、Eepth、NDVI-2、NDVI-4 和红枣病虫害等级线性相关,Area、NDVI-3和红枣病虫害等级呈明显多项式,而NDVI-1、NDVI-5、NDVI-6和红枣病虫害等级相关性较小,因此,能够确定输入向量Rep、Lo、Depth、Area、NDVI-2、NDVI-3、NDVI-4。测试结果表明,采用不同核函数 将获得不同的分类结果。根据红枣病虫害等级和光谱特征参数,确定采用径向基函数(RBF)形式的核函数,其表达式为:

K(xi,xj)=exp{-γ‖xi-xj‖2}(6)

γ为核参数,构建南疆红枣病虫害等级识别支持向量机模型为图4。

2.2.2核参数及惩罚系数和分类函数的确定为获得较高识别精度,需要对核参数γ和惩罚系数C进行测试与分析[7]。其中γ和C取值范围为[2-12,212]。根据表7中的数据,可以区分南疆红枣病虫害等级的支持向量,以及红枣病虫害识别模型的的重要影响参数:核参数(γ)和惩罚系数(C)。通过计算,取得它们最佳值分别为C=210,γ=2-8。将核参数(γ)代入式(6),得到核函数K(xi,xj),将C和K(xi,xj)代入式(7),通过迭代计算,计算出南疆红枣病虫害等级分类超平面的垂直法向量ω和分类阈值b。

ω=-2.081 8

2.569 8,b=-0.280 6

-0.113 5

由此,得到分类函数为:

y=ωx+b=-2.081 8

2.569 8x+-0.280 6

-0.113 5(7)

不同核参数和惩罚系数判定准确率

C不同γ下的判定准确率(%)2624222-12-22-42-62-8212878787879197988721089898989919699892888888888889696882683838383838895832472727272727284722262626262626272622-241414141414154412-438383838383843382-63737373737374037

模型对南疆红枣病虫害等级识别正确率为98.8%,结果如表8所示。

样本识别结果

级别样本数

(个)识别结果(个)C1C2C3识别正确率

(%)C11201200098.8C212001200C312004116

3结论

采用高光谱技术在460~2 260 nm波长对南疆红枣的吸收光谱的相关参数及光谱特性参数进行提取,并计算轻度、中度、重度、特重度4个不同级别黑斑病红枣光谱特征参数与红枣病虫害等级识别的相关度。通过测试和模型识别计算,本研究结果表明,运用主成分分析法和带惩罚系数及核参数的支持向量机技术,构建的模型能够实现南疆红枣病虫害等级识别,识别正确率为98.8%,实现了对南疆红枣病虫害进行精确的等级识别。

参考文献:

[1]罗华平,卢启鹏,丁海泉,等. 南疆红枣品质近红外光谱在线模型参数的实验研究[J]. 光谱学与光谱分析,2012,32(5):1225-1229.

[2]陈兵,李少昆,王克如,等. 病害胁迫下棉花叶片色素含量高光谱遥感估测研究[J]. 光谱学与光谱分析,2010,30(2):421-425.

[3]刘占宇,祝增荣,赵敏,等. 基于主成分分析和人工神经网络的稻穗健康状态的高光谱识别[J]. 浙江农业学报,2011,23(3):607-616.

[4]周鹏,张小刚,徐彪,等. 基于高光谱的南疆红枣病虫害特征谱段选择模式[J]. 江苏农业科学,2013,41(4):108-111.

[5]何勇,李晓丽,邵咏妮. 基于主成分分析和神经网络的近红外光谱苹果品种鉴别方法研究[J]. 光谱学与光谱分析,2006,26(5):850-853.

[6]王秀珍,黄敬峰,李云梅,等. 水稻叶面积指数的高光谱遥感估算模型[J]. 遥感学报,2004,8(1):81-88.

[7]高洪智,卢启鹏,丁海泉. 近红外无创生化检测中不同光程的光谱校正模型研究[J]. 光谱学与光谱分析,2012,32(5):1423-1426.叶小岭,赵二摆,朱春阳. 基于Android智能手机的户用沼气池管理系统[J]. 江苏农业科学,2014,42(6):358-360.

2.1.1光谱特征参数与发生病害红枣危害等级识别相关度分析采用线性和多项式拟合相结合的方法进行光谱特征参数与不同等级病害红枣相关性分析,确定模型构建参数[4]。光谱特征参数与不同等级病害红枣相关性见表6。

光谱特征参数与红枣病虫等级的相关性

特征参数线性拟合多项式拟合相关系数误差相关系数误差Rep0.924 80.2910.913 80.245Lo0.721 10.5730.569 60.545Depth0.789 80.5050.802 70.374Area0.700 60.5020.808 90.371NDVI-10.431 50.7830.238 60.779NDVI-20.679 80.5810.633 50.583NDVI-30.763 50.5150.948 80.198NDVI-40.699 80.5390.616 60.535NDVI-50.158 10.8330.061 50.823NDVI-60.347 80.7980.098 80.779

2.1.2基于重采样光谱PCA-RBFN不同病害等级的识别分析在对红枣的原始光谱进行合适的重新采样后,仍有196个波段,如果采用全部数据输入径向基网络RBFN(radial basis function neural network),数据的计算量十分庞大。图3为经过光谱仪进行重采样光谱的第一主成分(PC1)在检测的波段范围内的载荷图。PC1与波长738~1 299 nm的光反射值具有负向比例的关系,在可见光(<713 nm)和短波红外(>1 343 nm)波段范围内的相关性较弱。但是,当Spread为0.000 5时,光谱仪测试结果的RMSE为65.1%,对红枣检测的观测值和模拟值的相关系数为0.141。这说明,经过重采样光谱进行压缩处理后,对红枣病虫害的等级识别,还不能满足检测的要求。

2.2南疆红枣病虫危害等级识别模型

2.2.1模型构建设X为模型的判断输入空间,X={xi}∈Rn,Rn为n维数据特征空间值,Y为模型的输出域,矩阵的判断主要由2类点组成数据方阵,Y={-1,+1}。对于n维数据特征样本值组成的样本集合S=[(x1,y1),…,(xn,yn)](X×Yn),构建一个分析病虫害的数据目标函数,将非线性不可分的输入空间映射到高维空间,通过形成的数据映像,可以有效地形成一个数据平面,使得训练集中的点距离满足线性要求,经过归一化后,对于红枣光谱2类线性不可分数据样本集(xn,yn)的分类超平台应满足:

yi(<ω·xi>+b)-1+ζi≥0(3)

相应的数据处理,就转化为分类数据的间隔1/‖ω‖最大值等价于‖ω‖2最小,红枣优化平面的数据问题可以转化为约束优化问题[6]:

φ(ω,b,λ)=12‖ω‖2+C∑ni=1ζi-∑ni,j=1λiλj{yiyj[K(xi,xj)+b]-1}(4)

最终求出最优解为:

ω=∑ni=1λiyixi,b=1-ωxs(5)

其中:φ代表Lagrange的函数值,病虫害的识别模型转变为对ω和b求φ函数的极小值和特征差异值。公式(5)代表垂直于红枣分类超平面的法向量,代表数据的分类阈值,为病虫害光谱值有效范围,采用相应的计算公式可以求得;xi为红枣病虫害识别模型的输入向量;C为惩罚系数;ζi为函数的松弛因子。

从表6中看出光谱特征参数Rep、Lo、Eepth、NDVI-2、NDVI-4 和红枣病虫害等级线性相关,Area、NDVI-3和红枣病虫害等级呈明显多项式,而NDVI-1、NDVI-5、NDVI-6和红枣病虫害等级相关性较小,因此,能够确定输入向量Rep、Lo、Depth、Area、NDVI-2、NDVI-3、NDVI-4。测试结果表明,采用不同核函数 将获得不同的分类结果。根据红枣病虫害等级和光谱特征参数,确定采用径向基函数(RBF)形式的核函数,其表达式为:

K(xi,xj)=exp{-γ‖xi-xj‖2}(6)

γ为核参数,构建南疆红枣病虫害等级识别支持向量机模型为图4。

2.2.2核参数及惩罚系数和分类函数的确定为获得较高识别精度,需要对核参数γ和惩罚系数C进行测试与分析[7]。其中γ和C取值范围为[2-12,212]。根据表7中的数据,可以区分南疆红枣病虫害等级的支持向量,以及红枣病虫害识别模型的的重要影响参数:核参数(γ)和惩罚系数(C)。通过计算,取得它们最佳值分别为C=210,γ=2-8。将核参数(γ)代入式(6),得到核函数K(xi,xj),将C和K(xi,xj)代入式(7),通过迭代计算,计算出南疆红枣病虫害等级分类超平面的垂直法向量ω和分类阈值b。

ω=-2.081 8

2.569 8,b=-0.280 6

-0.113 5

由此,得到分类函数为:

y=ωx+b=-2.081 8

2.569 8x+-0.280 6

-0.113 5(7)

不同核参数和惩罚系数判定准确率

C不同γ下的判定准确率(%)2624222-12-22-42-62-8212878787879197988721089898989919699892888888888889696882683838383838895832472727272727284722262626262626272622-241414141414154412-438383838383843382-63737373737374037

模型对南疆红枣病虫害等级识别正确率为98.8%,结果如表8所示。

样本识别结果

级别样本数

(个)识别结果(个)C1C2C3识别正确率

(%)C11201200098.8C212001200C312004116

3结论

采用高光谱技术在460~2 260 nm波长对南疆红枣的吸收光谱的相关参数及光谱特性参数进行提取,并计算轻度、中度、重度、特重度4个不同级别黑斑病红枣光谱特征参数与红枣病虫害等级识别的相关度。通过测试和模型识别计算,本研究结果表明,运用主成分分析法和带惩罚系数及核参数的支持向量机技术,构建的模型能够实现南疆红枣病虫害等级识别,识别正确率为98.8%,实现了对南疆红枣病虫害进行精确的等级识别。

参考文献:

[1]罗华平,卢启鹏,丁海泉,等. 南疆红枣品质近红外光谱在线模型参数的实验研究[J]. 光谱学与光谱分析,2012,32(5):1225-1229.

[2]陈兵,李少昆,王克如,等. 病害胁迫下棉花叶片色素含量高光谱遥感估测研究[J]. 光谱学与光谱分析,2010,30(2):421-425.

[3]刘占宇,祝增荣,赵敏,等. 基于主成分分析和人工神经网络的稻穗健康状态的高光谱识别[J]. 浙江农业学报,2011,23(3):607-616.

[4]周鹏,张小刚,徐彪,等. 基于高光谱的南疆红枣病虫害特征谱段选择模式[J]. 江苏农业科学,2013,41(4):108-111.

[5]何勇,李晓丽,邵咏妮. 基于主成分分析和神经网络的近红外光谱苹果品种鉴别方法研究[J]. 光谱学与光谱分析,2006,26(5):850-853.

[6]王秀珍,黄敬峰,李云梅,等. 水稻叶面积指数的高光谱遥感估算模型[J]. 遥感学报,2004,8(1):81-88.

[7]高洪智,卢启鹏,丁海泉. 近红外无创生化检测中不同光程的光谱校正模型研究[J]. 光谱学与光谱分析,2012,32(5):1423-1426.叶小岭,赵二摆,朱春阳. 基于Android智能手机的户用沼气池管理系统[J]. 江苏农业科学,2014,42(6):358-360.

2.1.1光谱特征参数与发生病害红枣危害等级识别相关度分析采用线性和多项式拟合相结合的方法进行光谱特征参数与不同等级病害红枣相关性分析,确定模型构建参数[4]。光谱特征参数与不同等级病害红枣相关性见表6。

光谱特征参数与红枣病虫等级的相关性

特征参数线性拟合多项式拟合相关系数误差相关系数误差Rep0.924 80.2910.913 80.245Lo0.721 10.5730.569 60.545Depth0.789 80.5050.802 70.374Area0.700 60.5020.808 90.371NDVI-10.431 50.7830.238 60.779NDVI-20.679 80.5810.633 50.583NDVI-30.763 50.5150.948 80.198NDVI-40.699 80.5390.616 60.535NDVI-50.158 10.8330.061 50.823NDVI-60.347 80.7980.098 80.779

2.1.2基于重采样光谱PCA-RBFN不同病害等级的识别分析在对红枣的原始光谱进行合适的重新采样后,仍有196个波段,如果采用全部数据输入径向基网络RBFN(radial basis function neural network),数据的计算量十分庞大。图3为经过光谱仪进行重采样光谱的第一主成分(PC1)在检测的波段范围内的载荷图。PC1与波长738~1 299 nm的光反射值具有负向比例的关系,在可见光(<713 nm)和短波红外(>1 343 nm)波段范围内的相关性较弱。但是,当Spread为0.000 5时,光谱仪测试结果的RMSE为65.1%,对红枣检测的观测值和模拟值的相关系数为0.141。这说明,经过重采样光谱进行压缩处理后,对红枣病虫害的等级识别,还不能满足检测的要求。

2.2南疆红枣病虫危害等级识别模型

2.2.1模型构建设X为模型的判断输入空间,X={xi}∈Rn,Rn为n维数据特征空间值,Y为模型的输出域,矩阵的判断主要由2类点组成数据方阵,Y={-1,+1}。对于n维数据特征样本值组成的样本集合S=[(x1,y1),…,(xn,yn)](X×Yn),构建一个分析病虫害的数据目标函数,将非线性不可分的输入空间映射到高维空间,通过形成的数据映像,可以有效地形成一个数据平面,使得训练集中的点距离满足线性要求,经过归一化后,对于红枣光谱2类线性不可分数据样本集(xn,yn)的分类超平台应满足:

yi(<ω·xi>+b)-1+ζi≥0(3)

相应的数据处理,就转化为分类数据的间隔1/‖ω‖最大值等价于‖ω‖2最小,红枣优化平面的数据问题可以转化为约束优化问题[6]:

φ(ω,b,λ)=12‖ω‖2+C∑ni=1ζi-∑ni,j=1λiλj{yiyj[K(xi,xj)+b]-1}(4)

最终求出最优解为:

ω=∑ni=1λiyixi,b=1-ωxs(5)

其中:φ代表Lagrange的函数值,病虫害的识别模型转变为对ω和b求φ函数的极小值和特征差异值。公式(5)代表垂直于红枣分类超平面的法向量,代表数据的分类阈值,为病虫害光谱值有效范围,采用相应的计算公式可以求得;xi为红枣病虫害识别模型的输入向量;C为惩罚系数;ζi为函数的松弛因子。

从表6中看出光谱特征参数Rep、Lo、Eepth、NDVI-2、NDVI-4 和红枣病虫害等级线性相关,Area、NDVI-3和红枣病虫害等级呈明显多项式,而NDVI-1、NDVI-5、NDVI-6和红枣病虫害等级相关性较小,因此,能够确定输入向量Rep、Lo、Depth、Area、NDVI-2、NDVI-3、NDVI-4。测试结果表明,采用不同核函数 将获得不同的分类结果。根据红枣病虫害等级和光谱特征参数,确定采用径向基函数(RBF)形式的核函数,其表达式为:

K(xi,xj)=exp{-γ‖xi-xj‖2}(6)

γ为核参数,构建南疆红枣病虫害等级识别支持向量机模型为图4。

2.2.2核参数及惩罚系数和分类函数的确定为获得较高识别精度,需要对核参数γ和惩罚系数C进行测试与分析[7]。其中γ和C取值范围为[2-12,212]。根据表7中的数据,可以区分南疆红枣病虫害等级的支持向量,以及红枣病虫害识别模型的的重要影响参数:核参数(γ)和惩罚系数(C)。通过计算,取得它们最佳值分别为C=210,γ=2-8。将核参数(γ)代入式(6),得到核函数K(xi,xj),将C和K(xi,xj)代入式(7),通过迭代计算,计算出南疆红枣病虫害等级分类超平面的垂直法向量ω和分类阈值b。

ω=-2.081 8

2.569 8,b=-0.280 6

-0.113 5

由此,得到分类函数为:

y=ωx+b=-2.081 8

2.569 8x+-0.280 6

-0.113 5(7)

不同核参数和惩罚系数判定准确率

C不同γ下的判定准确率(%)2624222-12-22-42-62-8212878787879197988721089898989919699892888888888889696882683838383838895832472727272727284722262626262626272622-241414141414154412-438383838383843382-63737373737374037

模型对南疆红枣病虫害等级识别正确率为98.8%,结果如表8所示。

样本识别结果

级别样本数

(个)识别结果(个)C1C2C3识别正确率

(%)C11201200098.8C212001200C312004116

3结论

采用高光谱技术在460~2 260 nm波长对南疆红枣的吸收光谱的相关参数及光谱特性参数进行提取,并计算轻度、中度、重度、特重度4个不同级别黑斑病红枣光谱特征参数与红枣病虫害等级识别的相关度。通过测试和模型识别计算,本研究结果表明,运用主成分分析法和带惩罚系数及核参数的支持向量机技术,构建的模型能够实现南疆红枣病虫害等级识别,识别正确率为98.8%,实现了对南疆红枣病虫害进行精确的等级识别。

参考文献:

[1]罗华平,卢启鹏,丁海泉,等. 南疆红枣品质近红外光谱在线模型参数的实验研究[J]. 光谱学与光谱分析,2012,32(5):1225-1229.

[2]陈兵,李少昆,王克如,等. 病害胁迫下棉花叶片色素含量高光谱遥感估测研究[J]. 光谱学与光谱分析,2010,30(2):421-425.

[3]刘占宇,祝增荣,赵敏,等. 基于主成分分析和人工神经网络的稻穗健康状态的高光谱识别[J]. 浙江农业学报,2011,23(3):607-616.

[4]周鹏,张小刚,徐彪,等. 基于高光谱的南疆红枣病虫害特征谱段选择模式[J]. 江苏农业科学,2013,41(4):108-111.

[5]何勇,李晓丽,邵咏妮. 基于主成分分析和神经网络的近红外光谱苹果品种鉴别方法研究[J]. 光谱学与光谱分析,2006,26(5):850-853.

[6]王秀珍,黄敬峰,李云梅,等. 水稻叶面积指数的高光谱遥感估算模型[J]. 遥感学报,2004,8(1):81-88.

[7]高洪智,卢启鹏,丁海泉. 近红外无创生化检测中不同光程的光谱校正模型研究[J]. 光谱学与光谱分析,2012,32(5):1423-1426.叶小岭,赵二摆,朱春阳. 基于Android智能手机的户用沼气池管理系统[J]. 江苏农业科学,2014,42(6):358-360.

猜你喜欢

支持向量机主成分分析
基于改进支持向量机的船舶纵摇预报模型
基于NAR模型的上海市房产税规模预测
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
基于支持向量机的金融数据分析研究