APP下载

基于近红外光谱的骏枣病虫害与风沙损伤检测

2018-03-12范泽华张楠楠喻彩丽白铁成

江苏农业科学 2018年2期
关键词:骏枣风沙虫害

范泽华, 张楠楠, 喻彩丽, 白铁成

(1.塔里木大学信息工程学院,新疆阿拉尔 843300; 2.塔里木大学现代农业工程重点实验室,新疆阿拉尔 843300; 3.新疆南疆农业信息化研究中心,新疆阿拉尔 843300)

骏枣是新疆大枣领域中一个极为重要的农产品,为新疆带来了巨大的经济效益[1]。新疆南疆地区的风沙较大,对农业种植具有巨大的影响,骏枣生长过程中也会受到风沙的影响,导致骏枣果实受到损伤[2]。

黑铁头病与溃疡病是骏枣主要的2种病害[3],这2种病害会导致骏枣果皮上产生直径2 mm左右的病斑,这种病害的病斑极小,通过人工检测或者图像识别技术难以保证较高的检测准确率。桃小食心虫是骏枣的一种虫害[4],会导致骏枣表面产生1个直径1~2 mm的重口,颜色为暗色,病虫害具有极强的传播性,所以必须尽早准确地检测出虫害,避免造成重大的虫害灾情与经济损失,虫害的虫口极小,通过人工检测或者图像识别技术难以保证较高的检测准确率。

随着计算机技术的广泛应用,许多研究人员将计算机技术引入农业工程技术中[5],其中在病虫害检测方面应用较为广泛且有效的技术为图像处理与机器视觉方案[6]。例如,结合原彩色图像与补偿模糊神经网络的脐橙病虫害识别技术[7],基于图像规则推理的玉米病虫草害诊断系统[8],基于图像分析的玉米病虫害智能化识别方法[9]。基于图像处理的技术可以减少参与的人工,提高病虫害检测的效率,但是对于病虫害症状不明显的情况检测准确率较差。骏枣的病虫害症状一般仅有2 mm左右的病症,南疆风沙对骏枣的损坏一般也是颗粒形的损伤,所以,使用图像技术来检测骏枣的病虫害与风沙损伤难以获得理想的效果。

此外,许多研究人员采用光谱技术检测果实的病虫害。例如,基于高光谱成像的苹果虫害检测[10],基于太赫兹光谱技术的山核桃内部虫害检测[11]。受益于诸多研究人员的成果,光谱技术是果实无损病虫害检测问题的理想解决方案。病虫害对骏枣种植的影响巨大,应当尽早地识别并摘除。本研究将近红外光谱应用于南疆地区骏枣的病虫害与风沙损伤检测。首先,采集大量骏枣的近红外光谱,采用遗传算法从全部近红外光谱中选择一部分最优的光谱特征;然后,使用二次判别分析模型对选择的光谱特征进行训练;最终,通过支持向量机对骏枣进行病虫害分析。

1 材料与方法

1.1 材料

试验地点为南疆第一师阿拉尔市十四团-数字枣园示范基地。骏枣生长过程中并未进行防虫害处理,并且受到南疆地区的风沙影响,有些骏枣易被风沙损伤。从骏枣树上采摘2 kg骏枣,人工挑选出病虫害与风沙损坏的骏枣。

采摘的骏枣全部放置于实验室的热箱中,将骏枣保持在(25±0.5)℃,从而使得骏枣的温度与湿度平衡,为近红外光谱数据的采集做准备。

1.2 近红外光谱采集

使用Luminar 5030型便携式近红外光谱仪采集骏枣的光谱,光谱仪装备了反射后分光的光配置、1个预校准的双光束灯与1个近红外探测器(indium gallium arsenide,InGaAs)阵列,光谱采集的持续时间为60 ms。对每个骏枣样本采集3次近红外光谱数据,将平均值作为最终的试验数据,进行进一步分析。通过文献[12]所述的方法采用近红外光谱仪自动测量参考光谱,使用SNAP!2.03光谱采集处理软件采集漫反射光谱。在采集近红外光谱之前,人工选出受损骏枣与完好的骏枣,最终将每个骏枣的光谱分类为有损光谱类与无损光谱类。

将每个骏枣的光谱数据建模为数据向量,近红外光谱反射率作为数据向量的每个元素,即骏枣的特征值。随机选择50%样本组成定标集,剩下的50%样本分别组成预测集。从定标集的全部光谱提取光谱特征,作为分类处理阶段的特征集合。图1所示为本研究基于近红外光谱分析的无损病虫害与风沙损伤检测技术的主要流程。

1.3 光谱数据的分析处理

因为光谱数据之间存在高相关性,所以使用遗传算法来选择分类算法的输入特征集,遗传算法的优化目标是选择描述预测器变量与响应变量关联性的最优波段集合,即选出具有生物学意义的光谱波段。本研究使用遗传算法获得n个特征子集,根据文献[13]n的范围应为2~6,此时的特征子集是全部数据集的最优表征,为了最小化过度拟合问题,最终选择6个特征。

本研究考虑了3个分类器,即线性判别分析(LDA)、二次判别分析(QDA)、k-近邻算法。线性判别分析与二次判别分析分类器均基于贝叶斯规则,而k-近邻算法使用欧氏距离作为相似性度量。将所有情况的临界值设为标准值0.5,因此,将预测结果的概率高于0.5的输出分类为一类,其他的输出分为另一类。线性判别分析的线性判别函数数量应当等于类别的数量减1,因此对于2个类别的情况,应当生成1个线性判别函数。二次判别分析与线性判别分析的使用场景较为接近,一般用于类内协方差矩阵不理想的情况,对于大数据集,各类的协方差矩阵差异较大,二次判别分析的性能优于线性判别分析。线性判别分析与二次判别分析2个算法的时间复杂度与分类数量成比例关系,但是k-近邻算法的时间复杂度对类别数量则不敏感。kNN分类器通过计算训练集中每个样本的距离,如果1个样本在特征空间中的k个最近邻样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。通过交叉检验方法选出最优的k个近邻,选出的最小k个近邻具有最小的平均误差。本研究最终选择二次判别分析分类器对遗传算法选出的最优特征进行分类处理。

每个判别模型的分类结果定义为误报率、漏报率与总误差,使用接受者操作特征分析(receiver operating characteristics,简称ROC))对每个模型进行分析,绘制每个模型的ROC曲线。ROC曲线包含误报率与漏报率:

误报率=FP/(FP+TN);

(1)

漏报率=FN/(TP+FN);

(2)

总误差率=(FP+FN)/(TP+FN);

(3)

敏感性=TP/(TP+FN)。

(4)

式中:FP表示被模型预测为正的负样本;TN表示被模型预测为负的负样本;FN表示被模型预测为负的正样本;TP表示被模型预测为正的正样本。

2 结果与分析

2.1 数据集

图2-a所示是有损骏枣与完好骏枣的平均二阶导数反射光谱,图2-b、2-c、2-d是95%置信度定标集中2个类别的光谱变化曲线。光谱的变化情况说明,骏枣质量主要与 1 300~1 420 nm、1 650~2 300 nm波段区域的光谱特征有关,这2个光谱范围内的光谱反射率一般与蛋白质、脂肪、水分相关,这些成分是骏枣的主要成分。

使用遗传算法主要在1 320、1 460、1 650、1 920 nm与 2 000~2 220 nm附近选择特征,1 150~1 750 nm范围的特征代表O—H键对与—CH(CH3—、—CH2—等)键对的近红外光谱泛频。上述频带反射率的变化一般与酚(~1 320 nm)、过氧化氢化物(~1 460 nm)有关,而酚与过氧化氢化物2个化学成分与骏枣的破损、虫害有关,一般认为骏枣具有愈伤作用,收到撞击以及害虫破坏等会使总氧化值提高,导致骏枣的酚含量下降。

水分、酚、蛋白质、氨基酸之间近红外光谱反射率的差异则与水分流失、氧化反应、微生物腐蚀等有关。风沙与病虫害对骏枣的内部组织产生损坏,影响了骏枣的水分、密度与硬度。而这些影响可以通过近红外光谱观察出来。

2.2 分类结果分析

选择2组特征(近红外光谱的波长)进行2组独立的试验,结果见表1。试验1的误报率、漏报率、总误差分别为 1.72%、5.97%、4.00%,试验2的误报率、漏报率、总误差分别为5.17%、2.99%、4.00%。

图3所示是二次判别分析模型的试验1分类结果,其中仅有1个有损骏枣与4个完好骏枣的分类发生了错误,总的分类准确率为96%。

图4所示是二次判别分析模型的试验2分类结果,其中仅有3个有损骏枣与2个完好骏枣的分类发生了错误,总的分类准确率为96%。

光谱数据中一般包含一些干扰因素、室内噪声以及化学物质的影响,从原数据集提取出最优的特征光谱可以降低分类模型的冗余信息,并提高分类的准确率。

3 结论与讨论

本研究探讨了近红外光谱 (1 100~2 300 nm) 检测病虫害与风沙导致的损坏南疆骏枣,通过2组近红外光谱特征子集的试验结果可看出,本模型的检测总误差小于5%,具有较好的检测准确率。

表1 二次判别分析模型对预定义光谱5个、 6个特征子集的判别性能

病虫害与风沙受损骏枣检测的最优近红外光谱特征包含1 320、1 400~1 550、1 650、2 000~2 220 nm,这些光谱波段一般与酚、过氧化氢、烷基等关联,实时的骏枣检测系统应当从这些光谱波段选择特征。

本技术是一种自动化、高准确率、无损的骏枣病虫害损伤检测系统。未来将引入大数据集处理技术,增加近红外光谱光波特征的数量,从而提高检测的准确率与处理速度。

[1]宋锋惠,哈地尔·依沙克,史彦江,等. 新疆塔里木盆地骏枣果实营养与土壤养分相关性分析[J]. 果树学报,2010,27(4):626-630.

[2]郑素慧,葛清华,车凤斌,等. 气调贮藏不同温度对新疆骏枣干枣贮期品质及生理活性的影响[J]. 新疆农业科学,2014,51(4):620-626.

[3]韩夫云,崔大鹏,黄喜宇. 朝阳地区大枣主要病虫害的发生特点及防治技术[J]. 现代农业科技,2015(8):144.

[4]王燕平,王文平. 关于枣树病虫害防治技术的几点思考[J]. 黑龙江科技信息,2016(34):254.

[5]汪京京,张 武,刘连忠,等. 农作物病虫害图像识别技术的研究综述[J]. 计算机工程与科学,2014,36(7):1363-1370.

[6]姚 青,张 超,王 正,等. 分布式移动农业病虫害图像采集与诊断系统设计与试验[J]. 农业工程学报,2017,33(增刊1):184-191.

[7]温芝元,曹乐平. 基于补偿模糊神经网络的脐橙不同病虫害图像识别[J]. 农业工程学报,2012,28(11):152-157.

[8]刘同海,黄斌博,李少昆,等. 基于图像规则推理的玉米病虫草害诊断系统的设计[J]. 中国农业大学学报,2012,17(4):154-158.

[9]杨 青. 一种基于图像分析的玉米病虫害智能化识别方法[J]. 江苏农业科学,2014,42(7):128-130.

[10]田有文,程 怡,王小奇,等. 基于高光谱成像的苹果虫害检测特征向量的选取[J]. 农业工程学报,2014,30(12):132-139.

[11]李 斌,张伟立,赵春江,等. 基于太赫兹光谱技术的山核桃内部虫害检测初步研究[J]. 光谱学与光谱分析,2014,34(5):1196-1200.

[12]Cayuela J A,Weiland C. Intact orange quality prediction with two portable NIR spectrometers[J]. Postharvest Biology & Technology,2010,58(2):113-120.

[13]Brusco M J,Singh R,Steinley D. Variable neighborhood search heuristics for selecting a subset of variables in principal component analysis[J]. Psyhemetrika,2009,74(4):705-726.

猜你喜欢

骏枣风沙虫害
基于近红外光谱技术的南疆骏枣动态水分模型研究
桃树主要虫害及防治方法
山西骏枣和梨枣果实品质指标的年动态变化及其比较
风沙地区公路路基防护措施初探
不用农药也能治虫害
东明县风沙化土地监测与治理
浅析白三叶的虫害防治
行道树香橼主要虫害及其防治
不同贮藏温度对三个产地骏枣果实营养品质的影响
高考试题中“风沙、河沙”知识点的解读