APP下载

基于理化参数和图谱特征的稻曲病病害高光谱识别

2023-06-28王爱芳张运孟孟沈豪

关键词:稻曲病支持向量机

王爱芳 张运 孟孟 沈豪

摘要:基于水稻冠层高光谱数据和样点植株理化数据,首先利用连续小波分析、灰度共生矩阵等方法提取高光谱图像的图谱特征,并对主要理化指标和病害程度做相关性分析,然后通过Relief F算法对多特征进行优选,最后建立不同核的支持向量机分类模型。结果表明:理化特征参与下的分类精度较高,通过Relief F算法筛选得到的最优特征中四项理化特征均在内,最后精度达到0.95。研究证实了理化参数对稻曲病识别的重要作用,可以为大田水稻病害监测提供新思路。

关键词:稻曲病;高光谱识别;连续小波分析;支持向量机

中图分类号:TP751文献标志码:A文章编号:1001-2443(2023)03-0259-10

引言

水稻病虫害的及时监测和预警对提高水稻产量和质量十分重要[1-2]。传统监测方法多为目测手查、单点监测,真实性高,但主观性强、滞后性大。所以传统调查方法无法满足大范围病虫害监测和及时预警需求[3]。

常规卫星传感器波段宽、分辨率低,难以对作物局部细微变化实施有效探测。高光谱技术的优势在于能够在宏观尺度上提供更精细的光谱分辨率,在细微之处察觉作物的“微表情”,为各类病虫害胁迫区分提供详细的信息[4-6]。由于这些信息存在特异性,在光谱、纹理等层面得到反映,所以基于高光谱数据找到光谱、纹理等特征是作物病虫害识别的重要途径。于丰华等利用连续投影等方法进行高光谱特征波段筛选,构造了仅包含3个波段的优化指数,得到了相比IDB数据库更优的寒地水稻叶片叶绿素含量反演结果[7]。Zhang等也指出通过原始条带的代数组合,强调了植物一些重要的生物物理特性或功能[8]。Mamata G等采用K-means聚类和GLCM技术得到芒果叶片病害的纹理特征,为芒果叶片病害的鉴别提供依据[9]。郭小清等选取不同灰度级下0°、45°、90°和135°的能量、对比度等纹理特征参数实现了番茄叶部病害的分类[10]。高光谱成像数据 “图谱合一”的优势使其成为研究重点。闫明壮等基于绿萝高光谱图像分别提取光谱和纹理特征,建立基于单一特征和基于特征融合的识别模型,实验表明基于特征融合的模型分类效果最佳[11]。Huang等基于小麦高光谱图像提取了12个特征波谱、4个纹理特征和9个颜色特征,采用PSO-SVM方法建立多特征组合的小麦赤霉病诊断模型,达到了较好的效果[12]。

以上研究表明高光谱技术能有效实现病虫害的识别,但多集中于提取“图”和“谱”特征。如果作物特有的理化参数和结构参数能够被恰当地选择为分类变量,将会大幅提高识别精度。因此,本研究考虑水稻稻曲病胁迫下特有的理化特征,利用多种特征提取方法构建稻曲病胁迫识别特征集,结合支持向量机分类器完成目标分类,以期从内部层面为稻曲病的诊断提供理论依据。

1数据与方法

1.1 数据资料

研究区位于弋江區白马街道东庄村,隶属于安徽省芜湖市,地理坐标为118°23′45′′E,31°11′04′′N(如图1)。区域内亚热带季风气候特征显著,雨热同期,有利于优质稻米的生长。研究使用华测P550 Pro六旋翼无人机为遥感平台,搭载Resonon高光谱成像系统捕获水稻冠层影像。该系统中Pika L高光谱相机的技术指标如表1。整套无人机采集系统使用大疆如影云平台,以保证在机载拍摄过程中能够承受高速运动过程中的风阻和惯性,时刻提供稳定的影像。

数据采集于2021年8月25日—29日。时间为10:00—15:00,此时太阳高度角大,无风。通过地面站软件CHCNAV规划航线,设置飞行高度为60m,飞行速度为3m/s,旁向重叠率为85%,得到2cm分辨率的田块影像。

考虑到样本的代表性与合理性,采样点随机均匀分布,覆盖全部研究地块。由于采集的是水稻冠层信息,以1m×1m的范围为样方大小,尽量选择在田块中心以保证样方内水稻的均一性,地面样方选取完成后,在每个样方相同对应位置以红色塑料袋标杆做标记,并手绘样点分布图供后续几何定位参考。

采用安徽省稻曲病测报调查规范对研究区内稻曲病样本受害等级进行划分[13],共分为3级,如表2所示。

采用TYS-4N多参数测定仪测量水稻植株的理化参数,包括叶绿素含量、含氮量、叶片温度和湿度。基于五点取样法分别测量每株稻株的剑叶和倒三叶,取每片叶片尖端、中部和尾部三处位置均值作为该样点水稻冠层理化值。实验中一共采集了155个样点,依据7∶3比例将其分为训练样本和验证样本。

1.2 研究方法

1.2.1 数据预处理 高光谱数据预处理是基于ENVI以及高光谱成像仪配套软件Airlion Division和Megacube完成,主要进行高光谱数据的辐射定标、几何校正和拼接裁剪等工作。研究是通过在实验区设置的红色标志物来获取具体样本位置和范围的。由于无人机高光谱影像数据空间分辨率为0.02m,地面调查实验中样方大小为1m×1m,所以在数据分析时采用ROI工具,根据地面采样点在影像对应位置构建感兴趣区,以ROI内平均光谱反射率作为该样点光谱反射率[14-15]。基于像元感兴趣区均值处理可以最大化降低单个像元几何定位误差。利用S-G算法对光谱曲线进行平滑,降低随机噪声干扰。由于数据两端受到较大噪声干扰呈现剧烈起伏,故截取400-910nm范围内的光谱进行分析[16]。从TYS-4N多参数测定仪中导出测得样点理化数据,在Excel中进行整理。

1.2.2 特征提取及优选 研究首先基于Python、MATLAB等程序提取光谱反射率的主成分特征、连续投影特征和连续小波特征。并对主要理化指标和高光谱做相关性分析,获取基于理化参数的敏感特征波段。其次计算特征图的灰度纹理特征。

Relief F算法是由KONONENKO在Relief算法上扩展而来的可以处理多分类问题的一种算法,其原理与Relief算法类似[17-18]。具体实现过程如下[19]:

(1)初始化权值矩阵向量W=0;

(2)对于特征A,从所有样本中随机取出一个样本[Ri],在与该样本相同分类的样本组内,取出k个最邻近样本[H]和k个不同类样本[M];

(3)依据公式不断更新该特征的权重,循环至m次直至所有样本依次计算完毕,得到单个特征的最终权值。

式中,[pC]是该类别的比例,[pclassRi]是随机选取某样本类别的比例,[dA,Ri,Hi]是[Ri]和[Hi]在特征A上的归一化距离。

1.2.3 病害分类 支持向量机算法的最大优点在于能够求解小样本和非线性高维模式识别问题,精度高、学习能力强。网格搜索法通过遍历给定的参数组合优化模型,减少获得最优参数的偶然性,具有一定的说服力[20]。本研究使用網格搜索法首先确定不同核函数的最佳参数,再进行不同核函数的分类对比。

2 结果与分析

2.1 特征提取

2.1.1 光谱特征提取 使用ENVI 软件提取稻曲病高光谱数据的主成分特征,得到各主成分特征如表3。

由表3可以得到第一个主成分的特征值最大为0.6977,贡献率为99.57%,说明第一主成分综合原始信息能力最强。遵从“量少值大”原则,本研究选用第一个主成分进行后续分析。

由图2可知,通过多次循环得到最终选取变量个数为6个时,均方根误差最小。选择的特征波段为第1、55、68、73、87和121波段。

利用python软件实现对121个波段的连续投影操作,得到结果如图2所示。

利用MATLAB软件对155条高光谱数据实现连续小波分析,由于需要尽可能找到最佳尺度下的光谱信息,参考已有研究选择10个尺度进行分析[21]。并考虑到sym2相比其他小波基(如dbN)具有更好的对称性,即一定程度上能够减少对信号进行分析和重构时的相位失真,故选用sym2作为小波基函数。将各尺度小波系数与稻曲病病害程度进行相关性分析得到决定系数热力图,如图3所示。

由图3可知,光谱数据经连续小波变换后随分解尺度的变化呈现有规律的变化。在可见光波段尤其是绿光波段,决定系数随着尺度增加先降低后增加,但最有效的光谱信息主要存在于低分解尺度。近红外波段,随着分解尺度增加决定系数增加,但整体相关性较低。在此基础上,取每个尺度上R2大于0.5为界选取特征敏感区,再取各敏感区内具有最高R2的波段为特征波段,具体见表4。

由表4得出,经过连续小波算法得到的敏感特征区域主要覆盖1-5尺度的绿光波段、红光波段和近红外波段,几乎遍历整个光谱波段范围。进一步筛选出的特征波段为尺度1-3的第41波段、尺度4的第42波段和尺度5的第56波段,最后以不同尺度特征波段对应的小波系数作为小波特征。

图4显示SPAD值、含氮量和叶片湿度值在400-910nm范围内与原始高光谱反射率之间的相关系数均能通过0.01的显著性。其中SPAD值、叶片湿度及叶片湿度与原始高光谱呈正相关关系,在748nm处达到最大正相关,相关系数分别为0.59和0.5。含氮值与原始光谱反射率呈负相关关系,在727nm处达到最大相关系数-0.48。叶片温度与原始高光谱反射率呈负相关,在417-658nm和692-910nm波段范围内与反射率相关系数均能够通过0.01的显著性,在757nm处达到最大相关系数-0.39。

2.1.2 图像特征提取 为减少全波段计算工作量,对第一主成分进行灰度共生矩阵计算,进而提取纹理特征,结果如图5所示。

从图5可以看出,随着病害程度加重纹理特征值越来越小。不同受害程度的稻曲病样本在均值和对比度特征下的纹理特征值最大,区分度最为明显。

为进一步挖掘稻曲病识别农学特征,最大化发挥理化指标的价值,现对相关性分析得到的敏感波段图进行灰度共生矩阵计算,提取其纹理特征。结果如图6所示。

从图6可知,所有纹理特征中,均值、方差、对比度和差异性四项特征在不同受害样本中具有较好的区分性。可以明显看出,基于敏感波段图像的纹理特征相比基于第一主成分图像的纹理特征不仅在有效特征数量上有所提高,在方差和差异性特征上也具有明显分类能力。另外,各类特征值区分度也有了提高,说明基于理化指标敏感波段图像的纹理特征将会在分类时更具潜力,表明本研究探索得到的稻曲病病害识别农学特征有效。

2.1.3 理化特征提取 为直观了解四种理化指标含量,利用箱型图进行统计,结果如图7。

由图7可以看出随着病害程度加大,叶绿素和叶片湿度呈下降趋势,而含氮量和叶片温度呈上升趋势。SPAD均值健康样本为38.46、轻度受害样本为35.71,重度受害样本为32.49。健康样本的SPAD值相对集中,而严重受害样本的数据波动较大。含氮量均值健康样本为14.62mg/g,重度受害样本为16.04 mg/g。叶片温度均值健康样本为32.62℃,重度受害样本为33.75℃。叶片湿度均值健康样本为58.17%RH,重度受害样本为53.12%RH。总体看来不同受害程度下四种理化指标相对可分,有利于下一步的病害等级分类识别。

2.2 特征優化

经过上述特征提取,选用Relief F算法进行优选。对所有特征进行权重计算,结果如图8,各类特征缩写形式如表5。根据“权值大”和“个数少”原则确定特征选择阈值,经多次实验最终选择0.1为特征确定阈值,得到满足条件的特征有SPAD、含氮量、叶片温度、叶片湿度、SPA6、PCA、Cor3-GLCM8和CWT1共8个特征,简称Relief F8。可以看出,四项理化指标全部入列,说明理化指标对于稻曲病病害分类贡献最大。

2.3 病害识别

2.3.1 基于光谱和纹理特征的病害识别 将光谱维特征和纹理特征进行组合,共计6类47个特征作为输入变量,进行SVM分类。结果如表6。

经过网格搜索法获得最优参数如下:Linear核下惩罚系数为0.0009、阶数为3、gamma值为0.01;RBF核下惩罚系数为1024、阶数为3、gamma值为0.1;Poly核下惩罚系数为0.0009、阶数为3、gamma值为0.01;Sigmoid核下惩罚系数为0.0009、阶数为3、gamma值为0.01。由表6可知,在各最优参数核函数下经SVM分类精度最优的是RBF核,为0.68。实验结果表明,基于光谱和纹理特征的分类结果并不佳。

2.3.2 基于光谱和理化特征的病害识别 将光谱维特征和理化特征进行组合,共计5类19个特征作为输入变量,进行SVM分类。结果如表7。

经过网格搜索法获得最优参数如下:Linear核下惩罚系数为1024、阶数为3、gamma值为0.01;RBF核下惩罚系数为1024、阶数为3、gamma值为0.1;Poly核下惩罚系数为0.0009、阶数为4、gamma值为3;Sigmoid核下惩罚系数为1024、阶数为3、gamma值为0.1。由表7可知,在各最优参数核函数下经SVM分类精度最优的是Sigmoid核,为0.93。实验结果表明,相比之下在同样有光谱维特征参与时理化特征的分类贡献率远大于纹理特征。

2.3.3 基于光谱、纹理和理化特征的病害识别 将光谱维、图像维和理化特征进行组合,共计7类51个特征作为输入变量,进行SVM分类。结果如表8。

经过网格搜索法获得最优参数如下:Linear核下惩罚系数为1024、阶数为3、gamma值为0.01;RBF核下惩罚系数为1024、阶数为3、gamma值为0.01;Poly核下惩罚系数为0.0009、阶数为4、gamma值为0.1;Sigmoid核下惩罚系数为0.0009、阶数为3、gamma值为0.01。由表8可知,在各最优参数核函数下分类精度最优的是Linear核,为0.89。当前实验条件下特征维数最多,但在分类精度上仅仅优于基于光谱维和图像维特征参与的分类。

2.3.4 基于Relief F特征优选的病害识别 将经Relief F算法选取的8个特征作为输入变量,进行SVM分类。结果如表9。

经过网格搜索法获得最优参数如下:Linear核下惩罚系数为1024、阶数为3、gamma值为0.01;RBF核下惩罚系数为1024、阶数为3、gamma值为0.1;Poly核下惩罚系数为0.0009、阶数为5、gamma值为3;Sigmoid核下惩罚系数为1024、阶数为3、gamma值为0.1。由表9可知,在各最优参数核函数下分类精度最优的是RBF核,为0.95。实验结果表明,在经过Relief F特征优选后仅使用8个特征就较好地提高了稻曲病病害的识别率。分析原因,可能是优选特征中综合了各个维度、各种提取方法的优势,并包含了全部理化特征,最大化发挥了理化参数的价值。

3 结论与讨论

本研究以稻曲病为对象,基于机载高光谱成像数据研究了水稻理化特征、光谱特征及纹理特征对稻曲病胁迫识别的意义。结论如下:(1)基于RBF核的SVM分类方法在稻曲病病害识别中优于其他类型的核函数。在基于优选8个特征参与下的精度达到最大,为0.95。这也和大多数研究结果一致,RBF核具有较好的分类普适性。(2)整体来说,Linear核和RBF核在不同特征参与下呈现相近的分类结果且每次分类都能保持较为稳定的高精度状态,但在训练集较少、特征个数较多的情况下,Linear核优势更大,如基于光谱维、图像纹理维和理化特征参与的模型中,基于Linear核的分类精度最高,为0.89。(3)模型中Sigmoid核对不同分类参数具有较高的敏感性,表现在整体分类精度随特征个数变化呈现较大波动。Poly核在一些分类中能取得较好的结果,但受阶数影响较大。(4)对比不同特征组合,有理化特征参与的分类精度较高。且基于Relief F特征优选后得到的8个特征中理化指标权重值最大,在不同核函数下的分类精度也都达到0.90及以上,说明理化特征对于稻曲病病害识别具有较大潜力,本文提出的分类方法有效。

参考文献

[1] 韩国鑫.基于气象条件水稻病害短期分级预警系统的研究[D].大庆:黑龙江八一农垦大学,2019:1-6.

[2] 孙盈蕊.基于多尺度遥感技术的水稻病虫害监测研究[D].北京:中国地质大学,2019:1-6.

[3] 黄文江,张竞成,施越,等.作物病虫害遥感监测与预测研究进展[J].南京信息工程大学学报(自然科学版),2018,10(1):30-43.

[4] ZHAO X H, ZHANG J C, HANG Y B, et al. Detection and discrimination of disease and insect stress of tea plants using hyperspectral imaging combined with wavelet analysis[J]. Computers and Electronics in Agriculture, 2022, 193: 1-11.

[5] XIE Y T, PLETT D, LIU H J. The promise of hyperspectral imaging for the early detection of crown rot in wheat[J]. AgriEngineering, 2021, 3(4): 924-941.

[6] 李志伟,袁婧,丁为民,等.基于高光谱成像技术识别水稻纹枯病[J].华南农业大学学报,2018,39(6):97-103.

[7] 于丰华,许童羽,郭忠辉,等.基于红边优化植被指数的寒地水稻叶片叶绿素含量遥感反演研究[J].智慧农业,2020,2(1):77-86.

[8] ZHANG J C, HUANG Y B, PU R L, et al. Monitoring plant diseases and pests through remote sensing technology: A review[J]. Computers and Electronics in Agriculture, 2019, 165: 1-14.

[9] MAMATA G, SOUMYA G, SONALI H, et al. Identification of anthracnose disease in mango plant using clustering and gray level co-occurrence Matrix[J]. ITM Web of Conferences, 2020, 32: 1-6.

[10] 郭小清,范涛杰,舒欣.基于图像融合特征的番茄叶部病害的识别[J].湖南农业大学学报(自然科学版),2019,45(2):212-217+224.

[11] 闫明壮,王浩云,吴媛媛,等.基于光谱与纹理特征融合的绿萝叶绿素含量检测[J].南京农业大学学报,2021,44(3):1-14.

[12] HUANG L S, LI T K, DING C L, et al. Diagnosis of the severity of fusarium head blight of wheat ears on the basis of image and spectral feature fusion[J]. Sensors, 2020, 20(10): 1-17.

[13] 安徽省植保总站.稻曲病测报调查规范 安徽省地方标准:DB34/T 2958—2017[S].合肥:安徽省质量技术监督局,2017.

[14] 刘杨,冯海宽,黄珏,等.基于无人机高光谱特征参数和株高估算马铃薯地上生物量[J].光谱学与光谱分析,2021,41(3):903-911.

[15] 刘林毅.小麦赤霉病及白粉病多尺度遥感监测方法研究[D].北京:中国科学院大学(中国科学院空天信息创新研究院),2020:13-14.

[16] 刘爽,谭鑫,刘成玉,等.高光谱数据处理算法的小麦赤霉病籽粒识别[J].光谱学与光谱分析,2019,39(11):3540-3546.

[17] 陈俊颖,陆慧娟,严珂,等.ReliefF和APSO混合降维算法研究[J].中国计量大学学报,2017,28(2):214-218.

[18] 张文博,孔金玲,杨园园,等.面向对象的旱区植被遥感精细分类研究[J].测绘科学,2021,46(1):136-140+183.

[19] 徐畅,李绍青,李正飞,等.超参优化的Relief F-SVM在制冷剂充注量故障诊断的应用[J].制冷技术,2021,41(1):17-34.

[20] 姜明男,汪守康,何俊捷,等.基于支持向量机的大型生活垃圾焚烧炉排炉运行参数预测[J].中国电机工程学报,2021,42(1):1-14.

[21] 束美艳,顾晓鹤,孙林,等.倒伏胁迫下的玉米冠层结构特征变化与光谱响应解析[J].光谱学与光谱分析,2019,39(11):3553-3559.

Abstract: Based on the hyperspectral data of the rice canopy and the physicochemical data of the sampled plants, the spectral features of the hyperspectral images were extracted by methods such as continuous wavelet analysis and grayscale co-occurrence matrix, and the correlation analysis was carried out on the main physicochemical indicators and the degree of disease. Then, multiple features were optimized by the Relief F algorithm, and finally a support vector machine classification model with different kernels was established. The results showed that the classification accuracy with the participation of physicochemical features was high, and the four physicochemical features were included in the optimal features screened by the Relief F algorithm, the final accuracy reached 0.95. The study confirmed the important role of physicochemical parameters in the identification of rice false smut, which can provide new ideas for field rice disease monitoring.

Key words: rice false smut; hyperspectral identification; continuous wavelet analysis; support vector machine

(責任编辑:巩 劼)

猜你喜欢

稻曲病支持向量机
一季晚粳稻曲病防治药剂筛选试验
籼粳杂交水稻稻曲病防治药剂试验
基于改进支持向量机的船舶纵摇预报模型
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究
2011年怀集县水稻稻曲病重发生的原因及防控对策