APP下载

基于高光谱分析技术的桉树叶片黄化识别

2024-03-12赵隽宇石媛媛杨瑞青程小辉陈守学曹继钊

广西林业科学 2024年1期
关键词:黄化病黄化桉树

赵隽宇,石媛媛,杨瑞青,邓 昀,程小辉,陈守学,曹继钊,唐 健

(1.广西壮族自治区林业科学研究院 广西林用新型肥料研发中心,广西南宁 530002;2.广西华沃特集团股份有限公司,广西南宁 530025;3.桂林理工大学,广西桂林 541004)

桉树(Eucalyptusspp.)是我国南方地区重要的用材林树种,可用于生产旋切板、纸浆等,为推动南方地区经济发展做出了重要贡献[1]。因长期采取短轮伐期(5~7 年)、高强度和粗放式的经营模式,桉树人工林地力衰退[2-4];近年来桉树黄化病频发,严重限制桉树人工林及其下游产业的发展。桉树黄化病是一种较特殊的生理性病害,表现为发病后植株失绿,长出黄色叶片,在无处理的情况下通常50~70天自动复绿,但在黄化期间,植株生长停滞,新叶抽出速度异常缓慢,当年生长量减少约20%~40%;在黄化病发生初期,增施有效态铁(Fe)、锰(Mn)肥及喷洒叶面肥可显著减少黄化病造成的经济损失[5]。受限于森林土壤高度的空间变异性和较高的土壤调查成本[6-7],通过大规模土壤调查、实验室分析的方式对桉树黄化病进行预防,成本较高。桉树黄化病发生受水、热条件变化的影响[8],如何在桉树植株未表现出病害时准确识别黄化病是目前亟待解决的问题。

高光谱(Hyperspectral)是近年来发展较迅速的一种光学分析技术,已被应用于木材性质研究[9-10]和植物生理信息获取[11-13]等方面。目前,大多数高光谱仪器的光谱范围为400~1 000 nm,主要为可见光和部分近红外波段,也有1 000~1 700 nm 近红外波段的范围[14];通过检测叶片、果实等器官中细胞或果肉组织内部结构对光不同程度的反射、散射[15-16],及植物叶片中水分、色素等的吸收作用[17],对植物光谱响应特征进行提取,并进行形式化、定量化表达,不仅可以研究植物病虫害侵染程度、侵染种类和侵染阶段,也有助于进一步研究光谱响应特性与病虫害间的关系,为深入研究病虫害光学遥感监测提供依据[18]。与传统的田间调查和人工监测方式相比,可见-近红外(Visible and Near-infrared,VNIR)光谱技术通过传感器获取电磁波能量和目标地物辐射反射信息,不与目标地物直接接触,更高效和准确,且允许在整个生长季内对植物生长情况进行实时监测、分析和评价,有助于制定合理的防治措施[19]。

本研究以桉树人工林病态和正常植株为研究对象,采集叶片并测定其光谱数据,采用基础图谱解析和数学变换方法处理原始光谱数据,分析不同叶片的光谱特征,同时进行线性判别分析,将黄化叶片、暂未表现出病态的叶片和正常健康叶片分类,找到与叶片黄化相关的特征光谱波段,对存在潜在黄化风险的叶片进行识别,旨在利用高光谱技术开发一种高效、快速且低成本的桉树黄化病筛查方法,为桉树人工林产业高产、高效和可持续经营保驾护航。

1 材料与方法

1.1 试验地概况

试验地位于广西壮族自治区国有黄冕林场(109°43′E,24°37′N),属中亚热带气候,温热多雨,雨热同季,年均气温19 ℃,年均降水量1 750 mm,年均蒸发量1 426 mm;以低山地貌为主,相对高差200~400 m;土壤以砂页岩发育的红壤为主,质地为轻壤。

1.2 供试材料

在黄化林区内,随机设立立地条件一致的3 个20×20 m标准地,采用平均木法确定10株活立木,采集黄化叶片(Chlorosis);从每株活立木顶端向下采集10 片新鲜叶片,共计100 片叶片(图1a)。以相同的方法采集黄化林中受病害影响但未表现出病害的未发病叶片(Chlorosis-Normal)(图1b)和同一林班内立地条件一致的正常健康叶片(Normal)(图1c),将正常叶片作为对照组。采集完成后,将样品放入4 ℃冰盒内保存,用于室内高光谱信息采集。

图1 黄化叶片(a)、未发病叶片(b)和正常叶片(c)Fig.1 Chlorosis(a),Chlorosis-Normal(b)and Normal(c)

1.3 光谱数据采集

采用美国ASD FieldSpec 4 地物反射高光谱仪和手持式叶片夹收集植物叶片的光谱,采集同一株活立木10 片叶片的光谱数据,取平均值。光谱波段为可见-近红外波段(350~2 500 nm),分辨率为1 nm,探头视场角为15°;光源采用仪器配套的50 W卤素灯,光源入射角为90°。采用仪器控制器扣除空气背景值后测定叶片光谱数据。每种叶片均采集10次光谱数据,取平均值为最终叶片光谱数据。

1.4 光谱数据预处理

采用ViewSpec Pro 6.0 软件对光谱数据进行预处理。由于仪器自身性能会造成光谱数据噪声,首先去掉光谱仪器量程两端(<400 nm、>2 400 nm),同时对原始光谱反射率(R)进行对数变换(Logarithm,Log),减少噪声影响;为使不同时间和不同地点条件下测量的光谱曲线具有可比性,对实地光谱测量数据进行归一化处理。计算每条光谱曲线在测量波段范围内的反射率均值;每条光谱曲线的每个波长位置除以反射率均值,得到归一化数据。

1.5 线性判别分析

偏最小二乘法判别分析(Partial Least Squares Discriminant Analysis,PLS-DA)是一种有监督模式识别的多变量统计分析方法,在构造因素时考虑辅助矩阵,并以代码的形式表示类成员信息。正交偏最小二乘法判别分析(Orthogonal Partial Least Squares Discriminant Analysis,OPLS-DA)是偏最小二乘法判别分析的延伸,通过增加正交验证,消除不相关变量,降低模型的复杂性,使建立的模型具有更好的拟合度。OPLS-DA 利用响应变量Y中的信息将X分成3 部分;将光谱数据与分类变量进行线性回归的判别步骤为:(1)建立校正集样本的分类变量(Category Variable);(2)根据需要区分的类别数量将分类变量拆分,以代码形式表示分类变量;(3)建立代码列与校正集光谱数据的PLS 模型;(4)计算验证集样本的PLS 预测Yp和偏差D。Yp>0.5 且D<0.5,判定样本属于该类;Yp<0.5 且D<0.5,判定样本不属于该类;D≥0.5,该判别模型不稳定。

1.6 数据处理

所有数据的基础处理均采用Excel 2010 软件完成;数学变换均采用Origin 2018 软件完成;PLSDA、OPLS-DA 均采用Simca 软件完成。模型评价指标为拟合度(R2)和均方根误差(Root Mean Squared Error,RMSE);R2是一个0 到1 之间的值,表示模型预测变量与实际观察变量的拟合程度,越接近1,模型拟合度越好;RMSE 是衡量模型预测错误的指标,反映模型预测变量与实际观察变量的标准偏差,值越小,模型预测能力越好。

2 结果与分析

2.1 光谱反射率特征分析

不同叶片光谱反射曲线呈相同趋势,反射率差异明显;受病害影响叶片的原始光谱反射率大部分情况下高于正常叶片;对数变换后的变化规律与原始光谱反射率呈相反趋势(图2)。原始光谱反射率吸收峰主要有5 个,分别在可见光区域(550 nm)及近红外1 180、1 288、1 630 和2 200 nm 处;在近红外波段800~1 260、1 400~1 720 和2 000~2 400 nm,正常叶片的原始光谱反射率明显低于受病害影响叶片(图2a)。经对数变换后,黄化叶片、未发病叶片和正常叶片的光谱反射率差异减小,但峰形更尖锐,差异峰主要出现在640、1 508 和2 000 nm 处,波谷出现在550和2 280 nm处(图2b)。这些差异可作为识别桉树叶片黄化的光谱特征波段。

图2 不同叶片原始光谱反射率(a)与对数变换(b)Fig.2 Original spectral reflection rates(a)and logarithmic transformation(b)of different leaves

2.2 主成分分析

主成分得分图是通过主成分分析(Principal Component Analysis,PCA)将高维数据降维至二维或三维的一种可视化方法[20]。图中,每个点表示1 个样本,坐标轴对应主成分,坐标轴的标签为原始特征的名称或主成分的编号。主成分得分图上的散点分布可表征光谱间的相似性。对不同叶片的光谱数据进行主成分分析,第一主成分(PC1)和第二主成分(PC2)分别包含42.9%和26.0%的方差信息,可代表原始光谱68.9%以上的主要信息(图3)。不同叶片的原始光谱有一定差异,未发生重叠,分布较分散;黄化叶片在1、2 和4 象限均有分布;未发病叶片在1、2、3 和4 象限均有分布;正常叶片主要分布在2、3 和4 象限;未表现聚类特征。PCA 方法可以很大程度地压缩数据并尽可能保留有效信息,但难以通过光谱数据的主成分得分图对不同叶片进行有效分类。

图3 不同叶片光谱指标主成分得分图Fig.3 Principal component score figure of spectral indexes of different leaves

2.3 不同叶片光谱数据判别分析

将所有样品的不同光谱指标(R、Log)作为建模数据输入模型,采用PLS-DA 和OPLS-DA 对不同叶片进行判别分析。PLS-DA 和OPLS-DA 在原始光谱的2 150 个光谱点位数据中提取得到的主成分(累计方差大于99.9%)分别为7和4个,将这些主成分作为样本属性数据,并为数据集中同种叶片的属性值设定相同标签(表1)。从拟合度来看,OPLSDA 的判别效果优于PLS-DA。判别分析模型散点图显示,图4c和d的点位分布比图4a和b更集中,聚类效果更好,未出现不同类型样品点位重叠的现象。由于OPLS-DA增加了正交验证,同种叶片光谱数据的相似性提高,不同叶片光谱数据的差异扩大;相对于PLS-DA 仅处理数据相关性和冗余性,OPLS-DA 在桉树黄化叶片判别上效果更优。图4a和b 显示,与PLS-DA 相比,Log-PLS-DA 的点位离散程度更小,虽然黄化叶片2、3 号点位与未发病叶片8号点位重叠,但其他各点位分布更集中,说明对数变换对于提高样品差异性有一定效果。

表1 不同叶片判别分析模型Tab.1 Discriminant analysis models for different leaves

图4 不同叶片光谱指标判别函数散点图Fig.4 Scatter plots of discriminant functions for spectral indexes of different leaves

4 种判别分析方法中,最优判别模型为Log-OPLS-DA,其R2为0.91,RMSE 为0.203;同种叶片的样本表现出较强的聚类特征,仅未发病叶片14号点位与黄化叶片2、3号点位的间距较近(图4d)。

对最优模型Log-OPLS-DA 进行独立样本验证,验证样品为黄化叶片,验证集样本量为8个,占总样品个数的27.6%(图5)。在Log-OPLS-DA 模型中,主成分累计方差达到98.7%,判别错误样品为2 个(22、23号),22号验证样点处于正常叶片区域,23号样点处于未分类区域,正确样品为6 个(24、25、26、27、28 和29),识别率达到75.0%。同类模型对除草剂危害叶片的识别率为70%以上[21],说明本研究建立的Log-OPLS-DA 判别分析模型能准确识别桉树叶片黄化情况,具有一定的应用前景。

图5 独立样本验证集Fig.5 Independent sample validation set

3 结 论

本研究选择桉树种植区域内出现黄化病的林分,采集黄化叶片、未发病叶片和正常叶片在350~2 500 nm 的可见-近红外光谱数据,发现黄化叶片特征识别光谱主要有5 个,分别在可见光区域(550 nm)及近红外1 180、1 288、1 630 和2 200 nm处,受病害影响叶片的光谱吸收率明显降低。不同叶片光谱反射曲线呈相同趋势,反射率差异明显,差异较大的波段主要为近红外波段800~1 260、1 400~1 720和2 000~2 400 nm,在这些波段,受病害影响叶片的原始光谱反射率明显高于正常叶片;对数变换能在一定程度上减少光谱数据冗余量,突出差异;两种线性判别分析方法均能识别潜在黄化叶片,Log-OPLS-DA 的判别效果更好,模型R2为0.91,RMSE 为0.203。采用线性判别分析明显提高不同叶片的聚类程度,OPLS-DA 有更好的聚类效果,能实现桉树黄化叶片判别,同时对潜在黄化叶片进行预判,具有一定的应用推广潜力。

在未来的研究中,一方面应扩大样本量,对病害程度进行分级,有利于识别准确率的提高[22-23];另一方面,应引入基于机器学习算法的非线性模型,如支持向量机(Support Vector Machine,SVM)[24]、随机森林(Random Forest)[25]等监督分类算法进行判别分析,提升模型精度,为桉树黄化病的预测、预警提供更有力的支撑。

利益冲突:所有作者声明无利益冲突。

作者贡献声明:赵隽宇负责样品收集与分析、光谱数据采集和论文撰写与修改;石媛媛、唐健负责研究计划制定;杨瑞青负责样品处理和数据分析;邓昀、程小辉负责文献检索和数据分析;陈守学负责研究计划制定和数据分析指导;曹继钊负责研究计划制定和统筹实施。

猜你喜欢

黄化病黄化桉树
黄化安全性保障
杜鹃黄化病的发生与防治
彩虹桉树
猕猴桃黄化病防治技术
桉树茶饮
浅谈苏北地区香樟树黄化病的防治
岭石叶面铁肥 缺铁黄化
铝胁迫下不同桉树无性系叶差异蛋白表达分析
3个桉树品种对桉树枝瘿姬小蜂抗性研究
生化黄腐酸对砂糖橘黄化病的治疗作用