APP下载

基于高光谱成像技术的甜菜叶片氮素遥感估测*

2018-12-05张晶张珏田海清

关键词:甜菜反射率波段

张晶,张珏,2,田海清

(1.内蒙古农业大学机电工程学院,内蒙古 呼和浩特 010018;2.内蒙古师范大学物理与电子信息学院,内蒙古 呼和浩特 010022)

甜菜是我国重要的糖料作物,主产于东北、华北及西北地区,也是内蒙古自治区具有地区优势的经济作物[1]。甜菜需氮量高,且对氮肥十分敏感,氮肥的施用量会直接影响叶片颜色、形态结构以及其他生长信息[2]。由于我国甜菜种植一般采用统一施肥模式,普遍存在单产偏低或单产高但含糖率低的问题[3]。可见,传统施肥方式不仅无法满足不同甜菜植株对氮肥的需求,同时也会造成施氮量过高或过低的现象。近年来,随着科学技术水平的不断提高,氮素营养诊断技术正从传统的实验室检测向现场无损检测方向发展[4]。张珏等[5]基于数码相机图像对甜菜叶片中氮的质量分数(ρN)进行定量分析,提出的归一化调优参数(NOP)对叶片ρN的敏感度较高,预测集决定系数为0.69。一些研究者利用光谱分析技术在马铃薯[6]、小麦[7]等作物的无损检测方面也取得了一定的成果。然而高光谱成像技术兼具机器视觉技术和光谱分析技术的优势,已成为当前无损检测作物养分最具潜力的新方法[8]。因此,根据甜菜植株的生长需求,基于高光谱成像技术准确、快速测定甜菜氮素营养状况,对合理施肥、最大化产能以及降低土壤污染等方面均具有重要的指导意义。

目前,高光谱成像技术已被成功的应用于作物叶片ρN的无损检测中。孙俊等[9]基于高光谱成像技术对生菜叶片ρN进行估测,发现利用偏最小二乘法建立的模型预测效果最佳,R2为0.82;Wang等[10]利用高光谱成像技术结合偏最小二乘算法实现了水稻冠层ρN的实时监测;Shi等[11]利用高光谱成像技术对黄瓜叶片ρN的丰缺状况进行无损检测,预测效果较理想,R2为0.81;张莜蕾等[12]基于12个特征波长下的高光谱图像,结合偏最小二乘模型,实现了油菜冠层ρN的可视化;朱文静等[13]利用高光谱成像技术对四种氮胁迫下的番茄叶片ρN进行识别,识别率分别为96%、88%、92%和93%。但当前利用高光谱成像技术估测甜菜叶片ρN的研究还鲜有报道。本研究基于高光谱成像技术,对甜菜叶片ρN进行无损检测,对比分析各预处理下光谱反射率与ρN的相关关系,以期找到甜菜叶片ρN的最佳光谱预处理方法和敏感波段范围;参照现有其它作物氮素营养诊断的光谱参数构建方法,构建适合甜菜氮素诊断的光谱参数,并建立预测模型,为实时、快速遥感监测甜菜氮素营养丰缺水平,制定最佳甜菜氮素养分调控策略提供理论依据。

1 材料与方法

1.1 样本的培植和采集

试验于2014年在内蒙古赤峰市松山区太平地镇开展,为单因素(N)试验,共设7个氮肥水平(N1、N2、N3、N4、N5、N6和N7),施肥量依次为(0、15、32.5、76、108.5、163和217.5 kg/hm2),作为基肥一次性施入农田,试验品种为KWS1676,甜菜幼苗于五月下旬移栽至大田,株行距为25 cm×50 cm,小区面积大约为50 m2,各小区随机排列,田间管理按常规方式进行。数据采集时间为2014年6月23日到9月15日。每个小区挑选2×2株甜菜样本,高光谱成像仪通过三角架固定在甜菜冠层上方1 m处,扫描角度为40°。将图像数据采集完毕后的样本烘干、粉碎,并利用凯氏定氮法测定叶片ρN[14]。

本研究共选取95个甜菜样本,利用K-S分类法[15]将总样本数按3∶2的比例划分为建模集和预测集,即57个样本用于建模,38个样本用于模型精度的验证。

1.2 叶片高光谱图像的校正

使用ImSpectorV10E高光谱成像系统采集甜菜叶片高光谱图像,成像光谱仪的分辨率为2.8 nm,波长范围为383~1 003 nm,图像分辨率为800×428。为保证图像尺寸、清晰度以及全分辨率,采集过程中,曝光时间设置为5 ms,电控平台移动速度为6 mm/s,扫描行程为120 mm。通过采集全黑B和全白W图像,对光谱数据进行黑白标定,以减小光照角度、强度、以及相机中暗电流对光谱数据的影响。根据公式(1)对原始光谱(raw hyperspectral,R0)数据进行标定,将标定后的光谱数据记为Rb。

(1)

1.3 数据处理与分析

利用ENVI5.3加载高光谱图像,并在图像中选取5处具有代表性大小为20×20个像素的矩形感兴趣区域为研究点(图1:a),将其加权平均后的光谱值作为样本的原始光谱数据。其中,去掉383~399 nm和901~1 003 nm信噪比较低的首尾波段,选取400~900 nm波段范围内的光谱数据供下一步研究分析。图1:b为甜菜叶片高光谱图像中ROI对应的原始光谱曲线。

图1 甜菜叶片高光谱图像原始光谱曲线Fig.1 The original spectral curve of sugar beet leaves’ hyperspectral image

1.3.1 光谱预处理 数据采集时存在的一些干扰因素,如样本表面颗粒度的大小以及表面散射程度的不同等,均会对光谱数据造成一定的误差,影响光谱的检测精度。因此,为最大程度的提取有效光谱信息,增强光谱数据与成分含量的相关性,需对原始光谱数据(Rb)进行预处理。本文采用Savitzky-golay平滑[16](Savitzky-golay smoothing, S-G)、一阶微分[17](First derivative, FD)、多元散射校正(Multiplicative scatter correction, MSC)和标准正态变换[18](Standard normal variate transformation, SNV)4种不同的算法对原始光谱数据进行预处理,并结合连续投影算法[19](Successive projections algorithm, SPA)提取甜菜叶片ρN的特征波长。

1.3.2 模型构建与验证 针对高光谱数据冗余度大、波段间相关性高的特点,在定性和定量分析时,不能简单采用比尔定律进行分析,需利用多变量数据分析法,如偏最小二乘(Partial least squares, PLS)[20]以及支持向量机(Support vector machines, SVM)[21]等方法。本研究以SPA提取的特征波长作为输入参数,建立甜菜叶片ρN的PLS和SVM预测模型,通过对比两模型的评价指标,确定最佳甜菜叶片ρN预测模型。

应用预测集的决定系数(R2)、均方根误差(RMSE)和相对分析误差(RPD)3个指标作为模型预测能力和实用性能的主要评价标准。R2越大,RMSE越小,模型的精度越高;RPD值小于1时,表明模型不具备预测能力;RPD值为1~1.4时,模型具有区别高值和低值的能力;RPD值为1.4~1.8时,模型具有一般的定量预测能力;RPD值大于1.8时,模型具有定量预测能力,且模型的实用性较强[22]。

2 结果与分析

2.1 不同氮水平下甜菜叶片ρN及光谱反射率的变化规律

由甜由甜菜叶片ρN变化曲线图2a可以看出,叶片ρN随施氮量、生育期的变化而变化。甜菜叶片ρN整体在叶丛快速生长期最高,随后在糖分增长期呈下降趋势,糖分积累期又升高。各生育期内,叶片ρN随施氮量的增加呈先升高后降低的变化趋势。当施氮量在N1~N5范围内时,甜菜叶片ρN随施氮量的增加而增加;当最大施氮量超过N5(108 kg/hm2)时,继续增加施氮量反而使叶片ρN下降,可能是各生育期内植株物质转移中心和氮代谢强弱不同所致。同时发现不同氮胁迫下甜菜叶片光谱反射率的变化趋势(图2b)与各生育内叶片ρN的变化规律相同,在绿峰550 nm附近以及750~900 nm波段范围内差异性显著,N1~N5处理下,反射率随施氮量增加而增大到最大值,之后随施氮量的增加而减小,体现了光谱信息反演叶片ρN的有效性。

图2 不同氮水平下甜菜叶片ρN及光谱反射率曲线 (a) 甜菜叶片ρN;(b) 甜菜叶片光谱反射率;(c)510~590 nm范围内的光谱反射率;(d)750~899 nm范围内的光谱反射率Fig.2 Curves of leaves nitrogen content and spectral reflectance of sugar beet under different nitrogen levels(a) Leaves nitrogen content of sugar beet; (b) Leaves spectral reflectance of sugar beet;(c) Spectral reflectance in the range from 510 to 590 nm; (d) Spectral reflectance in the range from 750 to 899 nm

2.2 敏感波段范围及最佳预处理方法的选取

分析原始光谱数据与甜菜叶片ρN的相关性发现,当反射率与ρN的相关系数(r)达到0.361时,相关性呈极显著水平(P<0.01),因此,将r=0.361作为上下显著水平边界线,绘制了不同预处理下光谱反射率与叶片ρN的相关系数曲线图(图3)。结果显示,经S-G预处理后的曲线与原始光谱曲线基本重合,S-G曲线仅在光滑性方面表现较好。两曲线均在808~900 nm波段范围内光谱反射率与叶片ρN呈极显著负相关,r变化范围在0.361~0.43之间,其余波段相关性较差。而经SNV处理后的曲线突显了正常植被光谱所特有的吸收峰和谷,反射率与叶片ρN的相关性在400~514、523~585、654~689、700~789以及806~900 nm波段范围内均达到极显著水平,r在0.361~0.62之间变化,较原始光谱相关性显著提高。MSC处理后的效果和SNV相似,相比之下SNV处理后的光谱曲线较平滑,毛刺较少。这是由于MSC是对光谱矩阵进行处理,而SNV是分别对光谱矩阵的每一行光谱数据进行校正,去噪效果更精细。对于FD曲线,反射率与叶片ρN的相关系数在极显著水平线间上下波动,同原始光谱曲线相比,吸收峰个数明显增加,光谱反射率在724~749 nm波段范围与叶片ρN呈极显著负相关,除此之外,在749~900 nm波段范围内还存在一些散点呈极显著正、负相关,但整体显著性水平偏低,平均r为0.23,这是由于导数预处理在辨别重叠峰的同时也会放大局部误差。上述分析表明,对原始光谱进行预处理可显著提高光谱数据与叶片ρN的相关性。经SNV和MSC预处理后相关性在700~789以及806~900 nm波段范围内整体表现较好,FD曲线在724~900 nm波段范围内处理效果较理想,S-G处理效果与原始光谱曲线相同,相关性在808~900 nm波段范围内达到极显著水平,因此,综合考虑波段间的连续性以及信息的互补性,本研究将700~900 nm作为甜菜叶片ρN的敏感波段。

分别以敏感波段的原始光谱反射率及其4种预处理后的反射率为输入,建立甜菜叶片ρN的PLS模型,建模结果如表1所示。结果表明,FD-PLS、S-G-PLS、SNV-PLS以及MSC-PLS模型预测效果均优于Rb-PLS模型,R2分别提高了10%、14%和22%,均方根误差降低了2%、7%和4%。其中,SNV-PLS模型的预测效果最佳,R2为0.59,RMSE为3.31 g/kg。综上所述,SNV为甜菜叶片光谱数据的最佳预处理方法,后续研究均基于SNV预处理后的敏感波段范围内的光谱信息(Sensitive band spectrum, SBS)进行分析。

图3 不同预处理下光谱反射率与ρN的相关性Fig.3 Correlation of spectral reflectance and nitrogen content under different pretreatment methods

预处理方法建模集 (n=57)R2RMSE/(g·kg-1)预测集 (n=38)R2RMSE/(g·kg-1)Rb0.653.380.483.45FD0.692.930.533.38S-G0.643.450.563.22SNV0.762.730.593.31MSC0.762.740.593.31

2.3 基于敏感波段的光谱参数构建

敏感波段范围内共有247个波长,若全部用于建模,会引入大量的冗余信息,影响模型的预测精度。因此,为减少输入量个数,利用SPA对光谱数据进行降维处理。该算法依据RMSE最小且变量数较少的原则,优选特征波长,变量数选取范围设定为1~10。由图4可以看出,整个敏感波段范围内共优选出5个特征波长,分别为716、757、789、822和899 nm。利用任意两特征波长反射率做比值构建光谱指数(RDI),并与甜菜叶片ρN进行相关性分析,分析结果如表2所示。结果表明,构建的RDI与ρN的相关性均达到极显著水平,r在0.374~0.72之间变化。因此,选取其中涵盖所有特征波长且相关系数较高的6个RDI(789/822、789/899、822/716、822/757、899/716和899/757),作为下一步建模的输入参数,以期建立精度更高的预测模型。

图4 SPA算法选择的最优特征波长(a) 最佳变量数; (b) 最优波长Fig.4 Best variables selected by SPA(a) The optimal number of variables; (b) Optimal wavelength

RDI716/789716/757716/822716/899789/716789/757789/822789/899757/716757/789r0.432a0.542a0.651a0.664**-0.453a0.551a0.702a0.720a-0.554a-0.551aRDI757/822757/899822/716822/798822/757822/899899/716899/789899/757899/822r0.553a0.660a-0.654a-0.702a-0.556a0.375a-0.665a-0.717**-0.662a-0.374a

1)a表示在P<0.01水平极显著。

1) “a” indicats that the correlation reaches a significant level,whenPis less than 0.01。

2.4 建模结果分析

为定量分析高光谱成像技术对甜菜叶片氮素估测的可行性,分别以敏感波段范围内的全波长、特征波长以及由表2筛选的6个RDI为自变量,利用SVM和PLS建立甜菜叶片ρN预测模型,并与传统的多元线性回归(multivariable linear regression,MLR)模型对比,验证模型预测精度,优选最佳预测模型。模型的预测效果见表3。

研究利用MATLAB中的libsvm工具箱运行SVM算法,选用径向基函数(RBF)作为核函数,svmtrain函数进行模型的训练,svmpredict函数则利用训练好的模型进行预测输出。根据均方根误差最小化原则,利用K-fold交叉验证法确定SVM模型中两个待定参数的最佳组合:惩罚因子c为22,核参数g为0.006。

从输入变量的角度分析表3,SPA-RDI-SVM模型预测集的预测效果优于SBS-SVM和SPA-SVM模型,R2分别提高了56%和50%,

RMSE均降低了21%和20%。同样,与SBS-PLS和SPA-PLS模型相比,SPA-RDI-PLS模型预测集的预测效果较好,R2分别提高了17%和43%,RMSE均降低了7%和18%。SPA-RDI-MLR模型预测精度高于SBS-MLR和SPA-MIR,R2分别提高了49%和33%,RMSE均降低了21%和19%。以上结果表明,虽然SPA仅提取了5个特征波长,但基于特征波长构建的RDI与叶片ρN相关度较高,使模型的预测精度和稳定性得以提高。但SPA-PLS模型的预测精度低于SBR-PLS模型,R2降低了18%,RMSE升高了13%。这是由于PLS是一种基于主成分分析的多元回归算法,仅输入5个特征波长作为SPA-PLS模型的自变量,会导致模型处于欠拟合状态,模型的泛化性差,预测精度也随之降低。

从建模方法的角度看,SVM模型的预测效果优于PLS模型,PLS模型优于MLR模型。其中SBS-MLR模型的预测精度最低,原因可能是MLR算法仅对数据进行线性回归运算,不存在降维处理,模型呈现过拟合现象。SPA-RDI-SVM模型预测效果最佳,R2较SBS-PLS、SPA-PLS、SPA-RDI-PLS、SBS-MLR、SPA-MLR以及SPA-RDI-MLR模型分别提高了30%、59%、11%、81%、63%和22%;RMSE降低了13%、23%、6%、27%、25%和8%。但其中基于SBS-PLS模型的预测结果优于SBR-SVM模型,R2提高了20%,RMSE降低了10%。这是由于PLS建模过程中结合了主成分分析的特点,降低了数据的共线性,从而提高模型的预测精度。

综合各模型的预测结果,发现SPA-RDI-SVM模型的预测效果最好。图5中实测值和预测值的拟合散点图也直观的反映了这一现象,SPA-RDI-SVM模型的数据较均匀的分布在拟合曲线两侧,且拟合曲线与1∶1线间夹角最小,表明甜菜叶片ρN的实测值和预测值呈现较好的线性关系。模型的预测结果很好的突显了SVM算法在处理非线性数据时较强的泛化能力。

表3 模型的预测结果Table 3 Prediction results of models

图5 甜菜叶片ρN实测值与预测值的拟合散点图Fig.5 The fitting scatter plots of the measured value and predicted value of nitrogen content in sugar beet leaves

3 讨 论

本文通过借鉴前人的研究思路,基于高光谱成像技术,综合利用多种光谱预处理方法和建模算法,探明了甜菜叶片ρN的敏感波段范围以及最佳光谱预处理方式,最终建立了预测精度较高的甜菜叶片ρN估测模型。综合分析不同氮水平下甜菜叶片ρN与光谱反射率的变化规律,发现当施氮量为108 kg/hm2(N5)时,叶片ρN和反射率均达到最大,由此推测N5可能为种植区甜菜生长所需的最佳施氮量,本结果对该区域甜菜合理施肥具有一定的指导意义。

研究发现不同预处理下光谱反射率与甜菜叶片ρN的相关性在700~900 nm波段范围内均可达到极显著水平,鉴于此,确定甜菜叶片ρN的敏感波段为700~900 nm。这与前人的研究结果相近,周丽丽等[23]研究发现3个不同品种的玉米叶片光谱反射率与叶片ρN在500~649 nm和691~730 nm均呈极显著的负相关关系;徐克强等[24]研究指出,尖椒叶片ρN的敏感波段主要集中在700~1000 nm。这是由于叶片内部大分子物质受到外界光照辐射时,内部低能电子的跃迁、含氢原子团的伸缩振动会引起化学键的变化,进而影响叶片对光的吸收,特别在近红外区域,光谱响应曲线的差异性显著。

目前,用于作物叶片ρN估测的高光谱数据大多是在室内特定的条件下采集而来,外界影响因素较少。李金梦等[25]研究表明,利用特征波长构建的柑橘叶片ρN预测模型,预测集R2为0.86,RMSE为0.15。王树文等[26]在对寒地水稻叶片氮素营养的诊断研究中指出,采用分段主成分分析-相关性分析筛选出的4种光谱参数作为建模变量,模型预测集的R2为0.87,RMSE为0.085。本研究结果表明,基于RDI的SVM模型对甜菜叶片ρN的预测效果最佳,预测集R2为0.78,RMSE为3.08 g/kg,RPD为1.49。与上述研究相比,模型预测精度偏低,主要原因可能是数据采集环境不同所致。本研究使用的数据采集于田间,数据采集过程中气象、人为等不可控干扰因素较多,降低了光谱数据的准确性,进而影响模型检测精度。王巧男等[27]基于811和856 nm的双波段植被指数建立了最佳的柑橘叶片ρN预测模型,R2为0.61,并在此基础上,实现了叶片ρN的可视化。因此,本文认为构建的RDI-SVM模型预测精度在田间应用中仍可接受,具有较高的参考价值。

光谱信息的准确提取是影响模型检测精度的重要因素。因此,通过综合分析R2、RMSE和RPD三个模型评价指标,确定甜菜叶片ρN特征波长的最佳提取方法,是下一步研究的重点。后续将优化的估测模型与高空遥感信息相结合,可为大区域的甜菜氮素遥感监测提供理论依据。

4 结 论

本文以不同氮水平下的甜菜叶片为研究对象,基于高光谱成像技术,通过样本集划分,最佳光谱预处理及构建敏感光谱参数,建立了甜菜叶片ρN预测模型,主要得出以下结论:

1)通过对原始光谱反射率以及光谱预处理后的反射率与甜菜叶片ρN的相关性分析,确定了700~900 nm为甜菜叶片ρN的敏感波段。

2)基于敏感波段的SNV-PLS模型预测精度整体上优于R-PLS、S-G-PLS、FD-PLS和MSC-PLS模型,其预测集R2为0.59,RMSE为3.31 g/kg。

3)基于SVM和PLS建立的模型预测精度均优于常规MLR模型对甜菜叶片ρN的预测精度。其中SPA-RDI-SVM模型的预测效果最好,预测集R2=0.78,RMSE=3.08 g/kg,RPD=1.49,表明了利用高光谱成像技术检测甜菜叶片ρN的可行性。

猜你喜欢

甜菜反射率波段
利用镜质组反射率鉴定兰炭与煤粉互混样的方法解析
商品条码印制质量检测参数
——缺陷度的算法研究
车灯反射腔真空镀铝反射率研究
最佳波段组合的典型地物信息提取
辣椒甜菜,各有所爱
当食物成为艺术创作的燃料
甜菜咋喂猪
基于地面边缘反射率网格地图的自动驾驶车辆定位技术
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块