近红外光谱技术在闽楠叶片氮含量测定中的应用
2023-01-18涂白连伍艳芳刘新亮郑永杰张月婷徐海宁
涂白连,伍艳芳,,刘新亮,郑永杰,张月婷,徐海宁
(1.江西农业大学 林学院,南昌 330045;2.江西省林业科学院 国家林业草原樟树工程技术研究中心,南昌330032)
闽楠(Phoebebournei(Hemsl.)Yang),樟科楠属常绿大乔木,中国特有,被列为国家二级珍稀濒危种,同时也是江西省重要乡土珍贵阔叶用材树种[1-3]。江西省的闽楠资源丰富,楠木种植面积2万hm2(30万亩)以上,但在楠木人工林的营建过程中,有50%以上的人工林需根据营养诊断结果进行肥力提升或低产低效林改造,因此,亟需提升闽楠的营养诊断技术,改善林地肥力结构,实施森林质量精准提升。氮素(N)是闽楠生长过程中所必需的主要营养元素之一,同时也是限制闽楠生长和产量形成的重要因素,恰当的施用氮肥不但能够有效促进闽楠生长,还能提升其产量[4-7]。实现实时、快速的检测闽楠氮素营养水平,对楠木营养诊断技术的提升具有重大意义。传统的植物氮素检测方法主要有形态诊断、组织全氮含量诊断、硝酸盐快速诊断和土壤化学诊断等[8],但这些方法均存在一定的弊端,难以实现大面积的推广使用;现代的检测方法主要有叶绿素仪诊断[9]、叶绿素荧光法[10]、遥感技术诊断[11]、可见近红外光谱技术(NIRs)等[12]。近年来,随着科学技术的快速发展,近红外光谱技术也得到相当程度的发展和完善,应用近红外光谱技术无损、快速地测定多种植物生化组分含量已经能够很好实现[13-14]。吴静珠等[15]通过比较竞争自适应重加权采样法(CARS)、蒙特卡罗无信息变量消除法(MCUVE)、向后间隔偏最小二乘法(BiPLS)、组合间隔偏最小二乘法(SiPLS)等4种特征谱区筛选方法,优选出BiPLS为最适合建立番茄叶片氮含量模型的方法,并建立了最优定量分析模型;张玉森等[16]应用近红外光谱技术结合偏最小二乘法(PLS),经光谱预处理和建模谱区选择,建立了水稻鲜叶和粉末氮含量预测模型;胡永光等[17]以茶树活体鲜叶为研究对象,利用便携式光谱仪于田间收集了86个茶鲜叶样品的漫反射光谱信息,通过选择建模波段、预处理方法、建模方法等步骤,建立了茶鲜叶全氮含量近红外光谱预测模型。
截至目前,尚无将NIRs技术与闽楠营养成分检测和应用相结合的研究报道。因此,本文将近红外光谱分析技术与闽楠叶片氮含量预测相结合,以期得到一种快速便捷的闽楠叶片氮含量检测方法。以江西省永丰县官山林场国家楠木良种基地采集到的高产组和低产组共64份闽楠叶片样品为材料,其中54份用于模型建立,余下10份用于模型的外部验证。通过常规的组织全氮含量诊断法获得闽楠叶片的全氮含量作为实测值,应用近红外光谱仪采集闽楠干叶粉末样品的近红外光谱信息,通过化学计量学方法结合软件分析,选择最佳建模方法、建模波段、预处理方法,最终得到预测效果最优的模型。用10份未知样品对模型进行外部检验,结合配对样本T检验评价模型,以期为闽楠营养水平实时测评技术的提升提供参考。
1 材料与方法
1.1 试验材料与仪器设备
2021年5月下旬,于江西省永丰县官山林场楠木种子园,随机选择高产组和低产组各32棵单株,每单株为1个样本,采集中部功能叶片,不带小枝,共得到64份闽楠叶片样品。
所用近红外光谱采集仪器为瑞士BUCHI公司生产的傅里叶变换近红外光谱仪NIRFlex N-500,及其配套的Operator光谱采集软件和NIRCal分析软件,仪器光谱范围为1 000~2 500nm,分辨率为13.38nm。
1.2 实验方法
1.2.1样品前处理
闽楠叶片经实验室纯水洗净晾干,于电热恒温鼓风干燥箱中105℃杀青10~30min,在调至80℃烘干至恒重,经粉碎机粉碎成粉末状,最终得到闽楠干叶粉末样品,装入聚四氟乙烯封口袋中,避光干燥保存待用。其中54份作为建模集参与建模,另随机选取10份作为外部验证集用于检验模型。
1.2.2近红外光谱采集
将叶片粉末装入Petri培养皿中,装样厚度15mm,反射盖压实,置于近红外光谱仪器上进行光谱测定。使用Management软件设置光谱扫描参数:扫描范围1 000~2 500nm,扫描次数32次,分辨率13.38 nm,环境温度保持恒定24~25℃。采取单个样品重复装样3次、扫描3次,得到3张光谱,取其平均光谱作为该样品的表征光谱。
1.2.3氮含量测定
参考鲍士旦[18]的方法进行闽楠养分含量测定,氮、磷、钾含量分别采用凯氏定氮法、钼锑抗比色法和火焰光度计法测定。
1.2.4模型建立
利用仪器配套的Operator软件采集样品近红外光谱,将所测得的样品实测值赋值于所采集得到的近红外光谱,导入配套的化学计量学软件NIRCal进行相关分析,依次通过选择合适的建模方法、最佳建模波段、预处理方法建立定量分析模型。选用内部交叉验证的方法检验模型[19],外部验证的方法评价模型的预测效果。以校正集相关系数Rc(Related coefficient of calibration)、校正集均方根误差RMSEC(Root Mean Square Error of Calibration)、交互验证集相关系数Rv(Related coefficient of validation)、交互验证均方根误差RMSEV(Root Mean Square Error of Validation)、残差(BIAS)等5个值对模型进行评价,以确定最优模型。
1) 建模方法选择。近红外光谱分析中,主要的建模方法有偏最小二乘法(PLS)、主成分回归(PCR)、多元线性回归(MLR)等线性校正方法和人工神经网络(ANN)、支持向量机(SVN)等非线性校正方法[20-22]。本研究主要选择PLS和PCR这2种方法对模型进行构建,并比较其效果。
2) 建模波段选择。在全光谱段上不是所有的光谱信息都是对总提取物含量的预测有用,无效的光谱信息会影响所建模型的精度[16]。因此,选择特定有效的光谱区域参与建模能够在一定程度上优化模型,提高模型的预测效果。
3) 预处理方法选择。近红外光谱的实测光谱为样品的表观光谱(Apparent spectrum),表观光谱由能够表征样品的真实光谱(Real spectum)和不确定的背景(Background)组成。样品的真实光谱包含了大部分物理、化学和生物等确定信息,其中有需要用到的确定信息,也有不需要的信息[23]。此外,光谱基线偏移、高频噪音、斜坡背景等偏差也会影响建模的准确性,增加近红外光谱分析的难度[24-25]。因此,在建立近红外光谱模型时,需要对近红外光谱进行预处理,以消除这些干扰信息对模型精度造成的影响。
1.2.5模型的评价及外部验证
近红外光谱校正模型效果的评价,可以从模型自身相关性和外部预测能力2个方面进行[26]。评价参数方面,较高的Rc和Rv,较低的RMSEC和RMSEV是一个好的预测模型应该具备的条件,其中Rv和RMSEV又更为重要。这主要是因为虽然模型具有较高的Rc和较低的RMSEC,表示其预测建模样品的能力更强,但这也可能造成模型过拟合;而Rv和RMSEV代表模型在预测外部样本时的准确性,更高的Rv和更低的RMSEV就表明模型预测外部样本时更准确,同时RMSEC和RMSEV越接近越好[20,24,27-28]。模型的外部验证方面,通过将10份未参与建模样品的近红外光谱图导入模型进行预测,比对模型预测值和实测值,对模型的预测能力进行检验和评价。在利用SPSS 25.0软件进行配对样本T检验,验证该方法的可靠性[28]。
2 结果与分析
2.1 闽楠叶片氮含量的实测值
测定得到的样品全氮含量结果如表1所示。所测64份闽楠叶片样品的氮含量最大值为19.15g/kg,最小值为9.29g/kg,平均氮含量为13.28g/kg。样品含量涵盖范围较广,具有一定的代表性,可用于近红外光谱技术分析。
表1 闽楠样品氮含量实测值描述性统计表Tab.1 Descriptive statistics table of the measured value of nitrogen content in P.bournei. samples
2.2 谱图分析和建模方法的选择
由图1可看出,在整个光谱波段内,闽楠干叶粉末的近红外光谱总体变化趋势基本一致,这可能是由于闽楠叶片的物质组成基本相同;但不同样品在同一波长下反射率方面有一定的差异,并非完全相同,说明叶片的内部组成存在一定的差异。这表明近红外光谱分析技术可用于闽楠全氮含量的定量分析。
图1 所有样品的近红外光谱图Fig.1 Near-infrared spectra of all samples
本研究选用偏最小二乘法(PLS)和主成分回归(PCR)2种方法分别建立定量模型,从中选择出最恰当的建模方法,结果如表2所示。2种方法所建模型的Rc值均高于0.9,但PCR方法所建模型的Rv值更高,RMSEV也更低,且RMSEC和RMSEV值更为接近,所以可得出PCR方法建立的模型效果更好。
表2 不同建模方法氮含量预测模型表现比较Tab.2 Comparison of model performance of nitrogen content prediction by different modeling approaches
2.3 特征波段的选择
应用PCR方法,选择不同的光谱区域建模,结果如表3所示。虽然在3个波段内建立的模型Rc值均高于0.9,但观察表中数据会发现在1 000~1 350nm,1 400~2 000 nm范围内建立的模型具有更高的Rv值和更低的RMSEV值,且其RMSEC值和RMSEV值最为接近。由此表明,选择1 000~1 350nm,1 400~2 000 nm波段建立的模型效果更好。
表3 不同光谱波段范围氮含量预测模型表现比较Tab.3 Comparison of the performance of nitrogen content prediction models in different spectral band ranges
2.4 预处理方法的选择
选择1 000~1 350,1 400~2 000nm建模波段,使用标准化(Normalization)、导数(Derivatives)、平滑(Smoothing)等方法对光谱进行预处理,其结果如表4所示。经一阶导数(db1)、二阶导数(db2)、SG(savitzky-golay filter)平滑、结合单位长度归一化(nle)、乘法散射校正MSC和SNV标准化等预处理方法所建立的模型,各参数较为接近,但仔细比较后发现,经“一阶导数(db1)、平滑SG(savitzky-golay filter)和结合单位长度归一化(nle)”预处理方法所建立的模型具有更高的Rv值和更低的RMSEV,效果最佳。图2为经预处理后所有样本的光谱图。
表4 不同光谱预处理方法氮含量预测模型表现比较Tab.4 Comparison of the performance of nitrogen content prediction models with different spectral pretreatment methods
2.5 模型的建立
选择1 000~1 350nm,1 400~2 000nm组合波段,经一阶导数、平滑SG和结合单位长度归一化预处理,利用PCR方法建立闽楠叶片氮元素含量模型,模型的各参数如表5所示。图3是模型内部交叉验证预测值和实测值之间的关系图,由图可知,模型的预测值和样品实测值间没有显著差异,且偏差较小。
图2 光谱预处理效果图Fig.2 Effect diagram of spectral pre-treatment
表5 近红外模型建立结果参数Tab.5 Parameters of near-infrared model establishment result
图3 预测值与实测值关系图Fig.3 Relationship between predicted values and measured values
2.6 模型的验证
将10个未知样品的近红外光谱图导入模型检验所建模型的预测能力,结果如表6所示。预测值和实测值的相对偏差在0.070%~0.705%范围内,预测值与实测值接近,表明模型的预测值和实测值具有较高的相关性。
采用统计学分析方法,结合SPSS分析软件,对闽楠样品氮含量的预测值和实测值进行配对样本T检验,结果如表7所示。P值为0.116,大于0.05,没有显著差异,说明NIR结合PCR对闽楠叶片粉末样品的氮元素含量进行快速分析是可行的。
表6 闽楠叶片氮含量外部验证结果Tab.6 The results of external verification of nitrogen content in leaves of P.bournei
表7 外部验证预测值与实测值T检验结果Tab.7 T-test results of predicted and measured values of external verification
3 讨论与结论
研究结果表明,借助近红外光谱仪,采集闽楠干叶粉末的光谱数据,结合其传统分析方法测得的理化值,经化学计量学分析方法处理可建立闽楠叶片氮含量预测模型。所建模型经外部检验,结果也无显著差异,这说明应用近红外光谱分析技术建立闽楠叶片氮含量预测模型可行,该方法具备一定的创新性,可为闽楠营养成分检测技术的改善提供参考。
相比于传统的化学分析方法,近红外光谱技术有着分析快速、无损,可实施大批量样品快速检测和实时在线分析的特点[29],已逐渐替代传统分析方法,在工农业分析领域得到了广泛的运用[30]。在植物氮含量检测方面,近红外光谱分析技术相关的研究现阶段主要集中在农业经济作物:小麦[31-32]、苹果[27,33-35]、茶[17,36]等方面,对于林业经济树种方面的研究较少[37]。本研究针对闽楠叶片建立近红外光谱氮含量检测模型,与前人的研究相比:建模方法方面,凌智刚等[38]利用偏最小二乘回归方法建立的烟叶的总氮含量检测模型,得到了较高精确度的模型,本研究采用的建模方法为主成分回归,对比使用偏最小二乘法所建立的预测效果更好。样品光谱采集方式方面,本研究参与建模的样品为闽楠干叶粉末,这在一定程度上规避了闽楠叶片水分对叶片光谱造成的影响,但制作叶片粉末样品的过程较繁琐。以往有大量的学者直接应用植物鲜叶构建相关的营养成分检测模型[16-17,33,39],因此下一步可对闽楠鲜叶光谱进行研究,利用闽楠鲜叶直接构建闽楠叶片氮含量近红外光谱预测模型。植物叶片有机成分含量检测方面,集中在氮含量检测方面的研究较多,但也有学者运用近红外光谱技术对叶片其他有机成分的检测进行了研究,石吉勇等[40]应用近红外光谱技术结合人工神经网络(BP-ANN)算法建立了黄瓜叶片磷元素亏缺快速诊断模型,模型识别率达到100%。前人的研究结果表明,应用近红外光谱技术检测植物叶片的磷、钾等营养成分是可行的,因此,后期可尝试对闽楠其他营养成分(如P,K等)的近红外预测模型进行相关研究,可为闽楠营养成分的快速、实时检测提供新的技术途径。