土壤营养元素光谱检测技术的研究进展
2022-12-21李锦昌何洪源赵雪珺王晓宾吕铷麟胡益滔
李锦昌,何洪源,赵雪珺,王晓宾,吕铷麟,胡益滔
(1.中国人民公安大学 侦查学院,北京 100038;2.上海市刑事科学技术研究院 上海市现场物证重点实验室,上海 200083)
土壤营养元素氮(N)、磷(P)、钾(K)常见于肥料当中,用于提高土壤的肥力和农作物产量。施肥欠缺会因土壤肥力下降而限制作物的生长,施肥过量会造成土壤富营养化等环境问题[1-2]。因此,农业中对于土壤中氮磷钾含量的控制是土壤分析的关键因素,也是土壤信息化管理和土壤环境监测的前提条件。土壤中营养元素含量传统的检测以化学方法为主,包括凯氏定氮法、氢氧化钠-钼锑抗分光光度法和醋酸铵萃取-火焰光度法等[3]。由于这些方法存在分析过程复杂、检测周期长、成本高以及实验中产生的废液还会因处理不当造成环境污染等缺点。近年来,光谱技术以快速性、准确性和无损性的特性[4],已成为土壤中营养元素含量检测技术研究和应用的热点问题。光谱技术检测土壤营养元素含量的流程见图1。
图1 光谱技术检测土壤营养元素含量流程图Fig.1 Flow chart of spectroscopic technology for detectingsoil nutrient element content
本文介绍了近年来国内外采用可见-近红外光谱(Vis-NIRS)、激光诱导击穿光谱(LIBS)、X射线荧光光谱(XRF)和高光谱遥感(HRS)4种常见的光谱技术结合化学计量学方法检测土壤营养元素含量的研究现状,并对未来研究进行了展望。
1 土壤营养元素光谱数据分析方法
1.1 光谱数据预处理
利用光谱技术检测土壤中营养元素时,为了消除非目标因素对结果的影响,通常会对原始光谱数据进行预处理来达到降噪的目的,以提升实验结果的准确性。常用光谱数据预处理方法主要有以下几种。
SG平滑由Savizky和Golay在1946年提出[5],本质上该方法是对移动窗口平均法的改进。SG平滑利用多项式最小二乘拟合,计算出窗口内中心点关于其周围点的加权平均和。在土壤研究领域中会有效地去除土壤光谱中的高频噪声信号,从而突出氮磷钾在土壤光谱中的信息。郭志新等[6]在利用可见-近红外光谱技术研究杉木林土壤中氮磷钾含量时将采集到的光谱进行了SG平滑,很大程度上消除了光谱噪声信号。
数学变换包括导数和对数变换。导数变换分为一阶导数法(FD)和二阶导数法(SD),导数变换可以很好地去除土壤光谱中基线漂移的影响,呈现出土壤光谱的轮廓变化,提供比原始光谱更高的分辨率,但要求原始光谱应具有较高的信噪比。朱琦等[7]对采集的光谱进行一阶导数处理,从而解决了红外光谱分析时出现的谱图偏移或漂移的现象。对数变换可以增强光谱差异,还能有效地减小噪声对目标物光谱波段的影响。高会等[8]进行了对不同有效磷含量的土壤高光谱反射率包括对数变换在内的一系列数学变换,得到了变换形式中(lnR)′对有效磷的估算效果最佳。
由于土壤颗粒粒径存在差异,表面分布不均,从而产生对原始光谱干扰的散射现象。针对该现象采取的处理方法称为散射校正法,包括多元散射校正(MSC)和变量标准化(SNV)。MSC常用于校正散射现象对土壤原始光谱数据的影响,减少基线漂移。SNV则类似于MSC,但SNV更适用于样本光谱差异较大的条件下进行前处理。Ramrio等[9]通过对原始光谱进行SNV处理,使得可见-近红外光谱在预测土壤有效磷和有效钾的结果更加准确。基于土壤光谱数据的常见光谱预处理方法的原理与作用见表1。
表1 光谱预处理方法Table 1 Pre-processing methods for spectroscopy
1.2 特征波段提取
由于采集的光谱数据存在谱峰重叠造成的光谱信息冗余、特征吸收峰不明显等缺点[8],因此需要寻找对模型起关键作用的有效波长来代替全谱建立预测模型。特段波长提取方法可以有效提高光谱技术分析结果的准确性。土壤光谱中常用的特征波段提取方法包括以下几种。
连续投影算法(SPA)是通过对光谱数据投影映射选取原始数据中的少数波长,尽可能多地概括样本光谱信息,最大程度避免信息重叠[24]。朱淑鑫等[25]提出了结合SPA和K均值算法对高光谱特征波段进行选择,结果表明可以有效地减低数据冗余的情况。
无信息变量消除算法(UVE)是基于PLS回归系数建立的波长选择算法,用于消除无用信息变量,降低模型复杂程度。Li等[26]分别利用SPA和UVE两种方法提取特征波长,最终证明UVE提取得到的特征变量结合模型时预测效果更好。
主成分分析(PCA)可用于对土壤营养元素的光谱数据信息矩阵进行压缩,即将光谱信息矩阵分解得到主成分载荷矩阵和得分矩阵,然后再使用样本集的主成分对应其相应的得分作图[27]。Terra等[28]利用PCA对光谱数据进行降维,得到了中红外光谱和近红外光谱对土壤样品预测的分布情况。
随机青蛙(Radom frog)是一种基于青蛙觅食过程而创建的一种智能优化算法。何东健等[29]采用随机蛙跳算法进行特征波长的选择,结果表明该方法可以很好地选取特征波长,有效去除冗余信息且建模结果很好。
竞争性自适应重加权算法(CARS)是模仿了达尔文进化论中的“适者生存”原则,可以有效找到最优变量组合的一种算法。而稳定竞争性自适应加权抽样法(sCARS) 是在CARS的基础上将稳定性同时纳入考虑中,将变量的稳定性作为变量建模能力的指标,剔除冗余信息[30]。Sara等[13]采用CARS对LIBS、Vis-NIRS检测土壤中磷含量的光谱数据集进行特征提取,结果表明CARS在筛选关键波长上十分有效。基于土壤光谱数据的光谱特征常见提取方法总结见表2。
表2 光谱特征提取方法Table 2 Spectral feature extraction methods
1.3 建立光谱预测模型及评估指标
基于样本的光谱数据和已知信息建立预测模型,通过获得未知土壤样本的光谱数据,依照建立的预测模型,可以预测出未知土壤样本中营养元素的准确含量。目前,基于土壤光谱数据所建立的预测模型以线性回归模型的偏最小二乘法为主。随着研究人员对更高预测精度的要求,更多非线性模型也引入到了土壤数据研究中,并在检测土壤营养元素含量时有着较好的预测效果。光谱技术在检测土壤营养元素含量的研究日趋成熟。
为评估模型的预测能力,通常会从决定系数(R2)、相关系数(r)、性能偏差比(RPD)、均方根误差(RMSE)等方面来比较不同标定方法的预测精度。通常好的预测模型具有较高的R2、RPD值和较低的RMSE值。RPD的区分范围没有明确规定,一般由研究人员会自行确立一个界定范围以区别不同RPD值模型预测能力。Qi等[10]利用SSR/SST(即R2值)和RPD值作为模型预测土壤中氮磷钾元素含量的评估标准,即通过SSR/SST>0.5和RPD>2来评判最佳的模型预测能力。
2 土壤营养元素的光谱检测技术
2.1 可见-近红外光谱
可见-近红外光谱(Vis-NIRS) 是基于电磁辐射与物质之间的相互作用,波长范围在400~2 500 nm之间。可见区(400~700 nm)主要由分子的电子跃迁控制,近红外区(700~2 500 nm)主要由中红外区分子振动的泛频和组合频控制。由于土壤中各个组分与吸收的辐射相联系,因此可提供样品的定性和定量信息[36]。
Mouazen等[37]通过PLSR建立了土壤有效磷含量的预测模型,发现Vis-NIRS预测磷含量是可行的,随后研究了不同光谱数据处理方法来提高预测模型的准确性。袁石林等[11]以浙江省潮化盐土为研究对象,利用Vis-NIRS检测了6组120个土壤样品中总氮(TN)和总磷(TP)的含量,分别建立了PLS和LS-SVM的预测模型,结果发现在预测总磷方面LS-SVM方法要比PLS好。李雪莹等[38]以青岛市三个不同地区的180份土壤样品为研究对象,基于Vis-NIRS结合PLSR对土壤中TN、TP、TK建立了预测模型。结果为TN和TP校正集和验证集的R2均在0.9以上,RPD值均高于2,表明模型对土壤中TN、TP、预测能力较好。吴茜等[12]以云南省玉溪水稻土为研究对象,基于Vis-NIRS结合BPNN对土壤有效氮磷钾含量进行了预测,得到rp分别为0.90,0.82和0.94。Qi等[10]研究对比了原始光谱和22种光谱预处理方法,结合PLSR、LS-SVM和BPNN三种模型对土壤中营养元素含量进行了预测,最终得出BPNN+MSC是预测钾的最优方法,RPD值为2.23,R2为0.81;SG+LG/PLS-R是预测磷的最优方法,RPD值为1.47,R2为0.95。
2.2 激光诱导击穿光谱
激光诱导击穿光谱(LIBS)是一种原子发射光谱技术,可以对样品中多元素成分进行快速现场定量检测。通过超短脉冲激光聚焦样品表面形成等离子体,进而对等离子体发射光谱进行分析以确定样品的物质成分及含量[39]。
在土壤研究中,LIBS通过结合化学计量学方法可用于测定氮磷钾的常量和微量元素。Erler等[31]使用基于LIBS的手持仪器,采用多元回归方法估计农田土壤中的常见组分(氮、磷、钾、钙、镁等),测定的结果表明钾的预测效果最好,而对于磷和氮的预测效果较差。Sara等[13]利用LIBS和 Vis-NIRS 对印度农田的147份土壤样品对可浸出磷、奥森磷、草酸可浸出磷和总磷进行了检测。建立了PLSR模型,结合区间偏最小二乘回归(iPLS)和竞争自适应重加权抽样(CARS)确定了土壤中磷的特征波段。结果表明,在几乎所有模型建立和预测土壤磷库方面,LIBS比Vis-NIRS结果好。猜测可能是由于磷的谱线强度可能会受到土壤中其他金属元素的影响,且建议应当建立多元的定量模型以提高预测相关系数(R2)。Xu等[40]将LIBS与偏最小二乘回归法(PLSR)相结合,同时测定了土壤的pH值、阳离子交换容量(CEC)、土壤有机质(SOM)、TN、TP、TK、速效磷(AP)和土壤有机质(SOM),结果表明基于全LIBS光谱下对上述土壤参数都有较好的预测能力,特别是对土壤中TP的预测,RPD值达到了1.993。
2.3 X射线荧光光谱
在X射线荧光光谱(XRF)中,利用原级X射线光子或其它微观粒子以一定能量(在1~115 keV)范围激发待测物质中的原子,使之产生次级的特征X射线(X光荧光)来进行物质成分分析和研究。在土壤检测中,通过便携式X射线荧光光谱在现场初筛后再进行实验室检测,可以避免盲目的大量采样[41]。
Towett等[42]采用总X射线荧光光谱法(TXRF)对南非44个地区的700份土壤样品进行了检测,结果显示磷和钾都得到较好的预测效果。Said等[43]使用随机森林(RF)对便携式XRF检测的光谱数据进行分析,来预测钾(K)、磷(P)、镁(Mg)和钙(Ca)的含量。结果表明钾的预测效果最佳,R2为0.83。说明便携式XRF结合数据分析方法,可快速、低成本、准确地分析土壤钾的含量。Tiago等[22]证明了XRF对关键土壤肥力属性的测量中利用多元回归模型分析是有效的,其中磷和钾均得出的预测结果为RPD>1.54和R2>0.61。最近,关于XRF与其他技术(如可见光和近红外光谱)数据融合使用的研究也开始流行起来。Javadi等[32]检验了可见-近红外光谱和X射线荧光光谱数据融合技术的潜力,以提高实践中对关键土壤属性的估计精度。探究了数据融合在可见近红外光谱和XRF测定土壤属性的潜力,结果表明基于CNN建模方法测定含磷土壤属性的效果最好。
2.4 高光谱遥感
高光谱遥感(HRS)是指利用固定的电磁波波段获取地物的连续光谱信息,与反映地物空间分布的影像相结合,从而可以同时对土壤表面状况与其性质的空间信息进行监测的一种技术。近地传感高光谱因其成本低,操作省时省力,且具备大范围监测的应用潜力,故在土壤研究中得到广泛关注[44-45]。
Malley和Williams[46]于1997年利用HRS对湖泊沉积物中的重金属元素进行了定量反演,取得了较好的预测精度。在此之后HRS才被广泛应用于土壤营养元素检测中。徐丽华等[47]通过断点拟合和消除包络线的预处理方法,分别选取了4个相关系数较大的波段作为总磷和总氮的特征波段,在基于特征谱线下建立的预测模型表现出较高的预测精度,R2分别为0.842和0.622。陶培峰等[21]通过对土壤原始反射率光谱进行了数学变换、MSC等变换,利用多元逐步回归(SMLR)、PLSR和BPNN三种分析方法建立了高光谱预测模型,结果表明PLSR和BPNN模型的预测能力更好。Li等[11]利用高光成像系统在900~1 700 nm光谱范围内检测了土壤样品中的TN含量,并对不同的特征光谱提取方法(UVE和SPA)和预测模型(PLS和ELM(极限学习机))进行了比较,结果表明UVE-ELM模型可获得相对较好的结果,rp、RMSEP和RPD分别为 0.940 8,0.007 5 和2.97。Patel等[48]结合深度学习算法,利用高光谱数据估算了土壤和尿素肥料混合样品的丰度,结果表明该算法可有效提高数据的光谱分解精度,也说明HRS可用于农田土壤肥力状况的评价。
3 结论与展望
目前,可见-近红外光谱、激光诱导击穿光谱、X射线荧光光谱和高光谱遥感已广泛用于土壤营养元素含量的检测工作中。利用化学计量学方法对测得的光谱数据进行处理已成为研究热点,利用SG平滑处理可有效减小噪声干扰,MSC和SNV可有效消除土壤中不均匀介质产生的散射。光谱预处理方法从单一化向多样化发展,再到多种方法并用,有研究者采用SG+MSC+FD或SG+LG等组合的方法校准光谱数据以提高预测模型的准确度。还有应用SPA、CARS和GA和随机蛙跳等方法对目标元素的特定波长进行选择。近些年,建模方法从采用PLSR线性回归模型转向了复杂的神经网络模型,如CNN、DBN、BPNN等模型的复杂度更高,泛化能力更强,在测量土壤营养元素含量有更好的预测效果。
研究发现,四类光谱技术虽然已在土壤营养元素含量的研究中得到普遍使用,但大部分工作还是针对特定地域或地区进行的分析,尽管得到了较为理想的预测模型,但模型的通用性会受到一定限制。在未来的工作中,随着便携式光谱检测仪器的不断发展,可以实地采样测量获得数据信息。为了适应复杂的土壤类型和大面积土壤营养元素含量的测定,研究人员还要不断优化建模方法,提高模型的泛化能力。进一步扩大采样范围,建立大规模的土壤光谱数据库,将其应用到农业或地质科学研究中,不仅通过与传统的土壤剖面分类图结合起来完成数字化土壤分类,从而实现对不同土壤层级进行快速有效分析;还可与光谱数据的化学计量学模型相结合,对各类作物提供施肥建议,更好地为发展精准农业服务。