APP下载

基于sCARS的淮北平原土壤有机质含量高光谱建模

2024-01-01高迎凤赵明松于芝琳赵治东王涛

关键词:土壤有机质

摘要:为确定淮北平原砂姜黑土土壤有机质(SOM)最佳反演模型,探寻最佳特征波长筛选方法,提高模型预测精度。利用原始光谱进行倒数对数(Log(1/R))、标准正态变量变换(SNV)、去包络线(CR)、一阶微分(FDR)处理,采用稳定竞争性自适应重加权算法(sCARS)筛选特征变量,对比分析竞争性自适应重加权算法(CARS)、相关系数法(|r|≥0.47)和显著性水平法(p≤0.01)所得结果,建立SOM含量的偏最小二乘(PLSR)模型,并对比精度差异。结果表明:(1)全波段范围内,SOM含量与原始光谱呈极显著负相关,与Log(1/R)光谱呈极显著正相关,与SNV光谱相关性明显增强。CR和FDR光谱与SOM含量呈不同程度的正负相关性。(2)对比全波段,CARS和sCARS算法能够有效去除光谱冗余信息,筛选得到特征波段数目仅占全波段的1%~5%。筛选后模型精度更高,相对分析误差(RPD)均大于1.8。(3)相比于CARS算法,sCARS算法具备更好的稳定性和精确性。筛选到的特征波段主要分布在800~850、1850~1900、2050~2500 nm区域。(4)Log(1/R)-sCARS模型精度最佳,建模集和预测集的决定系数(R2)分别提升了0.08和0.28,RPD值为3.05,对SOM含量预测极好。

关键词:土壤有机质;砂姜黑土;光谱变换;sCARS筛选;偏最小二乘模型

中图分类号:TP79;S151.9 文献标志码:A 文章编号:1001-2443(2024)03-0255-09

引言

土壤有机质(soil organic matter, SOM)含量是体现土壤生产力强弱的重要参数[1-2]。为了更加快速地测量土壤有机质的含量,近年来推出了高光谱技术,相比于传统的土壤有机质测定方法节省了时间及劳动成本,同时推动了环境、农业可持续发展,为土壤有机质的快速监测提供了保障。国内外学者研究发现可见光-近红外(visible and near infrared, Vis-NIR)光谱能够快速捕捉土壤信息,具有分辨率高、操作简便等特点[3-5]。因此通常利用Vis-NIR光谱预测SOM含量,但Vis-NIR光谱往往包含大量的波段,如何在提高建模精度的前提下,减少工作量,筛选特征波段已成为研究的热点内容。

光谱变换能更好地突出光谱的特征信息,然而不同光谱变换方法对光谱数据有不同作用,不同的变换对建模结果精度有影响[6-8]。高志海等[9]对荒漠化土地的土壤数据进行倒数对数(inverse-log reflectance, Log(1/R))变换,发现在550~900nm范围内弓形突起变化有明显特征。白继伟等[10]对去除包络线(continuum removal, CR)前后的光谱数据进行对比,发现处理后的光谱更能突出地物光谱的特征信息,可以有效提高建模精度。李雪等[7]通过实验对比认为经过一阶微分 (first-order derivative reflectance, FDR) 处理的光谱数据,其相关系数会有所提高。谭洋等[11]则认为标准正态变量变换(standard normal variable, SNV)能够更好地减少土壤样本表面的散射噪声,便于后续优化建模精度。

全波段光谱数据建模效率低、耗时长,对其进行特征波段筛选可以减少波段输入量,加快建模速度,提高模型精度[12-13]。通常使用的筛选特征波长的方法主要包括:竞争性自适应重加权算法(competitive adaptive reweighted sampling, CARS)[14]、稳定竞争性自适应重加权算法(stability competitive adaptive reweighted sampling, sCARS) 和连续投影算法(successive projections algorithm, SPA)[15]等。汪六三等[16]对光谱变换过后的光谱数据采用遗传算法(genetic gorithms, GA)、连续投影算法、竞争性自适应重加权算法、随机蛙跳(random frog, RF)筛选特征波段,结果表明连续投影算法优于全谱建模,在提取特征变量方面具有明显效果。蔡亮红等[17]将小波变换结合CARS等多种算法分别进行敏感波段提取,结果显示小波变换和CARS-SPA算法的结合可以更好地剔除无信息变量,消除变量间的共线性问题。根据前人的研究可知CARS算法筛选出的波段数目少,效率快,建模精度高,但筛选的波段具有不确定性,而sCARS延续了CARS的筛选流程,优化了筛选过程中的稳定性,被广泛应用于土壤特征波段筛选。丁泊洋等[18]对多种光谱变换后的近红外光谱进行sCARS筛选,预测集的RPD为2.9,预测效果最优。李冠稳等[19]对青海省湟水流域土壤进行研究,对比CARS和sCARS两种特征变量筛选,结果表明后者的建模效率及精度高于前者。

光谱数据与土壤属性之间常用的建模方法包含主成分回归分析(principle component regression, PCR)、偏最小二乘法(partial least squares regression, PLSR)、多元线性回归(multiple linear regression, MLR) 、随机森林(random forest, RF)、人工神经网络(artificial neural networks, ANN)等,前三种主要是线性回归方法,后两者则是非线性回归技术。大量研究表明,PLSR法能更准确地预测SOM含量,在模型预测中精度较优[20-21]。曹永研等[22]使用随机蛙跳算法筛选特征波长,分别建立MLR、PLSR、随机森林(random forest,RF)模型,证明PLSR法在快速预测SOM含量的精度上更有潜力。田永超等[23]对砂姜黑土、水稻土、盐土等5种光谱数据进行光谱变换,采用4种建模方法预测SOM含量,结果表明PLS-BP神经网络是最佳预测模型。

砂姜黑土内部含有钙质结核,土壤黏粒含量高,耕作能力差。目前对砂姜黑土水分、养分和理化性质等研究颇多,对砂姜黑土SOM最佳反演模型的研究较少。因此,本文以安徽省淮北平原中部蒙城县的砂姜黑土为研究对象,对原始光谱数据进行倒数对数变换、标准正态变量变换、去除包络线和一阶微分处理,采用sCARS筛选特征波段,与全波段、CARS、相关系数和显著性水平等方法进行对比,并分别进行PLSR建模,研究sCARS结合PLSR高精度建模的可行性,为今后SOM的快速检测做出一定的理论支持。

1 数据与方法

1.1 采样区概况

采样区位于安徽省淮北平原中部蒙城县境内(116°15′43″~ 116°49′25″E,32°55′29″~ 33°29′64″N),面积约为2091km² (图1),盛产小麦、玉米、大豆等优质农产品。地貌类型主要为黄泛冲积平原和河间侵蚀平原,地势由西北向东南缓缓倾斜,土壤类型以砂姜黑土、黄褐土为主。

1.2 土壤样品采集与划分

2016年夏季6—7月,在蒙城县田地区域内选取108个土壤样品,采集深度为0~20 cm。采样时遵循等量、随机和多点混合的原则。首先规划好采集土壤样品的区域,以其为中心分别作半径为10~20 cm的半圆,即S形区域。每个区域内需采集8~12个样品,将所有样品随机混合,通过四分法进行筛选,最终取1kg用于后续检测。检测之前土壤样品要保持自然风干的状态,经过木棒碾碎之后利用筛网剔除掉石块、残渣等杂质。进行土壤光谱测试时,筛网的标准目数为10目;通过重铬酸钾氧化滴定法测定有机质的含量时,筛网的标准目数为60目。在室内黑暗环境下,由卤素灯提供光源,将土样置于直径为10 cm、深度为1.5 cm的容器中,采用ASD Field Spec进行光谱测定,传感器探头位于土样表面以上15厘米处,探头视角为25°,波长范围为350~2500 nm。其中350~700 nm光谱分辨率≤0.048 nm,700~2500 nm光谱分辨率≤0.2 nm,重采样间隔1 nm。采用浓度梯度法划分建模集和预测集,即将SOM含量从低到高排列,按2:1比例确定建模样本72个,预测样本36个。表1为SOM含量在建模集和预测集的分布情况。

1.3 sCARS变量选择

稳定竞争性自适应重加权算法(sCARS)是在竞争性自适应重加权算法(CARS)筛选变量的基础上将稳定性Ci作为衡量指标,计算每个波长的稳定性值,进行多次循环迭代。然后利用自适应重加权采样方法和指数衰减函数选择稳定性较好的变量子集,最后建立PLSR模型计算权重系数,然后将权重系数较小的波段剔除,从N个波长子集中选择交叉验证均方根误差最小值作为最优变量子集[24]。计算公式为

1.4 数据处理与精度评价

首先对砂姜黑土的原始数据进行Savitzky-Golay平滑,设置移动窗口宽度为11 nm,多项式阶数为2,以此来平滑光谱反射率曲线,降低噪音的干扰。然后分别进行Log(1/R)、SNV、CR和FDR四种光谱变换,计算R、Log(1/R)、SNV、CR、FDR光谱与SOM之间的相关系数,探究不同光谱变换后光谱反射率与SOM的相关性变化。然后采用sCARS算法筛选特征波段,分析筛选波段的过程,研究敏感波段的数目和范围,对比CARS、相关系数法和显著性水平筛选法所得结果,建立PLSR模型,分析不同光谱变换和不同特征波段对建模结果精度的影响。

倒数对数变换、一阶微分变换在The Unscrambler中处理;去包络线变换在ENVI中进行;CARS和sCARS算法均在Matlab中运行;相关系数、显著性水平和标准正态变量变换在RStudio中进行;PLSR建模及预测则在The Unscrambler中完成。

研究主要运用了三个指标进行模型精度评价,分别为决定系数(determination coefficients, R²)、均方根误差(root mean squared error, RMSE)及相对分析误差(relative percent deviation, RPD)。当R²越接近1,RMSE值越小时,预测模型精度越好,拟合程度也越高[25]。RPD为预测样本的标准差(SD)与RMSE的比值。当RPDlt;1.4时,表明模型精度很差,无法对SOM含量进行预测;当1.4≤RPDlt; 2时,表明预测精度一般,能够粗略的对模型进行估测;当RPD≥2时,则表明预测结果的准确性很高,参考价值强[26,27]。

2 结果与讨论

2.1 土壤光谱曲线特征

将SOM的含量按从小到大排序,分别选择最小值、25%分位值、50%分位值、75%分位值和最大值,探究波长与反射率的关系,分析土壤光谱曲线特征 (图2)。从整体上看,不同有机质含量砂姜黑土的光谱曲线形态差别较小。如18.91 g/kg和21.82 g/kg,23.89 g/kg和31.30 g/kg的光谱曲线特征较一致,没有明显差异。同时随着SOM含量的增加,光谱反射率降低,而6.65 g/kg光谱曲线较特殊,该光谱曲线的反射率并没有处于最大值,有可能与SOM含量较低有关。当SOM含量较低时,其他土壤组成物质对光谱反射率影响增强,SOM对土壤反射率的影响减弱。

通过图2可以发现,5条光谱曲线均在1400~2200 nm范围内出现了水分吸收谷,其中1900 nm附近的吸收谷最为明显,1400 nm、2200 nm附近的吸收谷深度次之,5条光谱曲线的吸收程度和面积均有所不同,这与张森等[28]的研究结果一致。季耿善等[29]研究也表明在土壤样本含水时光谱曲线会出现吸收带,1400 nm附近主要与羟基为主的OH谱带有关,1900 nm附近主要由层间水的谱带引起,2200nm附近存在高岭类矿物吸收带,2300 nm附近的吸收谷则与三价铁和MgO的蛙石特征谱带有关。

图3为不同光谱变换之后,SOM含量与光谱反射率的相关系数分布曲线。图3a表示SOM含量与原始光谱呈显著负相关,最大相关系数绝对值为0.48。经Log(1/R)变换后,SOM含量与Log(1/R)光谱呈显著正相关,最大相关系数为0.47(图3b)。对比R和Log(1/R)相关系数曲线,可以发现两者相关系数绝对值变化形态基本相同,相关系数绝对值均大于0.3。经SNV处理后,SOM与光谱数据相关系数整体较高,其中350~456 nm、613~869 nm波段范围内的相关系数绝对值均大于0.8,相比于其他光谱变换方法相关系数明显提升。由图3d和图3e可知,SOM含量与CR光谱、FDR光谱相关系数上下波动大,变化剧烈,呈现不同程度的正负相关性,最大正负所在波长分别位于1164 nm和1443 nm,相关系数绝对值分别为0.43和0.66,且相比于R光谱和Log(1/R)光谱,相关系数略有下降。

2.2 sCARS特征波段筛选

经过不同光谱变换后,筛选到的特征波段有所不同。以原始光谱为例,阐述sCARS算法筛选特征波段的过程(图4)。分别通过筛选得到的波段数目、交叉验证均方根误差(RMSECV)和回归系数三个方面,分析蒙特卡罗采样次数(即运行次数)对筛选过程的影响。由图4可以看出,当运行次数不断增加时,筛选出来的波段越来越少,由急速减少到趋于平缓。RMSECV随着蒙特卡罗采样次数的增加呈现先减小后增大的趋势。在第27次运行时出现转折,这是因为在1~27次运行过程中,与SOM含量相关性较小的波段被剔除,建模精度逐渐提高;而第27次运行之后,与SOM含量相关性较大的波段被去除,RMSECV值增大,致使建模结果变差;当运行次数为27时,RMSECV处于最小值,值为1.17。此时共筛选出53个敏感波段,占总波段数的2.46%。

图5是经过光谱变换之后,sCARS算法筛选得到的波段分布情况。可以发现经过不同处理之后,筛选的敏感波段数目从2000多骤减至100左右,占全波段的1.86%~5.02%。勾宇轩等[30]对400~2400 nm范围内的光谱进行sCARS筛选,得到的波段数占初始波段的比率介于0.35%~5%,筛选波段所占比例与其相似。在五种sCARS筛选中,FDR处理后筛选的波段数目最多,波段数为108;Log(1/R)和CR处理后筛选波段数目次之;R和SNV筛选到的波段数最少,SNV-sCARS数目为40个。FDR-sCARS波段主要分布范围在350~380、550~570、740~860、1390~1400、1860~1940、2030~2500nm,而SNV-sCARS波段分布在800~840、1880~1910、2070~2500 nm。五种光谱变换均在800~850、1850~1900、2050~2500 nm筛选到了敏感波段,因为在这些范围内光谱数据与SOM之间具有较高的相关性,这与张娟娟等[31]的研究结果基本一致。张娟娟等在河南省商水县砂姜黑土的研究中表明:对于近红外光谱,1860~1890 nm和2000~2350 nm范围内光谱反射率与SOM相关性较强。而经Log(1/R)、CR和FDR处理后,光谱在可见光范围内也筛选到了一部分敏感波段,这是因为经过处理后的光谱反射率降低了背景产生的噪声干扰,扩大了土壤样品之间微小光谱的差异,便于提取有效波段[32]。

2.3 基于不同特征波长的PLSR模型建模

分别对原始光谱R、Log(1/R)、SNV、CR和FDR光谱进行CARS与sCARS算法筛选。由于原始光谱R、Log(1/R)和SNV光谱大多通过了0.01显著性检验,显著性水平筛选方法无法有效筛选得到有用的波段信息,而CR、FDR光谱情况与上述相反(图3)。因此,对原始光谱R、Log(1/R)和SNV光谱进行相关系数筛选,经过反复实验并结合前人学者研究,选择|r|≥0.47的波段[25],此时筛选得到的波段数目分别为680、262和996。对CR、FDR光谱进行显著性水平筛选,选择p≤0.01的波段。将以上筛选过后的光谱进行PLSR建模,建模结果见表2。

结果表明:经CARS和sCARS筛选后,建模的波段数目大大减少,建模精度也大大提高。特别是各光谱变换经sCARS筛选后的建模性能极佳。其中原始光谱和Log(1/R)光谱结合sCARS筛选建模精度最高,预测集的R2依次为0.88和0.89,相对分析误差RPD分别为2.94和3.05,能够准确地预测SOM的含量;SNV、CR和FDR光谱预测结果稍弱于前两种变换,建模集的R2分别为0.88、0.94和0.95,RMSE介于0.86~1.41 g/kg;预测集的R2分别为0.76、0.79和0.81,RMSE介于1.65~1.85 g/kg ,RPD值也均大于2。sCARS相比于CARS筛选到的波段数目略多,但CARS算法筛选的波段具有随机性。刘国海等[33]的研究表明sCARS算法更加稳定,建模精度也极优, sCARS与PLSR模型结合能够更好地预测SOM含量。李冠稳等[19]的研究同样表明,相比于全波段和CARS筛选,sCARS筛选后模型精度有所提高,RPD分别提高了0.4和0.1。其建模集和验证集R2为0.87和0.88,RMSE分别为8.33、7.80 g/kg。

在全波段光谱中,建模精度不高。R、Log(1/R)和SNV变换光谱的RPD介于1.5~1.6之间,仅能够粗略地预测土壤有机质的含量;而CR和FDR的RPD分别为1.19和1.18,模型精度极差,这可能是因为光谱变换后两种光谱数据与土壤有机质的相关系数大多集中于-0.4~0.4,具有弱相关性,较多波段没有通过0.01显著性水平。

基于R、Log(1/R)、SNV变换光谱进行相关系数筛选,预测集的R2分别为0.13、0.30和0.33,RMSE 介于3~3.5 g/kg,RPD均低于1.4,建模结果难以对SOM进行预测。在CR光谱和FDR光谱中,经显著性水平筛选后的特征波段,其预测集RPD值分别为1.18和1.47,说明显著性水平筛选也不适合用于砂姜黑土模型预测。

综上所述,20种模型中,sCARS较CARS筛选的敏感波段建模精度普遍更高,其中Log(1/R)-sCARS模型精度最优,建模集和预测集的R2为0.97、0.89,此时RPD值为3.05。相对于FDR光谱,其余四种光谱变换经相关系数和显著性水平筛选RPD值均低于全波段,不能预测土壤有机质。

由独立验证结果的散点图可以看出(图6),真实值与预测值的样本点在1:1直线呈不同程度的上下偏离。以图6a为例,在原始光谱全波段中,当SOM含量低于20 g/kg时,预测值基本高于真实值;当SOM含量高于20 g/kg时,预测值大多低于真实值。单海斌等[34]对北疆灰漠土进行SOM反演,其逐步回归模型结果与本研究结论相似,这可能是因为随着SOM含量的增加光谱趋于饱和。全波段、相关系数法和显著性水平筛选法样本点的离散程度很高,模型精度有待提升,有些甚至不能估测SOM含量。而经过CARS和sCARS筛选特征波段后,如图6f和6g所示,模型的真实值与预测值数据紧贴1∶1直线,模型精度极好,与上述分析一致。

3 结论

通过对安徽省蒙城县土壤有机质含量进行建模预测,并分析与土壤光谱曲线之间的对应关系,探究不同光谱变换和特征波段筛选下,建模效果和预测精度的差别,结果表明:

(1)不同有机质含量的砂姜黑土光谱曲线形态差别较小,在短波红外范围内均有3处吸收谷,与其附近谱带相关。土壤有机质与原始光谱呈极显著负相关,与Log(1/R)光谱呈极显著正相关,与SNV光谱的相关性明显增强。CR光谱和FDR光谱与SOM的相关系数波动较大,呈现不同程度的正负相关性。

(2)五种光谱变换经sCARS筛选后波段的范围和数目有所不同,筛选到的波段主要分布在800~850、1850~1900、2050~2500 nm区域内,波段数目介于40~108。

(3)对于sCARS算法,筛选结果的RPD值均在2以上,sCARS对比其它筛选结果具有更好的稳定性和准确性,能极佳地预测SOM含量。其中Log(1/R)-sCARS-PLSR的模型精度最优,建模集和预测集的R2分别提升了0.08和0.28,RPD值为3.05,采用sCARS-PLSR建模优于其他方法,为今后SOM预测提供了研究方向。

参考文献:

[1] OLDFIELD E E, BRADFORD M A, WOOD S A. Global meta-analysis of the relationship between soil organic matter and crop yields[J]. Soil, 2019, 5(1): 15-32.

[2] 钟翔君, 杨丽, 张东兴, 等. 不同粒径对土壤有机质含量可见-近红外光谱预测的影响[J]. 光谱学与光谱分析, 2022, 42(8): 2542-2550.

[3] DOTTO A C, DALMOLIN R S D, TEN CATEN A, et al. A systematic study on the application of scatter-corrective and spectral-derivative preprocessing for multivariate prediction of soil organic carbon by Vis-NIR spectra[J]. Geoderma, 2018, 314(11): 262-274.

[4] 焦彩霞, 郑光辉, 解宪丽, 等. 可见-短近红外成像光谱数据的土壤有机质含量估算[J]. 光谱学与光谱分析, 2020, 40(10): 3277-3281.

[5] 胡亚男, 高小红, 申振宇, 等. 基于野外实测Vis-NIR光谱的土壤肥力估算研究——以湟水流域为例[J]. 土壤通报, 2021, 52(3): 575-584.

[6] 陈思明, 毛艳玲, 邹小兴, 等. 基于不同建模方法的湿地土壤有机质含量多光谱反演[J]. 土壤通报, 2018, 49(1): 16-22.

[7] 李雪, 范仲卿, 高涵, 等. 基于高光谱的土壤有机质快速检测模型构建[J]. 山东农业大学学报(自然科学版), 2021, 52(5): 833-839.

[8] 周伟, 谢利娟, 杨晗, 等. 基于高光谱的三江源区土壤有机质含量反演[J]. 土壤通报, 2021, 52(3): 564-574.

[9] 高志海, 白黎娜, 王琫瑜, 等. 荒漠化土地土壤有机质含量的实测光谱估测[J]. 林业科学, 2011, 47(6): 9-16.

[10] 白继伟, 赵永超, 张兵, 等. 基于包络线消除的高光谱图像分类方法研究[J]. 计算机工程与应用, 2003, 39(13): 88-90.

[11] 谭洋, 姜琦刚, 刘骅欣, 等. 基于多尺度SNV-CWT特征的黑土有机质、水分、总铁及pH值估测[J]. 光谱学与光谱分析, 2021, 41(11): 3424-3430.

[12] JIA S, LI H, WANG Y, et al. Recursive variable selection to update near-infrared spectroscopy model for the determination of soil nitrogen and organic carbon[J]. Geoderma, 2016, 268(1): 92-99.

[13] 林志丹, 汪玉冰, 王儒敬, 等. 波长优选对土壤有机质含量可见光/近红外光谱模型的优化[J]. 发光学报, 2016, 37(11): 1428-1435.

[14] LI H, LIANG Y, XU Q, et al. Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J]. Analytica Chimica Acta, 2009, 648(1): 77-84.

[15] ZHANG J, RIVARD B, ROGGE D M. The Successive Projection Algorithm (SPA), an algorithm with a spatial constraint for the automatic search of endmembers in hyperspectral data[J]. Sensors, 2008, 8(2): 1321-1342.

[16] 汪六三, 鲁翠萍, 王儒敬, 等. 土壤碱解氮含量可见/近红外光谱预测模型优化[J]. 发光学报, 2018, 39(7): 1016-1023.

[17] 蔡亮红, 丁建丽. 基于变量优选和ELM算法的土壤含水量预测研究[J]. 光谱学与光谱分析, 2018, 38(7): 2209-2214.

[18] 丁泊洋, 陈万超, 张飞宇, 等. 波长选择SCARS和偏最小二乘法建立香菇中多糖含量预测的近红外光谱模型[J]. 天然产物研究与开发, 2017, 29(1): 125-128.

[19] 李冠稳, 高小红, 肖能文, 等. 基于sCARS-RF算法的高光谱估算土壤有机质含量[J]. 发光学报, 2019, 40(8): 1030-1039.

[20] 乔娟峰, 熊黑钢, 王小平, 等. 新疆阜康荒地土壤有机质高光谱特征及其反演模型研究[J]. 干旱地区农业研究, 2018, 36(5): 207-214.

[21] 吕梦琪, 宋宇杰, 翁海勇, 等. 近红外高光谱成像扫描速度对拟南芥冠层含水率预测的影响[J]. 光谱学与光谱分析, 2020, 40(11): 3508-3514.

[22] 曹永研, 杨玮, 王懂, 等. 基于水分和粒度的土壤有机质特征波长提取与预测模型[J]. 农业机械学报, 2022, 53(9): 1-11.

[23] 田永超, 张娟娟, 姚霞, 等. 基于近红外光声光谱的土壤有机质含量定量建模方法[J]. 农业工程学报, 2012, 28(1): 145-152.

[24] 李冠稳, 高小红, 肖能文, 等. 特征变量选择和回归方法相结合的土壤有机质含量估算[J]. 光学学报, 2019, 39(9): 361-371.

[25] 牛芳鹏, 李新国, 靳万贵, 等. 利用高光谱估算博斯腾湖西岸湖滨绿洲土壤有机质含量[J]. 中国土壤与肥料, 2021, 53(1): 9-16.

[26] GHOLIZADEH A, BORUVKA L, SABERIOON M, et al. A memory-based learning approach as compared to other data mining algorithms for the prediction of soil texture using diffuse reflectance spectra[J]. Remote Sensing, 2016, 8(4): 310-322.

[27] 刘艳芳, 宋玉玲, 郭龙, 等. 结合高光谱信息的土壤有机碳密度地统计模型[J]. 农业工程学报, 2017, 33(2): 183-191.

[28] 张森, 卢霞, 聂格格, 等. SVM和BP检测滨海湿地土壤有机质[J]. 光谱学与光谱分析, 2020, 40(2): 556-561.

[29] 季耿善, 徐彬彬. 土壤粘土矿物反射特性及其在土壤学上的应用[J]. 土壤学报, 1987, 24(1): 67-76.

[30] 勾宇轩, 赵云泽, 李勇, 等. 基于CWT-sCARS的东北旱作农田土壤有机质高光谱反演[J]. 农业机械学报, 2022, 53(3): 331-337.

[31] 张娟娟, 席磊, 杨向阳, 等. 砂姜黑土有机质含量高光谱估测模型构建[J]. 农业工程学报, 2020, 36(17): 135-141.

[32] 玉米提·买明, 王雪梅. 连续小波变换的土壤有机质含量高光谱估测[J]. 光谱学与光谱分析, 2022, 42(4): 1278-1284.

[33] 刘国海, 夏荣盛, 江辉, 等. 一种基于SCARS策略的近红外特征波长选择方法及其应用[J]. 光谱学与光谱分析, 2014, 34(8): 2094-2097.

[34] 单海斌, 蒋平安, 颜安, 等. 基于高光谱数据的北疆绿洲农田灰漠土有机质反演[J]. 农业资源与环境学报, 2018, 35(3): 276-282.

Based on sCARS Hyperspectral Modeling of Soil Organic Matter Content in Huaibei Plain

GAO Ying-feng1.2.3,ZHAO Ming-song1.2.3,YU Zhi-lin1,ZHAO Zhi-dong1,WANG Tao1

(1. School of Geomatics, Anhui University of Science and Technology, Huainan 232001,China; 2. Key Laboratory of Aviation-Aerospace-Ground Cooperative Monitoring and Early Warning of Coal Mining-Induced Disasters of Anhui Higher Education Institutes, Huainan 232001, China; 3. Coal Industry Engineering Research Center of Collaborative Monitoring of Mining Area’s Environment and Disasters, Huainan 232001,China)

Abstract: In order to determine the best inversion model of soil organic matter (SOM) of sand and Shajiang black soil in the Huaibei Plain, the best characteristic wavelength screening method was explored to improve the prediction accuracy of the model. The original spectrum was used to perform inverse-log reflectance (Log(1/R)), standard normal variable (SNV), continuum removal (CR), and first-order derivative reflectance (FDR) processing, and the stability competitive adaptive reweighted sampling (sCARS) was used to screen the characteristic variables, and the results obtained by the competitive adaptive reweighted sampling (CARS), correlation coefficient method (|r|≥0.47) and significance level method (p≤0.01) were compared and analyzed, and a partial least squares regression (PLSR) model of SOM content was established. And compare the accuracy differences. The results show that: (1) In the whole band, the SOM content is negatively correlated with the original spectrum, positively correlated with the Log(1/R) spectrum, and significantly enhanced with the SNV spectrum. CR and FDR spectra showed different degrees of positive and negative correlation with SOM content. (2) Compared with the full band, the CARS and sCARS algorithms can effectively remove the spectral redundancy information, and the number of characteristic bands screened accounts for only 1%~5% of the full band. After screening, the accuracy of the model was higher, and the relative percent deviation (RPD) was greater than 1.8. (3) Compared with the CARS algorithm, the sCARS algorithm has better stability and accuracy. The screened characteristic bands are mainly distributed in the 800~850, 1850~1900, 2050~2500nm regions. (4) The Log(1/R)-sCARS model has the best accuracy, the determination coefficients (R2) of the modeling set and the prediction set are increased by 0.08 and 0.28, respectively, and the RPD value is 3.05, which is excellent for the prediction of SOM content.

Key words: soil organic matter; Shajiang black soil;spectral transformations; sCARS screening; partial least squares model

(责任编辑:巩 劼)

猜你喜欢

土壤有机质
玉米秸秆还田对土壤有机质提升影响因素及对策分析
耕地土壤有机质提升方法探讨
土壤有机质测定条件的筛选与优化
不同作物生态种植模式对砂质土壤培肥与产量的影响
重铬酸钾容量法的改进技术研究
三门峡土壤有机质含量分布特征及其与烟叶品质的关系
长白山区野生羊肚菌与其土壤成分的相关性分析
不同林分类型及土层对土壤养分的影响
不同干扰林地土壤重金属与养分积累的关系
长白山北坡和西坡林线土壤有机质含量的对比分析