南疆盐碱土水、氮、盐光谱特征及其反演模型
2023-08-09赵泽艺李朝阳王洪博李国辉唐茂淞王兴鹏
赵泽艺,李朝阳,王洪博,张 楠,李国辉,唐茂淞,王兴鹏*,高 阳
(1.塔里木大学 水利与建筑工程学院,新疆 阿拉尔 843300;2.中国农业科学院 农田灌溉研究所,河南 新乡 453002)
0 引 言
【研究意义】土壤水、矿物质[1]、有机质量[2]直接影响植物生长与产量形成。快速、准确地监测土壤信息对农业生产具有重要意义。【研究进展】土壤含水率[3]、含氮量[4]、含盐量[5]的传统监测方法是现场采样,然后进行物理或化学监测。传统监测方法虽然可以获得准确信息,但耗时、耗力,时效性较差。随着高光谱技术的发展,星载光谱、机载光谱、地物手持光谱技术逐渐成熟,光谱反演土壤中的元素种类越来越多,反演方法层出不穷。以往研究利用高光谱技术监测了草甸土[6]、黑土[7]、紫土[8]、黄壤土[8]的水分特征,监测了褐土[9]、黄绵土[10]、砂姜黑土[11]、黑土[12]的含氮量;这些研究均证实高光谱监测土壤含水率和氮素是可行的。高光谱不仅可以反演土壤中的含水率和含氮量,还可以反演土壤盐渍化程度。土壤盐渍化程度越高,对光谱的反射率则越大[13]。陈睿华等[14]采用支持向量机算法反演了银川平原的土壤盐分。李志等[15]利用高光谱特征参数对土壤盐量进行了建模,发现在17 种一维单波段光谱中,对数倒数的一阶微分变换与土壤盐量的相关性最好,峰值敏感波段为1 083 nm。徐驰等[16]采用光谱吸收参数作为自变量,用盐分指数对土壤盐量进行了反演。Ivushkin 等[17]采用无人机遥感技术对土壤盐量进行了反演,决定系数(R2)最高可达到0.64。Darochaneto 等[18]指出,线性模型在土壤盐渍化预测方面优于非线性模型。柴思跃等[19]运用遗传算法、偏最小二乘法对水分、盐分共同影响下的特征光谱进行建模,得出土壤电导率会受到水分和盐分的共同影响。王海江等[20]对不同土壤水分与盐分状况建立高光谱定量模型,在土壤含水率较低的情况下能够得到较好的土壤盐量监测精度。【切入点】然而,已有研究多以土壤水、氮、盐的单一因子作为变量,缺少多因素相互影响下的土壤信息监测与反演研究。【拟解决的关键问题】因此,本研究设置水、盐(EC)和氮(TN)3 个变量,在不同组合下获取土壤光谱信息,利用偏最小二乘回归(PLSR)、支持向量回归(SVR)和BP 神经网络(BPNN)模型分别对土壤水、盐、氮量进行反演。本研究旨在建立多因素影响下的土壤水、盐、氮反演模型,为精准监测土壤水、盐、氮量提供技术支撑。
1 材料与方法
1.1 研究区概况
研究区位于新疆生产建设兵团第一师(图1)。该区域属暖温带极端大陆性干旱荒漠气候,昼夜温差大,常年干旱少雨,日照时间长,地表蒸发强烈。多年平均气温为10.7 ℃,年平均降水量为48 mm,年平均蒸发量为2 100 mm。土壤类型为砂土,干密度为1.1 g/cm3。土壤盐分组成以NaCl 为主,有机质量为11.05 g/kg,有效磷量为7.2 mg/kg,有效硼量为0.6 mg/kg,速效钾量为33 mg/kg。以五点采样法测定了研究区土壤理化性质,土壤平均田间持水率、全氮量和含盐量分别为87 g/kg、4.963 mg/L 和0.93 g/kg。
图1 研究区与采样点示意Fig.1 Schematic diagram of research area and sampling site
1.2 土壤样品采集与制备
于2021 年11 月16 日在阿拉尔市十团矮砧千亩果园,采集3 m3的0~30 cm 土层的土壤。取样结束后,将样品带回实验室自然风干21 d;采用4 cm 筛网去除土壤杂质后备用。
试验设置水、氮、盐3 个因子,其中土壤水分设置2个梯度,质量含水率分别为64.7 g/kg和56.5 g/kg,约为田间持水率的75%和65%;土壤全氮量设置10个梯度,分别为9.926、12.407、14.889、17.37、19.852、22.333、24.815、27.296、29.778、32.259 mg/L;土壤盐量设置10 个梯度,分别为1.860、2.325、2.790、3.255、3.720、4.185、4.650、5.115、5.580、6.045 g/kg。不同水平的水、氮、盐进行全组合设计,共200 个处理,每个处理设置10 个重复,共计2 000 份样本。通过添加尿素(总氮量≥46.0%)和NaCl(分析纯)来调控土壤的含氮量和含盐量。不同处理的土壤样品制备好后,将体积质量为0.97 g/cm3的土壤样品放入深度为4.5 cm,半径为4 cm 的PVC 圆柱容器内,用于观测光谱信息。
1.3 土壤光谱数据获取
使用美国SEI公司的PSR+3 500地物光谱仪采集土壤样品的光谱信息,仪器的波谱范围为350~2 500 nm,数据输出重采样间隔为1 nm,共2 151 个波段,每采集一个样本,自动收集10 条光谱曲线,取平均后作为一个样本的光谱数据。测量时,将不同处理的土壤样品置于光谱仪光纤探头正下方,每1 min 使用反射率为1 的白板进行一次校正。
1.4 光谱数据处理
在光谱采集过程中,数据会受到诸多因素影响,影响模型反演的精度。因此,对原始光谱信息进行数据降噪是构建反演模型的前提。Savitzky-Golay 是一种常用的降噪方法,是在时域内基于局域多项式最小二乘法拟合的滤波方法;平滑滤波的效果随选取的窗口宽度不同而有所差异。使用Savitzky-Golay 降噪可以显著提高光谱平滑度。本研究采用滤波器窗口长度为51,拟合样本的多项式阶数为5 的方法对光谱进行平滑,结果如图2 所示。将平滑后的数据进行归一化,使用主成分分析法(PCA)进行降维,PCA 映射到低维度空间后有32 个主成分,保留99.88%的原始信息,将PCA 处理后的数据作为模型的输入信息。所有算法均由Python 3.10 实现。
图2 不同含水率处理下土样的原始光谱与Savitzky-Golay 平滑光谱Fig.2 Original spectra and Savitzky-Golay smoothed spectra of soil samples in different water treatments
1.5 土壤水、氮、盐量的光谱反演模型
采用偏最小二乘回归(PLSR)[21]、支持向量机回归(SVR)[22]和BP 神经网络(BPNN)[23]构建土壤水、氮、盐量的光谱反演模型。PLSR 是一种多变量回归分析方法,可以简化数据结构,构建线性回归模型。SVR 是一种多元非线性的回归算法,能够将低维空间中难以解决的非线性问题映射到高维度空间,从而将非线性问题转化为线性问题。BPNN 主要分为输入层、隐藏层、输出层3 层,采用随机梯度下降算法。利用决定系数(R2)和均方根误差(RMSE)评价模型的模拟效果。R2越高、RMSE越小,说明模型所预测的效果越好。R2最大为1,RMSE最小为0。
2 结果与分析
2.1 土壤光谱特征
图3 为经过Savitzky-Golay 平滑处理后的不同处理土样的光谱特征值。同一含水率下,含盐量上升导致氮光谱反射率下降(图3(a)),光谱反射率的最大差值波段为1 909 nm,处理间最大相差4.24%;同一含水率条件下,含氮量升高导致盐光谱反射率下降(图3(b)),光谱反射率的最大差值波段为1 895 nm,处理间最大相差7.01%。同一含氮量条件下,含水率升高导致盐光谱反射率上升(图3(c)),光谱反射率的最大差值波段为1 870 nm,处理间最大相差2.34%;同一含氮量条件下,含盐量升高导致水光谱反射率下降(图3(d)),光谱反射率的最大差值波段为1 894 nm,处理间最大相差5.01%。同一含盐量条件下,含水率升高导致氮光谱反射率上升(图3(e)),光谱反射率的最大差值波段为1 870 nm,处理间最大相差4.27%;同一含盐量条件下,含氮量升高导致水的光谱反射率下降(图3(f)),光谱反射率的最大差值波段为1 895 nm,处理间最大相差7.01%。
图3 经Savitzky-Golay 平滑处理的不同处理土样的平均光谱值Fig.3 Average spectrum of soil samples in different treatments after Savitzky-Golay smoothing
采用皮尔逊相关系数筛选出土壤水、氮、盐的特征光谱波段。图4 为土壤水、氮和盐的皮尔逊相关系数及其显著性。在350~2 500 nm 范围内,土壤水分与光谱反射率呈正相关,但不显著(P>0.05);在1 900 nm 附近的相关性最高,相关系数约为0.6。在350~2 500 nm 范围内,土壤含氮量与光谱反射率呈显著负相关(P<0.05);在512~2 500 nm 范围内,土壤含氮量与光谱反射率的皮尔逊相关系数在-0.8~-0.6 之间。在350~2 500 nm 范围内,土壤电导率与光谱反射率呈显著负相关(P<0.05),在1 878 nm处的皮尔逊相关系数为-0.8。
图4 土壤含水率、含氮量、含盐量与光谱特征值的显著性及皮尔逊相关系数Fig.4 Significance and Pearson coefficient of soil water, nitrogen, and salt content with the characteristic value of the spectrum
2.2 土壤氮(TN)量反演模型的建立与验证
不同模型对训练集的预测效果如图5 所示。32个主成分的PLSR 模型的R2与RMSE均优于SVR 模型与BPNN 模型。分别对56.5、64.7、56.5、64.7 g/kg含氮量下不同组合处理TN 量进行反演,R2最高的是56.5 g/kg 处理下PLSR 的TN 反演模型,R2为0.576 9,RMSE为6.9 mg/L;R2最低的为56.5 g/kg 与64.7 g/kg组合处理下BPNN 的TN 反演模型,R2仅为0.146 7,RMSE为6.157 mg/L。就RMSE而言,预测值与实测值最接近的是64.7 g/kg 含水率处理下的PLSR 模型,RMSE为5.12 mg/L。BPNN 模型反演土壤含氮量时,无论是针对单一含水率处理还是2 个含水率处理都存在下限阈值。56.5 g/kg 含水率处理下土壤含氮量反演下限阈值为3.619 mg/L,64.7 g/kg 含水率处理下TN下限阈值为5.257 mg/L;而含水率为56.5 g/kg 和64.7 g/kg 组合处理下TN 反演的下限阈值为4.297 mg/L。
图5 不同土壤含水率条件下土壤含氮量实测值与高光谱反演模型预测值的对比Fig.5 Comparison between the measured and predicted values of soil nitrogen content with the hyper-spectral inversion model under the different conditions of soil water content
2.3 土壤EC 反演模型的建立与验证
图6 为PLSR、SVR 和BPNN 构建的土壤EC反演模型的预测效果。R2最高的是64.7 g/kg 含水率处理的PLSR 模型,为0.555 6。R2最低的是2 个含水率处理组合的BPNN 模型,为-0.924 4。就RMSE而言,预测值与实测值最接近的是64.7 g/kg 含水率下的PLSR 模型,RMSE为257 μS/cm,最差的是56.5 g/kg 和64.7 g/kg 含水率处理下的SVR 模型,RMSE为530 μS/cm。
图6 不同土壤含水率条件下土壤电导率实测值与高光谱反演模型预测值的对比Fig.6 Comparison between the measured and predicted values of soil electrical conductivity with the hyper-spectral inversion model under the different conditions of soil water content
2.4 土壤含水率反演模型的建立与验证
由于仅有64.7、56.5 g/kg 的2 个含水率处理,因此,将2 个含水率处理合并进行含水率预测。不同模型对训练集的预测效果如图7 所示。PLSR 模型的预测精度最高,R2为0.662 4,RMSE为0.315 3。SVR模型最差,相关系数为0。
图7 56.5 g/kg 与64.7 g/kg 混合水处理下的测定和预测含水率对比Fig.7 Measurement and prediction of the water content of the water treatment of 56.5 g/kg and 64.7 g/kg
3 讨 论
高光谱对土壤中水、氮、盐的反演精度较高[24-26],这是由于在单一因素下可以放大某一因子的特征波段。本试验对土壤设置水、氮、盐3 个因子,研究结果可应用于土壤盐渍化地区。光谱在1 900 nm 附近的波谷受到水、氮、盐3 种因素的影响,含水率越低,氮、盐量越高,1 940 nm 之后波段主要受氮量影响。土壤含水率与光谱反射率呈正相关。随着土壤含水率的升高,光谱反射率整体呈上升趋势,这是因为沙土的持水能力较低,添加的水分在沙土表面形成水膜,水膜的镜面反射导致反射率上升。张世文等[27]、刘秀英等[28]、刘伟东等[29]研究表明,水分会吸收1 400、1 900 nm 附近的特征波段光。本研究筛选出盐碱土的水分特征波段在1 900 nm 附近,决定系数略低于已有研究结果。这主要是因为氮和盐吸收了1 400 nm处的光线。孙建英等[30]研究发现,氮在1 827、1 901、2 090、2 240 nm 的4 个波段的相关系数较高。本试验下土壤氮量的特征波段为1 490~1 506、1 540~2 006、2 011~2 500 nm。随着土壤含盐量的增加,土壤光谱反射率呈下降趋势,这与穆其尔等[31]的结果一致。Srivastava 等[32]研究发现,1 390~2 400 nm 波段的反射率与土壤盐量相关性较高。
多因素影响下的土壤水、氮、盐反演模型中,偏最小二乘回归模型反演水、氮、盐量的相关系数均高于支持向量机和BP 神经网络,偏最小二乘回归的均方根误差最小。同一水分条件下,随着含氮量与含盐量的增加,光谱反射率逐渐降低,并且低浓度NaCl溶液与碳酸铵溶液在光谱反射率上的整体差距不明显,导致输入到模型中的光谱区别不大。偏最小二乘回归对土壤含水率的预测效果最好,这是因为同一水处理内部水分差距较小,不同处理间水分差距较大。土壤含水率反演的R2最高为0.662 4,低于裴承忠等[33]的结果。土壤盐量反演的R2最高为0.555 6,也略低于裴承忠等[33]的结果,这是由于电导率反映的是土壤中全部水溶性盐的导电性能,土壤中的盐分组成较为复杂,且尿素溶于水生成碳酸铵会使电导率上升,导致光谱反射率曲线发生偏移,致使盐的特征波段信息不全,降低模型对盐的预测能力。土壤氮量光谱差异显著,特征明显且波段多,R2最高为0.576 9。
4 结 论
1)南疆盐碱土的水光谱特征波段为1 900 nm,氮光谱特征波段为1 490~1 506、1 540~2 006、2 011~2 500 nm,盐光谱特征波段为1 880~1 883 nm 和1 890~1 942 nm。
2)水分会使南疆盐碱土光谱反射率上升,氮和盐会使南疆盐碱土光谱反射率下降。
3)在水、氮、盐共同影响下,建立了基于高光谱的土壤水、氮、盐反演模型,偏最小二乘回归模型的估算精度最高。
(作者声明本文无实际或潜在的利益冲突)