基于多种高光谱指标反演冻结土壤含水率的研究
2023-07-25侯晨悦杨锡震白旭乾陈俊英栗现文
王 勇,侯晨悦,杨锡震,张 博,刘 浩,白旭乾,陈俊英,栗现文
(1.西北农林科技大学水利与建筑工程学院,陕西 杨凌 712100;2.西北农林科技大学旱区农业水土工程教育部重点实验室,陕西 杨凌 712100)
0 引 言
土壤含水率作为描述土壤物理性质的重要指标之一,与其作物的生长发育息息相关。在当前全球严重缺水以及精准农业概念的背景下,快速精确地监测土壤含水率对于高效用水至关重要[1]。我国横跨高中低3 个纬度区,各地区间气候差异较大,中北部季节性冻融区广泛存在。而在季节性冻融区,土壤冻融会使土壤中的水、热等状况发生复杂的迁移变化,其中土壤的水分相变是重要部分[2]。面对季节性冻融区的气候特点,如何高效监测土壤冻结状态下的含水率是亟需解决的重要问题。
目前土壤含水率的监测方法主要有烘干法、电阻法、中子法、时域反射击法等,每种方法适用不同的情况和精度要求,同时操作难易程度、设备价格、耐用性等也需要综合考虑[3,4]。近年来,高光谱技术在多个领域应用得到突破[5],在植物和土壤含水率监测方面也得到一定的发展[6]。徐金华[7]在研究中利用高光谱原始反射率(Raw Spectral Reflectance,REF)、原始光谱反射率一阶微分(First-order Differential Reflectance,FDR) 和二阶微分(Second-order Differential Reflectance,SDR)的归一化指数来反演土壤含水率。Levy[8]等根据土壤的干、湿和盐渍土的高光谱数据来反演土壤含水率。张智韬[9]等采用偏最小二乘回归(Partial Least Squares Regression,PLSR)、逐步回归(Stepwise Regression,SR)、岭回归(Ridge Regression,RR)3 种模型对4 种光谱指标建立土壤含水率反演模型,得到较好效果。刁万英[10]等通过人工神经网络(Artificial Neural Network,ANN)模型对砂土和壤土的高光谱数据进行分析来反演土壤的表层含水率,较为精确的反演出表层土壤的水分特征。但上述研究多是在土壤未冻结状态下开展的,当土壤处于冻结状态时,土壤水分的相态改变必然影响其对反射光谱的响应特征,进而对水分反演模型产生影响,而针对于冻结土壤含水率的反演模型目前还鲜有研究涉及。
当前各种预测模型层出不穷,包括偏最小二乘回归(PLSR)、多元逐步回归(MSR)、岭回归(RR)[9]、一元线性回归(ULR)等线性回归模型,还包括支持向量机(Support Vector Machine,SVM)、卷积神经网络(Convolutional Neural Networks,CNN)、极限学习机(Extreme learning machine,ELM)等机器学习法,同时各种光谱指标也得到很好的应用,并取得了较好的成果[10,11]。不同种方法各有优劣,各种模型和光谱指标反演土壤的物理性质和指标有不同的反演效果,而高光谱遥感技术对监测各种物理指标均有较好的效果[12]。目前土壤中的液态水在以往的研究中已经得到了很好的反演,但是通过高光谱波段反演土壤冻结状态下含水率的研究较少,通过对比分析不同状态下基于高光谱遥感技术反演土壤含水量的异同,为高光谱遥感技术在我国季节性冻融区的应用提供了理论基础,同时更好的监测土壤冻结状态下的土壤特性,为之后高光谱遥感技术的应用拓宽了领域。
基于此,本研究以河套灌区盐渍化土壤为对象,通过ASD 地物光谱仪采集冻结与未冻结土壤样本的原始光谱,并对原始光谱反射率进行标准正态化(Standard Normal Variable,SNV)、倒数之对数(Logarithm of Reciprocal,LR)、一阶微分(FDR)和二阶微分(SDR)等数学变换,建立冻结与未冻结状态下基于不同光谱指标的土壤含水率高光谱反演模型,对比两种土壤状态下不同处理方式以及模型之间反演效果,以获取最佳的光谱指标和模型,为我国季节性冻融区土壤含水率的遥感反演提供一定的理论基础和技术支撑。
1 材料与方法
1.1 研究区概况
研究区位于内蒙古河套灌区的沙壕渠灌域(40°52'~41°00'N,107°05'~107°10'E,图1),沙壕渠灌域外观为一狭长倒三角形,地面较为平整,整体地势呈现为南高北低,总面积约为52.4 km2[13,14],为温带大陆性气候,夏季高温炎热,冬季寒冷干燥,土壤状态具有典型的季节性冻融特征。年降水量约为140 mm,年蒸发量约为2 000 mm,年平均气温约为7 ℃,年最高气温约为25 ℃,年最低气温约为-11 ℃[15]。土壤在11 月份开始冻结,到次年5 月中旬才能完全解冻,约有180 d土壤处于冻结状态,冻结深度约为1.0~1.3 m[16,17]。沙壕渠灌域内的土壤质地以砂壤土、粉壤土和壤土为主[18]。
图1 研究区域示意图Fig.1 Schematic diagram of the study area
1.2 土壤采集和样本制备
为保证土壤样品的代表性,从研究区随机选取3 个地块,每一地块随机选取4 个地势平坦的地方作为取样点,采集0~5 cm 的表层土壤均匀混合,得到3 个不同地块的代表性土样。经过风干、碾碎、过2 mm 筛后,按不同比例混合共形成120个试验土样,将试验土样置于内径10 cm、深度2 cm 的培养皿中,装满后用直尺将土壤表面均匀抹平。然后用喷雾器分梯度加蒸馏水,去除3个处理过程中被损坏的样本,最终获得不同含水率(5%~40%)的117 个试验样本,并将试验样本静置48 h 使水分分布均匀,最后放入冰箱中(零下15 ℃,12 h)进行冻结处理,其统计特征如表1所示。
表1 土壤含水率统计特征表Tab.1 Descriptive statistical characteristics of soil moisture content
1.3 光谱数据的获取和处理
本试验中共117个试验样本,在土壤样本冻结处理前后均用ASD Field Spec 3 地物光谱仪在室内采集试验样本的高光谱反射率数据,光谱仪波谱范围为350~2 500 nm,采样间隔为1.4 nm(350~1 000 nm)和2 nm(1 000~2 500 nm),重采样间隔为1 nm。ASD 光谱数据采集过程全部在暗室条件下进行,测量光源选用ASD 公司生产的接触探头,该探头内置100 W卤素反射灯。光源到土壤表面的距离、光源入射角度和探头距土壤表面高度,设置为室内土壤高光谱测试最佳几何参数组合(50 cm、30°、15 cm)[19,20]。在每次测定光谱前,需要进行去除暗电流(防止内部电流影响光谱数据)以及使用标准参考白板进行光谱定标等过程,每个土样进行5 次光谱测量,作为该样本的实测原始光谱曲线。
获得的原始光谱数据进行预处理可以一定程度消除试验条件等因素的影响,主要包括阶跃点处理(Splice Correction)、求平均值处理(Statistics)和剔除边缘波段,并采用Savitzky-Golay(SG)滤波法进一步去噪,得到最终光谱反射率[21]。在此基础上进行标准正态变量变换(SNV)[22]、倒数之对数变换(LR)[23]、一阶微分(FDR)[24]和二阶微分(SDR)变换[25],作为后续数据分析的自变量。
1.4 模型的构建与验证
根据试验的数据量和相关性分析,本研究选择偏最小二乘回归(Partial Least Squares Regression,PLSR)[26]、多元逐步回归(Multiple Stepwise Regression,MSR)[27]、支持向量机学习回归(Support Vector Machine,SVM)[28]和一元线性回归(Unary Linear Regression,ULR)[29]。
选取117 个样本中的2/3 为建模集,剩余的1/3 为验证集。将试验样本按设计的制备顺序,相邻的3个为一组,其中1、3号试验样本选取为建模集,2号试验样本作为验证集,最终选中建模集78个,验证集39个。从图2可以看出,3个样本集之间的样本分布基本一致,建模集和验证集均能很好地体现总体特性。
图2 土壤含水率样本集箱线图Fig.2 Box line diagram of soil moisture content
1.5 模型精度评价
为判断出高光谱反演不同冻结状态盐渍化土壤含水率的可行性和筛选最佳模型,通过建模集决定系数Rc2、验证集决定系数Rp2、均方根误差(Root Mean Square Error,RMSE)和相对误差(Relative Error,RE)来综合评价模型的效果。其中Rc2和Rp2越大越好,最大值为1;RMSE和RE越接近于0,表征模型的准确性越好。
2 结果与分析
2.1 不同处理方法的土壤光谱特征
不同含水率的典型土壤样本的原始光谱曲线如图3 所示。由图3 可知,随着土壤含水率的变化,反射率在两种状态下的变化趋势相似,大多随含水率的增加反射率逐渐降低;在1 400 nm 和1 900 nm 处均有明显的水分吸收谷。但冻结状态下获取的不同含水率土壤高光谱原始反射率的差异更加明显,与土壤含水率的梯度趋势更为清晰[见图3(a)]。
图3 冻结与未冻结状态的土壤高光谱原始反射率曲线Fig.3 Hyperspectral REF curves of soil in frozen and unfrozen states
经过标准正态变量变换(SNV)之后,光谱反射率范围扩大,但光谱曲线更加平滑,波峰和波谷现象也不再明显(图4)。从图4 中可以看出不同含水率的光谱大小范围略有不同,冻结状态下光谱反射率较大,为-1.5~3.0,未冻结状态下的土壤反射率为-1.5~2.0。此外,冻结状态下不同含水率的光谱反射率曲线分离度更清楚,而未冻结状态下400~1 000 nm 的光谱曲线交汇比较密集。整体来看,冻结状态下反射率和土壤含水率的梯度分布更明显。
图4 冻结与未冻结状态土壤高光谱标准正态变量变换反射率曲线Fig.4 Hyperspectral SNV curves of soil in frozen and unfrozen states
与标准正态变量变换不同的是,倒数之对数变换(LR)后未冻结状态的光谱反射率较大(见图5),同时1 400 nm 和1 900 nm处的波峰更高,冻结和未冻结状态的光谱反射率范围分别为0.55~1.30 和0.60~1.35。光谱反射率随土壤含水率的增加而增加,在冻结状态下的土壤含水率和光谱反射率的变化趋势更加统一。
图5 冻结与未冻结状态的土壤高光谱倒数之对数变换反射率曲线Fig.5 Hyperspectral LR curves of soil in frozen and unfrozen states
从一阶微分(FDR)、二阶微分(SDR)变换的反射率曲线来看(见图6和图7),土壤含水率和光谱反射率的大小关系不易区分。但两种状态下经FDR 变换后(见图6),光谱在1 400~1 500 nm 和2 000~2 100 nm 波段处有明显区别:未冻结状态下光谱曲线的范围更大。SDR 处理后(见图7),未冻结状态下的光谱在600~1 200 nm和1 800~2 000 nm波段处反射率更大,同时反射率的分布范围更小。
图6 冻结和未冻结状态土壤高光谱一阶微分变换反射率曲线Fig.6 Hyperspectral FDR curves of soil in frozen and unfrozen states
图7 冻结与未冻结状态土壤高光谱二阶微分变换反射率曲线Fig.7 Hyperspectral SDR curves of soil in frozen and unfrozen states
2.2 基于高光谱原始反射率反演土壤含水率
以冻结与未冻结状态下的原始反射率(REF)为自变量,土壤含水率为因变量,通过PLSR、MSR、SVM 和ULR 建立两种状态下的土壤含水率反演模型,建模与验证结果如表2所示。
表2 冻结与未冻结状态基于高光谱原始反射率的模型效果汇总表Tab.2 Summary of model results base on hyperspectral REF in frozen and unfrozen states
从表2可以看出,冻结状态下,4种模型的建模集Rc2都在0.69 以上,其中PLSR 和MSR 的Rc2在0.90 以上,模型拟合效果极好。从验证集Rp2和RMSEP来看,4 种回归模型均能够反演冻结状态下的土壤含水率:PLSR 的Rp2最大,并且RMSEP和RE最小,反演效果最佳;ULR 的Rp2最小,且RMSEP和RE最大,反演效果最差;MSR 的Rp2与RMSEP 和PLSR 接近,反演效果也较高。未冻结状态下,MSR 的Rc2最大,拟合效果最好;而ULR 的Rc2最小,拟合结果最差。从验证效果来看,PLSR 的Rp2最大,RMSEP和RE最小;MSR 拟合效果略差于PLSR;ULR 拟合效果最差,Rp2最小,且RMSEP和RE较大,但仍能够很好地预测土壤含水率。
对比来看,冻结状态下通过高光谱原始反射率来反演土壤含水率是可行的,但冻结状态对各模型反演土壤含水率的精度均有削弱作用。两种状态下各模型反演精度的总体规律一致,PLSR最佳,MSR略高于SVM,ULR拟合效果最差。
2.3 基于高光谱标准正态变量变换反射率反演土壤含水率
以经过标准正态变量变换(SNV)的光谱反射率指标为自变量,建立冻结与未冻结状态下的土壤含水率反演模型,建模与验证结果如表3所示。
表3 冻结与未冻结状态基于高光谱反射率标准正态变量变换的模型效果汇总表Tab.3 Summary of model results base on hyperspectral SNV in frozen and unfrozen states
从表3可以看出,冻结状态下,4种模型的建模集Rc2均在0.60 以上,PLSR 模型拟合效果很好。从验证集Rp2和RMSEP来看,4 种回归模型均能够反演冻结状态下土壤的含水率:PLSR 的Rp2最大,并且RMSEP最小,反演效果最佳;ULR 的Rp2最小,且RMSEP和RE最大,反演效果最差;MSR的Rp2和RMSEP和PLSR接近,反演精度较高。未冻结状态下,MSR的Rc2最大;ULR 的Rc2最小,拟合结果最差。从验证效果来看,PLSR 的Rp2最大,RMSEP和RE最小;MSR 拟合效果略差于PLSR;ULR 拟合效果最差,Rp2最小,且RMSEP和RE较大,但仍能够很好地预测土壤的含水率。
对比来看,冻结状态下通过高光谱SNV 指标来反演土壤含水率是可行的。同时与原始光谱反演效果不同(表2),冻结状态各模型反演土壤含水率的精度总体上有所提高。两种状态各模型反演精度的总体规律仍表现出一致性,PLSR 最佳,MSR略高于SVM,ULR反演精度最差。
2.4 基于高光谱倒数之对数变换反射率反演土壤含水率
以经过倒数之对数变换(LR)的光谱反射率指标为自变量,建立冻结与未冻结状态下的土壤含水率反演模型,建模与验证结果如表4所示。
表4 冻结与未冻结状态基于高光谱反射率倒数之对数变换的模型效果汇总表Tab.4 Summary of model results base on hyperspectral LR in frozen and unfrozen states
从表4 可以看出,冻结状态下,PLSR、MSR 和SVM 3 种模型的建模集Rc2均在0.70 以上,模型拟合效果较好。从验证集Rp2和RMSEP来看,4 种回归模型均能够反演冻结状态下的土壤含水率:MSR 的Rp2最大,RMSEP最小,反演效果最佳;ULR的Rp2最小,RMSEP最大,反演效果最差;SVM反演精度略高于ULR;PLSR 的Rp2和RMSEP和MSR 接近,反演精度较高。未冻结状态下,MSR 的Rc2最大,ULR 的Rc2最小,拟合结果最差。从验证效果来看,PLSR 的Rp2最大,RMSEP和RE最小,拟合效果最好;MSR 拟合效果略差于PLSR;ULR 拟合效果最差,Rp2最小,且RMSEP和RE较大,但仍能够很好地预测土壤含水率。
对比来看,冻结状态下通过高光谱反射率LR 指标来反演土壤含水率是可行的,而且冻结状态的各模型反演精度有所提高。但冻结状态和未冻结状态下各模型反演精度不同,从Rp2来看,未冻结状态下的模型精度从大到小排序为:PLSR>MSR>SVM>ULR;冻结状态下为:MSR>PLSR>SVM>ULR。
2.5 基于高光谱一阶微分变换反射率反演土壤含水率
以经过一阶微分变换(FDR)的光谱反射率指标为自变量,建立冻结与未冻结状态下的土壤含水率反演模型,建模与验证结果如表5所示。
表5 冻结与未冻结状态基于高光谱反射率一阶微分变换的模型效果汇总表Tab.5 Summary of model results base on hyperspectral FDR in frozen and unfrozen states
从表5 可以看出,冻结状态下,PLSR 和MSR 两种模型的建模集Rc2均在0.81 以上,模型拟合效果很好,其余模型拟合效果较好。从验证集Rp2和RMSEP来看,4 种回归模型均能够反演冻结状态下土壤的含水率:ULR 的Rp2最大,RMSEP和RE最小,反演效果最佳;MSR 的Rp2最小且RMSEP和RE最大,反演效果最差;PLSR 的Rp2和RMSEP和ULR 接近,反演精度较高;SVM 的反演精度一般。未冻结状态下,MSR 的Rc2最大;ULR 的Rc2最小,拟合结果最差。从验证结果来看,SVM 的Rp2最大,RMSEP和RE最小,拟合效果最好;PLSR 拟合效果略低于SVM,MSR拟合效果最差。
对比来看,冻结状态下通过高光谱反射率FD 指标反演土壤含水率也是可行的,但相对而言冻结状态下各模型反演土壤含水率的精度较低,且冻结状态和未冻结状态下各模型拟合效果趋势不同。从Rp2来看,未冻结状态下的精度表现为:SVM>PLSR>ULR>MSR;冻结状态下的总体趋势为:ULR>PLSR>SVM>MSR。
2.6 基于高光谱二阶微分变换反射率反演土壤含水率
以经过二阶微分变换(SDR)的光谱反射率指标为自变量,建立冻结与未冻结状态下的土壤含水率反演模型,建模与验证结果如表6所示。
从表6 可以看出,冻结状态下,MSR 模型的建模集Rc2最大,模型拟合效果极好;PLSR和SVM 2种模型的Rc2在0.81以上,拟合效果较好。从验证集Rp2和RMSEP来看,4 种回归模型均能够反演冻结状态下土壤的含水率。SVM 的Rp2最大,并且RMSEP和RE较小,反演效果最佳;PLSR 的Rp2最小,且RMSEP最大,反演效果最差;ULR 和MSR 的反演精度略低于SVM。但从总体来看,冻结状态下4种模型的反演精度相差不大,效果也较为一般。未冻结状态下,MSR 的Rc2仍然最大,ULR 的Rc2最小,拟合结果最差。从验证结果来看,SVM 的Rp2最大,RMSEP最小,拟合效果最佳;但MSR 和PLSR 出现过拟合现象,其中对PLSR 的反演精度影响较大,Rp2仅为0.252;MSR 所受影响较小,Rp2最大;ULR 的Rp2为0.406,拟合效果较差。
对比来看,冻结状态下通过高光谱反射率SD 指标来反演土壤含水率,效果较差。其中PLSR 和MSR 均表现出较为明显的过拟合现象,整体拟合效果不佳,同时冻结与未冻结状态未表现出明显的差异性趋势。
3 讨 论
本文主要探究在冻结状态下基于高光谱遥感反演土壤含水率的可行性,并从预处理方法和不同模型拟合效果两方面,对比冻结与未冻结状态反演模型的差异。土壤处于冻结时,水分由液态转为固态,获取的高光谱反射率数据也随之变化。单明明[30]的研究表明季节性冻土区不同冻结状态土壤水热变化剧烈;樊贵盛[31]在研究季节性冻融土壤特性时指出,冻结状态下土壤中的水分入渗率更小,表层土壤冻结水会分布的更均匀;同时高光谱遥感技术更多的是对土壤表层湿度信息的获取[32],因此,冻结土壤会通过水热特性变化,进而对高光谱反射率产生影响。对比冻结与未冻结状态下的拟合效果,从图8 验证集决定系数趋势图来看,基于不同光谱指标建立的偏最小二乘回归模型(PLSR)、多元逐步回归模型(MSR)、支持向量机法(SVM)和一元线性回归模型(ULR)来反演冻结状态下土壤含水率均是可行的。
图8 验证集决定系数柱状图Fig.8 Histogram of the determination coefficirnt of the validation set
同时,基于原始光谱反射率(REF)的PLSR 模型的适用性最好,在冻结和未冻结状态均表现最优。非冻结状态下,其他学者的研究也表明,REF-PLSR 的模型组合最佳[9];梁亮[12]等通过高光谱遥感技术获得的16 种新指标反演小麦冠层叶片含水率,其中一阶微分指标得到的拟合效果最佳;程晓娟[33]等利用近地高光谱与TM 遥感影像技术的水分指数(WI)和归一化差异水分指数(NDWI)来反演冬小麦含水率也得到了很好的效果,但从拟合结果来看卫星遥感的拟合效果低于手持式地物光谱仪。
与未冻结状态不同,冻结状态下不仅通过原始反射率能够很好的反演土壤含水率,而且在经过SNV 和LR 处理后也取得了很好的反演效果。对于整数阶微分中的一阶微分FDR 处理,除了MSR 外拟合效果也都有所提高,但是二阶微分SDR处理在两种状态的4种模型中拟合效果均最差。邵丽冰[34]等基于高光谱反射率的分数阶微分变换(Fractional-Order Derivative,FOD)来反演土壤含水率,也表明当微分数阶超过1时,光谱波段和土壤含水率的相关性降低。
对比两种状态下的不同反演模型,冻结状态下利用SNV和LR 指标反演土壤含水率的效果均高于未冻结状态,但是未冻结状态下利用REF 和FDR 反演土壤含水率的拟合效果明显高于其他组合模型。考虑到季节性冻融区的复杂环境,以及土壤反复冻融可能带来的影响,未来研究中,还需进一步从室内拓展到野外田间,更深入地验证高光谱遥感技术在冻结条件下反演土壤含水率的可行性。
4 结 论
本文基于高光谱原始反射率以及经过标准正态变量变换(SNV)、倒数之对数变换(LR)、一阶微分(FDR)和二阶微分变换(SDR)4种光谱指标,建立偏最小二乘回归(PLSR)、多元逐步回归法(MSR)、支持向量机法(SVM)和一元线性回归法(ULR)模型反演土壤在冻结与未冻结状态下的土壤含水率,主要得出以下结论:
(1)通过REF、SNV、LR、FDR 和SDR 指标建立数学模型来反演冻结状态下土壤含水率均是可行的。其中冻结状态下REF-PLSR 组合模型的效果最佳,未冻结状态下FDR-SVM组合模型的效果最佳,对比两种状态下的最佳组合模型发现冻结状态下的拟合效果略低。
(2)从不同光谱指标来看,两种土壤状态下,REF 指标的反演效果最好,SDR 指标的反演效果最差。对比两种状态下不同指标的反演效果发现:SNV 和LR 两种指标在冻结状态下,基于高光谱反射率反演土壤含水率的精度高于未冻结状态,REF、FDR 和SDR 指标在冻结状态下的反演效果低于未冻结状态。
(3)从不同模型来看,PLSR模型在两种状态下运用SNV、LR、REF 和FDR 4 种指标均达到很好的反演效果,但SDR 指标的反演效果在4种模型中效果最差;MSR 和SVM 模型运用5种指标的反演效果相差不大,但两种状态下运用REF、FDR和SDR 指标反演效果差异明显;ULR 模型整体反演效果较差,但是对于FDR指标的反演效果较好。