APP下载

基于光谱变换的宁夏银北地区可溶性阴离子反演

2022-10-03陈睿华尚天浩张俊华

中国土壤与肥料 2022年8期
关键词:阴离子反射率反演

陈睿华,孙 媛,尚天浩,张俊华

(1.宁夏大学地理科学与规划学院,宁夏 银川 750021;2.榆林市自然资源调查与规划中心,陕西 榆林 719000;3.宁夏大学生态环境学院,宁夏 银川 750021)

土壤盐渍化是由自然或人类活动引起的一种主要的环境风险,全球大约有8.31亿hm2的土壤受到盐渍化的威胁,约占全球陆地面积的7%[1]。而次生盐渍化的面积大约为7700万hm2,其中58%发生在灌溉农业区,而且这个比例还在增加[2]。土壤盐渍化已经严重影响我国经济、生态的可持续发展,西北干旱半干旱地区尤为严重[3]。宁夏银北地区降水量小且蒸发强烈是其土壤盐渍化严重的源头。土壤阴离子是土壤盐分的重要组成部分,对土壤盐渍化的形成有重要影响[4],对该地区土壤阴离子的准确反演是进行盐碱地改良和盐碱化信息监测的前提。

国外从20世纪60~70年代开始便将遥感技术应用于土壤学的研究之中[2]。研究发现,有机质、铁的氧化物、土壤水分、土壤机械组成、盐分离子等都对土壤光谱特性有重要影响[5-6]。在此基础上大部分学者对盐分、水分、有机质、组成等进行了反演,并取得了较好的效果[7-10],少数学者将眼光聚焦在土壤阴离子上。土壤离子高光谱定量研究的理论依据在于土壤组成盐分、矿物等对特征光谱的吸收或反射。大量的含Cl-可溶盐在表土聚集析出使土壤变“白”,增高了土壤的反射率,1263~1495、1758~2014、2062~2299 nm区间附近波段有Cl-的吸收谷[11],而硫酸盐矿物则会在1795 nm处附近存在对光谱的吸收[12]。同时,土壤含Na+、Cl-及SO42-较多时,NaCl为白色立方晶体或白色颗粒状晶体,Na2SO4则属于单斜晶系,集合体呈致密块状或皮壳状,所以光谱反射率都较高[13];若土壤含Na+、CO32-和HCO3-较高,Na2CO3和NaHCO3与水结合后释出CO2,土壤表面蓬松且有蜂窝状外观,表层相对较粗糙,故表层反射率相对Cl-及SO42-含量高的土壤低;若土壤含Cl-及Mg2+较高,且由于MgCl2具有吸湿性,则土壤表层多呈褐色或暗色,光谱反射率很低[14]。Srivastava等[15]对印度哈里亚纳邦印度恒河平原地区研究表明,1390~2400 nm光谱波段所建立模型对Cl-、SO42-反演较佳,其决定系数(R2)分别为0.920、0.630;Peng等[16]指出利用线性与非线性模型可以准确预测HCO3-、SO42-、Cl-,其R2分别为0.870、0.810、0.650;田安红等[17]对新疆不同人为干扰盐渍化土壤的SO42-进行反演,指出基于logR一、二阶微分对SO42-的反演较佳,R2分别为0.910、0.906;马利芳等[18]利用相关性分析(PCC)筛选敏感波段对Cl-进行反演,最佳反演模型的验证决定系数(Rp2)为0.800;张俊华等[19]利用一阶微分、连续统去除等多种光谱变换建立了对不同土层盐分离子的反演模型,结果发现经过PCC优选的R′变换为CO32-、Cl-、SO42-最佳反演变换。总的来看,现有研究对土壤阴离子反演关注度较少,且研究方法局限于利用数学变换、PCC对阴离子光谱进行变换及敏感波段的筛选,继而建立模型,而光谱变换与PCC之外的敏感波段筛选结合研究方法鲜少。

高光谱数据建模的关键是将光谱数据与实测数据进行有效对接,目前采用的建模方法有主成分回归法(PCR)[20]、偏最小二乘回归法(PLSR)[21]、多元逐步回归法(MSR)[22]、支持向量机法(SVM)[23]、BP神经网络法(BPNN)[24]等。其中PLSR、PCR可以反映光谱数据之间的自相关问题,在进行土壤离子反演的研究中应用最广泛。另外,SVM通过统计学习中的VC维理论和寻求结构风险最小化原理来提高泛化能力,并且能在保证数据精度的同时降低逼近函数的复杂度,在解决非线性问题时具有很多优势[23]。Guan等[25]建立了内蒙古河套的土壤电导率动态预测模型,结果表明SVM模型最佳;贾萍萍等[26]通过SVM模型建立了对宁夏银北地区土壤含盐量等的反演模型;尚天浩等[27]利用光谱变换与SVM建立了土壤含水量的模型,R2达到了0.980;Weng等[7]建立的盐分高光谱定量估测模型R2为0.89。

土壤性质和环境条件的差异性导致相同光谱变换、特征波段筛选方法不同,基于高光谱的土壤盐分及土壤离子反演精度也存在较大差异。宁夏平罗县属氯化物-硫酸盐盐渍土,因此,本文以野外实测土壤高光谱反射率和室内测定土壤阴离子含量为基础数据,对光谱进行了6种数学变换,在利用PCC的基础上增加逐步回归(SR)筛选敏感特征波段进行比较,并利用PCR、PLSR和SVM 3种方法进行建模,以寻求一种适合银北地区土壤各可溶性阴离子含量反演的最佳模型,为同类区域的土壤盐渍化识别和监测等提供理论依据。

1 材料与方法

1.1 研究区概况

宁夏北部平罗县(38°26′60″~39°14′09″ N,105°57′40″~106°52′52″ E)地处贺兰山东麓冲洪积扇平原,属暖温带季风气候,年平均气温9℃,平均日照时数约3008.6 h,利于农作物生长。但由于该区域降水少(平均约173.2 mm)、蒸发强烈(平均约1755 mm)、地质和水文等自然因素复杂加之不合理的农业灌溉,使土壤盐分在地表聚集,是典型的土壤盐碱化地区。研究结果显示,研究区表土平均含盐量达到5.28 g/kg,平均pH值为9.17[26]。研究区土壤类型多为灰钙土、盐土、灌淤土等,土地利用类型有耕地、林地、草地、水域和未利用土地等。因此,研究区利用遥感技术反演土壤盐渍化,对防止盐渍化的进一步加剧及改善生态具有重要意义。

1.2 野外高光谱和样品采集与处理

考虑研究区表土盐分的分布特征及土地利用等因素,在研究区共设置9个样点区(图1)。在冬灌前使用Spectral evolution公司SR-3500地物光谱仪对土壤野外光谱进行测定,其光谱波段探测范围为350~2500 nm。土壤野外光谱选取在天气晴朗,日照充足,风力小的10:00~14:00,在预设样点附近30 m范围内寻找平坦、未经人为扰动的裸地进行光谱测定,在每次光谱测定前先进行白板校正,光谱仪探头设定为距离土壤表面垂直高度80 cm,每个样点光谱重复测定5次,取均值作为该样点最终反射率。

图1 研究区位置与采样点分布

光谱测定后用手持GPS记录经纬度,在光谱测定原点利用土钻采取土壤表层(0~20 cm)土壤,并同时记录四周土地类型与地表覆盖等信息,共采集样本57个。对样品进行实验室室内风干、过筛等预处理后测定各阴离子含量,其中CO32-和HCO3-采用双指示剂滴定法测定;Cl-采用AgNO3滴定法测定;SO42-采用EDTA间接络合滴定法测定。

1.3 光谱变换

噪声对高光谱数据有一定影响,本文基于Sacitzky-Golay法,对原始高光谱反射率数据进行平滑去噪处理,对平滑去噪后的高光谱反射率数据(R)进行以下5种光谱变换:平滑倒数(1/R)、平滑对数(lgR)、平滑倒数的对数lg(1/R)、一阶微分(R′)、二阶微分(R″)。

1.4 特征波段筛选

1.4.1 相关性分析

PCC是指对2个或多个具备相关性的变量元素进行分析,从而衡量2个变量因素的相关密切程度[18]。相关系数绝对值的大小可以表征光谱对离子信息的响应,根据实测高光谱反射率划分区间,将区间内与各阴离子含量相关性最强波段作为敏感波段,根据相关性分析筛选出特征波段,且在P<0.05条件下显著。

1.4.2 逐步回归

SR是一种线性回归模型自变量选择方法,基本思想是将各个波段光谱信息逐步引入,每引入一个新的波段信息后都会对已入选的波段进行检验,将检验判定为不显著的波段进行剔除,以保证引入的波段及其子集中每个波段都是显著的,直至若干次循环后不能再引入新的波段[27]。

1.5 模型与评价指标

基于升序等差取样,将57个样品分为两部分,其中选取38个样品作为训练集,19个样品作为验证集。基于PCC和SR筛选到的敏感波段分别对CO32-、HCO3-、Cl-和SO42-4种阴离子构建PCR、PLSR和SVM模 型。PCR、PLSR建 模 过程中利用训练集交叉验证法选择最佳主成分个数;SVM中核函数类型使用径向基函数,使用网格搜索法(Grid search)进行参数寻优,按照均方差最小原则确定惩罚参数C和核参量g的值[17,19]。PCR、PLSR、SVM模型均在The Unscrambler X 10.4中进行。

模型精度通过建模决定系数(Rc2)、Rp2、均方根误差(RMSE)和相对分析误差(RPD)来综合评价。RMSE越接近0,表示模型精度越高;当RPD<1.0时,表示模型预测能力极差;当1.0<RPD≤1.4时,表示模型预测很差;当1.4<RPD≤1.8时,表示模型具有定量预测的能力;当1.8<RPD≤2.0时,表示模型的预测能力较好;当2.0<RPD≤2.5时,表示模型具有很好的预测能力;当RPD>2.5时,表示模型具有极好的预测能力[28]。

2 结果与分析

2.1 宁夏银北地区土壤阴离子含量统计特征

不同的盐分组成对土壤盐碱化程度有重要影响。研究区实测土壤阴离子含量如表1所示,4种阴离子中Cl-含量最高,其对阴离子总量的贡献度达到52.17%;SO42-含量次之,对阴离子总量的贡献度为39.89%;HCO3-、CO32-的含量对阴离子总量的贡献度仅分别为7.28%、6.60%。根据经典盐碱土分类[29],研究区土壤属于氯化物-硫酸盐盐渍土。实测土壤阴离子中,CO32-与Cl-含量差异较大,属于强度变异,HCO3-与SO42-含量差异较小,属于中等程度变异。

表1 土壤样品阴离子含量统计

2.2 土壤可溶性盐基阴离子光谱响应特征

根据土壤可溶性阴离子含量的差异,对样本进行聚类分析,将土壤中主要阴离子Cl-和SO42-分为4档,其光谱反射率曲线如图2所示。在350~600 nm波段范围内反射率曲线上升趋势明显;601~1350 nm波段范围内反射率上升斜率变小;1351~1850 nm波段范围内反射率先不断下降,之后反射率又呈上升趋势;在1851~2160 nm波段范围内反射率剧烈波动;在2161~2500 nm波段范围内反射率呈现出缓慢下降趋势。随Cl-含量的增大,土壤光谱曲线反射率升高,Cl-含量171.71 mg/kg环境下土壤反射率较低,比大于2027.30 mg/kg含量降低了44%,这与马利芳等[18]研究基本一致。不同SO42-含量光谱反射率变化趋势与Cl-不同,含量大于688.20 mg/kg相比于378.60~688.20 mg/kg的反射率降低18%,说明不同SO42-含量与光谱反射率变化可能存在非线性关系[17]。

图2 不同Cl-、SO42-含量光谱曲线特征

2.3 光谱变换及特征光谱筛选

2.3.1 相关性分析

由图3研究区土壤各阴离子与6种变换光谱反射率的相关性可知,Cl-与6种光谱变换相关性最强,HCO3-次之,CO32-与SO42-相关性较弱。Cl-与各变换方式相关性均较强,其中R、R″和R′效果最好;HCO3-相关性较强的光谱变换方式为R″与R′;与CO32-及SO42-相关性较强的光谱变换方式均为R″与R′。R′、R″、R、1/R4种光谱变换的土壤阴离子含量与光谱反射率的相关性较强,因此,PCC选取以上4种光谱变换进行特征波段的筛选与建模。

图3 不同光谱变换方式阴离子相关性

戴昌达[30]将我国土壤光谱反射特征曲线划分为平直、缓斜、陡坎、波浪4种类型。银北地区光谱反射特征曲线属于缓斜型。根据土壤光谱反射率曲线的斜率特征,将波段分为5个区间,区间内剔除水分影响。基于4种光谱变换,对阴离子进行相关性分析,将各区间内与阴离子含量相关性最大的波段作为敏感波段,并对其进行显著性检验,在0.05水平上显著时选取此波段作为特征波段。土壤阴离子、4种光谱变换与对应波段区间内光谱反射率相关性最大值如表2所示。土壤CO32-和SO42-在R′、R″变换下敏感波段均通过显著性检验,且SO42-敏感波段均通过极显著性检验,因此,对这2个离子的建模采用R′、R″变换下在0.05水平上显著的波段作为特征波段。除HCO3-在1/R变换下2491、2500 nm波段通过显著性检验外,其他敏感波段均通过极显著性检验,Cl-在4种变换下均通过极显著性检验。因此,R′、R″、R、1/R在0.05水平上显著的波段作为特征波段对HCO3-与Cl-进行建模。

表2 不同变换方式下反射率与阴离子含量的相关系数

2.3.2 逐步回归

将6种光谱变换与CO32-、HCO3-、Cl-、SO42-做SR,选取调整R2≥0.50及P<0.05作为特征光谱方程优选阈值。CO32-、SO42-在R′、R″下可以得到特征光谱优选方程,HCO3-、Cl-在R、R′、R″下得到特征光谱优选方程,其结果如表3所示。4种离子的特征光谱筛选均通过显著性检验,CO32-的R″变换、HCO3-的R′变换、Cl-的R、R″变换、SO42-的R′变换均为极显著。SO42-的2种光谱变换均为9条,最少的为Cl-的R变换2条,但其调整R2也达到了0.771。R′变换对4种离子的特征光谱筛选均具有最佳调整R2,波段数量也最多。

表3 逐步回归特征光谱筛选

2.4 土壤阴离子反演模型建立与验证

对阴离子筛选后的光谱变换方法、特征波段分别利用PCR、PLSR和SVM进行建模,构建CO32-、HCO3-、Cl-和SO42-的定量反演模型并进行精度验证。阴离子反演建模结果如表4所示。SR筛选特征波段建模拟合度比PCC更高,其Rc2介于0.431~0.970之间,Rp2介 于0.179~0.940之 间,Rp2与Rc2较为接近,未出现过拟合现象;PCC建立模型的Rp2通常比Rc2值高。在模型预测方面,SR的预测能力更佳。

表4 土壤阴离子反演模型

PCC光谱变换为R′、R″、R、1/R,其中R′和R″的建模结果比R和1/R效果更好;SR光谱变换为R′、R″、R,其中R′和R″建模结果更佳,R对Cl-的建模具有定量预测能力,对HCO3-的预测能力有限。

3种模型中SVM的建模结果最佳,SR-SVM模型Rc2>0.512、Rp2>0.455;PLSR模型在结果上也较为接近SVM,其也可以在一定程度上保证对离子的反演精度;PCR相比于PLSR与SVM结果更差,在PCC下不具有定量反演能力。

本文建立的模型对Cl-和SO42-的反演精度更高,Cl-在R″变换下SR-PCR、SR-PLSR、SR-SVM都具有很好的反演能力,其Rc2、Rp2皆大于0.900,RPD大于3.5,具有极好的拟合和预测能力。SO42-的最佳模型为R″变换下SR-SVM模型,Rc2、Rp2和RPD分别为0.970、0.841和5.59。HCO3-的反演结果相比Cl-、SO42-次之,R′变换下的SR-SVM等模型也具有很好的反演能力。CO32-的反演结果最差,但SR-SVM模型仍具有一定的反演能力。

续表

3 讨论

为提高土壤阴离子反演精度,本研究对土壤高光谱反射率数据进行了平滑去噪。平滑去噪后不同的光谱变换可以放大光谱识别的概率,提高对土壤阴离子的反演精度,但不同的光谱变换其结果具有差异[19]。可溶性盐基阴离子是土壤盐分的重要组成部分,在本研究中R″、R′对4种离子的反演精度较高,这与张贤龙等[31]发现R′、R″等光谱变换对盐分的反演具有较高的精度相一致。R对Cl-的建模也具有一定的定量预测能力;1/R对于可溶性盐基阴离子的反演较差,仅对HCO3-和Cl-通过0.05水平上的显著性检验,且反演精度较低;lgR与lg(1/R)在PCC下与Cl-达显著相关,但与CO32-、HCO3-和SO42-的相关性普遍未达显著水平。代希君等[32]对新疆地区水溶性盐基离子反演中HCO3-和SO42-的最佳光谱变换为lg(1/R)和lgR。研究结果不同主要是由于土壤盐分组成差异造成的,新疆土壤中阴离子以SO42-为主,属于硫酸盐盐渍土,而本研究区以Cl-为主,属于氯化物盐渍土。

选择合适的特征光谱是提高土壤阴离子模型反演精度的关键环节。PCC对特征波段的筛选中,CO32-、SO42-2种离子仅有R′与R″变换筛选的敏感波段通过显著性检验,而HCO3-、Cl-2种离子在4种变换下的显著性更好。SR与PCC相对比建模效果更佳,这与张俊华等[19]和孙亚楠等[33]对于SO42-的研究结果一致。这可能是因为SR作为一种简化的线性模型,不但对敏感波段进行了保留,还更多地考虑了变量间共线性的问题,通过调整入选、排除变量的显著性阈值及迭代次数,进而寻找到最优的解释变量,在保证精度的同时进行简化[34]。

本研究发现,在传统的线性模型中,PLSR模型反演效果优于PCR。一般来说PLSR与PCR主成分的意义可以用权重来解释,但PCR模型可能对于与组分值无关的一些变量有很大的权重,使PLSR模型比PCR模型对组分值会有更好的预测结果[35]。基于机器学习SVM的水溶性盐基阴离子反演精度比起传统的PCR与PLSR线性模型普遍较高,这与刘亚秋等[11]、孙亚楠等[33]在对离子的反演中,SVM的精度高于传统线性模型相一致。这是因为SVM的原理是考虑到离子信息的光谱特征并在高维空间寻求最优解。

本研究在土壤阴离子的反演中,发现光谱对Cl-、SO42-和HCO3-都有较好的反演结果。屈永华等[36]在对内蒙古河套灌区的研究表明,SO42-的反演模型较高,而其他水溶性盐基离子较难预测。而本文对Cl-的反演精度最高,SO42-次之。现有研究中水溶性盐基阴离子反演精度存在的差异性可能是由于土壤母质、土壤成土过程的不同,从而导致土壤中主要离子含量组成的不同,高光谱反射特性机理是对土壤主要离子组成的响应。而本研究区Cl-占水溶性盐基阴离子的52.17%,其反演结果最佳,这与王海江等[37]论述一致。研究发现CO32-利用SR筛选特征光谱相比于PCC显著提高了模型的拟合和预测精度。

4 结论

本研究所在研究区土壤属于氯化物-硫酸盐盐渍土,Cl-和SO42-含量较高,Cl-、CO32-的变异性较大。光谱数据经过R″、R′、R和1/R光谱变换后与土壤阴离子的相关性普遍提高,其中R″效果最好,R′次之。与PCC相比,SR可以更好地剔除变量间共线性的问题,进而筛选特征光谱,SR模型反演结果比PCC模型精度更高。对比4种阴离子反演结果,3种建模方法的精度为SVM>PLSR>PCR。土壤Cl-、SO42-和HCO3-均获得了极好的反演结果,Cl-、SO42-的最佳反演模型为R″-SR-SVM,HCO3-的最佳反演模型为R′-SR-SVM。

猜你喜欢

阴离子反射率反演
反演对称变换在解决平面几何问题中的应用
中红外波段超广角抗反射微纳结构的研究
车灯反射腔真空镀铝反射率研究
叶酸靶向anti-miR-221阴离子脂质体的制备及体外抗肿瘤作用
反演变换的概念及其几个性质
基于ModelVision软件的三维磁异常反演方法
300MW火电厂水汽氢电导率超标的原因及处理方法
高光谱遥感数据下城市植被碳汇的研究
高压电致淋洗液发生器的研制与评价
分步催化制备纳米SiO2减反射膜的性质与结构研究