APP下载

博斯腾湖湖滨绿洲土壤电导率高光谱估算模型

2021-05-28李新国牛芳鹏靳万贵麦麦提吐尔逊艾则孜

中国土壤与肥料 2021年2期
关键词:微分对数电导率

赵 慧,李新国*,牛芳鹏,靳万贵,麦麦提吐尔逊·艾则孜

(1.新疆师范大学地理科学与旅游学院,新疆 乌鲁木齐 830054;2.新疆干旱区湖泊环境与资源实验室,新疆 乌鲁木齐 830054)

土壤电导率反映在一定水分条件下土壤盐分的实际状况,且包含土壤水分及离子组成等丰富信息[1-2]。土壤电导率是衡量土壤盐渍化的重要指标,与土壤盐分含量有极显著的相关关系,土壤电导率的测定更加简单快捷[3-4],对高光谱信息的反应比含盐量更敏感[5-6]。因此利用土壤电导率快速、准确地获取土壤盐分信息在土壤开发利用和土壤盐渍化防治等方面具有重要的意义[7]。随着高光谱遥感技术的产生与发展,高光谱遥感凭借其分辨率高使得不同地物之间较细微的特征差异被区分和识别出来[8-9]。因此,在进行土壤性质的定量半定量研究中,使用光谱特征进行相关研究成为众多学者关注的热点并取得了重要的成果[10-12]。利用土壤电导率和土壤盐分含量建立高光谱数据的偏最小二乘回归(PLSR)模型发现,构建土壤电导率模型的决定系数和均方根差都优于土壤盐分含量[13]。基于盐碱地的基本土壤性质数据集,采用自适应遗传算法确定支持向量机(SVM)模型的最优自由参数。结果表明,与基于线性和Sigmoid的模型相比,采用径向基核函数(RBF)模型的SVM具有更高的精度[14]。不同区域的盐渍化土壤在反射率和光谱曲线形态上均存在明显差异,但优化光谱指数法有效地克服了盐渍化土壤高光谱特征的区域异质性,与盐渍化土壤高光谱特征的相关性一直较好[15]。利用两波段优化算法对简化光谱指数进行波段优化,优化光谱指数对土壤电导率的敏感程度更强[16]。张文文等[17]利用分数阶微分与铜的相关性分析中,发现分数阶微分可以扩大特征波段的选择空间。以博斯腾湖西岸湖滨绿洲为研究区,运用5种数学变换(分数阶微分、平方根、对数、对数倒数、倒数)预处理土壤高光谱数据,并采用不同预处理方式优化4种光谱指数筛选特征波段,利用PLSR和SVM构建土壤电导率和土壤高光谱数据估算模型。

1 材料与方法

1.1 研究区概况

博斯腾湖湖滨绿洲行政区隶属于新疆博湖县,位于新疆焉耆盆地东南部,地理位置介于E 86°15′~86°55′,N 41°45′~42°10′。其是典型的人工绿洲和自然绿洲混合的山前湖泊绿洲,面积为1360 km2。湖滨绿洲受到博斯腾湖水域的调节,年平均气温8.2~11.5℃,无霜期175.8~211.3 d,年蒸发量1880.0~2785.8 mm,年降水量47.7~68.1 mm,蒸降比高达40∶1。研究区内土壤类型主要有草甸土、沼泽地、灌耕潮土、盐土、风沙土、棕漠土等,地下水埋深1.0~2.5 m,矿化度0.1~10 g/L[18]。湖滨植物有芦苇、柽柳等。由于独特的地理位置,干旱的气候荒漠条件,活跃的地表水以及地下水补给,研究区土壤盐分平均含量为2.84 g/kg[19]。

图1 研究区示意图

1.2 土壤样品采集及测定

土壤采样时间为2019年5月8日,根据研究区土壤类型的现状,结合研究区的土壤盐分状况,采用GPS定位技术,使采样点尽可能遍及研究区范围内的主要土地利用类型,考虑采样点的水文地貌条件、植被覆盖类型以及土壤盐渍化程度等因素,选取11个样点进行土壤采集,每个样点采用分层随机取样的方法,每1层随机采集,3次重复,对0~50 cm的土壤进行人工分层,每个样本点按10 cm为1层,共采集165个样本。将每层重复的样本进行混合,共有55个样本,利用55个样本进行不同深度的模型构建。将土壤样品带回实验室经过前期处理自然风干后除去枯枝、残叶等杂质,磨碎过2 mm网筛后,分装自封袋,用于后续土壤电导率测定和光谱采集,土壤电导率测定按照5∶1的水土浸提液比例进行配置,并用电导仪测定浸提液25℃时的电导率(EC,mS/cm)。从55个代表性的土壤样品中按照土壤电导率值大小的顺序先选3个为建模数据,下一个为验证数据,以此类推,共选取41个样本作为建模集,剩下14个样本作为验证集,如表1所示。

表1 建模集与验证集的电导率描述性统计

土壤光谱测定采用ASD FieldSpec3便携式地物光谱仪,波段范围为350~2500 nm,光谱采样间隔在350~1000、1000~2500 nm波段分别为1.38、2 nm,光谱仪最后数据重采样间隔为1 nm。野外测量需要选择晴朗无风的天气,采集光谱前对光谱仪白板校正,且校正间隔控制在5 min[20],每个土壤样品重复测量20条光谱曲线,取其平均值作为此样本的光谱数据。对均值处理后的光谱曲线去除水分吸收带波段,对去除干扰波段的光谱曲线用Savitzky-Golay滤波方法进行平滑处理。

1.3 数据处理与研究方法

1.3.1 分数阶微分

分数阶微分是将整数阶微分的阶数扩展至任意阶。目前,Grünwald-Letnikov[21-23]定义的分数阶微分较为常用,主要是应用一元函数差分来实现,表达式为:

式中V—阶数,Γ()—Gamma函数,λ—对应的值,n—微分上下限之差。

1.3.2 偏最小二乘回归

采用偏最小二乘回归(PLSR)方法进行建模及验证,PLSR方法融合主成分分析、典型相关分析和多元线性回归分析[18]。在多元线性回归里采用逐步回归,逐步分解输入变量矩阵和输出变量矩阵,并综合考虑提取的主成分对输入变量矩阵和输出变量矩阵的解释能力,直到满足性能要求为止。建模和验证的精度分别用决定系数RC2、RV2,均方根误差RMSEC、RMSEV[24]体现。决定系数用来判定建模的稳定程度,越接近1说明模型越稳定;RMSE用来说明模型的准确度,值越小表示模型的精度越高[25]。

1.3.3 支持向量机

支持向量机(SVM)是Cortes和Vapnik于1995年首先提出来的用于解决函数拟合的问题,SVM一般用于分类和回归两种情况[26]。SVM应用于回归拟合时,是寻找一个最优分类面使得所有训练样本离该最优分类面的误差最小,控制SVM回归的参数主要有惩罚参数c、不灵敏损失参数ε、核函数类型和核函数参数[27]。已有学者研究表明,径向基核函数在土壤盐渍化反演模型中效果更好[28]。因此,本研究基于高光谱数据的土壤电导率估算模型进行回归分析,选择径向基作为核函数,采用训练交叉验证进行参数寻优。

1.3.4 光谱指数

根据研究区土壤盐分离子状况结合前人的研究结果,采用比值盐分指数(RSI,Ratio salt indices)、差值光谱指数(DSI,Difference spectral indices)、亮度光谱指数(BSI,Brightness spectral indices)、归一化光谱指数(NDSI,Normalized difference spectral indices)[16]进行研究分析。Ri和Rj是土壤盐分离子在第i波段和第j波段的土壤光谱反射率。根据全光谱第i波段和第j波段的所有组合计算二维相关系数,绘制形成光谱系数矩阵图。光 谱 指 数 计 算 公 式:RSI=Ri/Rj;DSI=Ri-Rj;BSI=(Ri2-Rj2)0.5;NDSI=(Ri-Rj)/(Ri+Rj)。

2 结果与分析

2.1 分数阶微分光谱反射率与土壤电导率的相关性

由图2可知,通过分数阶微分光谱反射率与土壤电导率进行P=0.01极显著性检验的相关性分析。0.6~0.8阶波段通过极显著性检验的波段数从7增加到95个;1~2阶特征波段与土壤电导率的相关性在正负值之间波动,特征波段分布较相似。0~0.4阶波段相关性值在350~750和1450~1600 nm波段随着阶数的增加,相关系数有逐渐增加的趋势,0.4阶只有2个波段通过极显著性检验,相关系数分别为-0.48、-0.36;0~0.2阶没有通过极显著性检验的波段。

图2 0~2阶分数阶微分变换下的光谱反射率与土壤电导率的相关性分析

统计0~2阶微分通过P=0.01极显著检验的相关系数绝对值最大值及其对应波段,由表2可知,0.4~2阶通过0.01显著性水平的分数阶微分中,2阶的特征波段数量最多,为335。相关性值随着阶数的增加,特征波段数量呈现增加的趋势。相关系数绝对值最大值随着阶数的增加,呈现增加-减少-增加的趋势,2阶的相关系数绝对值最大,为0.64。0.4~2阶的相关系数绝对值对应的特征波段分布为1402、2402、2182、1937 nm。

表2 分数阶微分通过0.01极显著性检验的波段数和相关系数绝对值最大值及其对应波段

2.2 基于分数阶微分-光谱指数的土壤电导率筛选特征波段

采用分数阶微分-光谱指数筛选特征波段,防止数据冗余,以0阶(原始数据)、0.8阶为例(图3和图4)。随着阶数的增加,光谱矩阵系数图中黑色分布范围越大,表明相关系数在正负值之间波动较大。在0阶NDSI的相关系数绝对值最大为0.64;在0.2阶NDSI的相关系数绝对值最大为0.67;在0.4阶NDSI的相关系数绝对值最大为0.68;在0.6阶的NDSI的相关系数绝对值最大为0.71;在0.8阶DSI的相关系数绝对值最大为0.75;在1阶NDSI的相关系数绝对值最大为0.74;在1.2阶的DSI的相关系数绝对值最大为0.74;在1.4阶RSI的相关系数绝对值最大为0.73;在1.6阶DSI的相关系数绝对值最大为0.74;在1.8阶的DSI的相关系数绝对值最大为0.73;在2阶DSI的相关系数绝对值最大为0.74。筛选出4种高光谱数据变化相关性光谱指数较高的光谱矩阵系数图(图5),平方根( )在DSI的相关系数绝对值最大为0.64;对数(lgR)在DSI的相关系数绝对值最大为0.64;对数倒数(1/lgR)在NDSI的相关系数绝对值最大为0.62;倒数(1/R)在NDSI的相关系数绝对值最大为0.64。可见,0~2阶分数阶微分的相关系数绝对值最大值比4种高光谱数据变化的相关系数绝对值最大值大0.11,可见,分数阶微分能更好地挖掘波段信息。

图3 电导率与光谱反射率的0阶光谱矩阵系数图

图4 电导率与光谱反射率的0.8阶光谱矩阵系数图

图5 土壤电导率与不同高光谱数据变化下的光谱矩阵系数图

利用原始数据及5种高光谱数据变化与土壤电导率经过光谱指数筛选出较好的相关性,由表3可知,0.8阶微分、平方根、对数的最优光谱指数是DSI;原始数据、对数倒数、倒数的最优光谱指数是NDSI,其相关性绝对值最大值大小对应变换顺序为0.8阶微分>原始数据>平方根>对数>倒数>对数倒数,因此,分数阶微分预处理对于提高优化光谱指数与土壤电导率的相关性具有一定作用。相关系数绝对值最大值对应波段组合,0.8阶微分波段集中在可见光部分;平方根波段集中在1830 nm;原始数据、对数、对数倒数、倒数的波段集中在2000~2100 nm。

表3 不同高光谱数据变化下的光谱指数和相关系数绝对值最大值及其对应波段组合

2.3 基于分数阶微分-光谱指数的土壤电导率模型构建

采用PLSR和SVM对土壤电导率高光谱数据进行建模。由表4可知,建模集误差相对较大的是原数据和对数,分别达到7.38和9.58,建模集较优的是0.8阶微分和对数倒数,模型精度RC2=0.83和0.85;验证集较优的是对数RV2=0.96,RMSEV=1.12,通过分析建模集和验证集的精度和误差,发现基于0.8阶微分光谱变换和DSI进行波段优化运算后,筛选的优化指数[x1=DSI(634,673)、x2=DSI(634,682)、x3=DSI(1996,2011)、x4=DSI(1997,2001)、x5=DSI(1998,2001)、x6=DSI(634,2228)、x7=DSI(593,2253)、x8=DSI(595,2253)、x9=DSI(596,2253)、x10=DSI(598,2253)、x11=DSI(599,2253)、x12=DSI(600,2253)、x13=DSI(601,2253)、x14=DSI(606,2253)、x15=DSI(607,2253)、x16=DSI(609,2253)、x17=DSI(602,2253)、x18=DSI(604,2253)、x19=DSI(579,2253)]为自变量建立的模型最佳,模型公式为:Y=3.05-6571.58x1-5126.74x2+2757.50x3+3654.55x4+761.07x5-7553.53x6-5850.75x7-38.34x8+8862.43x9+9427.01x10+33987.79x11-7853.02x12-22900.3x13-3513.78x14+1741.29x15-1931.01x16+2788.85x17-4108.78x18+3656.37x19。由表5可知,利用SVM构建的土壤电导率估算模型中,建模集较优的是0.8阶微分和lgR,建模精度分别为RC2=0.89和RC2=0.91;验证集模型精度最佳的是0.8阶微分,建模精度为RV2=0.80。分析验证集和建模集可知,0.8阶微分和DSI筛选的特征波段构建的SVM模型效果较优。

表4 基于PLSR的土壤电导率高光谱估算模型的构建与验证

表5 基于SVM的土壤电导率高光谱估算模型的构建与验证

3 讨论

博斯腾湖西岸湖滨绿洲土壤高光谱分析已有大量研究,涉及到不同盐渍化程度的光谱反射分析[19],采用MSR和PLSR对土壤盐分含量进行建模[11],芦苇地土壤盐分特征高光谱分析[29]等方面,但是基于土壤电导率和土壤高光谱数据,利用分数阶微分优化光谱指数进行特征波段筛选的分析鲜有报道。分数阶微分对于高光谱波段数量多、信息量大的数据,能够较好地挖掘潜在信息,本文中0.8阶微分,通过PLSR和SVM建立的模型都优于其他数据变化建立的模型,此研究结果与亚森江·喀哈尔等[16]研究结果基本一致。从分数阶微分的一维相关性和二维光谱指数的相关性分析,发现分数阶微分的Pearson相关性随着阶数的增加,通过显著性检验的特征波段数量增加,相关系数值也增加,分数阶微分优化光谱指数发现与采用一维相关性展现相似现象,且二维的相关系数绝对值最大值大于一维的相关性值,此研究结果与吾木提·艾山江等[30]研究结果基本一致。采用合适的数学变换对高光谱数据进行预处理,在一定程度上能提高其相关性,分数阶微分凭借其记忆性和非局部性,总体上优于传统预处理方法,并且采用光谱指数和分数阶微分筛选特征波段较传统方法更具有明显的优势[10,30]。利用分数阶微分优化光谱指数构建的土壤电导率估算模型在干旱区绿洲的适用性,有待进一步研究。

4 结论

分数阶微分的高光谱数据与土壤电导率的相关性:2阶的特征波段数量最多为335,相关系数绝对值最大值为0.64。0~2阶相关系数绝对值最大值对应的特征波段分布在1402、2402、2182、1937 nm。

基于分数阶微分优化光谱指数与土壤电导率之间的显著相关性,0.8阶DSI的相关系数绝对值最大为0.75,0阶相关系数绝对值最大值为0.64。随着分数阶微分阶数的增加,光谱矩阵系数图中黑色分布范围越大,表明相关系数在正负值之间波动较大;4种不同数学变化相关性提升效果不明显,平方根、对数、倒数的相关系数绝对值最大为0.64。

利用PLSR和SVM构建土壤电导率估算模型,基于0.8阶微分和DSI筛选的特征波段构建的土壤电导率估算效果较好,PLSR估算模型表达 式 为:Y=3.05-6571.58x1-5126.74x2+2757.50x3+3654.55x4+761.07x5-7553.53x6-5850.75x7-38.34x8+8862.43x9+9427.01x10+33987.79x11-7853.02x12-22900.3x13-3513.78x14+1741.29x15-1931.01x16+2788.85x17-4108.78x18+3656.37x19,模型精度为RPLSRc2=0.83,RMSEPLSRc=1.95,RPLSRv2=0.78,RMSEPLSRv=2.57;SVM估算模型精度为RSVMc2=0.89,RMSESVMc=0.03,RSVMv2=0.80,RMSESVMv=1.12;SVM构建的土壤电导率估算模型最优。

猜你喜欢

微分对数电导率
多飞行器突防打击一体化微分对策制导律设计
容重及含水率对土壤电导率的影响研究
一类带有Slit-strips型积分边值条件的分数阶微分方程及微分包含解的存在性
掺钙铬酸镧-氧化物复合材料的导电性能研究①
明晰底数间的区别,比较对数式的大小
比较底数不同的两个对数式大小的方法
跟踪微分器的仿真实验分析与研究
不同低温处理对桃1年生枝相对电导率的影响
活用对数换底公式及推论
神奇的对数换底公式