APP下载

基于分数阶微分的博斯腾湖湖滨绿洲土壤电导率高光谱估算

2021-03-15赵慧李新国靳万贵麦麦提吐尔逊艾则孜牛芳鹏

甘肃农业大学学报 2021年1期
关键词:光谱信息微分反射率

赵慧,李新国,靳万贵,麦麦提吐尔逊·艾则孜,牛芳鹏

(新疆师范大学地理科学与旅游学院,新疆干旱区湖泊环境与资源实验室,新疆 乌鲁木齐 830054)

土壤电导率能间接地反应土壤盐分,两者呈现极显著相关性[1].土壤盐分在土壤中的含量决定了土壤盐渍化等级,土壤含盐量过高,会危害农作物减产或绝收、影响植被生长并间接造成生态环境恶化[2-4].快速、准确的获取土壤盐分信息在土壤开发利用和土壤盐渍化防治等方面具有重要的意义[5].传统土壤含盐量的测定需要耗费时间,且步骤繁琐,而高光谱遥感技术可以充分挖掘光谱信息和构建高精度的模型[6-8].对光谱数据预处理的常用方法有光谱变换、Savitzky-Golay滤波方法、光谱指数构建[9-10]等,而在光谱变换中一、二阶微分在进行土壤含盐量光谱建模中是一种常用的处理方法[11-12].但一阶微分和二阶微分的光谱曲线中间相差较多,导致一些中间的光谱信息会被遗漏掉,而分数阶微分可以挖掘中间的光谱信息,能够使光谱信息被充分利用,且分数阶微分在模式识别和建模等方面被广泛应用[13-15].张文文[16]利用分数阶微分与铜的相关性分析中,发现分数阶微分可以扩大特征波段的选择空间.亚森江·喀哈尔[17]采用分数阶微分优化光谱指数的方式,认为1.6阶微分波段预测效果最佳,精度达到0.84.蒋明[18]提出在不同采样间隔下分数阶微分对土壤重金属的影响.连续投影算法在光谱的多元定量和定性分析中广泛应用,能够从大量的光谱中降低信息冗余度和波段共线性[19].董哲[20]表明利用连续投影算法与玉米叶片SPAD的高光谱估算模型中有较高精度.由于区域土壤结构、土壤质地差异等因素,土壤高光谱的特征波段有所差异,大多学者采用均方根、对数、对数倒数等传统的数学变换对土壤高光谱数据进行处理,效果不明显;而基于分数阶微分处理绿洲土壤高光谱数据进行处理的研究鲜有报道.因此以博斯腾湖湖滨绿洲为研究区,通过分数阶微分处理高光谱数据,采用连续投影算法优选光谱数据与土壤电导率实测值的相关性,构建土壤电导率高光谱估算模型.

1 材料与方法

1.1 研究区概况

博斯腾湖湖滨绿洲行政区划隶属于新疆博湖县,位于新疆焉耆盆地东南部,地理位置介于N 41°45′~42°10′,E 86°15′~86°55′.其是典型的人工绿洲和自然绿洲混合的山前湖泊绿洲,面积为1 360 km2.年平均气温8.2~11.5 ℃,无霜期175.8~211.3 d,年蒸发量1 880.0~2 785.8 mm,年降水量47.7~68.1 mm,蒸降比高达40∶1.研究区内土壤类型主要有草甸土、沼泽地、灌耕潮土、盐土、风沙土、棕漠土等,地下水埋深1.0~2.5 m,矿化度为0.1~10 g/L[21].研究区土壤盐分平均含量为2.84 g/kg,土壤电导率平均含量为14.05 mS/cm[22].

1.2 土壤样品采集及测定

根据研究区土壤类型的现状,结合研究区的土壤盐分状况,采用GPS定位技术,考虑采样点的水文地貌条件、植被覆盖类型以及土壤盐渍化程度等因素,共采集37个样点如图1所示.研究区土地利用类型为耕地与未利用地;土壤类型主要为草甸土、典型盐土、荒漠土、绿洲耕作土;从土壤剖面来看,研究区土壤盐分呈现表聚型,土壤盐分离子中阳离子以Na+和Mg2+为主,阴离子主要以SO42-和Cl-为主[22].每个样点采用分层随机取样的方法,每个样本点范围按10 cm为1层,对0~30 cm的土壤进行人工分层,共采集111个样本.将土壤样品带回实验室经过前期处理自然风干后除去枯枝、残叶等杂质,磨碎过2 mm网筛后,分装自封袋,用于后续土壤电导率测定和光谱采集,土壤电导率测定按照5∶1的水土浸提液比例进行配置,并用电导仪测定浸提液25 ℃时的电导率(EC,mS/cm).从111个代表性的土壤样品中按照顺序选4个为建模数据,下一个为验证数据,以此类推,共选取89个样本作为建模集,剩下22个样本作为验证集,如表1所示.

图1 采样点及研究区示意图Figure 1 Sampling point and location of the study area

表1 建模集与验证集的描述性统计Table 1 Descriptive statistics of modeling and verification

土壤光谱测定采用ASD FieldSpec3便携式地物光谱仪,波段范围为350~2 500 nm,光谱采样间隔在350~1 000、1 000~2 500 nm分别为1.38、2 nm,光谱仪最后数据重采样间隔为1 nm.野外测量需要选择晴朗无风的天气,采集光谱前对光谱仪白板校正,且校正间隔控制在5 min[23],每个土壤样品重复测量20条光谱曲线,取其平均值作为此样本的光谱数据.对均值处理后的光谱曲线去除水分吸收带波段1 340~1 450、1 750~2 020、2 330~2 500 nm[9],对去除干扰波段的光谱曲线用Savitzky-Golay滤波方法进行平滑处理.

1.3 数据处理与研究方法

1)分数阶微分是将整数阶微分的阶数扩展至任意阶.目前,Grünwald-Letnikov[24-25]定义的分数阶微分较为常用,主要是应用一元函数差分来实现,表达式为:

(1)

式中:V为阶数 ,Γ()为Gamma函数,λ为对应的值,n为微分上下限之差.

2)连续投影算法(SPA)在光谱的多元定量和定性分析中广泛应用,是一种向前循环变量筛选,主要是在重叠的光谱信息中消除共线性波段的存在,削弱非目标因素对光谱数据的影响,减少建模变量,提高建模的精准度[19].SPA的计算过程中,先在验证集光谱矩阵中任意筛选一列,计算未被选中的列向量与选中的列向量投影,提取最大投影值,重复此投影步骤,筛选下一波段,循环一次后进行多元定量回归分析,得到验证集最小误差对应的列向量就是最优结果[20].

2 结果与分析

2.1 0~30 cm土壤光谱反射率以及与土壤电导率的相关性分析

由图2可知,0~30 cm土层的光谱反射率变化趋势较为一致,表现为在350~1 750 nm之间土壤光谱反射率随着波长的增加而增加,其中在350~750 nm之间的土壤光谱曲线增加迅速,在2 020~2 330 nm之间,土壤光谱反射率随着波长的增加表现为增加-减少-增加的趋势.土壤反射率最高的是20~30 cm,其次是10~20 cm、反射率最低为0~10 cm.从0~30 cm土层光谱反射率与土壤电导率实测值分析相关性发现,在20~30 cm土层,1 420 nm~2 430 nm的相关系数均大于0.418(P=0.01),最大相关系数值为0.45,0~10 cm和10~20 cm土层的光谱反射率相似,但均未超过P=0.01显著性检验.

图2 0~30 cm土层光谱反射率与土壤电导率通过0.01显著性检验的相关系数值Figure 2 Correlation values between spectral reflectance of 0~30 cm soil layer and soil conductivity passing 0.01 significance test

2.2 土壤光谱的分数阶微分特征

由图3可知,随着分数阶增加,反射率值逐渐减少,其值趋近于0.0阶是原始光谱,0阶随着波段的增加呈现逐渐增加的趋势,在500~1 000 nm增长速率较快,在2 132 nm反射率最大为0.41;0.2阶在2 132 nm反射率最大为0.13;0.4阶在351 nm反射率最大为0.09.从0阶到0.6阶相差较大,从0.6阶到2阶,之间的细节也相差较大.分数阶微分可以实现光谱信息细化,0阶~2阶之间的光谱信息丰富,可以弥补进行整数阶分析时被遗漏的光谱信息,便于深度挖掘和应用光谱信息.

图3 0~2阶微分光谱反射曲线Figure 3 Spectral reflectance curve of 0 to 2 order differential

2.3 分数阶微分光谱反射率与土壤电导率的相关性分析

将土壤电导率值与0~2阶微分光谱反射率进行相关关系分析,并且检验相关系数在0.01水平上的显著性,以寻找特征波段.由图4可知,从通过0.01显著性检验中发现,0~0.4阶,光谱波段与土壤电导率值的相关系数均呈负相关,3条曲线变化趋势相似; 0.6阶和0.8阶特征波段分布较相似,0.8阶的相关系数较大,平均相关系数值为0.51;1~2阶特征波段与土壤电导率值都呈正负相关,特征波段分布较为相似.

图4 0~2阶微分光谱反射率与土壤电导率通过0.01显著性检验的相关系数值Figure 4 Correlation coefficient values of 0~2 order differential spectral reflectance and soil conductivity values passed the 0.01 significance test

由表2可知,通过0.01显著性水平的分数阶微分中,0.8阶的特征波段数量较多,为776.随着阶数的增加,特征波段数量呈现逐渐减少的趋势.相关系数绝对值最大值随着阶数的增加,相关系数值呈现先增加后减少的趋势,1.2阶的相关系数值最大为0.69.0~0.6阶的相关系数绝对值对应的特征波段分布在581~744 nm,0.8阶~2阶相关系数绝对值最大值对应的波段分布在近红外波段.

表2 分数阶微分通过0.01显著性检验的波段数和相关系数绝对值最大值及其对应波段Table 2 Band numbers through 0.01 significant test of each fractional-order differential and maximum absolute value of correlation coefficient corresponding band

2.4 连续投影算法筛选特征波段

在分数阶微分的全波段和与特征波段中,采用连续投影算法(SPA)进一步筛选土壤电导率特征波段,结果如表3所示,在全波段中,特征波段数量最多的是1.4阶,为6个,最少的是1.2阶,为1个,剩下各阶微分特征波段在3~4个,在筛选的波段中0.2阶、0.4阶、0.6阶、1.2阶、1.6阶、1.8阶的波段全部位于近红外波段;在特征波段中,特征波段数量最多的是2阶,为3个,特征波段集中在1 338、1 151、1 446 nm,0~0.8阶和1.2~1.6阶的特征波段数量为1个,在筛选的波段中0.8阶、1.2阶、1.6阶、2阶全部位于近红外波段.

表3 SPA筛选出的特征波段个数及组合Table 3 The number and combination of sensitive bands selected by SPA

2.5 土壤含盐量高光谱反演模型优选

表4 土壤电导率分数阶微分光谱建模与验证Table 4 Modeling and verification of soil conductivity fractional differential spectroscopy

3 讨论

博斯腾湖西岸湖滨绿洲土壤高光谱分析已有大量研究,涉及到不同盐渍化程度的光谱反射分析[22]、采用MSR和PLSR对土壤盐分含量进行建模[10]、芦苇地土壤盐分特征高光谱分析[29]等方面,但是基于分数阶微分进行预处理并利用连续投影算法进行筛选特征波段的光谱分析鲜有报道.研究区的土壤盐分与土壤电导率相关性较高,相关系数为0.98,呈极显著正相关(P<0.01)[10].本文利用土壤电导率与光谱信息采用偏最小二乘回归进行建模,结果表现为分数阶微分模型优于整数阶模型,在1.6阶微分模型为最优模型,与王敬哲等研究结果基本一致[8].利用连续投影算法筛选波段建立的模型精度较高决定系数为0.83,与吾木提·艾山江等研究的分数阶微分建立的模型精度较高的结果基本一致[30].采用连续投影算法能够消除波段共线性,可以提高建模精度,利用连续投影算法筛选的特征波段与全波段进行对比,得到连续投影算法筛选的模型最优为1.6阶.利用连续投影算法筛选基于土壤电导率的高光谱反演模型的机理,有待于进一步研究.研究区盐分呈现为夏季积盐,春季和秋季脱盐的季节性动态变化[21].采集的时间为夏季,土壤表层的土壤电导率较高,土壤高光谱与土壤电导率的一致性较好;0~0.4阶光谱波段与土壤电导率值的相关系数均呈负相关,可能与土地利用方式,土壤类型等有关,其机理有待于进一步研究.

4 结论

1) 0~0.4阶,光谱特征波段与土壤电导率值呈负相关,相关系数呈先增加后减少的趋势0.4阶的相关系数绝对值最大为0.67.0~2阶随着阶数的增加,特征波段数从725增加至776再至498,呈现先增加后减少的趋势;相关系数值随着阶数的增加从0.48至0.68再至0.59,呈现先增加后减少的趋势.

2) 0~0.6阶的相关系数绝对值最大值对应的特征波段分布在581~744 nm,0.8阶~2阶相关系数绝对值最大值对应的波段分布在近红外波段.利用SPA筛选全波段中0.2阶、0.4阶、0.6阶、1.2阶、1.6阶、1.8阶的波段全部位于近红外波段;在SPA筛选特征波段中,0.8阶、1.2阶、1.6阶、2阶全部位于近红外波段.

猜你喜欢

光谱信息微分反射率
影响Mini LED板油墨层反射率的因素
近岸水体异源遥感反射率产品的融合方法研究
具有颜色恒常性的光谱反射率重建
拟微分算子在Hp(ω)上的有界性
上下解反向的脉冲微分包含解的存在性
基于光谱和Gabor纹理信息融合的油桃品种识别
基于地面边缘反射率网格地图的自动驾驶车辆定位技术
基于植被光谱信息的龟裂碱土碱化程度预测研究
傅立叶变换光谱仪的研究现状与光谱信息分析原理
借助微分探求连续函数的极值点