利用高光谱估算博斯腾湖西岸湖滨绿洲土壤有机质含量
2021-03-29牛芳鹏李新国靳万贵麦麦提吐尔逊艾则孜
牛芳鹏,李新国*,靳万贵,赵 慧,麦麦提吐尔逊·艾则孜
(1.新疆师范大学地理科学与旅游学院,新疆 乌鲁木齐 830054;2.新疆干旱区湖泊环境与资源重点实验室,新疆 乌鲁木齐 830054)
土壤有机质(SOM)是衡量干旱区绿洲农林业与土壤生态系统平衡的关键参数,是改善区域土地荒漠化、土壤盐碱化和草场退化等环境问题的关键因子[1-2]。高光谱遥感的出现在土壤有机质含量的估算以及土壤环境的检测方面提供了强有力的技术手段,可以低成本、高效率的快速掌握该区域土壤理化性质及其动态变化过程[3-4]。在土壤有机质含量与光谱反射率反演模型上国内外众多学者进行了大量研究[5-8]。Liu等[9]选用混合土地利用类型的土壤样本进行土壤有机质预测,发现在350~800和1900 nm附近的波长对土壤有机质估算有重要意义,且在350~1000 nm波段土壤光谱反射率在每个波长上都不是线性相关的。王延仓等[10]发现采用光谱变换方法与连续小波耦合可提升土壤光谱反射率对土壤有机质的敏感性;Chen等[1]研究香格里拉森林土壤有机质含量的最优高光谱估算模型,结果表明土壤粒径与光谱反射率呈负相关关系,土壤粒径越小光谱反射率越明显,且一阶微分变换可显著增强土壤有机质的光谱信息。于雷等[11]以江汉平原公安县为研究区,通过对多种模型精度的比较发现原始光谱反射率经连续统去除后建立的土壤有机质高光谱偏最小二乘回归(PLSR)预测模型效果最优,验证集决定系数(R2)达0.84。石朴杰等[12]探讨农田土壤有机质含量时发现光谱数据经矢量归一化校正和一阶微分变换后,构建的PLSR模型预测效果显著,决定系数为0.91。林鹏达等[13]运用多元逐步回归(MSR)与PLSR方法构建黑土土壤有机质高光谱估算模型,建模效果均显著,R2≥0.75,均方根误差(RMSE)≤0.25。土壤光谱反射率与土壤理化性质有着紧密的联系。吕雄杰等[14]对自然条件下不同水分含量黄棕壤光谱特征进行了研究,试验结果表明在可见光部分(460~710 nm),土壤含水量与光谱反射率相关性差,而在红外部分(760~1650 nm)土壤含水量与光谱反射率达到极显著负相关。沙晋明等[15]对8种不同环境条件下形成的土壤剖面进行光谱测量,发现土壤有机质与376、676及724 nm波段附近有较强的负相关性。国内关于荒漠[16-17]、平原[18-19]、煤矿区[20-21]等研究较多,干旱区湖滨绿洲土壤有机质含量高光谱估算模型的研究鲜有报道。以博斯腾湖西岸湖滨绿洲为研究区,对采集的115个土样进行土壤有机质含量的试验测量,并通过对光谱反射率进行5种不同形式的变换和预处理优化方法选取特征光谱波段,对比分析MSR与PLSR两种方法,构建土壤有机质含量的高光谱估算模型,以期为干旱区湖滨绿洲土壤有机质含量快速估算提供一种方法。
1 材料与方法
1.1 研究区概况
博斯腾湖西岸湖滨绿洲行政规划上属于新疆博湖县,位于焉耆盆地东南面,开都河下游,是典型的山前湖泊绿洲,地势由西北向东南倾斜;研究区夏季干旱少雨,蒸发强烈;冬季寒冷干燥,年均降水量83.55 mm,年均温8.0~8.6℃,季节过渡快,属于大陆性荒漠气候;主要土壤类型有绿洲潮土、扇缘典型盐土、山地棕色荒漠等;区域土壤有机质含量较低,主要分布在10.00~20.00 g·kg-1之间,耕地土壤有机质含量平均为17.70 g·kg-1[22]。根据研究区的主要土地利用类型、植被覆盖类型和微地形等因素,采样区的范围为200 m×200 m。
1.2 土样采集与制备
土样采集按照蛇形法线路随机布点,采样时间为2019年5月3日,在每个样区采用GPS记录每一样点经纬度坐标与高程数据;在样区布设23个土壤剖面,并进一步分成不同深度(0~10、10~20、20~30、30~40与40~50 cm)取样,每一层分三点取样混匀后采用四分法取0.5 kg土壤,共计115个样品。将土样带回实验室经自然风干后进行物理碾磨过0.25 mm筛,分为两份,其中一份用重铬酸钾容量法-外加热法测定土壤有机质含量,单位为g·kg-1;另一份用作测试室外土壤高光谱数据[23]。
1.3 土壤光谱的测定及预处理
土壤光谱数据测量通过ASD FieldSpec 3地物光谱仪于室外晴朗天气下测定,光谱波长为350~2500 nm,采集时间为12:00~14:00;光纤探头视场角为25°,垂直于土样表面约15 cm处,对每个土样重复测试15次光谱曲线并记录存档;去除光谱反射率大于1的异常值后作均值化处理,得到该土壤样品的实际光谱反射率数据。为减少采集过程中高频噪音对光谱信息的隐藏,提升光谱数据信噪比,运用Origin软件对光谱曲线进行Savitzky-Golay平滑处理[24];由于环境不可控因素,所有光谱曲线统一去除噪声较大的尾部波段(2451~2500 nm)以及受环境水汽影响较大的1300~1450和1800~1950 nm波 段[25];并 对去除后原始光谱曲线分别进行一阶微分(R′)、倒数的一阶微分(1/R)′、连续统去除(Rcr)、对数的一阶微分(lgR) ′、倒数的对数一阶微分(lg1/R)′5种光谱变换。
1.4 模型的建立与评价
采用Kennard-Stone(K-S)算法选择80个土样作为建模样本集,剩余的35个样本作为验证样本集[26]。以变换后的5种光谱敏感波段为自变量,实测的土壤有机质含量数据为因变量,运用Matlab软件完成MSR模型与PLSR模型的建立。模型精度的检验选用决定系数、均方根误差、验证集相对分析误差(RPD)和统计量F进行,其中决定系数的取值范围为0.00~1.00,当决定系数越大、均方根误差越小、统计量F>Fα时模型的拟合程度越高,估算方程越显著;当RPD≥2.00时,模型非常成功;当1.40≤RPD≤2.00时,模型较为成功;当RPD<1.40时,模型不可靠[27]。
2 结果与分析
2.1 土壤有机质含量统计特征
由表1可知,研究区土壤有机质含量变化范围为5.09~44.00 g·kg-1,平均值为16.87 g·kg-1;样本总集变异系数为44.69%,说明研究区土壤有机质含量呈中等变异,样本的离散程度较高。训练样本变异系数为47.02%,验证样本变异系数为37.61%,与样本总集相近,用于模型的构建具有一定的普适性和代表性。由表2可知,在0~10 cm土壤中有机质含量平均值最高,为19.84 g·kg-1,变异系数为39.69%;40~50 cm土壤中有机质含量平均值最低,为14.40 g·kg-1,变异系数最高,为57.53%;20~30 cm土壤中有机质含量变异系数最低,为36.10%;0~50 cm土层中土壤有机质含量随着土壤深度的增加而逐渐减小,土壤有机质含量平均值最大相差5.44 g·kg-1。
表1 土壤有机质含量统计特征
表2 研究区剖面土壤中有机质的含量
2.2 土壤有机质高光谱曲线特征
由图2a可知,在0~50 cm土层中,随着土层深度的增加土壤有机质含量的反射率逐渐升高,40~50 cm土层土壤有机质反射率最高,0~10 cm土层土壤有机质反射率最低,在775、1150、2240 nm波段存在较明显的吸收谷。根据研究区土壤有机质含量的状况,结合前人研究成果,采用K-means聚类分析方法将土壤有机质含量划分为<11.49、12.03~17.66、17.88~26.66、>29.04 g·kg-14类,获得4种不同土壤有机质含量的平均光谱曲线[28]。从图2b可知,4类光谱曲线形状变化基本一致,在400~2135 nm波段反射率与波长呈正相关,光谱反射率随波长升高而增强,在2135 nm波段之后反射率逐渐减弱,与波长呈负相关关系;在可见光波段(400~780 nm)波谱曲线上升速度加快,在短波近红外及部分长波近红外波段(780~1300 nm)上升相对缓慢。有机质含量越高,光谱反射率越低,在400~1750 nm波段变化较明显[29]。当有机质含量<11.49 g·kg-1时,其反射率均值为0.36;当有机质含量在12.03~17.66 g·kg-1时,其反射率均值为0.34;有机质含量在17.88~26.66 g·kg-1时,其反射率均值为0.33;当有机质含量>29.04 g·kg-1时,其反射率均值为0.30。
2.3 土壤有机质敏感波段的选取
将土壤有机质含量分别与变换后的5种光谱数据进行相关性分析,并选择通过显著性检验(P<0.01)的波段作为敏感波段用于模型构建。由图3可知,土壤有机质含量与原始光谱反射率R表现为单一负相关性,通过极显著性检验(P<0.01)的波段数有658个,主要集中在448~1300与1489~1614 nm波段,相 关 系 数0.09<|r|<0.42,在760 nm波段相关性最高;通过微分变换后反射率曲线呈正负波动,放大了原始光谱曲线的细微变化,反射率一阶微分R′与土壤有机质含量在400~504、664~891和1025~1092 nm波段相关性较高,相关系数r最大为0.46,通过极显著性检验(P<0.01)的波段数有423个;连续统去除(Rcr)通过极显著性检验(P<0.01)的波段数明显减少,仅有242个,且相关性的连续性较差,呈极显著相关性(P<0.01)的波段主要在404~440、458~551、601~687和758~813 nm;反射率倒数一阶微分(1/R)′与土壤有机质含 量 在444~906、1003~1093、1171~1297和1541~1646 nm波段范围内相关性较高,相关系数|r|最大为0.50,相关性比原始反射率R提高了19.05%,通过极显著性检验(P<0.01)的波段数有745个;光谱反射率(lgR)′和(lg1/R)′与土壤有机质含量通过极显著性检验(P<0.01)的波段数分别有556、657个,且都主要集中在590~756、770~892、1003~1092与1223~1291 nm波段,相关系数|r|最大值均为0.49,且都主要集中在676 nm左右。综合分析,不同光谱变换下的最佳显著性波段主要集中在590~687、758~892、1003~1092和1171~1297 nm波段。
2.4 模型的对比分析
2.4.1 多元逐步回归模型
由表3可知,基于5种变换形式建模的决定系数在0.41~0.68之间,均方根误差在6.55~8.77 g·kg-1之间,建模精度较差。其中以(lgR)′建模决定系数最高,Rcr模型次之,决定系数分别为0.68、0.65;(1/R)′建模效果最差,决定系数为0.41。从图4可知,(lgR)′模型验证集决定系数为0.66,预测效果最好,均方根误差为4.65 g·kg-1,统计量F达56.19,其次为Rcr、R′模型,验证集决定系数依次为0.63、0.61,均方根误差依次为3.06、3.55 g·kg-1。R′模型验证集决定系数大于建模集决定系数,存在不稳定性,总体来说,在MSR模型中经(lgR)′、Rcr变换下的土壤有机质含量估算模型精度较好。
表3 土壤有机质含量多元逐步回归模型构建
2.4.2 偏最小二乘回归模型
由表4可知,5种变换光谱建立的PLSE模型较MSR模型的决定系数均有所提高,分别增长了15.52%、26.15%、65.85%、22.06%、48.84%,均方根误差分别降低了32.70%、24.43%、35.76%、47.99%、32.84%;5种光谱变换形式的PLSE模型预测能力排序为(lgR)′>Rcr>(1/R)′>R′>(lg1/R)′,其中(lgR)′模型的建模集决定系数最高,均方根误差最小,分别为0.83和4.01 g·kg-1;(lg1/R)′的建模决定系数最低,为0.64,均方根误差最大,为5.89 g·kg-1。由图5可知,(lg1/R)′、R′的验证样品分布较散,偏离1∶1线程度较大,均方根误差分别为4.12、3.86 g·kg-1;Rcr、(1/R)′与(lgR)′模型验证样品在1∶1线偏离程度较低,决定系数均大于0.75,相对分析误差均大于1.40,其中以(lgR)′模型验证效果最好,误差最小,决定系数为0.82,均方根误差为2.64 g·kg-1,相对分析误差为2.30,统计值F为116.41。
对比采用MSR、PLSR两种方法建立的10个数学模型,可知对数一阶微分(lgR)′变化下模型效果均高于其它变换形式,且基于(lgR)′变换下PLSE模型建模集与验证集决定系数分别高于MSR模型22.06%、24.24%,建模集与验证集的均方根误差分别低于MSR模型47.99%、43.23%,表明选用(lgR)′变换下的特征波段所建立的PLSR模型可以更好地实现研究区土壤有机质含量的估算。
表4 土壤有机质含量偏最小二乘回归模型构建
3 讨论
研究表明,随着土层深度的增加土壤有机质含量的反射率逐渐升高,且土壤有机质含量越高光谱反射率越低,在不同深度、不同有机质含量下土壤有机质光谱曲线变化趋势一致[30]。本研究通过样区采集剖面土样115个,主要分析了湖滨绿洲土壤有机质含量的高光谱曲线特征,并构建湖滨绿洲土壤有机质含量的高光谱估算模型,结果表明,最优模型决定系数为0.83,比林鹏达等[13]、南锋等[21]、方少文等[31]最优模型决定系数分别低0.14、0.12、0.07,高于乔娟峰等[32]模型决定系数0.04,表明选用PLSE方法建模效果较一致。土壤光谱反射率能够综合反映土壤内在理化性质,不同区域土壤因其理化特性的差异,土壤有机质光谱的响应波段也不同[33-34]。有机物、含水量和土壤质地是影响土壤光谱反射率的主要因素[35]。土壤水分的存在会改变光的折射率而影响光的散射,司海青等[36]的研究结果表明,去除土样水分可以提高有机质高光谱估算精度。宋金红等[37]发现土壤光谱特性在很大程度上依赖于成土母质。方少文等[31]选取红壤地区土壤有机质的敏感波段560~710 nm进行建模,最优模型为(lg1/R)′光谱变换下PLSR模型;林鹏达等[13]研究表明光谱数据利用连续小波变换方法预处理后结合R′变换,选取400、486、712、821、1770和2416 nm波段建立黑土有机质含量高光谱反演模型精度最高;南锋等[21]选取(lg1/R)′变换下的400~1830、1860~2400 nm波段建立黄土区农田土壤有机质高光谱模型最优;乔娟峰等[32]通过对光谱数据去包络线后选取800~960、1050~1110与2000~2100 nm波段建立荒地土壤有机质高光谱模型最优;本研究土壤有机质高光谱敏感波段主要集中在590~756、770~892、1003~1092和1223~1291 nm,经(lgR)′变换后建模精度最高,这与上述研究在敏感波段的选择上基本一致,但在光谱响应的具体位置存在较小差异,可能与对光谱反射率的预处理方法有关[38-39]。万洪秀等[40]、吴成永等[41]对博斯腾湖流域植被覆盖变化的研究表明,2001~2016年间博斯腾湖流域植被覆盖度指数多年平均值为2.85,植被覆盖度较低,建立植被指数与土壤有机质含量的模型效果不明显。由于不同绿洲土壤有机质组成的差异,土壤水分、土壤母质等因素对绿洲土壤有机质含量的高光谱估算影响有待于进一步研究。
4 结论
研究区土壤有机质含量变化范围为5.09~44.00 g·kg-1,平均值为16.87 g·kg-1,变异系数为44.69%,呈中等变异;不同土壤有机质含量等级的光谱曲线形状较为一致,土壤光谱反射率在400~2135 nm波段随波长的增加而升高,呈正相关,在2135 nm波段之后呈负相关,且在400~1750 nm波段土壤有机质含量越高反射率越低。
反射率(1/R)′与土壤有机质含量的相关性最高,相关系数|r|最大为0.50,比原始反射率R提高了19.05%;土壤有机质的显著性波段(P<0.01)主要集中在590~687、758~892、1003~1092和1171~1297 nm 4个波段。
研究区土壤有机质含量高光谱估算模型为:Y=30428.37X677+12738.78X775+2894.02X865+11589.35X885+5.56,建模集和验证集决定系数R2分别为0.83和0.82,均方根误差RMSE分别为4.01和2.64 g·kg-1,验证集统计量F=116.41(P<0.01),RPD=2.30预测能力较好。