干旱区绿洲耕层土壤重金属铬含量的高光谱估测
2022-01-07王雪梅玉米提买明毛东雷梁婷
王雪梅 ,玉米提·买明 ,毛东雷 ,梁婷
1. 新疆师范大学地理科学与旅游学院,新疆 乌鲁木齐 830054;2. 新疆维吾尔自治区重点实验室(新疆干旱区湖泊环境与资源实验室),新疆 乌鲁木齐 830054;3. 新疆师范大学科研处,新疆 乌鲁木齐 830054
随着现代化工农业的迅猛发展,土壤重金属污染问题越来越突出,已严重威胁到生态环境的健康发展和粮食安全。作为国际社会公认的三大致癌金属元素之一,土壤铬Cr污染以其毒性大、隐蔽性强和难降解等特点对农牧业以及人体健康造成了极大的危害(Li et al.,2014;Rinklebe et al.,2019)。因此,快速、准确监测和掌握土壤重金属铬含量对预防和治理铬污染具有十分重要的现实意义(Khosravi et al.,2021)。传统调查方法在获取土壤铬含量信息时,需要进行大量的野外取样和实验室观测,具有时间周期长、费用成本高的特点,且无法准确掌握土壤铬含量的空间分布信息。而高光谱遥感技术则可实现大范围快速、准确监测土壤铬含量及其空间分布特征(陈元鹏等,2019)。目前,众多学者采用多种光谱变换方法开展了土壤重金属铬含量的反演研究,有效提高了光谱数据与土壤重金属含量的相关性(Tan et al.,2020;贺军亮等,2019;陈宇波等,2020)。路杰晖等(2018)利用灰色关联度模式识别方法对山东省烟台市土壤重金属铬含量进行了定量估测,结果表明光谱变换结合灰色关联度修正模型具有较好的估测效果。张明月等(2019)通过11种光谱变化方法采用偏最小二乘回归模型对土壤铬元素进行反演,认为平方根一阶微分模型能够较好地定量预测铬含量,且反向光谱吸收积分处理可显著改善铬含量反演模型的精度和稳定性。章琼等(2020)采用像元二分模型提取了的Landsat 8遥感影像的土壤光谱反射率,并运用倒数对数变换处理构建土壤重金属 Cr含量的三次多项式估算模型,从而对湖南岳阳耕地土壤 Cr含量进行准确反演。Tan et al.(2020)、Wang et al.(2020)和赵玉玲等(2020)研究表明,偏最小二乘回归、BP神经网络和随机森林回归模型对土壤重金属含量具有较高的估测精度和稳定性。对原始光谱反射率进行多种变换处理可更为准确反映土壤信息的微小差异,同时选择合适的反演模型将有效提高土壤重金属的估测精度。
新疆南疆绿洲区作为新疆重要的粮食主产区和经济林果产品生产基地,其耕地质量的优劣直接影响了我国的粮食安全。近年来,随着南疆石油化工产业的迅猛发展以及农药化肥的不合理使用,铬、铜、铅、铜、镉和砷等重金属元素广泛存在于耕层土壤中。由于土壤铬常以三价态和六价态存在于自然界中,且毒性大、难降解,具有强致癌性。故在南疆绿洲区开展重金属总铬含量的高光谱遥感监测研究具有重要的现实意义和应用价值。以新疆南疆渭干河-库车河三角洲绿洲耕层土壤为研究对象,通过野外样品采集和室内测定对原始土壤光谱反射率经多种数学变换处理与土壤重金属铬含量进行相关分析,提取与铬含量密切相关的特征光谱波段,并采用多元线性逐步回归(Multiple Linear Stepwise Regression,MLSR)、偏最小二乘回归(Partial Least Squares Regression,PLSR)、BP神经网络(Back Propagation Neural Network,BPNN)以及随机森林回归(Random Forest Regression,RFR)方法构建渭干河-库车河三角洲绿洲耕层土壤铬含量的估测模型,从而选择最优反演模型对土壤重金属铬含量的空间分布格局进行预测,其研究结果为快速、准确监测土壤铬含量提供科学依据。
1 材料与方法
1.1 样品采集与制备
渭干河-库车河三角洲绿洲位于新疆南疆塔里木盆地北缘,中天山南麓,是典型而完整的扇形平原绿洲。辖区包括库车市、新和县和沙雅县,是阿克苏地区最大的灌溉区,也是新疆主要的产棉区之一。土壤类型主要有潮土、棕漠土、灌淤土,草甸土,沼泽土和盐土等。粮食作物以小麦(Triticum aestivum)和玉米(Zea mays L.)为主,经济作物主要有棉花(Gossypium spp)、红枣(Ziziphus jujuba Mill.)、核桃(Juglans regia L.)和杏(Armeniaca Mill.)等,荒漠植物主要有胡杨(Populus euphratica)、柽柳(Tamarix ramosissima)、盐节木(Herculaneum strobilaceum)、盐穗木(Halostachys caspica)、芦苇(Phragmites australis)和骆驼刺(Alhagi sparsifdia)等(黄晔等,2018)。2019年7月中下旬以遥感影像及地形图为参考底图,根据研究区不同土地利用类型手持GPS进行随机布点。采集土层深度为0—20 cm,共采集98个土壤样品(图1)。每个样点分别进行GPS精准定位和景观拍照。土壤样品经实验室自然风干,挑出杂物,研磨过筛处理后按照四分法分为两份,其中一份送至新疆分析测试研究院,由工作人员通过火焰原子吸收分光光度法对土壤重金属总铬含量进行测定,另一份则用于高光谱数据的采集。
图1 采样点分布图Fig. 1 Distribution of sampling points
1.2 高光谱数据的采集与处理
采用ASDFieldSpec3光谱仪在室外空旷场地,选择晴朗天气中午12:00—14:00光照条件良好状态下测定光谱。采集光谱范围为350—2500 nm,光谱采样间隔为1 nm。在采集光谱数据之前,要先进行光谱仪白板校正,且测量时要远离干扰土壤光谱的物体。首先按照样品顺序将土样均匀覆盖在牛皮纸上,保持3°视场角的探头且探头与样品的垂直距离为15 cm。对每个样品重复测量10次,并取其平均水平作为样品的光谱反射率值。通过剔除水分吸收波段 1341—1400 nm 和 1811—1950 nm,采用MATLAB软件进行Savitzky-Golay噪声平滑处理以及原始光谱反射率(R)的倒数(1/R)、对数(lg(R))以及倒数对数(lg(1/R))变换,并分别对原始光谱与3种变换结果进行一阶微分和二阶微分处理,为快速筛选特征波段提供依据。
1.3 构建反演模型与精度检验
通过MATLAB R2018b软件使用多元线性逐步回归、偏最小二乘回归、BP神经网络和随机森林回归方法构建反演模型,其中多元线性逐步回归和偏最小二乘回归模型的最佳潜在变量按照入选波段的数量而定;BP神经网络和随机森林回归函数可通过多次的模型调试后最终确定。检验模型的预测精度主要通过决定系数Rd2、均方根误差RMSE和相对分析误差RPD最终确定。其中Rd2越大,RMSE越小,则模型估测值和实测值的拟合效果越好,RPD越大则说明模型的预测能力越好,精度越高(王涛等,2018)。
1.4 空间分布图的制作
通过分析比较筛选出土壤重金属铬含量的最佳反演模型,并根据估测结果采用ARCGIS 10.5软件的地统计学分析模块对土壤重金属铬含量的空间分布格局进行预测,绘制铬含量的空间分布图。
2 结果与分析
2.1 土壤重金属铬含量与光谱特征分析
通过对研究区 98个样品土壤重金属铬含量的基本特征进行统计(表 1),总样品土壤铬含量在15—86 mg·kg−1之间变动,中位值和平均值分别为51 mg·kg−1和 52.2 mg·kg−1,标准差为 13.31 mg·kg−1,偏度和峰度分别为 0.34和 0.33,变异系数为25.48%,属于中等程度的空间变异。根据国家《土壤环境质量农用地土壤污染风险管控标准 (试行)》(GB 15618—2018)规定,当土壤pH值>7.5时,土壤重金属铬含量污染的风险管控值为 250 mg·kg−1(中华人民共和国生态环境部,2018)。据调查结果显示研究区土壤pH值平均水平为8.7,土壤铬含量平均值为52.2 mg·kg−1,远未超过该标准,故认为研究区耕层土壤目前不存在重金属铬污染风险。为了确保估测模型的准确性,根据所调查样品重金属铬含量的取值范围在不同含量等级分别等间隔抽取样品构成训练集和验证集。两组数据的变异系数分别为24.37%和28.38%,空间变异均属于中等水平,变异程度较高,构建的模型具有代表性。
表1 土壤重金属铬的基本统计特征Table 1 Basic statistical characteristics of soil samples
根据采集的所有样品光谱反射率绘制总样品光谱曲线,同时按土壤样品重金属铬的最高含量、最低含量和中等含量对应的光谱反射率分别绘制光谱曲线(图2)。通过分析光谱曲线的变化特征后发现,不同铬含量的光谱反射率曲线大致有相同走向,在350—600 nm范围内,随着波长的增加,反射率呈现快速上升趋势;在 600 nm以后,除在1400、1900、2200 nm附近存在水分吸收谷外,曲线整体上较为平缓,且表现为可见光波段的反射率小于近红外波段。随着土壤铬含量的不同,其反射光谱曲线有明显差异,说明光谱反射率与土壤铬含量具有一定的相关性,通过高光谱数据反演土壤重金属铬含量具有一定的科学依据。
图2 不同含量土壤重金属铬的光谱曲线Fig. 2 Spectral curves of organic matter content in different grades
2.2 光谱反射率与土壤铬含量的相关分析和特征波段提取
分别对原始光谱反射率R以及经倒数1/R、对数 lg(R)以及倒数对数 lg(1/R)转换的光谱反射率与土壤铬含量进行相关分析。由图表可知(图 3、表2),原始光谱反射率R与对数处理后的光谱反射率lg(R)与土壤重金属铬含量呈负相关关系,倒数 1/R和倒数对数 lg(1/R)则与重金属铬含量存在正相关关系。4种光谱反射率与土壤铬在可见光波段具有极其显著的正负相关性(P<0.001),且特征波段主要分布在可见光的350—600 nm范围内,最大相关系数为0.487。在近红外波段,土壤铬含量与光谱反射率则无明显的相关性。总体而言,原始光谱反射率R及3种数学变换后的光谱反射率与土壤铬含量之间的相关性较低,且仅在可见光的部分波段具有相关性。
表2 不同变换下的特征波段及对应相关系数Table 2 The characteristic bands under different transformations
图3 土壤铬含量与不同数学变换后的光谱反射率的相关分析Fig. 3 Correlation analysis of soil organic matter content with spectral reflectance and its mathematical transformation
进一步对原始光谱及3种数学变换后的光谱反射率做一阶微分和二阶微分处理(见图4和表2),发现微分变换后的光谱反射率与土壤铬含量之间的相关性得到很大程度的提高,且经二阶微分处理后光谱反射率与土壤铬含量的相关关系表现得更为密切,最大相关系数可达0.669(P<0.001)。通过显著性检验的特征波段由可见光范围扩展至近红外的800—1000 nm以及1200—2400 nm附近,特别是经 (1/R)′、[lg(R)]′和[lg(1/R)]′3 种变换处理后相关显著的特征波段数目有明显增加。研究结果说明通过一阶和二阶微分变换可以有效降低光谱数据收集过程中环境因素的干扰或消除基线漂移,有助于吸收光谱特征的增大和有效波段的获取。本研究最终选取特征波段的原始及3种数学变换后的一阶微分和二阶微分光谱反射率作为自变量,土壤重金属铬含量作为因变量,采用多元线性逐步回归(MLSR)、偏最小二乘回归(PLSR)、BP神经网络(BPNN)和随机森林回归(RFR)分析方法建立土壤铬含量的高光谱估测模型。
图4 土壤铬含量与微分处理后光谱反射率的相关分析Fig. 4 Correlation analysis of soil organic matter content with spectral reflectance and its transformation
2.3 土壤铬含量的高光谱反演模型的构建
通过对微分处理后的8种光谱变换结果分别采用4种建模方法,构建32个土壤重金属铬含量估测模型。通过对比各建模方法的训练集和验证集的估测结果(表3),由原始光谱反射率的倒数二阶微分(1/R)′′、对数二阶微分[lg(R)]′′和倒数对数二阶微分变换构成的估测模型精度较低,而其它光谱变换的估测模型均具有较高的预测能力,且由一阶微分变换处理构建的估测模型精度明显高于二阶微分处理。进一步对8个MLSR模型的估测结果分析认为,采用多元逐步回归分析方法筛选的 15个特征波段(作为建模自变量)构建的(1/R)′-MLSR模型估测精度最高,训练集和验证集决定系数Rd2均达到0.80以上,均方根误差RMSE在8.5 mg·kg−1以下,相对分析误差RPD在1.8以上,说明该模型具有较好的预测能力,可较为准确估测土壤中重金属铬的含量。采用主成分回归分析方法提取6个主成分因子作为最优PLSR模型的自变量;最优BPNN模型的实验参数最终设置为:输入层数为 224,输出层数为1;隐层数为15,学习率为0.01,学习误差为0.001,分级迭代级数为25。PLSR和BPNN模型以倒数对数一阶微分[lg(1/R)]′模型估测效果最佳,训练集和验证集 Rd2均大于 0.76,RMSE小于 7.6 mg·kg−1,RPD大于2,模型预测能力较好,稳定性高。最优RFR模型则选择默认分类器个数为10,以倒数一阶微分(1/R)′变换构建的模型较其它模型估测效果好,训练集和验证集RMSE最大仅为8.846 mg·kg−1,Rd2和RPD值均较大,具有较高的估测精度和稳定性。
表3 土壤铬含量反演模型的训练集与验证集结果Table 3 Modeling set and validation set results of soil organic matter content inversion models
为了进一步对比各模型的预测效果,选择4种建模方法下预测效果最好的模型,分别以土壤重金属铬含量的实测值与预测值作为横纵坐标绘制散点图(见图5)。从图中可清晰看出4种模型的预测值和实测值基本分布在1꞉1线附近,其中,[lg(1/R)]′-BPNN模型构成的散点与1꞉1线更为贴近,模型的估测精度最高。通过综合比较训练集和验证集估测结果认为,经倒数对数一阶微分[lg(1/R)]′处理后的BP神经网络模型具有较高的估测精度和较强的稳定性,可作为研究区土壤重金属铬含量的最优估测模型。
图5 不同反演模型土壤铬含量预测值与实测值的比较Fig. 5 Comparison of measured and predicted values of soil organic matter content under CWT
2.4 土壤铬含量的空间分布
利用ARCGIS 10.2软件的地统计分析模块简单克里格插值方法分别对渭干河-库车河三角洲绿洲土壤重金属铬含量的实测值和最优模型估测值进行普通克里格空间插值(见图6),两种插值结果所得重金属铬的分布规律大致相同,均呈现出土壤铬含量由西南向东北逐渐递增的总体变化趋势。在最高含量(70—86 mg·kg−1)和最低含量(15—45 mg·kg−1)等级上,两种插值结果有所不同。通过对采集的样本进行分析,认为极高含量和极低含量的样本数量较少是形成二者差异的主要原因,说明样本数量过少会直接影响克里格插值结果的准确性。纵观中间各等级(45—70 mg·kg−1)在两种插值结果上基本保持一致,说明在保证足够的样本数量前提下,采用高光谱技术在反演土壤重金属铬含量方面具有较高的估测精度和准确性。
图6 土壤重金属铬含量的空间插值图Fig. 6 Spatial interpolation map of soil heavy metal chromium content
通过对土壤重金属铬含量的空间分布格局进行分析,发现三角洲绿洲的耕层土壤铬含量平均水平为52.2 mg·kg−1,具有中等空间变异性,低含量区域主要分布在新和县和沙雅县的外缘地带,而库车市的土壤铬含量整体水平较高,特别是位于库车市东北部区域的耕层土壤铬含量达到最高值 86 mg·kg−1。结合实地考察以及文献分析认为,受人类活动的影响渭干河-库车河三角洲绿洲的土壤污染问题日趋严重,尤其是随着库车市石油化工产业的快速发展,该区域耕层土壤重金属铬含量较其它区域呈现出较高含量的空间分布(侯一峰等,2020)。研究区土壤铬含量虽未达到我国农用地土壤污染风险管控标准,但其污染风险依然存在,目前,对土壤铬含量进行遥感动态监测十分必要。
3 讨论与结论
3.1 讨论
采用高光谱遥感技术结合统计模型快速、有效估测土壤重金属元素含量是目前众多学者研究的主要方向。但从研究结果来看,高光谱遥感估测需要依靠大量实验数据的支持,而所得的统计模型在不同实验条件下无法被广泛适用(Liu et al.,2017)。因此,深入探讨土壤重金属元素与高光谱遥感数据间的相关性将有助于提高反演模型的通用性。相关研究表明不同的光谱变换处理能消除不确定性因素对地物光谱信息的干扰,对原始光谱反射率采用多种变换处理在一定程度上提高了光谱与土壤铬含量的相关性,从而快速提升反演模型的预测能力(张贤龙等,2018)。目前,采用多种数学变换处理方法探索光谱数据与土壤重金属元素之间的联系,通过筛选有效波段,结合不同建模方法对土壤重金属元素含量进行精准估测是遥感反演研究的热点(Khosravi et al.,2021)。本研究表明,微分变换处理可显著提高光谱反射率与土壤重金属铬含量间的相关性,且在筛选有效波段数量上,一阶微分变换要明显优于二阶微分。同时,采用深度学习算法模型较多元线性统计模型对土壤重金属铬含量的估测更为准确。为了进一步提高高光谱技术的实用性和反演结果的准确性,使用多光谱协同技术将高光谱遥感反演从实验室研究拓展至大空间范围的复杂实地监测已成为目前高光谱遥感发展的趋势(刘彦平等,2020)。
3.2 结论
采用不同光谱变换处理结合4种建模方法对渭干河-库车河三角洲绿洲耕层土壤重金属铬含量进行高光谱反演,通过筛选特征波段光谱值与 98个样品的土壤重金属铬含量进行高光谱反演模型的构建,并分析对比不同模型的精度和预测能力,可得出以下结论:
(1)对原始光谱反射率R进行多种光谱变换处理,可显著提高光谱与土壤重金属铬含量的相关性,原光谱数据的最高相关系数由 0.464提高到0.669,说明光谱变换处理可将部分细小的光谱吸收特征进行局部放大,有助于通过光谱曲线变化进行土壤属性的识别。
(2)以R、1/R、lg(R)和lg(1/R)经微分处理的特征波段光谱反射率为自变量进行土壤铬含量估测模型的构建,通过综合分析训练集和验证集预测精度,认为以(1/R)′和[lg(1/R)]′为自变量构建的反演模型估测精度较高,其中[lg(1/R)]′-BPNN模型精度最高,训练集和验证集的决定系数均达到0.8以上,均方根误差小于6.5 mg·kg−1,相对分析误差大于2,说明BP神经网络回归模型可更为准确进行本研究区土壤重金属铬含量的估测,一阶微分变换可有效提高模型的预测能力和稳定性。
(3)由研究区土壤重金属铬含量的空间分布图可知,土壤铬含量自西南向东北呈逐渐递增的态势。最低含量位于新和县和沙雅县外缘地带,最高含量出现在库车市东北部区域。采用高光谱遥感数据结合GIS技术可对土壤重金属铬含量进行快速估测和空间分布反演。