基于地物光谱和Landsat8遥感影像的土壤铅含量反演研究
2019-02-10马磊颜安
马磊 颜安
摘要:随着人类活动的影响,重金属污染逐渐成为土壤和环境研究的重点。采用遥感技术可以克服传统重金属监测过程中的缺点,做到快速、高效地反映重金属空间分布。本文以克拉玛依市某区域为研究区,利用SVC HR-768光谱仪和Landsat8影像对41块土壤样品进行地物光谱和波段反射率的获取,采用相关性分析和偏最小二乘回归的原理,建立地物光谱与Landsat8数据的土壤铅含量反演模型。结果表明,基于一阶微分变换的地物光谱能更好地反映光谱与重金属铅含量的相关性,建立的模型为最优预测模型;通过波段比值和波段差值方式建立的基于Landsat8波段反射率的反演模型精度较好,能粗略预测土壤重金属铅的含量,并且基于Landsat8影像反演的土壤鉛含量空间分布符合土壤样点实测值的空间分布,为今后土壤环境监测土壤重金属含量提供数据支撑。
关键词:高光谱;Landsat8;铅;相关性分析;偏最小二乘法;土壤环境监测
中图分类号:S127 文献标识号:A 文章编号:1001-4942(2019)12-0120-07
Abstract With the influence of human activities, heavy metal pollution has gradually become the focus of soil and environmental research. The application of remote sensing technology could overcome the shortcomings in the process of traditional monitoring of heavy metals and reflect the spatial distribution of heavy metals quickly and efficiently. In this study, the SVC HR-768 spectrometer and Landsat8 images were used to obtain hyperspectral data and band reflectance of 41 soil samples in Karamay City. By using the principle of correlation analysis and partial least-squares regression, the inversion model of soil lead content based on hyperspectral and Landsat8 data was established. The results showed that the first order differential transform could better reflect the correlation between the spectrum and the heavy metal lead content, and it was the best prediction model. The retrieval model based on Landsat8 spectral reflectance established by band ratio and band difference had better accuracy, and could roughly predict the content of heavy metal lead in soil, moreover, the spatial distribution of soil lead content based on Landsat8 model was consistent with the measured spatial distribution of soil sample points, and provided data support for monitoring heavy metal content in soil environment in the future.
Keywords Hyperspectral; Landsat8; Lead; Correlation analysis; Partial least squares regression; Soil environment monitoring
土壤不仅是人们所依赖的环境,也是农业生产中不可缺少的一部分[1]。随着人类活动的不断产生,土壤环境将面临巨大的压力和挑战,主要表现在土壤重金属元素超标和土壤生态功能退化等方面[2]。重金属超标会对人们的生活造成长期且缓慢的影响[3]。因此,对重金属的监测能有效推动土壤环境的监测和保护。
目前,传统土壤重金属监测采用样品采集和化学分析的方法,该方法成本较高,周期较长,并且需要消耗大量人力和物力[4],而采用遥感技术能克服传统土壤重金属监测过程中存在的问题,做到大区域、高效以及环保地监测土壤重金属含量。Cheng等[5]采集了湖北省武汉市郊区的93份土壤样品,发现镉含量预测与土壤有机质密切相关,采用近红外光谱与偏最小二乘模型相结合是快速监测郊区土壤重金属超标的一种替代方法。吴明珠等[6]通过对福州土壤光谱进行数学变换,提取520~530、1 440~1 450、2 010~2 020、2 230~2 240 nm 4个敏感波段,建立了土壤重金属铬的预测模型。
随着遥感卫星的出现,利用遥感卫星数据进行土壤元素研究也逐渐增多。多光谱遥感技术能通过较少的成本研究大区域范围内土壤元素指标的数量和分布情况[7]。Fard等[8]利用偏最小二乘法建立了反射光谱与重金属含量之间的关系,对比了基于Landsat8波段直接反演和间接反演的模型,发现直接反演的精度高于间接反演。姚苹等[9]利用Landsat7影像的波段像元灰度值成功反演石亭江流域中下游土壤铅和镍含量,证明多光谱 Landsat7影像能作为土壤铅和镍含量预测建模的数据源。
本研究通过地物光谱与Landsat8多光谱影像波段分别与重金属铅含量进行相关性分析,提取相关性较大的波段用于建立偏最小二乘回归预测模型,采用决定系数和均方根误差对比不同遥感数据条件下重金属铅的预测模型精度,最后通过Landsat8反演模型预测铅含量的空间分布,预测结果符合实际铅含量的空间分布,说明利用多光谱数据反演土壤某些重金属元素含量具有可行性。
1 材料与方法
1.1 研究区概述
研究区位于新疆维吾尔自治区克拉玛依市境内,为东经85°15′~86°00′、北纬45°38′~46°13′区域,自然坡降约3%,平均海拔在300 m左右。研究区属于典型的温带大陆性荒漠气候,寒暑差异悬殊,冬季积雪较厚,主要农作物有小麦、玉米和棉花等。
1.2 土壤样品采集
采集日期为2017年4月5日,在研究区设置采样间距为300 m×300 m,共采集0~20 cm土层土壤样品41个。采集土样的同时利用手持 GPS 记录所取样点的经纬度,并填写野外土壤样点记录表,研究区采样点如图1所示。土壤样品经风干、磨碎、过0.25 mm筛后分别用于光谱测量和化学测定。模型建立时,每3个样点作为一组,每组从中随机抽取一个作为验证样点,最终得建模样品27份,验证样品14份。
1.3 光谱数据的获取
1.3.1 地物光谱的获取 本研究用于暗室光谱测量的仪器为SVC HR-768型地物光谱仪,范围为350~2 500 nm。在暗室,将样点土壤装在直径为15 cm、深约2.5 cm的黑色器皿内,并用木板刮去超出器皿的土壤,保证待测土壤表面平整光滑。采用1 000 W的卤素灯提供光源,光源照射方向与垂直方向夹角为30°,光源距土壤样品的距离为30 cm,光谱仪裸露光纤距离土壤约15 cm。光谱测定前,光谱仪和卤素灯先预热0.5 h,测定时,每3~5个样点测一次白板,保证测定的精度。光谱仪设置10次平均,每个土壤样品分别测3个方向,每次旋转90°,将30条区域平均后作为该样点土壤的实测光谱数据。
1.3.2 Landsat8多光谱数据的获取 采用Landsat8作为多光谱数据源,数据来源于美国地质调查局(United States Geological Survey,http://glovis.usgs.gov/)。Landsat8共有11个波段,从中选取可见光到红外光的前8个波段,空间分辨率为30 m。对遥感影像进行辐射定标、大气校正等处理后,根据采样点地理坐标位置,从Landsat8影像上提取采样点的多光谱波段数据。
1.4 地物光谱数据预处理
由于光谱仪在测定中会受到光源、視场及仪器本身等因素的影响,产生不同程度的噪声,因此需要对原始数据进行去噪处理[10]。本研究采用9点加权平均移动法进行光谱曲线的平滑降噪处理。
为方便提取土样光谱数据中的特征波段,增强可见光区域光谱差异,将平滑处理后的土样光谱曲线进行一阶微分处理。以一阶微分曲线峰和谷的斜率表示原始反射率变换的最大值和最小值[11]。
一阶微分计算公式:
1.5 土壤重金属含量反演方法
偏最小二乘法(partial least square,PLS)集中了主成分分析、典型相关分析和线性回归分析方法的特点,很好地解决了多重共线性问题,并且容许样本点个数少于变量个数[12]。因此作为本次研究的预测方法。
为了避免建模的主成分过多,导致预测重金属Pb的模型出现过拟合现象,本研究采用交叉验证法中的外部证实算法来选择偏最小二乘回归模型中的最佳主成分数。具体做法:先用建模样点建立主成分个数为1的预测模型,将验证样点中对应反射率带入该模型,计算出预测的Pb含量,再计算预测值和实测值的均方根误差(root mean square error,RMSE);不断增加主成分个数,重复计算不同主成分个数的均方根误差,直到新增主成分使得预测RMSE的减少不超过2%为止,此时的成分数为最佳主成分数,相应偏最小二乘回归模型为预测土壤重金属最优模型。
1.6 精度评价
在模型的验证中,采用决定系数(coefficient of determination,R2)和均方根误差RMSE来判断,决定系数与所建立模型的稳定性呈现正比例关系,均方根误差RMSE与建立模型的预测能力呈现反比例关系,因此模型建立和验证的精度通过R2和RMSE来评价。
式中,n为样本数,Yi为实测值,Y^i为预测值,Y为实测值均值。其中,R2越大,RMSE越小,建模效果越好,建立的模型为土壤重金属铅的最优模型。
2 结果与分析
2.1 地物光谱模型的建立
利用SPSS软件中的相关分析功能对铅含量与实测地物光谱的原始和一阶微分处理后的光谱波段进行相关分析。由图2可知,原始反射率与重金属Pb含量呈单一正相关性,并且相关系数曲线变化较为平缓;反射率经一阶微分处理后与Pb含量的相关曲线则呈现上下波动。根据光谱反射率曲线特征划分波段范围,选择特征波段范围内相关系数最大的波段为敏感波段。敏感波段选取结果如表1所示。以0.01水平显著相关性判断:原始光谱曲线的敏感波段在 377.4、399.0、418.9、421.9、465.8、603.6 nm 附近;一阶微分变换后的曲线敏感波段在395.9、414.3、465.8、1 436.0、1 571.6、1 668.2、2 057.2、2 265.2 nm 附近。以0.05水平显著相关性判断:原始曲线的敏感波段在 873.6、1 022.0、1 382.6、1 917.4 nm附近;一阶微分变换后曲线的敏感波段在377.4、958.5 nm 附近。
利用选取的原始光谱及其一阶微分光谱的敏感波段的反射率作为自变量,样本实测值作为因变量,通过验证均方根误差来选择偏最小二乘回归模型的最佳主成分。由表2可见,2种模型中,原始光谱反射率模型的决定系数较低,经过一阶微分变换后的模型决定系数明显提高。一阶微分可以消除一定的基线变动和平缓背景干扰的影响,提供更高分辨率的光谱和更清晰的光谱轮廓,从而增强土壤中重金属的光谱信息[13]。因此基于一阶微分光谱建立的土壤铅含量反演模型为最佳模型,模型如下:
式中,Y为Pb含量预测值,Xn为第n波段所代表的反射率值。
2.2 多光谱模型的建立
由表3可见,Landsat8影像存在10个与重金属Pb含量相关的波段组合,其中B1-B7、B2-B7这2个波段组合达到极显著水平(P<0.01),B3-B4、B1-B4、B2-B4、B3-B7、B1/B3、B1/B4、B2/B4和B3/B4这8个波段组合达到显著水平(P<0.05)。B1、B2、B3、B4、B7虽然与土壤重金属Pb含量相关不显著,但其组合后与土壤重金属Pb含量则具有较高的相关性,因此,选用这10个影像波段组合建立重金属铅的反演模型。
将Landsat8与重金属Pb含量相关的波段作为自变量,土壤重金属含量作为因变量,采用偏最小二乘回归法建立反演模型。建模R2为0.37,验证R2为0.47,建模和预测效果相对较好(表4)。
多光谱预测土壤重金属Pb模型如公式(5)所示。
式中,Y为Pb含量预测值,Xn为第n波段所代表的反射率值。
2.3 基于地物光谱与Landsat8波段建立模型的对比
将验证样点的反射率带入基于地物光谱和Landsat8波段反演模型中,利用验证样点的Pb含量实测值和预测值绘制散点图,如图3所示。横坐标代表验证样点的Pb含量实测值,纵坐标代表验证样点的Pb含量预测值。
基于原始地物光谱、一阶微分地物光谱和Landsat8波段建立的土壤Pb含量预测模型三者间比较,模型稳定性和建模精度为一阶微分地物光谱>Landsat8波段>原始地物光谱;而所建立的回归模型经验证后,模型稳定性和建模精度为Landsat8波段>一阶微分地物光谱>原始地物光谱。证明:基于一阶微分地物光谱的偏最小二乘回归模型的建模精度与稳定性最高,验证精度与稳定性较高,为预测土壤重金属Pb含量的最优模型;基于Landsat8影像波段的偏最小二乘回归模型建模和验证的精度与稳定性较高,可以粗略地预测研究区土壤重金属Pb含量。
2.4 基于多光谱模型的土壤铅空间分布反演
模型的精度评价仅能反映土壤铅模型预测值与实测值之间数值的差异,很难发现土壤铅预测的空间分布是否符合实际情况。因此,本研究采用ArcGIS中的地统计插值法,得到土壤重金属实测值的空间分布图(图4)。再采用ENVI平台上的波段计算和裁剪功能,利用预处理后的Landsat8影像波段反射率反演出研究区农田土壤铅的空间分布状况(图5)。
对比发现,实测Pb含量和Landsat8反演的土壤Pb含量都主要集中在研究区东部,呈自西向东增加的趋势。基于Landsat8数据反演的铅含量在研究区西部存在少量条形的含量较高区域,经证实,这些区域为道路及其周边土壤。根据Shi等[14]的观点,人类活动是表层土壤铅污染的重要来源,工业废弃物、汽车尾气、生活垃圾等人为污染源是城市表层土壤铅污染最可能的来源。道路及其周边表层土壤中铅的高含量与使用含铅汽油导致的汽车尾气排放的大气沉积有关。因此,基于Landsat8数据反演的土壤铅空间分布符合实际土壤重金属铅的空间分布,说明利用遥感技术反演土壤某些重金属元素含量具有可行性。
3 讨论
重金属元素由于在土壤中的含量较低,在反射光谱中很难有固定的特征范围[15]。农业土壤的重金属含量很少达到高污染水平,因此,从重金属对光谱吸收特征的角度,利用光谱直接预测农业土壤重金属含量将变得非常困难。
Hong等[16]研究了湖北省武汉市反射光谱与农业土壤中Pb和Zn含量间的关系,发现Pb和Zn的光谱检测主要依赖于它们与土壤有机质的共变。土壤有机质是土壤中所有含碳的有机物质,有机质主要通过螯合和络合作用与重金属离子结合,是吸附重金属离子最主要的土壤组分。因此,可以利用有机质与光谱之间的特征,达到预测土壤重金属含量的目的。本研究对此也进行了探索研究:首先计算了41个样点的土壤有机质含量与光谱反射率的相关性,然后利用Microsoft Excel的趋势线功能并基于各波段反射率对重金属进行拟合,结果(表5)显示,反射率与有机质的相关性越高,反射率与Pb含量的拟合效果越好,这与Hong等[16]的结论一致。表明,虽然重金属元素不能直接影响土壤光谱产生固定的光谱特征,但可以通过它们与土壤有机质含量的协同变化,利用反射光谱对其含量进行預测。
4 结论
本研究以实测地物光谱和Landsat8多光谱影像波段为遥感数据源,利用偏最小二乘回归分析方法,结合实地采集土样的Pb含量数据,分析了土壤重金属Pb含量与两种光谱数据的相关性,并分别建立了基于两种光谱数据的土壤重金属Pb含量预测模型,实现了对克拉玛依市某区域土壤重金属Pb含量的反演研究,得到如下结论:
(1)对地物光谱进行一阶微分变换能更好地提取光谱特征波段,所建立的模型为最优模型,能满足预测重金属Pb含量的精度要求。
(2)多光谱影像通过波段差值以及波段比值等方式也能使组合波段与土壤重金属具有较高的相关性,并且基于Landsat8影像数据预测的土壤Pb含量空间分布与基于土壤实测样点铅含量的空间分布相符,证明Landsat8影像对部分土壤重金属具有较好的响应能力,其时间和空间覆盖能力可对将来大区域的土壤重金属含量反演提供帮助。
参 考 文 献:
[1] 龚绍琦, 王鑫, 沈润平, 等. 滨海盐土重金属含量高光谱遥感研究[J]. 遥感技术与应用, 2010, 25(4): 169-177.
[2] 石伟. 汾河水库周边土壤养分和重金属空间分布风险评价[D]. 太原: 山西大学, 2011.
[3] 中国重金属污染现状及国内外植物修复技术发展分析[J]. 有色冶金节能, 2017, 33(4): 62-64.
[4] 吴健生, 宋静, 郑茂坤, 等. 土壤重金属全量监测方法研究进展[J]. 东北农业大学学报, 2011, 42(5): 133-139.
[5] Cheng H, Shen R L, Chen Y Y, et al. Estimating heavy metal concentrations in suburban soils with reflectance spectroscopy[J]. Geoderma, 2019, 336: 59-67.
[6] 吴明珠, 李小梅, 沙晋明. 亚热带土壤铬元素的高光谱响应和反演模型[J]. 光谱学与光谱分析, 2014, 34(6): 1660-1666.
[7] 沈文娟, 蒋超群, 侍昊, 等. 土壤重金属污染遥感监测研究进展[J]. 遥感信息, 2014, 29(6): 112-117, 124.
[8] Fard R S, Matinfar H R. Capability of vis-NIR spectroscopy and Landsat 8 spectral data to predict soil heavy metals in polluted agricultural land[J]. Arabian Journal of Geosciences, 2016, 9: 745.
[9] 姚苹, 张东, 张世熔, 等. 基于RS和GIS的石亭江中下游土壤铅和镍含量预测建模研究[J]. 农业环境科学学报, 2014, 33(1): 95-102.
[10]单海斌, 蒋平安, 颜安, 等. 基于高光谱数据的北疆绿洲农田灰漠土有机质反演[J]. 农业资源与环境学报, 2018, 35(3): 276-282.
[11]郭云开, 刘磊, 刘宁, 等. 基于支持向量机回归的水稻地重金属Fe含量估算[J]. 北京测绘, 2017(6): 10-13.
[12]金剑, 周显平. 内蒙古中西部栗钙土重金属Cd含量定量反演研究——以白云鄂博矿区为例[J]. 内蒙古科技大学学报, 2017, 36(3): 280-284.
[13]郭云开, 石自桂. 不同尺度反演土壤重金属铜含量研究[J]. 北京测绘, 2016(3): 20-23.
[14]Shi T Z, Hu Z W, Shi Z, et al. Geodetection of factors controlling spatial patterns of heavy metals in urban topsoil using multisource data[J]. Science of The Total Environment, 2018, 643: 451-459.
[15]吴昀昭. 南京城郊农业土壤重金属污染的遙感地球化学基础研究[D]. 南京:南京大学, 2005.
[16]Hong Y S, Shen R L, Cheng H, et al. Estimating lead and zinc concentrations in periurban agricultural soils through reflectance spectroscopy: effects of fractional-order derivative and random forest[J]. Science of The Total Environment, 2019, 651: 1969-1982.