乐安河流域土壤重金属含量高光谱间接反演模型及其空间分布特征研究
2015-06-07兰泽英,刘洋
兰 泽 英, 刘 洋
(1.广东工业大学管理学院,广东 广州 510060;2.广州市城市规划勘测设计研究院,广东 广州 510060)
乐安河流域土壤重金属含量高光谱间接反演模型及其空间分布特征研究
兰 泽 英1, 刘 洋2
(1.广东工业大学管理学院,广东 广州 510060;2.广州市城市规划勘测设计研究院,广东 广州 510060)
选取江西省乐安河及其支流流域作为研究区域,探讨了使用土壤高光谱数据间接反演其重金属(Cu、Zn、Pb)含量的方法。选用偏最小二乘模型对土壤有机质含量进行高光谱反演,引入人工神经网络回归模型建立土壤有机质含量与重金属含量的相关关系,从而提取出土壤中痕量级的重金属元素,并针对其空间分布情况进行关联分析和对比分析。实验结果表明,此方法在反演Cu、Zn元素时可有效反映其空间分布特征,具有在类似泛滥平原区域推广的适宜性,也为该区域土壤及水文生态环境监测提供了相关参考。
土壤重金属含量;高光谱反演;偏最小二乘回归(PLS);人工神经网络
0 引言
大量研究表明,遥感高光谱数据结合GIS野外采样分析已被成功应用于土壤重金属含量调查。1991年巴西科学家基于AVIRIS影像,探讨了3处样本采集区的土壤TiO2、Fe2O3、Al2O3光谱反射率与化学成分的关系[1]。近年来Kemper等通过逐步线性回归分析(MLR)和神经网络(ANN)方法预测重金属元素浓度与特征光谱反射率之间的拟合关系[2];Phoebe等利用高光谱调查弃矿及矿山废物的重金属元素分布[3];Shrestha等利用TM7光谱反射率统计预测土壤中Fe、Zn、Se的含量[4];Evangelou等基于Aster、TM等数据定量预测土壤中Hg的含量[5]。然而,采用上述直接估算法探测流域土壤中的重金属含量,其精度和稳定性受限[6,7],主要原因在于流域范围内的重金属含量通常属于痕量级,即使在重污染区域,即土壤重金属含量大于三级临界值的区域(参见《土壤环境质量标准》)[8],其诊断性光谱特征也很容易湮没在其他土壤组分的影响之中,不足以被光谱仪直接检测出来,因此需要考虑间接量化的模型和方法。
土壤重金属含量与土壤的理化性质联系紧密[7-12],进入土壤的外源重金属可以被土壤粘土矿物、铁氧化物和有机质等吸附,这些土壤成分具有典型光谱特征,因此,使用高光谱数据探测土壤成分(如有机质含量、土壤质地、pH值等)并通过重金属与这些土壤成分的相关分析可间接估算土壤中的重金属含量[2,6]。本文选取江西省乐安河及其支流流域作为研究区域,根据高光谱遥感数据及GIS采样数据的相关分析,建立高光谱数据和土壤重金属含量的间接反演模型,讨论土壤重金属元素的空间分布特征,从而为类似泛滥平原区域土壤重金属监测提供技术支持和参考依据。
1 研究区域与实验数据
1.1 研究区域及其土壤理化特性分析
研究区域包括江西省境内的乐安河及其支流(即大坞河和洎水河)流域。如图1所示,乐安河发源于怀玉山麓,向东注入鄱阳湖,全长275 km,流域面积8 534 km2。该区域的典型性表现在:1)乐安河中游、大坞河、洎水河沿岸分布着大量铜矿、金矿、铅锌矿和化工加工厂,其中包括亚洲最大的露天开采铜矿“德兴铜矿”(图1),开采废水排入乐安河及其沿岸土壤,暴露出土壤重金属污染问题[13]。2)乐安河下游直接汇入鄱阳湖——中国最大的湿地生态区域,分析乐安河沿岸的土壤重金属污染对于研究鄱阳湖生态环境有重要意义。3)1994年10月,联合国CERP计划曾对乐安河沿岸土壤的化学特性进行过研究,显示出Cu、Pb、Zn 3种重金属含量超标,本文再次对该流域土壤重金属含量进行测定,可以对比分析近20年来土壤污染的变化趋势,从而为当地实施环境保护政策提供依据。
图1 乐安河研究区域及其沿岸采矿点分布
Fig.1 The study area and the coastal mining sites of Lean River
与Kooistra的研究区类似[6],本区域属于典型的泛滥平原地区,河谷分布大量的潮土,其成土母质主要为河流现代冲积物。露天有色金属选矿厂排出的污水中的重金属离子和天然水体中的悬浮物结合,随着河水上涨逐渐沉积在泛滥平原土壤表层。另一方面,土壤有机质具有天然的螯合和络合效果,通过其团粒结构可以将重金属离子吸附住,重金属离子的活性降低后,以比较稳定的化合物形式“固定”下来,不被植被和其他成分吸收和转移,从而堆积形成受污染的流域土壤。因此,理论上流域土壤中重金属的含量及分布特征与有机质的含量及分布特征有强烈的正相关关系。根据这一理化性质,本研究以土壤有机质作为数据反演的媒介,建立高光谱数据和土壤重金属(Cu、Pb、Zn)含量的间接量化模型。
1.2 实验数据获取及其预处理
首先自上游到下游进行野外采样,样点尽量分布在流域两岸,并在靠近采矿区的地方(乐安河中游、大坞河、洎水河沿岸)、缓坡以及利于水中悬浮物沉积的一侧适当地密集布置,且采样点距河流的平均直线距离为10 m。为尽可能与1996年CERP项目的研究结果进行比对,分别在流域的上中下游地区,至少有两个以上采样点与CERP项目的采样点重合。对每个采样点,按梅花形收集5个子集,再混合成一个组合样本[14,15],最终选择了71个土壤采样点。
对土壤样本进行实验室分析与预处理,主要包括高光谱数据获取与选择、土壤有机质含量和几种重金属含量测定。使用ASD fieldSpec 3仪器测定土壤样本的高光谱数据,共测量2 151个波段。为消除高光谱数据的阶越现象和噪声,采用二阶微分技术和平滑技术进行处理[16],得到光谱匹配滤波曲线(图2)。可以看出,有7个波段特征规律明显,其中1 415 nm、1 930 nm和2 200 nm波段与反演土壤含水量的特征波段相近,为了减小含水量对光谱反射率的影响,将其剔除,最后选择415 nm、485 nm、770 nm和920 nm波段作为土壤样本的光谱特征波段。根据《土壤环境监测技术规范》[8],采用经典的重铬酸钾-浓硫酸油浴消解法,经化合反应后测定土壤样本有机质含量;考虑到操作的安全性和便捷性,采用XRF(X Ray Fluorescence)仪器[16-18],通过X射线荧光的能量特性,测定土壤样本的重金属含量。
图2 高光谱匹配滤波曲线
Fig.2 The continuum removal curve of hyperspectral data
2 土壤重金属含量间接反演模型建立
2.1 基于偏最小二乘法的土壤有机质高光谱反演
为建立土壤样本高光谱数据与有机质含量之间的反演模型,本文尝试了多种数据回归方程,并进行了对比分析。将土壤光谱特征波段和有机质含量的相关数据分别带入表1所示的回归模型。计算结果显示,其效果都不甚理想,最高的三次函数模型相关性系数仅达到0.51。
表1 传统的土壤有机质高光谱反演模型对比分析
Table 1 Comparative analysis of soil organic matter content based on the traditional hyperspectral inversion models
因而,进一步引入偏最小二乘模型(Partial Least Squares,PLS)进行测试。作为一种数学优化技术,它在普通回归方程难以解决的问题上表现优异,因此有“第二代回归分析方法”之称[16-19]。由于SIMCA-P软件中已经实现了这种算法,因而直接将相关数据代入其中,对土壤样本的有机质含量进行高光谱反演。图3a是偏最小二乘模型的回归系数图,直观上显示其收敛性比较理想。图3b实线部分是模型的回归结果,它与土样实测值之间的相关性为R2=0.9842,均方根误差达到0.9511,表现优异。为进一步验证该模型的精度,随机选择了10个土样进行测试,如图3b虚线部分所示,检验精度为61.84%,基本合格;但是检验样本偏度和均方根误差达11.23和4.56,发现是随机选择的个别检验样本和样本整体趋势之间有较大差异,导致偏移。但整个模型的精度和效果比传统经典模型有了质的提高,结果令人满意。因此,最终选定偏最小二乘回归法作为有机质含量的高光谱反演模型。
图3 基于偏最小二乘法的高光谱反演有机质含量模型
Fig.3 Analysis of the PLS based hyperspectral inversion model
2.2 土壤重金属含量量化分析模型建立与评价
根据前文对实验区土壤理化性质的分析,认为土壤重金属含量与有机质含量之间存在正相关关系。为此,引入人工神经网络算法进行回归分析。本文借鉴相关研究成果,基于Matlab平台实现了人工神经网络回归模型。首先对71个土壤样本进行随机分类,其中训练样本占70%(49个),验证样本占15%(11个),测试样本占15%(11个);分别对Cu、Zn、Pb 3种重金属含量进行神经网络回归计算,其回归模型的拟合结果分析如下:
Cu元素回归模型的整体拟合效果比较理想。如图4a所示,纵坐标表示重金属含量,横坐标代表有机质含量,黑色曲线为拟合曲线,圆点代表样本标准值。图中除个别样点的误差系数较大外,其他样点基本平均分布在曲线两侧,总体相关性R达0.7763;观察模型预测值与实际值间的偏离情况(图4b),发现大部分样本的拟合情况令人满意。Zn量化模型的整体拟合效果最佳。如图5a所示,样点基本平均分布在曲线两侧,总体相关性R达0.9370,大部分预测值与实际值的拟合情况非常好(图5b)。Pb量化模型的整体拟合效果不理想。如图6a所示,只有少数样点平均分布在曲线两侧,总体相关性仅0.4317;同时,Pb样本的预测值偏差较大(图6b)。分析其原因,一方面是间接量化模型所造成的误差累积;另一方面是由于该金属的复杂相关性造成了预测值的不准确。土壤中Pb属于极稳定的重金属,随时间的推移逐渐沉积在土壤中,一般元素或其他条件很难对其沉积起到作用,因此很难通过外部的单一条件(如有机质含量等)对其进行准确的量化分析。
图4 Cu含量量化模型效果分析
Fig.4 Analysis of the Cu contents quantitative model
图5 Zn含量量化模型效果分析
Fig.5 Analysis of the Zn contents quantitative model
图6 Pb含量量化模型效果分析
Fig.6 Analysis of the Pb contents quantitative model
此外,图4b、图5b、图6b圈线内标注的样点误差都比较突出,对比《土壤环境质量标准》的数值[8]发现,这些样本的重金属实测值属于极小(即含量小于一级土壤临界值)或极大(即含量大于三级土壤临界值)范围。究其原因,在重金属含量实测值极小的区域,表明土样未受污染,它与有机质含量之间的相关性并不显著,本文的量化模型会高估其含量;而在受重度污染的地区,重金属元素除与土壤有机质结合以外,还会以铁、锰等化合物以及游离态等其他形式存在,本文的量化模型忽视了其他元素的影响,造成了重金属含量的低估。由此可见,上述土壤重金属含量间接量化模型是可以投入到实际的环境污染监测中的,但具有地域适宜性,即适宜在土壤受到典型重金属污染(即土壤环境质量执行三级标准)的地区使用。
3 研究区土壤重金属空间分布特征分析
3.1 研究区土壤重金属含量空间分布
分别对乐安河、大坞河、洎水流域的土壤重金属含量进行统计,结果如下:铜含量均值分别为0.284 mg/g、0.788 mg/g、0.226 mg/g,为国家标准的5~20倍,各流域的铜污染都比较严重,以大坞河尤为突出;锌含量均值分别为0.256 mg/g、0.115 mg/g、0.218 mg/g,位于1级和2级土壤标准之间,锌含量正常;铅含量均值分别为0.082 mg/g、0.066 mg/g、0.18 mg/g,主要是洎水河流域存在较严重的铅污染。
根据上述统计结果,对受典型重金属污染的区域进行具体分析:在大坞河流域,如图7a所示,上游样点010、011和012未流经采矿区,Cu含量明显很低;自样点013开始(包括样点013、014、033和034),Cu含量大幅度提高,在样点034处达到峰值3.425 mg/g,经观察,它们均属于大坞河流经德兴铜矿后受到典型污染的样点;在下游地区,由于河水自净和矿区一些污染处理措施后,污染情况得到一定改善。在洎水河流域,Pb含量分布呈两级模式(图7b),上游和中游Pb含量整体比较稳定,保持在0.10 mg/g左右;而下游地区,样点046、047、048和050的Pb含量出现大幅提高,并在样点047处达到峰值(0.672 mg/g)。此处正是中下游大量采矿点的排水区,造成洎水河下游Pb含量激增。
注:Cu、Pb含量单位为mg/kg。
图7 典型采样点的Cu、Pb含量
Fig.7 The Cu,Pb content of the typical sampling sites
针对污染最为典型的流域(即乐安河中游、大坞河、洎水河)的重金属空间分布情况做进一步分析。基于ArcGIS平台,对采样数据进行空间二次插值(图8,见封2),可分别得到该区域连续的Cu、Pb元素的空间分布图。图8中,红色代表污染等级最高,蓝色为最低。可以看出,在受典型重金属污染的流域中:大坞河流经整个采矿区,是土壤重金属主要污染支流,受到了极为严重的铜污染;洎水河源于德兴铜矿东南部山区,流经德兴铜矿的尾矿区,其下游受到了比较严重的铜、铅污染。乐安河中游接收大坞河、洎水河支流的水流汇入,显示出一定程度的铜、铅污染,其下游流域至鄱阳湖口地区,重金属含量较低,但存在潜在威胁。
3.2 土壤重金属污染与CERP项目对比分析
本研究与1996年的CERP项目相比共有8个完全相同的采样点,分别位于乐安河上游(A01和A03)、大坞河(A04和A05)、洎水河(J10)、乐安河中游(A07和A08)、乐安河下游(A13)。将两组重金属含量数据做对比分析,黑线为CERP项目数据,灰线为本次研究数据(图9)。
图9 CERP项目和本研究的土壤Cu、Zn、Pb含量对比
Fig.9 Comparison of the Cu,Zn,Pb contents in soil between the CERP project and this project
通过比较发现:1)两次调查的重金属含量折线图具有类似的形态,除了CERP项目的Zn含量数据出现一个激变峰值,其他样点的走势图(尤其是Cu和Pb)呈现出相似的空间分布特征。2)Cu、Pb含量的峰值区均位于德兴铜矿以及小型矿山密集区域附近。在乐安河上游海口处,本研究的Cu含量明显高于CERP项目,原因是1996年此处位于德兴铜矿上游,未受到铜矿污染,如今随着铜矿规模不断扩大,新开的矿山已经往上游延伸。3)总体而言,Cu和Zn含量都较1996年发布的结果有所降低,但Pb含量整体提高,因此不能简单地说明研究区重金属污染情况是否有所缓解。进一步分析发现,土壤中的重金属含量受土壤类型、水文、地貌、河流中悬浮物等因素影响,且重金属含量测定方法也存在差异,因而本文尽量选择相对稳定的元素来做比较,显然Pb含量更具有代表性,显示随着采矿点规模的扩大,研究区的重金属污染仍然很严重,甚至有加深的趋势。
4 结论
本研究采用高光谱遥感间接反演的方式测定了土壤中的重金属含量(Cu、Zn、Pb),是对土壤理化特性的深入应用,与传统的纯化学测定法相比,在精度类似的同时极大提高了工作效率。作为一种更加自动化、智能化的低成本数据处理方法,可以满足大范围的流域土壤重金属含量监测,从而有望在类似泛滥平原区域替代传统的化学分析法。此外,将流域土壤的重金属分布特征及变化趋势映射在GIS空间分布图中,集成了遥感影像和GIS地形数据,可以扩大数据的应用尺度,快速获取决策信息。本研究结果显示流域土壤中存在不同程度的重金属污染,且与沿岸铜矿和铅锌矿区的开采、冶炼、排污活动密切关联,呈现出自采矿点污染源向下游漫延且逐年加剧的趋势。该结论为进一步评估与治理流域土壤及下游鄱阳湖的生态环境提供直观的数据支持。
未来研究中将尝试利用机载或星载的高光谱遥感数据代替地面分光计所获取的遥感数据进行反演模型的构建,以期进一步降低估算成本、提升计算效率并扩大研究区域范围。
[1] LOZET J,MATHIEU C.Dictionary of Soil Science[M].Rotterdam,Balkema,1991.348-352.
[2] KEMPER T,SOMMER S.Estimate of heavy metal contamination in soils after a mining[J].Accident Using Reflectance Spectroscopy,2002,36:2742-2747.
[3] PHOEBE L,HAUFF D C,PETERS,et al.Hyperspectral Investigations of Mine Waste and Abandoned Mine Lands[R].The Dragon Calibration Site Case Study,2002.64-72.
[4] SHRESTHA D P,MARGATE D E,MEER F V D,et al.Analysis and classification of hyperspectral data for mapping land degradation:An application in southern Spain[J].International Journal of Applied Earth Observation and Geoinformation,2005,7:85-96.
[5] EVANGELOU M W H.Chelate assisted phytoextraction of heavy metals from soil,mechanism,toxicity,and fate of chelating agents[J].Chemosphere,2007,68(6):989-1003.
[6] KOOISTRA L,WEHRENS R,LEUVEN R S E W,et al.Possibilities of visible-near-infrared spectroscopy for the assessment of soil contamination in river floodplains[J].Analytica Chimica Acta,2001,446(1):97-105.
[7] 刘伟东,项月琴,郑兰芬,等.高光谱数据与水稻叶面积指数及叶绿素密度的相关分析[J].遥感学报,2004(4):279-253.
[8] 中华人民共和国国家标准土壤环境质量标准(GB 15618-1995)[S].中国国家环境保护局,1995.
[9] BENDOR E,BANIN A.Visible and near infrared (0.4-1.1 mm) analysis of arid and semi arid soils[J].Remote Sensing of Environment,1994,48:261-274.
[10] ISLAM K,SINGH B,MCBRATNEY A B.Simultaneous estimation of several soil properties by ultra-violet,visible and near infrared reflectance spectroscopy[J].Australian Journal of Soil Research,2003,41:1-14.
[11] GROSSL P R,SPARKS D L.Evaluation of contaminant ion adsorption/desorption on goethite using pressure-jump relaxation kinetics[J].Geoderma,1995,67:87-101.
[12] NAIDU R,SUMNER M E,HARTER R.Sorption of heavy metals in strongly weathered soils:An overview[J].Environmental Geochemistry and Health,1998,20:5-9.
[13] UNESCO.Ecological Impacts of Heavy Metal Pollution from Dexing Copper Mine on Poyang Lake,China[R].1996.
[14] CHEN Q S,ZHANG H D,WANG X Y.Feasibility study on qualitative and quantitative analysis in tea by near infrared spectroscopy with multivariate calibration[J].Analytica Chimica Acta,2006,572:77-84.
[15] 李小斌,陈楚群,施平,等.珠江口海域总无机氮的遥感提取研究[J].环境科学学报,2007,27(2):313-318.
[16] CHO M A,SKIDMORE A.Estimation of green grass/herb biomass from airborne hyperspectral imagery using spectral indices and partial least squares regression[J].International Journal of Applied Earth Observation and Geoinformation,2007,9(4):414-424.
[17] FABER N M,RAJK R.How to avoid over-fitting in multivariate calibration——The conventional validation approach and an alternative[J].Analytica Chimica Acta,2007,595(1):98-106.
[18] FELIZARDO P,BAPTISTA P.Multivariate near infrared spectroscopy models for predicting methanol and water content in biodiesel[J].Analytica Chimica Acta,2007,595(1):107-113.
[19] YING Y B.Nondestructive measurement of internal quality in pear using genetic algorithms and FT-NIR spectroscopy[J].Journal of Food Engineering,2008,84:206-213.
Research on Indirect Hyperspectral Estimating Model and the Spatial Distribution Characteristics of Heavy Metal Contents in Basin Soil of Lean River
LAN Ze-ying1,LIU Yang2
(1.ManagementCollege,GuangdongUniversityofTechnology,Guangzhou510060; 2.GuangzhouUrbanPlanning&DesignSurveyResearchInstitute,Guangzhou510060,China)
At present,supervision on the heavy metal contents in soil attracts increasing attention in the field of geography.This paper selects Lean River and its tributary basin in Jiangxi Province as the study area,discusses an inversion analysis method for the heavy metals (Cu,Zn,Pb) content in soil by using the hyperspectral data.According to the physical and chemical properties of the basin soil,the PLS model is used for organic matter content inversion based on the hyperspectral data;and then,the artificial neural network model has been used to set up the correlation between the organic matter content and the heavy metal content.Finally,the spatial distribution characteristics of the heavy metals content in soil are summarized by using correlation analysis and comparative analysis methods.The experimental results provide a powerful reference for the ecological environment monitoring of the basin soil,and strongly show that this method is satisfactory,and is also suitable for promotion in similar flood plain regions.
heavy metals content in basin soil;retrieval with hyperspectral data;partial least squares regression (PLS);artificial neural network
2014-07-09;
2015-01-07
国家自然科学基金项目(41301377)
兰泽英(1983-),女,博士,主要从事遥感土地监测技术及应用研究。E-mail:lzy-lzy@163.com
10.3969/j.issn.1672-0504.2015.03.006
P237
A
1672-0504(2015)03-0026-06