基于统计分析和BP网络的土壤重金属污染研究
2016-09-21孙娓娓黄映雪张杰胡业刚
孙娓娓,黄映雪,张杰,胡业刚
阜阳师范学院数学与统计学院,安徽阜阳236041
基于统计分析和BP网络的土壤重金属污染研究
孙娓娓,黄映雪,张杰,胡业刚
阜阳师范学院数学与统计学院,安徽阜阳236041
土壤中重金属不仅对植物生长造成影响,还通过食物链危害人类健康,并可能造成大气和水污染等问题,影响和改变城市土壤的生态功能。因此,为了改善生活环境,彻底解决污染问题,就必须找出重金属污染的原因。本文通过污染指数评价、统计相关分析、BP网络空间插值等方法建立数学模型,得到了土壤重金属污染程度、原因及污染源位置,为环境保护和城市发展提供重要依据。
重金属污染;污染指数;相关分析;BP网络
城市土壤是城市生态系统的重要组成部分。对土壤地质环境异常的查证,以及应用已获取的海量数据资料对城市环境质量进行评价是很有必要的。研究人类活动影响下城市土壤环境的演变模式,对于城市的生态建设、提高农产品食品安全和人民身体健康、以及可持续发展都具有十分重要的意义。本文对某城区土壤重金属元素Cu、Zn、Pb、Cd、Ni、Cr、As、Hg的含量和空间分布进行统计分析探讨,利用BP网络确定污染源的位置,查明重金属污染的影响因素及对环境的潜在危害,以期了解不同的城区活动对土壤重金属形态分布的作用及影响,为评价重金属的环境效应和治理保障城市居民的身心健康提供依据。
1 采集样本
由于人类活动对不同环境的影响程度不同,一般将城区化为5个功能区:生活区、工业区、山区、主干道路区、公园绿地区[1]。为了全面地分析城市土壤重金属污染问题,首先要进行土壤采样。为使样点具有较好的代表性,采用近似网格法(1 km×1 km)布点,在不同功能区共采集土样319个。根据GPS记录采样点的位置,利用MATLAB软件绘制出样点分布如图1所示。然后利用专门仪器测试,获得每个样本所含Cu、Zn、Pb、Cd、Ni、Cr、As、Hg8种重金属元素的浓度数据。此外,按照2 km的间距在远离人群和工业的自然区取样,将其作为该城区土壤中元素的背景值。
图1 样点分布图Fig.1Distribution of samp les
2 重金属的污染程度
目前,对土壤重金属污染主要使用的评价方法,包括地积累指数法、污染指数法、潜在生态危害指数法[2]等等。本文采用最普遍的单因子指数法和内梅罗综合污染指数法[3],可以评价不同土地类型的土壤受到重金属污染的强度,具体公式为:
结合数据,得到该城市5个分类区土壤中8种重金属的单因子污染指数pi和内梅罗综合污染指数p综,如表1所示。
表1 土壤重金属污染指数Table1 Pollution index of heavymetals in soil
为了说明该城区不同区域重金属的污染程度,依据中国《绿色食品产地环境质量现状评价纲要(试行)》规定[4],相关标准如表2、3所示。
表2 土壤中各元素污染程度分级标准Table2 Pollution classification standard of elements in the soil
表3 土壤综合污染程度分级标准Table 3Classification standard of comprehensive pollution in soil
通过研究对比可知,5个功能区土壤重金属污染存在一定差异。具体如下:
1)重金属Hg在5个分类区均属于重度污染,尤其工业区和主干道区的污染指数分别为9.69、8.58,明显严重超标。As、Cr、Ni、Pb这4种元素在5个分类区均属于轻度污染。Cd在5个分类区均属于中度污染。Zn除了在山区属于轻度污染,在其他4个区均属于中度污染。Cu除了在工业区和主干道区属于重度污染,在其他3个区均属于中度污染。
2)通过综合污染指数可以看出,工业区和主干道区属于重度污染,其余3个区都为中度污染,且其污染程度从大到小依次为工业区、主干道区、生活区、公园绿地区、山区。
3)综合所有数据,在工业区和主干道区所有重金属浓度都明显高于其他功能区,表明工业污染与交通污染已经超过其他污染,成为该城市的主导污染源。
3 污染的原因
土壤中重金属不仅对植物生长造成影响,还通过食物链危害人类健康,并可能造成大气和水污染等问题。因此,为了改善生活环境,彻底解决污染问题,就必须找出重金属污染的原因。
首先利用Excel计算出该城市土壤中8种重金属的均值、标准差、变异系数等统计量,具体结果如表4所示。
表4 土壤中重金属含量统计Table 4 Statisticsof heavymetals in soil
通过表4数据可知:
(1)该城市土壤中各种重金属的平均含量均高于背景值;As、Cd、Cr、Cu、Hg、Ni、Pb、Zn分别是背景值的1.58、2.33、1.73、4.17、8.56、1.40、1.99、2.92倍,说明Cu、Hg都有一定程度上累积,主要来源于人类的工业生产活动以及交通活动。
(2)依据变异系数大小粗略分级规律,土壤重金属含量变异系数在28.8%~60.62%之间,属于中等程度变异[5]。则该城市土壤中As、Cd、Pb为强变异,Ni为中等变异,Cr、Cu、Hg、Zn均为弱变异;8种元素变异系数范围为11%~81%,变异性很大,可见土壤来源受外界影响很大,可能受人为活动的不合理布局及企业和道路交通的影响。
其次,元素地球化学研究表明,成因相似的元素之间常有较好的相关性[5]。因此,统计上相关性较高的重金属元素之间在成因上也有相似之处。运用SPSS统计软件进行因子分析,可以得出表5的重金属之间的相关系数。
表5 土壤中各重金属含量的相关系数Table5Correlation coefficient of heavymetal content in the soil
由表5可见,几种重金属含量都与至少1种或其他几种重金属呈正相关;Cr、Ni相关性最强,说明来源大致相同,并且相关系数最大为0.7158,说明土壤中Cr、Ni的关系最为密切,他们的含量彼此影响较大。其次Cd、Pb呈显著的正相关,说明来源极为相近。Zn、Cd、Cr、Cu、Ni、Pb呈正相关,可能暗示了在研究区域内存在相似的过程控制着土壤重金属元素的含量的分布特征。但Pb、Zn、Cd、Cu在不同功能区中取的最大值,因此,Pb、Zn、Cd、Cu没有产生复合污染物,可能具有相同的来源。
4 污染源的位置
若某种重金属的浓度在某一处取得最大值,就可以认为该处是污染源的位置。按照这个思想,我们试图建立重金属的浓度ρ与样本点三维空间坐标分量(x,y,h)的函数关系式,利用319个数据进行三元函数ρ(x,y,h)的插值或拟合,然后求该函数的最大值。但由于Matlab软件无法实现四维散点数据普通的插值或拟合,于是我们考虑统计回归模型。为了找出重金属浓度ρ与坐标x、y、h的关系式,首先利用数据分别作出ρ对x、y、h的散点图,如元素As效果如图2所示。
图2 As元素的散点图Fig.2Scattered pointsof Aselement
但由图2无法看出ρ与x、y、h具有明显的函数关系,因此很难进一步建立ρ与x、y、h的回归模型。事实上,土壤中各种重金属的含量与其空间位置之间存在着高度复杂的非线性映射关系,因此不宜用常规的建模方法来解决此类问题,也难以得到重金属含量与空间位置的定量关系。
仅根据样本中的数据显然不能求出整个城区的污染源的位置,为了能够充分有效地利用样本数据的信息量,确定某重金属在该城区的最大浓度的空间位置,我们仍然利用插值法求解,但本文采用BP神经网络的方法进行空间加密插值[6],它能学习和存贮大量的输入—输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。因此,可以有效地将研究区域内的海拔高程融入网络,提高网络的稳定性和精度。具体算法如下:
(1)确定BP网络拓扑结构。输入节点与输出节点是由问题的本身决定的,该问题采用有3个输入节点,分别表示样本点的三维坐标x、y、h;输出节点为8个,分别表示该样本点中8种重金属的浓度;隐层节点数凭经验取6,因此这里BP网络选用3-6-8的拓扑结构。
(2)随机采用250个样本数据作为训练集,剩余的69个样本作为测试数据。对网络在[-1,1]范围内的初始权值随机取值,学习率η=0.9,误差精度设置为0.0001,最大迭代步数为10000,当满足设置的误差精度或最大迭代步数,算法就停止训练。从而确定重金属浓度与空间位置的映射关系。
(3)用训练好的BP网络去进行空间插值。将所有样本点缩小其取样间隔(如10m),将所有加密点的x、y、h数据一一输入该BP网络,网络系统就会自动算出该点8种重金属的浓度。
(4)由所有插值点和样本点的重金属浓度的最大值,求出坐标确定污染源的位置(表6)。
表6 重金属污染源位置Table6 Locationsof pollution sourcesof heavymetals
由表6可以看出,As、Zn、Cr、Ni、Cd的污染源都在4区,即主干道路区;Cu、Hg的污染源都在2区,即工业区;Pb的污染源在1区,即生活区。
5 结论
本文就土壤重金属污染问题,分别利用统计分析、BP网络高维插值等方法,得到了污染程度、原因、污染源位置及传播特征相关结论。该模型不仅可以用于本文未提及的其他重金属污染问题的讨论,而且还可用于其他地区的土壤,甚至大气、水流污染等问题,具有一定的推广性。
[1]李春明.城市表层土壤重金属空间分布特性及影响因素[J].晋中学院学报,2014,31(3):24-27
[2]汤洁,陈初雨,李海毅,等.大庆市建成区土壤重金属潜在生态危害和健康风险评价[J].地理科学,2011,31(1):118-122
[3]尹俊,柳云龙.上海市城郊土壤重金属空间分布及其污染评价[J].现代农业科技,2010(10):251-255
[4]王海东,方凤满,谢宏芳,等.芜湖市区土壤重金属污染评价及来源分析[J].城市环境与城市生态,2010,23(14):36-40
[5]钱翌,张玮,冉德超.青岛城市土壤重金属的形态分布及影响因素分析[J].环境化学,2011,30(3):652-654
[6]胡大伟,卞新民,王书玉,等.基于BP模型的南通市农田土壤重金属空间分布研究[J].安全与环境学报,2007,7(1):91-95
[7]陈俊坚,张会化,刘鉴明,等.广东省区域地质背景下土壤表层重金属元素空间分布特征及其影响因子分析[J].生态环境学报,2011,20(4):646-651
Study on the Pollution of Heavy Metal in Soil Based on Statistical Analysis and BP Network
SUNWei-wei,HUANGYing-xue,ZHANG Jie,HU Ye-gang
SchoolofMathematicsand Statistics/Fuyang NormalCollege,Fuyang 236041,China
Heavymetals in soilnotonly affect the grow th of plantsbutalso harm to people'shealth through a food chain,and may cause the problem such as air and water pollution to influence the ecological function of urban soil.Therefore,in order to improve the living environmentand solve the pollution problem thoroughly,wemust find out the cause of the heavymetal pollution.In this article,themathematicalmodelwas established through pollution index evaluation,statistical analysis,BP network spatial interpolation.The soil heavy metal pollution degree,reason and pollution source location are obtained.It provides importantbasis forenvironmental protection and urban development.
Heavymetal pollution;pollution index;correlation analysis;BPnetwork
O29
A
1000-2324(2016)04-0536-04
2016-03-30
2016-06-03
安徽高校自然科学研究项目(2015KJ003,KJ2015A161);安徽省自然科学基金(1508085MA12);全国统计科学研究项目(2014LY088);安徽省质量工程项目(2015jxtd023;2015jxtd121);阜阳师范学院自然科学研究项目(2015FSKJ07)
孙娓娓(1981-),女,硕士,讲师,主要从事智能计算,数据挖掘工作.E-mail:93692849@qq.com