基于有限样点的农用地土壤污染状况分析探讨
2023-11-10林志华
林志华
(福州市环境科学研究院,福建 福州 350011)
土壤是陆地能够生长植物的疏松表层,属于重要的自然资源之一.我国部分地区土壤污染较重,耕地土壤环境质量堪忧,工矿业废弃地土壤环境问题突出[1].土壤污染因具有隐蔽性、累积性、滞后性、不均匀性及难可逆性等特点,易造成潜在危害[2].目前区域尺度土壤污染统计方法包括经典的描述性分析[3]及基于计算机代码的机器学习方法[4],但是由于成本高、保密严、地貌复杂等主客观原因,常常造成多数研究的样点量为百个左右,无法覆盖全区域范围,而部分研究往往仅是粗略地对调查范围内的罗列统计[5],甚至存在未对统计方法的假设条件进行验证分析[6].本文重新审视了基于有限样点的土壤污染状况分析过程,并对其中碰到的问题提出相应的建议.
1 数据来源
数据源于某市2021年度省级重点监管企业周边土壤调查工作,时间为2021年7月—2022年1月,期间通过现场踏勘编制了详细的采样方案,样品采集、制样、流转、检测、保存均严格遵循《土壤环境监测技术规范》(HJ/T 166-2004)要求,并同步开展内外部质控工作,形成的最终成果经由专家评审后验收成功,具有较强的可信度.本研究从样点数据中去除各类非农用地土壤样本后,共计获得191个农用地土壤有效样本,其中每个样本包括汞(Hg)、砷(As)、镉(Cd)、铅(Pb)、铬(Cr)、铜(Cu)、锌(Zn)、镍(Ni)等重金属质量浓度数据.
2 数据分析方法
使用Excel(版本2021)及R(版本4.2.2)进行统计分析,方法包括正态分布检验、地质累积指数法、潜在生态危害指数法及相关性分析.
2.1 正态分布检验
通过采用R语言nortest包对数据进行Lilliefor正态分布检验.若P<0.05,说明数据不符合正态分布;P>0.05,说明数据符合正态分布.对不符合正态分布的数据,进行对数转换处理,再进行检验.
2.2 地质累积指数法
地质累积指数法能考虑重金属区域背景值的差异,有利于消除背景值因素带来的干扰.其计算公式[7]如下:
(1)
其中Igeo为地质累积指数;Ci为i种元素实测值,单位为mg·kg-1;Bi为i种元素的背景值,单位为mg·kg-1,本文选取《中国土壤元素背景值》省域背景中位值;1.5为Bi的修正指数.评价分级见表1.
表1 地质累积指数评价分级[7]Tab.1 Classification of geoaccumulation index
2.3 潜在生态危害指数法
潜在生态危害指数法能综合考虑重金属含量及毒性、环境生态效应等因素,用于反映重金属对生态过程及物种种群的风险程度.其计算公式[7]如下:
(2)
(3)
其中Ei为i种金属潜在生态风险系数;RI为多种重金属综合潜在生态危害指数;Ti为金属毒性相关系数,本文为Hg=30、Cd=30、As=10、Pb=Cu=Ni=5、Zn=1和Cr=2[7];Ci和Bi与地质累积指数中含义一致.评价分级见表2.
表2 潜在生态危害指数评价分级[9]Tab.2 Classification of potential ecological risk index
2.4 相关性分析
相关性分析应根据数据是否满足正态分布进行选择.若变量间均满足正态分布,则选择Pearson相关系数,不满足的话选择Spearman系数[8].本文在正态分布检验的基础上,通过采用R语言psych包对数据做Spearman系数相关性分析,并对其相关性做显著性检验.其中相关系数绝对值为0~1,越接近0越不相关,越接近1越相关.
3 结果与分析
3.1 正态分布检验
从表3可知,无论是原始数据或对数转换后的数据,各重金属元素P值均小于0.05,属于偏态分布.在统计学中,无论是涉及的是经典方法还是机器学习模型,经常会有若干假设性条件需要满足.而正态分布作为本次研究的假设性条件,应优先完成,以便为判别Bi取值和相关性分析方法提供参考,确保结论的可靠性.
表3 土壤数据P值Tab.3 P values of soil data
3.2 地质累积指数
从图1可知,该市省级重点监管企业周边农用地土壤中8种重金属元素均出现不同程度的污染,其中,Cd属于污染最突出的元素,无到中度污染(含)样点占比大于70%,其次是Ni.另外,Hg元素尽管无到中度污染(含)样点占比低于40%,但存在较多中度至重度污染(含)以上的点位,需要在后续监测过程中加密布点采样检测.
图1 地质累积指数法中污染程度占比结果Fig.1 Proportion of pollution degree by geoaccumulation index
3.3 潜在生态危害指数
从图2的单个重金属Ei不同等级的样点占比结果看,Cd生态风险程度中度污染(含)以上的样点最多,其次是Hg.从多个重金属综合RI不同等级的样点占比看,该市省级重点监管企业周边土壤监测中有47.12%点位存在中度(含)以上污染(见图3).结合地质累积指数法的分析结果,Cd是该市省级重点监管企业周边土壤污染最为突出的重金属元素,地方生态环境部门应优先给予重视.
图2 单个重金属的不同等级Ei样点占比结果 Fig.2 Proportion of individual metal ecological risk degree (Ei)
图3 多个重金属的不同等级RI样点占比结果Fig.3 Proportion of environmental potential risk degree (RI)
3.4 相关性分析
从表4看,Hg与Cd、 Pb、Cu、Ni、Zn相关系数分别为0.36、0.30、0.34、0.16、0.23,As与Cd、Pb、Cr、Zn相关系数分别为0.17、0.37、0.21、0.24,Cd与Pb、Cu、Ni、Zn相关系数分别为0.41、0.42、0.24、0.69,Pb与Cr、Cu、Zn相关系数分别为0.21、0.24、0.46,Cr与Ni、Zn相关系数分别为0.39、0.31,Cu与Ni、Zn相关系数分别为0.38、0.56,Ni与Zn相关系数为0.43,以上各元素间均呈现显著性正相关,但相关性普遍较弱.其中Cd-Zn之间的相关性最高,相关系数为0.69,在置信度为1%时存在显著正相关关系,表示Cd与Zn来自共同来源的可能性较高,例如崔晓玉等[10]研究表明湖南省土壤中Cd与Zn存在相关性,且认为可能跟与污染途径来源及土壤基本理化性质有关.
表4 各元素含量相关系数及显著性结果Tab.4 Correlation coefficient and significance results between the contents of each element
4 结论与讨论
本文基于有限样点的土壤数据进行污染统计分析,其总结如下:
(1)运用正态分布检验发现,该土壤数据呈现偏态分布,而土壤中重金属的质量浓度数据往往不服从正态分布[7].在对数转换后的数据正态分布检验,可以发现铅元素P值为0.04,已经接近于0.05,因此考虑是否可以进一步做转换以满足正态分布要求,但在此并不建议,毕竟越复杂的转换,统计结论的解释性越差.
(2)运用地质累积指数法和潜在生态危害指数法发现,Cd是该市省级重点监管企业周边农用地土壤中污染最为突出的元素,其次是Hg.在指数法分析过程中,最关键的系数是Bi值,文献[11]表明土壤背景值的分布几乎既不符合正态分布,也不符合对数正态分布,而对于偏态分布的情况平均值更易受到极端值的影响,采用中位值进行统计更为准确[12-13],因此本文Bi值选取《中国土壤元素背景值》中土壤重金属元素背景值的中位值,但由于《中国土壤元素背景值》调查时间久远,且省域样点过少,可能无法适应现有实际情况.因此建议地方管理部门尽早开展市级层面区域背景值调查.
(3)运用相关性分析发现,Cd-Zn存在极显著的相关关系,但相关性不代表因果性,Cd与Zn有相关,只能说明两者之间具有共同来源的可能性较高,区域尺度上能影响元素质量浓度的因素实在过于复杂,并无法保证某一因素是Cd与Zn相关的起因,因此重金属污染的因果关系分析是后续应开展的工作.