基于信息熵的土壤Cr含量空间分布与土地利用空间相关性研究
2020-11-25李秀霞张子豪胡逸宁
李秀霞,朱 伟,张子豪,胡逸宁
(1.南京信息职业技术学院,江苏 南京 210023;2.生态环境部南京环境科学研究所,江苏 南京 210042)
关于土壤重金属污染的空间分布与评价是当前国内外学者及管理部门关注的重点[1-2]。一方面,土壤本身就含有一定量的重金属元素,关于区域土壤中重金属元素的自然背景值已有定量化的调查结果[3];另一方面,人类活动如工业生产过程会向环境中排放含重金属的废水、废气和废渣,从而导致土壤中重金属含量增加。有研究发现城市区域土壤表层重金属污染的空间格局与人口密度特征、环境要素、交通条件、产业结构与布局以及土地利用等内外部约束因素的空间分异特征密切相关[4]。由于土地利用是人类活动的集中体现,是控制土壤重金属累积和空间分布的重要因子[5-6],因此,研究土地利用对土壤重金属累积的影响成为一个重要研究方向。有学者通过对土壤重金属含量进行布点采样监测,并将其与重金属背景含量进行对比,分析了工业活动和土地利用类型对伊朗某地土壤中重金属分布的影响[7];还有学者采用地统计学方法分析不同土地利用方式土壤重金属空间分布特征[8];赵淑苹等[9]也运用对照分析方法,分析了大庆地区不同土地利用类型土壤重金属含量变化规律。陈宗娟等[10]对研究区域不同土地利用方式土壤重金属含量进行采样分析,结果表明土壤污染状况由高到低依次为农业用地、工业用地和居住用地。由于空间变量分布特征的定量化表征存在困难,目前大部分研究对土地利用类型与土壤重金属累积的空间分布相关度分析均为定性分析。因此,建立定性变量与定量变量之间的相关度分析方法成为该项工作的关键。笔者拟结合信息学和数理统计相关理论,采用定量化手段揭示土地利用类型与土壤重金属污染之间的空间相关性。
以南京江宁经济技术开发区为研究区域,在收集土地利用、土壤重金属监测等相关数据资料的基础上,基于ArcGIS软件平台的空间分析(Spatial Analysis)模块功能,获得区域土壤重金属Cr含量的空间分布图;通过引入信息熵概念,建立定性变量(土地利用类型)与定量变量(土壤重金属含量)之间的空间相关度分析方法;获得了该区域土地利用类型与土壤Cr含量之间空间相关性的定量结果,可为区域重金属污染防治方案的制定和治理决策提供参考。
1 研究区域概况
南京市江宁区位于长江下游南岸,介于北纬30°38′~32°13′、东经118°31′~119°04′之间,东西宽33 km,南北长57 km,总面积为1 572.96 km2。江宁经济技术开发区位于江宁区中部,为国家级开发区,规划范围东至青龙山—大连山,东南至汤铜公路,南至禄口新城、城市三环,西至吉山及吉山水库,以及牛首山、祖堂山沿线,北至秦淮新河、东山老城和上坊地区,规划面积为348.7 km2。近20 a来,开发区城市化进程加快,工业化和农业集约化发展迅速,区内土壤污染因素增多,土壤环境质量受到威胁。
2 研究方法
2.1 数据来源及处理
收集了江宁经济技术开发区土地利用现状资料,以及该区域2013—2019年土壤重金属Cr含量的环境监测数据。研究区域土地利用类型见图1,监测点位分布见图2。
图1 研究区域土地利用现状Fig.1 Status of land use in the study area
图2 研究区土壤监测点位分布Fig.2 Distribution of soil monitoring points
由于重金属污染物在土壤中的迁移转化过程相对缓慢,因此收集的监测数据虽然不处于同一时间段,但仍能总体上反映区域土壤中Cr含量状况,数据时效性较好。土地利用现状资料来源为当地规划部门提供的土地利用现状图,并结合现场踏勘对图件进行局部修正;监测数据来源主要为区域规划和建设项目环境影响评价报告,共收集52个监测点位数据,点位较均匀地分布于江宁经济技术开发区内及周边。
研究区域城镇建设用地类型及占比见表1。由表1可知,研究区域内城镇建设用地总面积为9 112.37 hm2,占区域总面积的26.13%,城镇建设用地中工业用地占34.7%,居住用地和公共设施用地占34.4%,其余用地主要为道路广场用地和城市绿地。非建设用地类型主要为农田和山体林地等,仅有极少量未利用地,说明该区域广泛受到人类活动的影响。各监测点土壤Cr含量数据及对应的土地利用类型见表2。
表1 研究区域城镇建设用地面积及其占比Table 1 Area and proportion of urban construction land in the study area
表2 监测点土地利用类型及土壤Cr含量Table 2 Cr content in soil of the monitoring points and corresponding land use types
2.2 研究方法
2.2.1土壤Cr含量的反距离加权插值法
实际工作中,由于受采样条件和人力、物力投入的限制,无法对一个宏观区域内所有样点进行全面布点和采样监测,而空间插值技术可以将离散的数据点转化为面,从而能够直观地反映出研究区土壤指标的空间分布特征[11]。反距离加权(inverse distance weighted,IDW)插值法是一种常用而简便的空间插值方法,它以插值点与样本点间的距离为权重进行加权平均,对离插值点越近的样本点赋予的权重越大。这一方法要求离散点分布较均匀,并且离散点数量足以反映变量的空间变化。IDW插值法计算公式为
(1)
(2)
式(1)~(2)中,z0为坐标点位于(xi,yi)处的属性值插值结果;zi为第i个(i= 1,2,…,n)样本的属性值;p为距离的幂,常选用p=2;Di为第i个样本点距离插值点的距离。
当获取区域多个点位的土壤Cr含量数据,且点位分布较均匀时,即可通过IDW插值法获取整个区域土壤Cr含量分布数据,点位分布越均匀,数量越多,则插值结果精度越高。可利用ArcGIS 10.3软件平台的空间分析模块实现IDW插值。
2.2.2土壤Cr含量与土地利用类型空间相关性的信息熵分析方法
在获取区域土壤Cr含量空间分布图后,即可将该分布图与区域土地利用类型分布图进行相关性分析。这是定性数据与定量数据之间的相关性分析,传统的相关性分析方法难以实现两者之间的定量分析。该研究引入信息论中的概念——信息熵,可定量探讨任意两个变量的空间分布相关度,不受变量定性或定量的限制。
信息熵是用来表示某一信息源所发出的多种信息的平均信息量,是随机变量不确定性的量度[12]。设信号xi是一个随机量,xi出现的信息量I(xi)是xi的函数,因而I(xi)也是一个随机量。I(xi)常称为xi的自信息,它具有随机变量的性质。信息论中将自信息的数学期望定义为信源X的平均自信息量,即信息熵:
(3)
式(3)中,X为随机变量的整体;P(xi)为发生事件xi的概率;n为可能发生的事件(状态)总数;对数的底a一般取2。当两个信源X和Y为二维随机变量时,它们的联合分布概率为P(xi,yj)(i=1,2,…,n;j=1,2,…,m),则X和Y的联合信息熵H(X,Y)为[13]
(4)
H(X,Y)/[H(X)+H(Y)]反映了变量X与Y之间的相关性,为了使用方便,用指标K来描述X和Y之间的相关度[14]:
(5)
因有H(X,Y)≤H(X)+H(Y),因此K的取值范围为[0,1]。当K=0时,表示X和Y不相关;当K>0时,表示X和Y具有相关性;K越大,说明两者之间的相关程度越高[15]。
信息熵的引入能够克服定性变量在表征上的困难,使其能够实现定量分析。笔者在前期研究中将信息熵原理应用于土壤侵蚀及其影响因素之间的空间相关性分析,取得了较好的应用效果[16]。该研究即采用信息熵K表征研究区域土地利用类型与土壤Cr含量之间的空间相关性。
3 结果与分析
3.1 区域土壤Cr含量空间分布
基于ArcGIS 10.3空间分析模块中的IDW空间插值功能,将Cr含量的点矢量图层插值为面栅格图层,插值底图为江宁经济技术开发区行政边界矢量图。插值过程通过搜索距离拟插值点处最近的12个已知Cr含量的点位,并根据距离远近按式(1)~(2)计算权重,从而获得被插值区域Cr含量数据,每个栅格大小设定为100 m×100 m。经过空间插值处理,研究区域土壤Cr含量空间分布见图3。
图3 土壤Cr含量空间分布Fig.3 Spatial distribution of Cr content in soil
已知研究区域所在地南京市土壤中Cr含量背景值为59 mg·kg-1[3],利用ArcGIS 10.3栅格运算工具,获得研究区域土壤Cr含量平均值为81.4 mg·kg-1,对照GB 15618—2018《土壤环境质量 农用地土壤污染风险管控标准(试行)》和GB 36600—2018《土壤环境质量 建设用地土壤污染风险管控标准(试行)》,土壤平均Cr含量未超过GB 15618—2018标准限值,略超过GB 36600—2018第二类用地的管制值(78 mg·kg-1)。但土壤平均Cr含量明显超过该区域土壤Cr含量背景值,说明该区域土壤Cr含量已经受到人类活动的影响。
对比图1和图3可知,研究区域土壤Cr含量较高区域集中在东部和西部的农田用地,其次是北部和南部的工业用地以及北部城镇居住用地;山体林地等区域Cr含量较低。这说明区域土壤Cr含量受人类农业生产、工业生产及城镇生活的影响较大。农业生产中,长期污水灌溉,污泥回用,以及有机肥、化肥和农药施用是造成土壤污染的主要原因[17];工业生产中,排放的含重金属废水、废气和废渣是造成重金属污染的主要原因;而城镇居民生活中,汽车尾气排放是环境重金属累积的重要来源。另外,按照城市发展规律,城镇居住用地有相当一部分是从农业用地转变而来,有重金属累积的历史因素。
3.2 区域土壤Cr含量与土地利用类型的空间相关性
根据3.1节的初步分析,区域土壤Cr含量空间分布受土地利用类型的影响,两者空间分布具有相关性。采用信息熵方法进一步定量研究两者之间的空间相关度。
基于区域土地利用图和土壤Cr含量空间分布栅格图,同时考虑到研究区域的空间尺度及土地利用类型斑块大小,以1.2 km×1.2 km网格布点,每个网格读取1个Cr含量平均值,共获取该区域210个点位的土壤Cr含量数据及其对应的土地利用类型。原始数据点位有52个,考虑研究区域的面积,则在土壤Cr含量空间插值过程中认为每个点的平均影响范围为6.7 km2,按照1.2 km×1.2 km网格读取数据,即每个网格数据均处于实测点位的影响范围内;因此,插值和统计过程未损失原始数据的精度,也兼顾了计算效率对网格大小的要求。
根据信息熵算法,为了获得两个变量的联合分布熵,首先需要统计计算土壤Cr含量分布概率P(xi)、土地利用类型分布概率P(yi)以及它们之间的联合分布概率P(xi,yi),统计结果见表3。
表3 土壤Cr含量与土地利用类型之间的联合分布概率矩阵Table 3 United distributing probability matrix between Cr content in soil and land use types
按式(3)~(5)计算,得到土壤Cr含量与土地利用类型两者之间的空间相关系数K=0.13>0,说明两者具有空间相关性,再次证明研究区域土壤Cr含量分布受到土地利用类型的影响。
4 讨论
4.1 研究区域土壤Cr含量及其空间分布
谢龙涛等[18]对江宁区周岗镇土壤重金属污染进行评价,结果表明,该镇土壤Cr平均含量为70.8 mg·kg-1。笔者统计的区域土壤Cr平均含量(81.4 mg·kg-1)与之较接近,区域土壤Cr平均含量超过区域土壤环境背景值。
开发区土壤Cr含量呈一定的空间分异性,表2显示,Cr含量较高的区域集中在区域的农业用地,其次为工业用地和城镇居住用地。已有研究表明,随着耕地历史的延长,表层土壤中重金属含量呈增加趋势[19];重金属污染地区均呈破碎、复杂和聚集的景观格局特征,其中,耕地、住宅用地和工业用地的这种特征与土壤重金属累积的相关性最大[20],证明农业生产对土壤重金属含量有明显影响,住宅用地和工业生产与土壤重金属的相关性也较大,笔者研究结果与之一致。
4.2 土壤重金属污染与土地利用类型的关系
随着南京城市化进程的发展,土壤重金属含量在增加,南京主要土地利用类型中重金属污染比较严重的是菜地和水田[21],笔者研究得出的Cr含量较高的区域集中在东部和西部的农田用地的结论与之一致。
笔者研究给出了土壤Cr含量与土地利用类型的空间相关系数K=0.13,说明两者空间分布具有相关性。但K值远小于1,说明土地利用类型不是影响土壤Cr含量的唯一因素或主导因素。这是因为:一方面,土地利用类型还不能充分代表人类活动的全部影响,仅能从一定程度上反映部分人类活动影响;另一方面,除人类活动影响外,区域土壤Cr含量还受自然因素的影响,如土壤元素的背景含量及其空间分异、区域降水及径流条件以及土质等自然条件空间差异等因素。已有研究表明,土壤中重金属含量主要受成土母质的影响[22],后期人为活动以及经济发展改变了土地利用类型,造成土壤中重金属含量的变化[23],这也证明笔者研究得到的相关系数是合理的。目前,土壤重金属主要来源于成土母质,但若不及时遏制人类活动造成的重金属污染,土壤重金属含量将持续增加,来源构成也会倾向于人类活动影响。
4.3 方法的空间尺度适用性
由于土壤属性具有空间变异特性,研究数据的尺度因子影响着土壤属性的评估结果[24],随着采样间距的加大,更小尺度下的结构特征将被掩盖。笔者研究的尺度为几百km2的区域尺度,在该尺度上,土地利用类型和土壤重金属含量均呈现明显的空间分异,统计过程中涉及10种土地利用类型,52个点位Cr含量在35~125 mg·kg-1之间变化,因此在该尺度上研究两者的空间相关性是有意义的,且数据精度越高,得到的分析结果越可靠;当研究尺度缩小到田间或地块尺度,则土地利用类型空间分异已不明显甚至无空间分异特征,此时土壤重金属含量空间分异特征与土地利用的相关性将接近于0。
5 结论
(1)江宁经济技术开发区土壤Cr含量明显超过该区域土壤Cr元素背景含量,Cr含量较高的区域集中在东部和西部的农田用地,其次是北部和南部的工业用地以及北部的城镇居住用地,山体林地等区域Cr含量相对较低。区域土壤Cr含量分布受农业用地、工业用地和城镇居住用地的影响较大。
(2)信息熵方法可实现任意变量之间空间相关性的定量分析。江宁经济技术开发区土壤Cr含量与土地利用类型的空间相关系数K=0.13,表明两者之间存在空间相关性。因此,在区域土壤重金属污染防治决策过程中,可通过优化土地利用类型减轻或控制人类活动对土壤污染的影响。
(3)如何表征土壤重金属影响因素以及研究这些因素与土壤重金属含量的空间相关性是下一步研究的重点,也是判断土壤重金属污染较显著影响因素的关键。