基于数理统计的烟台市地下水污染分析与评价
2022-03-09崔煜烽郭旭姜翠艳杜荔萍王有智
崔煜烽,郭旭,姜翠艳,杜荔萍,王有智
(1.烟台市土地储备和利用中心,山东 烟台 264000;2.山东省第三地质矿产勘查院,山东 烟台 264000;3.烟台市自然资源综合执法支队,山东 烟台 264000)
0 引言
烟台市作为我国沿海地区重要的经济发展骨干城市,近些年来城镇化建设已经取得了不俗的成就,然而城市地下水环境也遭受到了不同程度的破坏。前人对此做了一些研究,如于林弘[1]基于熵权综合指数法,利用水质检测数据对烟台市城区开展了地下水水质评价工作,李玲玲[2]基于DRASTIS评价体系对龙口市平原区开展地下水脆弱性评价并将研究区地下水脆弱性进行分级分区,闫少华[3]等利用综合指数法对烟台市浅层地下水进行了分析评价并且提出了相应的污染防治建议。
近些年来,数理统计方法在水文地质领域的应用越来越广泛,并且取得了一定的成果。陈倩[4]等利用数理统计方法对四川盆地浅层风化带裂隙水水化学数据进行了分析和研究,对研究区裂隙水水化学空间分布特征和演化规律进行了总结。高雅[5]等利用SPSS软件以成都市红层区Ⅲ类地下水水化学特征作为分析对象,系统总结了研究区地下水化学空间分布及成因规律。周亚醒[6]利用Q型聚类分析法对清凉泉水源地的污染程度进行了分析计算,取得了不错的效果。
但在分析土地利用类型与地下水污染之间关系方面的研究非常少,因此本文利用烟台市城市地质调查采集的松散岩类孔隙水水样检测结果,选取主要超标指标作为评价因子进行单因子污染评价;收集第三次全国土地调查资料,利用SPSS Statistics 23软件,基于数理统计的方法分析土地利用类型与不同因子污染程度的关系,然后基于粗糙集理论进行地下水污染综合评价,对研究区进行污染程度分区,为城市地下水污染防治规划和污染措施的制定提供科学依据。
1 研究区概况
本文以烟台市城市规划区作为研究区(图1),总面积约1077km2。地势总体上西南高、东北低,地貌南部主要为构造剥蚀丘陵,向北逐渐过渡为堆积山前平原滨海平原。
1—研究区范围;2—取样点位置图1 研究区范围及取样点位置分布图
2 污染评价方法的选取
2.1 单因子污染评价
本次污染评价利用烟台市城市地质调查采集的77个松散岩类孔隙水水样的水质检测结果作为数据(取样点分布如图1所示)。首先选择单因子污染评价法进行单指标污染评价[7]。充分考虑研究区水文地质条件,地下水分布特征等因素,参照《地下水质量标准》(GB/T14848—2017),结合以往工作经验,选取总硬度、TDS、硝酸盐、亚硝酸盐、硫酸盐、氯化物、氨氮指标作为本次单因子污染评价指标。计算公式为:
(1)
式中:Pij为第i个样品j指标的污染指数,无量纲;Cij为第i个样品j指标的水质分析结果,mg/L;C0j为j指标的背景值,mg/L;CⅢi为《地下水质量标准》(GB/T14848—2017)中给出的i指标的Ⅲ类水界限值,mg/L。
2.2 基于粗糙集理论的地下水污染综合评价
利用单因子污染评价结果对研究区进行地下水污染综合评价。目前针对地下水污染综合评价的方法主要包括综合污染指数法、系统聚类分析法、灰色聚类分析法、模糊聚类分析法和人类神经网络法。综合污染指数法计算相对简单,评价内容相对丰富,结果较符合实际,应用最广泛。综合污染指数法中,一类是利用单因子的污染指数经数理统计计算求得综合指数进行评价,如叠加指数法[8-9],内梅罗指数法[10],另一类是计算各参评因子的权重,然后乘以相应因子的污染指数求取综合污染指数,目前运用最广泛的是利用层次分析法[11-13]求取权重,然而层次分析法相对受主观因素影响较大,结果有时候与实际情况不符。
粗糙集理论是针对不完整性和不确定性的数据衍生出的一种数学理论,借助于知识表达系统进行研究,其基本成分是研究样本的集合,样本的知识通过指定样本的属性和它们的属性来描述。
由于每个指标对目标的影响大小是不一样的,因此,需要得出每个指标的重要程度。粗糙集理论的原理是,将某一指标去掉,看去掉该指标后的结果变化,如果变化较大,则说明该指标对结果的影响较大,即重要程度大;反之,若结果变化较小,则该指标对结果的影响较小,即重要程度小。
粗糙集理论虽然计算方法相对复杂,但注重对实际数据的分析,通过找出数据隐含的规律描述它对整体的影响,受主观影响小,得出的结论更加符合实际[14]。
3 地下水污染评价结果分析
3.1 单因子污染评价结果
本次单因子污染评价参评指标的背景值,选自20世纪80年代山东省地质环境总站烟台站地下水监测数据和山东省水环境调查项目所采集的地下水样测试数据,剔除异常值后采用平均值加减2倍标准方差法得出本次单因子污染评价参评指标的背景值(表1)。
表1 单因子污染评价参评指标背景值 单位:mg/L
根据公式1求得每个样品不同参评指标的污染指数,对照表2对其污染程度和级别进行划分[7],绘制单因子污染评价污染程度柱状图(图2),可以看出,研究区硝酸盐污染最为普遍,硝酸盐污染程度在较重污染以上的样品共计36个,占样本总量的46.75%,亚硝酸盐和氨氮污染较轻,亚硝酸盐和氨氮污染程度在较重污染以上的样品分别有5个,占样本总量的6.49%。
表2 单因子污染评价分级标准表
图2 单因子污染评价污染程度柱状图
3.2 土地利用类型与地下水污染程度的关系
随着城市化进程的推进,许多土地的利用方式发生了改变,不仅对地下水的补给径流排泄造成影响,而且还会带来新的污染源造成地下水的污染。因此研究土地利用类型与地下水污染程度的关系,能够准确地判别地下水污染源的具体来源,为城市地下水污染防治以及土地利用规划方案的制定提供数据支撑。
通过收集研究区最新土地利用类型资料(图3),根据每个取样点的具体位置,以取样点为中心,半径为500m作圆形区域[15],利用软件计算圆形区域内面积占比最大的土地利用类型作为该点对应的类型(表3)。分析土地利用类型与各参评因子污染程度的相关性。
1—研究区范围;2—城镇用地;3—公路用地;4—旱地;5—林地;6—农村居民点用地;7—水浇地;8—园地;9—其他类型用地图3 研究区土地利用类型分布图
表3 取样点土地利用类型一览表
土地利用类型包括建筑用地、公路用地、林地、草地等,这些数据属于定类数据,无法用具体的数值来衡量,因此不能直接计算土地利用类型与各参评指标污染指数的相关系数。因此本次分析选用二维交叉列联表分析法,对两两变量间是否存在关联性进行检验,然后利用卡方检验确定两变量之间相关性的强弱。
利用SPSSStatistics23软件,以硝酸盐为例,根据硝酸盐单因子污染评价结果将各样品的污染程度转化成定类变量,污染程度为未污染、轻污染、中污染、较重污染、严重污染、极重污染类别分别对应1,2,3,4,5,6,将土地利用类型设为行变量,硝酸盐污染程度定类变量设为列变量,进行二维交叉列联表分析,分析结果如表4所示。
表4 土地利用类型*硝酸盐污染程度交叉表
由于所有数据中期望计数<1或者<5的数据个数超过20%,因此在卡方检验的时候必须选择费舍尔确切检验(Fisher’sExactTest),将确切检验的方法设置为蒙特卡洛方法,置信水平和样本数量分别设置为95%和1000,根据SPSS卡方检验后得出的相伴概率P判断行列变量是否存在相关性[16]。土地利用类型与硝酸盐污染程度费舍尔确切检验的相伴概率P在95%置信区间的水平上P=0.000<0.05,因此土地利用类型与硝酸盐污染程度存在相关性。要想判断土地利用类型与硝酸盐污染程度相关性的强弱,可以根据克莱姆Ⅴ系数大小判断。计算求得土地利用类型与硝酸盐污染程度克莱姆Ⅴ系数值为0.510,说明土地利用类型与硝酸盐污染程度呈强相关关系。
要想进一步反应不同土地利用类型之间污染程度的差异,可以通过比较调整后的残差加以确定。由于涉及多重比较,为了估计更加保守,可以选择调整后残差的绝对值以3为界。大于3时,认为该数值的观测频数与期望频数之间的差异存在统计学意义[17]。由表5可知,城镇用地硝酸盐污染程度为1(未污染)的调整后残差为4.8,差异存在统计学意义,说明城镇用地中倾向于不受到硝酸盐的污染。同理,旱地硝酸盐污染程度为2(轻污染)的调整后残差为3.2,说明旱地倾向于受到较轻程度的硝酸盐污染;农村居民点用地硝酸盐污染程度为3(中等污染)的调整后残差为7,说明农村居民点用地倾向于受到中等程度的硝酸盐污染;园地硝酸盐污染程度为5(严重污染)的调整后残差为4.3,说明园地倾向于受到严重程度的硝酸盐污染;水浇地硝酸盐污染程度为6(极重污染)的调整后残差为4.8,说明水浇地倾向于受到极重程度的硝酸盐污染。
造成研究区硝酸盐污染差异化分布的原因是:研究区土地利用类型中水浇地占比较大,水浇地含氮化肥的大面积过量使用,在细菌微生物的作用下发生一系列化学反应最终以硝酸盐的形式滞留在土壤之中,随降水和灌溉水下渗至浅层地下水造成水体严重污染。部分水浇地附近地表水体已经受到生活生产污水的氮污染,在干旱年份浅层地下水补给量减少,在农业灌溉过程中为了节约浅层地下水直接利用被污染的地表水体进行灌溉造成地下水氮污染加剧。园地在作物生长过程中化肥农药的使用量相对水浇地有所减少,因此硝酸盐污染程度较水浇地有所减轻。农村居民点用地硝酸盐污染来源主要是生活污水、垃圾及粪便的不当处理,硝酸盐污染程度较之水浇地及园地更加减弱。城镇用地由于硝酸盐污染源较少,因此城镇用地基本不受到硝酸盐的污染。
土地利用类型与氯化物污染程度费舍尔精确检验的相伴概率值在95%置信区间的水平上P=0.400>0.05,因此土地利用类型与氯化物污染程度不存在相关性。地下水中氯化物主要来源包括含氯矿物的溶解以及风化溶解、海水入侵、居民区生活污水以及粪便排放[18]。通过分析受氯化物较重污染程度以上取样点的分布,受氯化物较重污染程度以上取样点基本都分布在沿海区域,越靠近内陆区域污染程度越小,推测研究区氯化物污染主要是由于海水入侵造成的。
土地利用类型与硫酸盐污染程度费舍尔精确检验的相伴概率值在95%置信区间的水平上P=0.917>0.05,因此土地利用类型与硫酸盐污染程度不存在相关性。通过分析硫酸盐较重污染程度以上取样点的分布,发现与氯化物污染程度分布相似,硫酸盐较重污染程度以上取样点基本都分布在沿海区域,内陆区域污染程度较小,因此可以推断研究区沿海地区硫酸盐污染主要是由于海水入侵造成的,污染程度比较严重,内陆地区硫酸盐污染由化石燃料燃烧、工业污水排放、含硫酸盐化肥农药过量使用造成,污染程度较轻。
土地利用类型与总硬度污染程度费舍尔精确检验的相伴概率值在95%置信区间的水平上P=0.297>0.05,因此土地利用类型与总硬度污染程度不存在相关性。通过分析总硬度较重污染程度以上取样点的分布,我们发现,与氯化物污染程度分布相似,总硬度较重污染程度以上取样点基本都分布在沿海区域,内陆区域污染程度越小,因此可以推断研究区沿海地区总硬度污染主要是由于海水入侵造成的,污染程度比较严重,内陆地区总硬度污染受地质因素[19-20]、污水排放、化肥农药过量使用以及地下水过量开采所致,污染程度较轻。
利用SPSS计算氯化物、硫酸盐和总硬度两两变量之间的皮尔逊相关系数,结果显示:氯化物、硫酸盐和总硬度两两变量之间的sig值均为0.000,说明变量之间在0.01水平(双侧)上显著相关(表5),氯化物、硫酸盐和总硬度之间的相关系数分别为0.903,0.919,0.948,说明两两变量之间相关性极强。也可以印证沿海区域氯化物、硫酸盐和总硬度污染程度高均与海水入侵有关。
表5 氯化物、硫酸盐和总硬度相关性分析结果表
土地利用类型与TDS污染程度费舍尔精确检验的相伴概率值在95%置信区间的水平上P=0.037<0.05,因此土地利用类型与TDS污染程度存在相关性。土地利用类型与TDS污染程度克莱姆Ⅴ系数系数值为0.328,说明土地利用现状与TDS污染程度呈中等相关关系。同样通过上述方法,计算求得土地利用类型与亚硝酸盐与氨氮不具有显著相关性。
3.3 基于粗糙集理论的地下水污染综合评价结果
将本次地下水污染评价单指标污染程度进行数值化处理,其中条件属性分别为1(Pij≤0),2(0
利用粗糙集理论计算方法,求得指标(硝酸盐污染程度C5)的权重:
同理,可以求得W(C1)=0.1875;W(C2)=0.125;W(C3)=0.125;W(C4)=0.1875;W(C6)=0.0625;W(C7)=0.0625
将各取样点单因子污染评价指数乘以相应的权重,得到该点的地下水污染综合评价指数I,利用自然断点法(jenks)对地下水污染综合评价指数的污染等级进行划分(表6),绘制研究区松散岩类孔隙地下水污染综合评价分区图(图4)。
表6 地下水污染综合评价分级标准
3.4 分析与讨论
研究区污染程度为未污染和轻污染区域面积分别约为113.63km2和141.86km2,分别约占总面积的18.08%和22.57%。农村居民点用地、水浇地和园地虽也有小面积分布,但区域土地利用类型主要以城镇用地为主,整体上区域污染源较少,未受到海水入侵影响,浅层地下水水交替迅速,地下水通过其自净能力将水质净化,整体上该区域浅层地下水环境较好。
基于粗糙集理论的地下水污染综合评价,首先从计算原理上,权重的计算能够极大的避免主观因素的影响,各参评指标的权重值也与研究区单因子实际的污染程度相吻合。其次,通过粗糙集理论对研究区开展的地下水污染综合评价能够较为准确地反应评价区的总体污染情况,评价结果合理,可靠性较高,对于区域地下水污染防治工作具有参考意义。
4 结论
(1)根据研究区松散岩类孔隙水单因子评价结果显示:研究区主要污染因子包括总硬度、TDS、硝酸盐、亚硝酸盐、硫酸盐、氯化物、氨氮,其中硝酸盐污染最为普遍。
(2)利用SPSSStatistics23软件,基于数理统计分析研究区土地利用类型与主要污染因子之间的关系,结果表明:土地利用类型与硝酸盐污染程度呈强相关关系,土地利用类型与TDS污染程度呈中等相关关系。土地利用类型虽然与硫酸盐、氯化物和总硬度无明显相关性,但三因子两两之间呈强相关性关系。
(3)基于粗糙集理论对研究区松散岩类孔隙水进行地下水污染综合评价,结果表明:研究区严重污染和极重污染区主要分布在沿海地区,海水入侵是造成该区域污染程度严重的因素。研究区中污染和较重污染区也受到中等程度的海水入侵影响,农业用地化肥农药的不合理使用,污水粪便的不合理排放也会造成区域污染加重,但影响程度不及海水入侵。该评价方法较为合理,值得推广。