基于Spearman 秩相关系数法的上海市水体水质变化特征分析
2020-07-15陈昊
陈 昊
(1.上海市环境科学研究院,上海 200135; 2.同济大学环境科学与工程学院,上海 200092)
0 引言
国务院颁布实施的《水污染防治行动计划》明确,城市建成区黑臭水体、丧失功能水体(劣于V 类水体标准)是水环境质量改善的两大阶段性目标指标,是水生态功能系统初步恢复目标得以实现的基础。上海市河网区域的水体量大面广,镇级以上河道即达到4 000 多条,而全市共有40 000 多个河湖水体,河道之间连通性较差,水质差异较大,全覆盖监测一次经费、人力投入极大。对个体河道而言,河道水质情况受到温度、季节、水文、上游来水水质、污染来源特征、水体自身的降解能力等因素,尤其是偶然性污染排放的影响,使得同一监测点位水质存在一定范围内波动的情况。对照国家GB 3838—2002《地表水环境质量标准》,存在不同季节监测评价出的水质类别有几个类别等级的差异的问题。这对长效监管过程中劣V 类水体的识别和筛查带来了很大的难度。利用统计学方法对历年大量水质监测数据进行分析,能够帮助我们有效降低水质偶发性变化的影响,探索水质在年际尺度内的周期性变化规律。
因此,本文通过现有水质监测数据的统计分析,识别上海市域的城市水体主要限制因子,并进行月度变化特征分析,探讨在不同月份识别水体水质类别进行水质监测的重点监测因子和相应月份参考筛选值,为提高识别、筛查水体水质效率提供参考技术手段。
1 研究方法
1.1 研究区域概况
上海市位于长江三角洲东缘,太湖流域下游,东濒东海,南临杭州湾,北依长江口,西接江苏、浙江2省。根据2018 年的统计数据,全市的常住人口2 423.78 万人,户籍人口1 447.57 万人;年地表径流量 32.03 亿 m3,本地水资源总量 38.70 亿 m3。
上海属东亚副热带季风性气候,全年四季分明,日照充分,雨量充沛。冬季盛行西北风,寒冷干燥;夏季多东南风,温暖湿润。多年平均气温15.2~15.7 ℃,多年平均降水量1 097.3 mm,70%集中在4~9 月。4~8 月盛行东南风,11 月至次年2 月盛行西北风。受到气温、降雨等气象条件影响,上海市水环境质量有明显的季节性变化[1]。
1.2 我国地表水质标准定义
根据GB 3838—2000《地表水环境质量标准》对水体功能类别的定义,I~V 类水体分别定义为源头水、国家自然保护区、饮用水源保护区、水生生物栖息地、水产养殖区、工业和娱乐用水区、以及农业和一般景观用水区等功能,而劣于V 类水标准的水体,则被定义为丧失功能水体。
从水质标准的修订依据来看,夏青等[2-4]在编制我国水质标准的过程中,考虑了将各项水质因子从感官、生态毒性、水体富营养化等方面进行分类。其中,DO 作为水体感官指标及保护水生生物生存的指标,是鱼类生存的必要条件,也是衡量水体水质好坏的一项重要指标,IV 类水体考虑保证鱼类正常生存的最低质量浓度,定为3 mg/L,V 类水体为维持鱼类不发生急性死亡,定为2 mg/L。NH3-N(非离子氨)则作为一项保护水生生物的毒理学指标[5-8],IV 类水体1.5 mg/L 参考了日本渔业水质标准允许质量浓度,同时兼顾NH3-N 对水体DO 下降的影响,在此基础上确定V 类水标准。而在目前上海的实际应用中,NH3-N 也是作为生活污染、养殖污染的一项重要指针指标。TP 作为控制水体富营养化的主要指标,在基于国外研究的基础上从防治水体富营养化角度提出了标准值[9-10],同时考虑了国内水体富营养化原因的不同,对IV,V 类水体质量浓度分别放宽至0.3 和0.4 mg/L 的标准,并建议各地区根据水体实际情况进行进一步控制。
1.3 分析方法
R 语言是用于统计分析、绘图的语言和操作环境,R 是属于GNU 系统的一个自由、免费、源代码开放的软件,是一个用于统计计算和统计制图的优秀工具。RStudio 是R 的集成开发环境,界面更加丰富实用,使用起来更加方便,它具有调试、可视化等功能,还支持纯R 脚本、脚本文档混排、交互式网络应用等。Spearman 斯皮尔曼相关系数可认为是等级变量之间的Person 皮尔逊相关系数。对于样本容量为n 的样本,n 个原始数据被转换成等级数据,原始数据依据其在总体数据中平均的降序位置,分配一个相应等级。
本文选取上海市典型水体2018 年水质数据进行分析,DO,NH3-N 和 TP 是黑臭/劣 V 类水体的主要限制因子[11-13],通过RStudio 的R 语言编程平台,分别对主要限制因子的2018 年度月度值与年均值进行相关性分析,计算Spearman 相关系数,明确相关性较高的月份,探索不同因子对年均值起主导影响作用的月份。
回归分析通常用来对数据元素之间的复杂关系建立模型,用来预测估计一种处理方法对结果的影响。本文在相关性分析的基础上,利用RStudio 对特征月份浓度值与年均值关系进行线性回归分析,寻找不同因子的最佳拟合回归关系,以此明确识别劣V 类水体时不同水质监测因子在不同时间段的参考限值、监测时间及频次。
2 结果与讨论
2.1 月度变化相关性分析
2018 年DO 浓度月度值与年均值相关系数及超标倍数见图1。由图1 可见,DO 与年均值相关性较高的月份为4~7 月(相关系数大于0.75),其中6 月相关性最高;冬季与夏季的相关性很低,可见单测某个季节的DO 浓度,不能说明该河道最好或最坏情况。从各月浓度与年均浓度比较来看,2 月份与年均值的比值相较其他月份而言最高,最高达到年均值的2.5 倍,有25%的断面达到年均值的1.75 倍,有25%的断面达到年均值的1.35 倍以上;而7 月份相比于年均值而言最低,75%的断面仅达到年均值的0.8 倍。
DO 浓度整体最高的2 月份与年均值的相关性并不高,浓度整体较低的7 月份则与年均值相关性较高,可见DO 的年均值更多受到夏季低DO 条件下的水质状况影响[14-16],本文将进一步对于7 月份DO 浓度值与年均值进行回归分析,建立DO 的7 月份对于年均值影响的拟合曲线。
图1 DO 浓度月度值与年均值相关系数及超标倍数
NH3-N 浓度月度值与年均值相关系数及超标倍数见图2。由图2 可见,NH3-N 与年均值相关性较高的月份为 2,4 和 5 月(相关系数大于 0.85);冬季与夏季的相关性很低,可见单测某个季节的NH3-N浓度值,不能说明该河道最好或最坏情况。从各月浓度与年均值比较来看,2 月份与年均值的比值相较其他月份而言最高,3/4 以上的断面2 月份较年均值高出20%以上,且有半数以上的断面高出了50%;而10 月份相比于年均值而言最低,75%的断面仅为年均值的0.8 倍,有半数断面仅为年均值的0.5 倍。
NH3-N 浓度整体最高的2 月份与年均值的相关性同样较高,而与年均值相关性同样较高的4 月和5 月月度值与年均值相对趋同,分别有半数以上的断面月度水质与年均值的差异幅度在30%以内。本文将进一步对于2 月份NH3-N 浓度值与年均值进行回归分析,建立NH3-N 的2 月浓度值对于年均值影响的拟合曲线。
图2 NH3-N 浓度月度值与年均值相关系数及超标倍数
TP 浓度月度值与年均值相关系数及超标倍数见图3。由图3 可见,TP 浓度月均值与年均值相关性较高的月份为4~8 月 (相关系数大于0.75),其中,5 月份相关系数最大; 冬季与夏季的相关性很低,可见单测某个季节的NH3-N 值,不能说明该河道最好或最坏情况。从各月浓度与年均值比较来看,7 月份月度值与年均值的比值相较其他月份而言最高,3/4 以上的断面7 月份浓度值高于年均值,且有半数以上的断面高出了50%; 而4 月份和11月份的月度值相比于年均值而言最低,各有75%的断面月度值低于年均值,有半数断面低于年均值10%以上。
TP 浓度整体最高的7 月份与年均值的相关性较高,而TP 浓度整体较低的4 月份与年均值的相关性同样较高。本文将进一步对于7 月份TP 浓度值与年均值进行回归分析,建立TP 在7 月份月度值对于年均值影响的拟合曲线。
图3 TP 浓度月度值与年均值相关系数及超标倍数
2.2 回归分析结果
选取DO 的2018 年7 月份浓度值与年均值进行拟合,见图4。分别进行了一元线性回归、指数、对数回归分析,根据拟合结果,DO 的7 月浓度值与年均值更符合指数关系,为:
式中:ρ(DO)年均为 DO 全年平均质量浓度,mg/L;ρ(DO)7月为 DO 7 月份监测质量浓度,mg/L。
图4 DO 的7 月质量浓度与年均值拟合结果
由图4 可见,DO 质量浓度在7 月份达到2 mg/L的情况下,年均质量浓度对应为4.84 mg/L,若DO年均质量浓度为2 mg/L 的情况下,7 月份对应仅为0.1 mg/L。
选取NH3-N 的2018 年2 月份浓度值与年均值进行拟合,见图5。分别进行了一元线性回归、指数、对数回归分析,根据拟合结果,NH3-N 的2 月浓度值与年均值更符合指数关系,为:
式中:ρ(NH3-N)年均为 NH3-N 全年平均质量浓度,mg/L;ρ(NH3-N)2月为 NH3-N 的 2 月份监测值,mg/L。
图5 NH3-N 的2 月质量浓度与年均值拟合结果
由图5 可见,NH3-N 在 2 月份质量浓度为 2 mg/L 的情况下,年均质量浓度对应为1.23 mg/L,若NH3-N 年均质量浓度为2 mg/L 的情况下,2 月份可能为3.6 mg/L。
选取TP 的2018 年7 月份浓度值与年均值进行拟合,见图6。分别进行了一元线性回归、指数、对数回归分析,根据拟合结果,TP 的7 月浓度值与年均值更符合一元线性关系,为:
式 中:ρ(TP)年均为 TP 全年 平 均 质 量 浓 度,mg/L;ρ(TP)7月为 TP 的 7 月份监测质量浓度,mg/L。
图6 TP 的7 月质量浓度与年均值拟合结果
由图6 可见,TP 的 7 月份质量浓度为0 mg/L的情况下,年均质量浓度为0.31 mg/L,若TP 年质量浓度为0.4 mg/L 的情况下,7 月份会达到0.57 mg/L。
2.3 讨论
(1)各因子月度变化规律特征
从各因子的月度变化规律来看,不同因子间月度变化存在较大差异,显示不同因子污染成因及特征不同。DO 在温度导致的饱和DO 浓度、污染物耗氧速率等因素影响下月度变化差异较大; 不同断面NH3-N 在各单一月度的差异幅度较大,并且总体呈现冬季较高的特征,主要原因在于NH3-N 易受局部污染影响且受降解速率影响较大;TP 全年的月度变化整体较为稳定,在6~10 月较其余月份略高,其主要原因为地表径流是TP 的主要污染源之一,6~10月为上海市降雨量较大季节。
(2)不同因子变化特征
在回归分析中可以看出,DO,NH3-N 和TP 这3项指标的月度与年均值相关性均较高,可以说明月度数据能够大致反映水质断面的整体情况,但不同指标的相关性变化特征不同,主要原因在于不同指标的污染成因、受温度水文等影响因素的敏感性存在差异。
DO 的7 月监测值与年均值符合指数关系。7 月份ρ(DO)≥10 mg/L 的断面,其年均质量浓度基本都≥6 mg/L,达到地表水 II 类水标准(ρ(DO)≥ 6 mg/L);7 月份ρ(DO)≥5 mg/L 的断面,其年均质量浓度基本≥5 mg/L,即7 月份高DO 的水体能够反映其年度整体水质较好;7 月份 ρ(DO)≤ 2 mg/L 的断面,其年均质量浓度介于2~7 mg/L 之间,可知单月高DO能够反映好水体水质状况,但DO 年均值水平不能反映单月DO 浓度的对应水平。
NH3-N 的2 月浓度与年均值关系的指数关系拟合度较好。NH3-N 月度及年度质量浓度较集中于2 mg/L(地表水V 类水标准为≤2 mg/L)以下,年均质量浓度≥2 mg/L 的断面,在2 月份基本同样高于2 mg/L,可见2 月份NH3-N 质量浓度≤2 mg/L,能够确保该断面年度整体水平≤2 mg/L,但年均质量浓度≤2 mg/L 不能反映单月NH3-N 浓度的对应水平。
TP 的月度值与年均值关系呈现线性关系,且分布较平均,说明无论污染程度如何,TP 月度值与年均值均有较好的线性关系。TP 月度质量浓度≤0.4 mg/L(地表水V 类水标准为≤0.4 mg/L)除 1 个断面外其余各断面年均值均≤0.4 mg/L,可见7 月份ρ(TP)≤0.4 mg/L,能够基本确保该断面年度整体水平≤0.4 mg/L,但年均质量浓度≤0.4 mg/L 不能反映单月TP 浓度的对应水平。
(3)对水质控制目标意义的讨论
根据我国水质标准中对于V 类水体的指标值制定的目的来看,无论是DO,NH3-N 还是TP,主要还是从水体感官、水生态保护、富营养化防控角度制定了较为宽松的标准值,为此郭晓茆、郭海娟等[7-8]也指出,任一时刻水体的任一项水质因子未达到V 类水标准,即表明水质支持V 类水某一使用功能就会有问题。这就要求我们在评价水体水质类别时,在水质季节变化影响特征下,应充分考虑各项水质指标可能出现的最差情况。
目前,我们正在开展的消除劣V 类水体工作,可以说是全市水体从消除黑臭等感官问题逐步转向以水生态修复为目标的重要节点目标之一,也是我们从关注水体功能分类到关注水生生物急性、慢性毒性两类生态基准为体系的管理体系调整的基础。通过回归曲线推算得出不同指标在不同月份出现的最低值,可作为在水质监测频次因客观因素限制的情况下作为筛选黑臭/劣V 类水体的参考技术手段,确保各因子在不同月份的最差值达到水质标准,才是我们真正消除劣V 类水体有意义的指标。
3 结论与建议
无论是黑臭水体还是劣V 类水体,DO,NH3-N是最主要超标因子,水质的类别受到该2 项指标的影响最大,TP 则对V 类水体的达标有较大影响,在后期对于全市黑臭/劣V 类水体的识别中,建议重点关注 DO,NH3-N 和 TP 等 3 项指标。
整体而言,不同因子各月间浓度值存在较大波动,年均值与水质较差月份的相关性较高,河道水质年度整体情况受水质最差月份的影响最大,应重点关注水质最差月份的监测情况,DO 应重点关注7月份,NH3-N 应关注 2 月份,TP 应关注 7 月。
回归分析显示,从判断最差月份能够达到V 类水标准的角度考虑,DO 质量浓度在7 月份达到2 mg/L 的情况下,年均值对应拟合结果为4.84 mg/L;NH3-N 在2 月份质量浓度为2 mg/L 的情况下,年均质量浓度对应拟合结果为1.23 mg/L;TP7 的月份质量浓度为0.4 mg/L 的情况下,年均质量浓度对应拟合结果为0.31 mg/L。上述限值可作为上海市黑臭/劣V 类水体的初步识别限值,应对于达不到参考限值的水体进一步开展连续监测,结合周边污染源识别,方能明确其水质实际情况。