基于典型日筛选的2004-2018年小浪底水质变化分析
2021-02-22樊宇堃蔡琦王春浩
樊宇堃,蔡琦,王春浩
(河海大学水文水资源学院,江苏 南京 210098)
1 引言
近年来,随着全球生态环境问题的日益突出,人类对水体污染问题也日益重视。河流的水质状况受其流域的人类活动、经济发展等影响具有时空差异性,因此需要对水体污染物时空互补特性进行动态分析。水质评价对水资源规划、管理与保护有着十分重要的作用,通过对水质的评价可发现水体污染程度及水质变化的规律,有利于制定相应的治理方案。黄河作为中国北方主要水源之一,其水质问题一直受到学术界的广泛关注。
目前,为充分了解水质信息,国内外学者为不同区域的水体进行水质分析,主要采用多元统计分析方法,如成分分析法、线性回归法、聚类分析算法、多元方差分析法等等。这些方法广泛应用于黄河流域、淮河流域、太湖、尼罗河流域以及部分城区等水体水质的时空分布特性分析中,申洪鑫等运用单因子污染指数法、内梅罗污染指数法和因子分析法对大汶河流域水质状况和污染源进行评价与分析;李义禄等综合利用GIS平台系统及多种多元统计技术对苏州古城区水体污染时空分布特征及污染源进行解析;张彦等通过M-K 检验和聚类分析对河南省2009-2017年水体污染物时空分布特征进行解析;明星等结合主成分与聚类的复合分析模型以及spss 统计分析软件得出我国各地区废水中污染物排放特征,并提出重点的针对治理措施,以利于各地区的污染控制与防治;李春晖、杨志峰通过单因子评价法揭示了黄河干流多年来水体污染的时空变化规律,并举例对干流各站点的水质水量进行联合评价;孙艺珂等使用主成分分析法赋权,并提出改进的内梅罗指数法,从而建立了改进的综合水质指数法;颜剑波等应用多元回归分析,预测出三门峡断面主要污染物浓度;徐发凯等基于综合污染指数法,结合单因子污染指数法及累积距平法等多种统计分析方法,定量分析了黄河流域兰州和白银段7 个监测断面水质时空变化特征。另外,相关的统计分析方法在国外河流流域水质时空分布特征方面也有运用。综上所述,目前多元统计分析方法在流域时空特性分析中应用较多,但大多为对个别断面进行分析,缺少对于黄河流域较为全面的分析。
因此,文章选用K-means 聚类算法对黄河流域的7 个主要监测断面2004-2018 年污染物数据进行聚类分析,得出黄河流域水体污染物在时间上的变化特征。此项研究对于黄河流域的水污染治理有着指导意义,可以为相关部门提供决策依据。
2 研究区域概况
黄河流域位于东经95°54′~119°13′,北纬32°09′~41°50′,是连接青藏高原、黄土高原、华北平原的重要生态廊道。黄河发源于青藏高原巴颜喀拉山北麓的约古宗列盆地,流经青海、四川、甘肃、宁夏、内蒙古、陕西、山西、河南、山东9 省区,从山东省注入渤海,全长5 464 km,流域面积79.50 万km2,直接影响全国近1/10的国土面积和近1/5的人口的生态及用水需求。
小浪底水利枢纽位于河南省洛阳市以北40 km 的黄河干流上,控制流域面积占黄河流域面积的92.30%,是以防洪为主;兼顾防凌、减淤、灌溉和发电综合利用的特大型水利工程。小浪底库区河段为峡谷型河道,从三门峡至小浪底流程130 km,区间流域面积5 756 km2,有较多支流、支沟、毛沟汇入,其中较大支流有北岸的西阳河、逢石河、亳清河、板涧河和南岸的畛河、青河等18条,比降一般较陡,多数分布在库中区和库前区。
3 方法原理
3.1 数据来源与标准化处理
研究数据主要来源于中华人民共和国生态环境部发布的黄河主要监测断面水质情况,选取了沿黄河干流的河南济源小浪底监测断面,COD(化学需氧量)、DO(溶解氧)和NH3-N(氮氧含量)三个水质监测指标,水质监测数据为2004-2018 年的原始水质监测数据,监测频率为每日1 次,通过对数据进行标准化处理将水质监测数据整理为标准化数据,据此来对黄河流域主要水体污染物进行年际时空互补特性分析。
数据标准化的方法有很多种,常用的有“最小—最大标准化”“Z-score 标准化”和“按小数定标标准化”等。经过上述标准化处理,原始数据转换为无量纲化指标测评值,即各指标值都处于同一个数量级别上,可进行综合测评分析。
文章选取“最小—最大标准化”方法对原始数据进行处理分析,其方法是对原始数据进行线性变换。具体如下所示:
式(1)中:Dmax和Dmin分别为属性D的最大值和最小值,将D 的一个原始值Draw 通过Min-Max 标准化映射成在区间[0,1]中的值Dnew。
3.2 基于K-means算法的典型日筛选
水体主要污染物指标CODMn、NH3-N、DO 在短期内易受环境变化等诸多因素影响而变化显著,且指标间的相对大小关系短期特性差异较大,因此根据短期水体特征分析中长期水体特征变化之前筛选出典型日是非常必要的。可以根据筛选出的不同测站2004-2018 年的典型日对该站的所有数据进行分类并统计其变化特征与指标数值突变点,进一步分析水体污染物的时间变化特征。
在大规模数据处理与分析中,机器学习具有精确、高效的特点。因此,文章将使用机器学习的方法对各类典型日进行智能划分。由于各测站的水体污染物典型日在分类前无法获取,因此,文章将选用已广泛应用的无监督分类算法K-means,其核心思想是针对给定的样本集合,以样本之间的欧氏距离为依据,将样本集合划分为K个类别。欧氏距离越近,样本间相似度越大。各类之间遵循类内的样本间距尽可能小,类与类之间样本间距尽可能大的原则。水体主要污染物指标典型日具体筛选流程如图1所示:
图1 K-means算法筛选典型日流程图
3.3 M-K突变评价体系
Mann-Kendall 检验(简称M-K 检验)是一种非参数统计检验方法,最初由Mann 于1945 年提出,它不需要假定样本服从某种分布,且不受少数异常值的干扰,在全球气候变化及其影响的研究方面得到了广泛应用。
原假设H0:序列无趋势性变化;备择假设H1:序列有趋势性变化。
对于样本容量为n的时间序列X,构造如下统计量:
在选定显著性水平a 之后,查正态分布表得到Ma/2,若|M| <Ma/2,则拒绝序列无趋势性变化的原假设,即推断出在显著性水平a下,序列存在向上或向下的趋势(M >Ma/2表示序列呈上升趋势,M <Ma/2表示序列呈下降趋势);否则,接受序列无趋势性变化的假设。
4 分析与结果
4.1 水体污染物的分布特征分析
根据2004-2018年济源小浪底监测站点的水质监测数据,济源小浪底的CODMn(高锰酸盐指数)质量浓度最大为6.90 mg/L,超过了II类水质标准的2.3倍,济源小浪底的CODMn质量浓度最小为1.20 mg/L,达到了I水质标准。CODMn质量浓度达到I类水质标准的监测天数有4 个,占比11.79%;II 类水质标准的监测天数有566个,占比79.49%;Ⅲ类水质标准的监测天数有61个,占比8.58%;IV 类水质标准的监测天数有1 个,占比0.14%。济源小浪底的NH3-N质量浓度最大为1.81 mg/L,超过了II类水质标准的3.60倍,济源小浪底的NH3-N质量浓度最小为0.03 mg/L,达到了I水质标准。NH3-N质量浓度达到I类水质标准的监测天数有218 个,占比30.83%;II 类水质标准的监测天数有341个,占比48.24%;Ⅲ类水质标准的监测天数有92个,占比13.01%;IV 类水质标准的监测天数有51 个,占比7.21%,V 类水质标准的监测天数有5 个,占比0.71%。济源小浪底的DO 质量浓度最大为14.10 mg/L,超过了II 类水质标准的2.35 倍,济源小浪底的DO 质量浓度最小为1.25 mg/L,达到了I 水质标准。DO 质量浓度达到I 类水质标准的监测天数有338 个,占比47.47%;II 类水质标准的监测天数有132 个,占比18.54%;Ⅲ类水质标准的监测天数有100 个,占比14.04%;IV类水质标准的监测天数有108 个,占比15.17%,V 类水质标准的监测天数有30 个,占比4.22%,劣V 类水质标准的监测天数有4个,占比0.56%。总体来说,济源小浪底监测站点的水体污染物的平均质量浓度较低,CODMn平均质量浓度达到了II类水质标准,NH3-N平均质量浓度达到了II类水质标准,DO平均质量浓度达到了II类水质标准,但近年来仍有部分时期的水体污染物质量浓度超过了Ⅲ类水质标准,水质有待进一步的加强。
4.2 水体污染物多年变化趋势分析
4.2.1 典型日筛选与分析
根据河南小浪底监测断面2004-2018年的逐日数据,利用基于K-means算法的典型日筛选模型进行聚类与分析,得到了该监测断面的四类典型日(图2)。
图2 典型日筛选结果图
根据典型日分类结果可知:分类模型从2004-2018年逐日标准化数据中筛选出了4类典型日,典型日数据特征分别为:
第一类典型日(a)溶解氧含量最高,高锰酸盐指数与氨氮指数较低,三者数据差值较大,表征水质污染情况较轻,水质情况良好。
第二类典型日(b)高锰酸盐指数最高,溶解氧指数其次,氨氮指数最低。突出特征为高锰酸盐指数较其他两指标表现异常,表征此类典型日受有机物污染较为严重,水质情况较差。
第三类典型日(c)溶解氧含量最高,氨氮指数略低于溶解氧指数,高锰酸盐指数最低。此类典型日尽管溶解氧指数较高,但另外二者较其他典型日数据提升较明显,表征此时水体中有机物含量与富营养化较严重,水质情况较差。
第四类典型日(d)溶解氧含量最高,高锰酸盐指数其次,氨氮指数最低。表征水质有轻微有机物污染,但水质情况总体良好。
根据典型日数量年际变化图可知:第一类典型日与第四类典型日的天数在15d间呈上升趋势,第二类典型日与第三类典型日的天数则呈明显下降趋势,其中,第三类典型日在2015—2018年中数量变为0,第二类典型日在2017年中数量下降为0。
4.2.2 三项指标M-K检验结果
将黄河小浪底标准化数据当中的各指标值进行M-K 检验,得到三项指标的UFk-UBk关系图(图4)。
图4 M-K检验结果图
由UFk 曲线及UBk 的变化趋势可知:2004-2018 年间DO指数呈明显的上升趋势,而NH3-N 与CODMn指数则呈下降趋势。由图中两曲线的交线与临界线的关系可以得出:DO 指数与CODMn指数没有明显的突变,而NH3-N指数在2008年6月前后有明显的突变。
图3 典型日数量年际变化图
5 结论
通过对2004-2018 年小浪底水质变化分析,可得出以下结论:
济源小浪底监测站点的水体污染物的平均质量浓度整体较低,水质较好。水体污染物CODMn、NH3-N和DO平均质量浓度都达到了II类水质标准,CODMn质量浓度超过Ⅲ类水质标准的监测天数占比91.28%,NH3-N 质量浓度超过Ⅲ类水质标准的监测天数占比79.07%,DO质量浓度超过Ⅲ类水质标准的监测天数占比66.01%。
M-K检验和典型日分析结果具有一致性,均可表明济源小浪底监测站点的水体污染物整体上趋势呈现显著减小趋势,2004-2018年间DO指数呈明显的上升趋势,而NH3-N与CODMn指数则呈下降趋势。在2015 年到2018 年水质达到较好的情况,其中NH3-N 与CODMn指数大幅降低,溶氧量指数保持较高水平。
值得注意的是,尽管2004-2018 年间水质呈现变好趋势,但近年来仍有部分时期的水体污染物质量浓度超过了Ⅲ类水质标准,水质仍有待进一步的提升。