主成分分析法评价汕头境内主饮用水源地水质
2021-05-06陈泽榕
陈泽榕
(广东省水文局汕头水文分局,广东 汕头 515041)
1 概述
水质评价的核心是水质评价方法,当前主流的水质分析评价方法有单因子评价法、综合水质标识指数评价法、人工神经网络评价法、模糊数学综合评价法、灰色系统评价法等等[1~4]。
单因子评价法是当前国标使用的分析评价方法[5],评价计算过程简单直观,直接从监测数据指标中筛选出最差的单项指标对应的水质类别作为水体的最终水质类别,判断水体水质是否达标,但是水体的污染情况和污染程度是受多种污染物指标共同影响的,不能简单一概而论,所以其科学合理性值得商榷。因此,选择一种能全面客观反映各种污染指标对水体水质真实影响的分析方法作为国标单因子评价法的补充是非常必要的。
主成分分析法可以综合考虑各种影响因子的影响,在最大程度保留各种监测指标信息的基础上,将多维因子通过降维纳入同一体系,简化数据结构,将繁多的原始指标转化成少量综合指标进行评价,从根本上避免了少数污染指标对水质类别的决定性影响,合理客观地赋予各个污染指标权重,使最终评价结果更加科学准确[6、7]。
2 汕头境内主要饮用水源地水质评价
2.1 监测断面及监测指标的确定
韩江是汕头近560 万人口的主要饮用水源,关系到汕头经济社会的稳定和发展,因此本文选取韩江汕头境内7 个主要水源地监测断面2019 年水质监测指标进行分析研究,7 个主要水源地监测断面分别为南社、庵埠水厂、澄海东部水厂、澄海第二水厂、澄海第一水厂、秋风岭水库和河溪水库。同时结合实际污染物指标的情况,选取高锰酸盐指数、六价铬、溶解氧、氨氮、五日生化需氧量、粪大肠菌群、氟化物、总磷、铜、锌10 个最具代表性的水质监测指标进行统计(见表1)。
2.2 监测数据的标准化处理
由于溶解氧的浓度和水质呈负相关关系,即溶解氧越小水质越差。因此,需要对溶解氧指标进行正向化处理,并将处理后的数据与其他监测数据一起进行标准化处理(见表2)。
2.3 主要计算结果及分析
本文采用spss statistics 17.0软件对上述指标进行主成分分析,并对得到的相关结果进行分析,10项原始指标的相关系数矩阵见表3,特征值、方差贡献率及累计贡献率见表4。由表3可知,大多数污染物指标之间存在较大的相关系数(即相关系数绝对值大于或等于0.3),例如高锰酸盐指数和五日生化需氧量、氨氮、粪大肠菌群、氟化物、铜、锌和总磷的相关性分别达到0.858、0.705、0.676、0.717、0.718、0.511和0.818,由此得出许多变量之间具有很强的相关性,表明其反映的信息存在重叠,适宜进行主成分分析。依据特征值大于1的筛选原则,由表4可知,只有主成分1和主成分2的特征根大于1,分别为6.586和2.326,方差贡献率为65.862%和23.261%,累计方差贡献率已达89.123%,符合累计方差贡献率大于85%的要求,这说明前两个主成分已经反映了89.123%的变量信息,可以确定主成分的个数为2。
表1 各评价断面2019年水质监测数据平均值
表2 标准化处理后的数据
表3 10项原始指标的相关系数矩阵
表4 特征值、方差贡献率及累计贡献率
各水质监测指标主成分载荷矩阵见表5。由表5可以看出,在方差贡献率为65.862%的第1主成分中,六价铬、高锰酸盐指数、五日生化需氧量、氨氮、粪大肠菌群、氟化物、铜和总磷均有较高的载荷,说明这些原始污染指标主要反映在第1主成分中。其中,高锰酸盐指数、五日生化需氧量和氨氮为水体有机污染物指标,粪大肠菌群、氟化物、铜和总磷为无机有毒害污染物指标,综合表明水体主要受到工业废污水、生活污水和农业养殖污水的共同影响。同理,在第2主成分中溶解氧、五日生化需氧量和氨氮均显示出较高载荷,反映出有机污染特征,说明其受到工业废污水的影响。
表5 各水质监测指标主成分载荷矩阵
根据表5中各水质监测指标的主成分载荷系数以及其对应的表4 中第1 和第2 主成分对应特征值计算可得到主成分1(F1)、主成分2(F2)以及综合评价函数F的表达式如下:
通过表达式(1)~(3)计算各水质监测断面2019年的主成分得分和水污染综合得分,进而定量化描述所监测断面水质污染程度,结果见表6,分值越高,水质越差,污染越严重。
评价结果可知,2019年汕头境内主要饮用水源地水质监测断面污染程度综合排序为秋风岭水库<河溪水库<澄海第二水厂<庵埠水厂<澄海第一水厂<南社<澄海东部水厂<北溪桥,与2019年度常规监测的结果基本相符。
表6 各监测断面主成分得分及排序
2.4 主成分分析法和单因子指数法的比对
将10 个评价指标按照《地表水环境质量标准》(GB3838-2002)中各级水质类别对应的上限值进行上述主成分分析法计算可得各级水质的综合得分(见表7),其中由于河流和水库总磷的评价上限值不同需要分开计算,最后根据表6 中各监测断面的综合得分确定相应的水质类别并与通过单因子指数评价的水质类别进行对比(见表8)。
表7 各级水质的综合得分
表8 两种评价方法综合评价结果表
由表8 可知,澄海第一水厂、澄海第二水厂、河溪水库和秋风岭水库这4个断面的水质类别用两种分析方法评价的结果是一致的。而庵埠水厂和南社断面由于粪大肠菌群检测浓度值分别位于Ⅲ类水浓度区间中距离上限值仅29%和6%的位置,均逼近Ⅲ类水上限,因此主成分分析法在充分考虑粪大肠菌群的浓度值在Ⅲ类水浓度区间中所在位置情况后判定这两个断面均为Ⅳ类水质;澄海东部水厂和北溪桥虽然粪大肠菌群的检测浓度值超过Ⅴ类水的标准限值,但是考虑到澄海东部水厂和北溪桥断面除粪大肠菌群的水质类别为劣Ⅴ类外,其他水质检测指标的水质类别均低于Ⅰ类水和Ⅱ类水的标准限值,因此主成分分析法在全方面科学考虑各个检测指标的实际情况后判定这两个水质监测断面的水质类别为Ⅴ类。
3 结论和建议
由以上分析评价过程可知,主成分分析法通过数学方法对水质评价因子进行降维处理,并在简化变量的同时最大限度地保留原有变量所反映的污染物的信息,充分考虑各种水质监测指标对水体污染的贡献程度,评价结果比只采用最差因子赋全权的单因子指数法评价出来的结果更能科学合理地反映监测水体水质的真实情况。
不过如果检测因子的浓度位于类别浓度区间的上限,用主成分分析法计算分析后倾向于将水质类别判定高一个类别,虽然其综合考虑到各检测项目之间的影响因素,但是与目前通过的国标单因子评价法判定的水质类别有所差异。因此,在判定水体水质类别和污染情况时,将主成分分析法与单因子指数法结合起来共同分析判定,必将得到更为客观全面的评价结果。
根据上述评价结果可知,目前汕头境内饮用水源地水质大体良好,水质超标断面主要的污染指标均为粪大肠菌群,河流断面粪大肠菌群超标主要是受沿岸城乡生活污水、农田施肥使用的人畜粪便以及河流两岸的生活垃圾未经处理直排到河流的综合影响,从而使粪大肠菌群的浓度维持在高位,影响水质类别的综合判定。因此,政府各相关职能部门因出台相应的法律法规,并加大饮用水源地水污染综合执法力度,切实保障汕头近560 万人口的饮用水安全。