太湖地区某水厂原水及出厂水水质统计
2021-08-17魏郭子建林秋风黄永斌潘博伦
魏郭子建,林秋风,李 聪,*,黄永斌,易 娟,潘博伦
(1. 上海理工大学环境与建筑学院,上海 200093;2. 蒙特克莱尔州立大学,新泽西蒙特克莱尔 07043;3. 湖州市水务集团有限公司,浙江湖州 313000;4. 深圳市水务<集团>有限公司,广东深圳 518000)
太湖地区人口密度、经济规模大,产业发达。由于以往重视发展速度忽视生态环境问题,出现了本地水资源不足、水污染严重、水生态环境恶化等恶劣情况,并发生过恶性污染事件。太湖区域曾暴发大规模蓝藻污染事件,江苏省太湖地区蓝藻污染严重、太湖水质恶化,进而导致无锡自来水供应受到影响,严重影响当地居民日常生产生活[1-2]。
据相关报道,自2007年以后,太湖治理成就显著,太湖地区地表水水质大幅改善[3]。2016年,太湖水体评价中高锰酸盐、氨氮、总磷等水质指标较2007年分别提高15.6%、84.6%和3.6%,总氮相比于2007年提高38.0%,综合富营养状态评价指数由2007年的中度改善为轻度。2007年太湖15条主要入湖河道中9条河水水质为劣Ⅴ类,经过治理后,2013年已消除Ⅴ类和劣Ⅴ类河道,其中12条年均水质达到或好于Ⅲ类,地区内检测的65个截面水质达标率为77.4%,比2007年升高15.5%,治理效果显著。太湖周边城市希望加大在太湖的取水量或开辟新的饮用水源地,以满足日益增长的生产生活用水需求。
本文研究的水厂以东太湖水作为水源,臭氧预氧化+混凝沉淀砂滤作为常规处理工艺,臭氧活性炭作为深度处理工艺,出厂水进行氯消毒,为当地居民提供饮用水。
现该水厂处理工艺成熟稳定,原水出水水质均达到相关水质标准。为了进一步提高出水水质,保障供水安全性,本次研究运用统计分析软件SPSS与数理统计的方法,就水厂原水水质及主要污染成分变化进行分析,为水厂处理原水及消毒副产物提供一定参考。
1 原水水质分析
1.1 主成分分析主要污染物
主成分分析又称主分量分析或矩阵数据分析,可以将一组具有一定相关性的变量进行变换,通过正交变换将这组变量重新组合成一组线性独立的变量[4]。该方法可以对具有一定相关性的数据集进行降维,从而简化问题分析[5-6]。
使用SPSS软件对某水厂2018年1月—2019年3月,共15个月的原水水质报告中浑浊度、耗氧量、菌落总数、pH、色度、铁、锰、总氮、总磷、氯化物、总硬度共11项水质指标(表1)进行主成分分析。
表1 样本数据Tab.1 Data of Water Samples
这些样本中水质指标间具有一定相关性,通过对样本进行正交变换,将水质指标重新组合成互不相关的11个主成分,并将主成分按照特征值大小依次排列。特征值描述对应特征向量方向上包含的信息量,而单个成分特征值除以总特征值(11个水质指标就意味着总特征值为11)等于该特征向量的贡献率,贡献率代表了该维度下蕴含的信息量的比例。提取前3个特征值大于1的主成分(说明这些主成分的信息量多于1个水质指标,可以用来降维),且其累计贡献率超过75%(表2),即选取的3个主成分可以解释原始数据中11个水质指标所含75%的信息,重新组合的主成分与原始数据相比会有一定模糊性,这是变量降维过程中不得不付出的代价[7]。由于表2中主成分可以描述样本中大部分信息,可以认为是有效主成分[8]。
表2 成分特征值与贡献率Tab.2 Component Eigenvalue and Contribution Rate
通过最大方差正交旋转后可得荷载矩阵的各元素值(表3)。由表3可知,主成分1中大部分系数多为正数,且浑浊度、色度系数最高,铁、锰其次。研究表明,太湖中铁、锰等重金属的存在形式主要为颗粒[9-10]。因此, 第一主成分中变量主要与水中颗粒相关,称第一主成分为固体颗粒成分。主成分2中由pH起主要作用,而受到pH变化影响,水中硬度和磷会与水下沉积物发生物质交换[11-13]。因此,主成分2中磷具有较大的正相关系数,而与总硬度与氯化物具有较大的负相关系数,称主成分2为沉积溶解成分。主成分3中由总氮起主要作用,而耗氧量与菌落总数也具有较大的系数,铁、锰则具有较大的负相关系数,则称主成分3为有机污染成分。
表3 成分系数矩阵Tab.3 Component Coefficient Matrix
其中,得分系数为载荷矩阵除以表2中的特征值,得到3个互不相关的主成分,主成分得分如式(1)。
(1)
其中:i——主成分序号,i=1,2,3;
j——水质指标序号,j=1,2,3,…,11;
n——水质报告样本序号,n=1,2,3,…,15;
Fni——第n个水质报告中的第i主成分得分;
kij——第i个主成分中第j个水质指标得分系数;
Xj——标准化后的第j个水质指标。
对每个主成分得分与表2中的贡献率计算得到综合得分,以及运用3个主成分的水质评价表(表4),综合得分表达如式(2)。
(2)
其中:Sn——第n个水质报告的综合得分;
ci——第i个主成分的贡献率。
SPSS软件进行成分分析时,会对原始数据进行Z-score标准化预处理,因此,得到的15份报告的成分评分与综合得分和都为0。即表4中分数越高,意味着该报告与其他相比受到该成分影响越大,相反分数越低,则受到该成分影响越低;综合得分越高说明水质越差,综合得分越低说明水质越好。由表4可知,这段时间内原水水质明显好转,其中,固体颗粒成分和有机污染成分评分随着时间的推进显著下降,而沉积溶解则相对稳定。
表4 水质成分评价Tab.4 Evaluation of Water Quality Composition
1.2 聚类分析污染指标关联性
为了进一步研究原水中各水质指标的关系,对其采用聚类分析。聚类分析是一种多元统计分析方法,聚类分析与其他分析不同之处在于其所要求的划分的类别未知。聚类分析根据样本或指标的特征,按照在数据间的相似程度进行分类。同一个类中的对象会具有一定的相似性,相反,不同类的则会具有较大的相异性[14]。
1.2.1 数据标准化
首先对原始数据进行预处理,本文选择的是Z-score标准化处理。被Z-score标准化转化的水质数据均值为0,标准差为1,将所有数据转换到一个统一的数值区间内,消去了量纲的影响,从而可以对不同指标进行比较和处理,如式(3)。
(3)
其中:i——样本序号,i=1,2,3,…,n(n为样品数);
j——水质指标序号,j=1,2,3,…,m(m为变量数);
Xij——原始数据;
Sj——变量在样品的标准差;
Zij——标准化数据。
1.2.2 相关性
本文采用浙江省湖州流域某水厂2017年1月—2019年3月连续监测27个月的水质数据,选取浑浊度、色度、耗氧量、总硬度、铁、锰、氯化物、总氮、总磷共9项水质指标进行相关性分析。采用皮尔逊简单相关系数[15],如式(4),结果如表5所示。
(4)
其中:n——样本量;
xi——样本i中水质指标x的值;
yi——样本i中水质指标y的值。
由表5可知,当显著性水平α为0.01时,色度与浑浊度、铁与浑浊度、铁与色度、铁与锰、氯化物与总硬度、锰与浑浊度具有较强的线性关系。
表5 各水质指标相关系数Tab.5 Correlation Coefficients of Each Water Quality Index
1.2.3 聚类分析
使用SPSS对1.2.2相关系数矩阵的9个水质因子进行R型聚类分析,并根据结果,绘制聚类分析树形图(图1)。图1展现了聚类分析中水质指标之间与小类之间每一次合并的情况,且将各类间的距离映射到0~25[16]。
图1 R型聚类分析树状图Fig.1 Tree Diagram of R-Type Cluster Analysis
由图1可知,浑浊度、色度和锰、铁距离最近,率先分别合并成一类;其次是总硬度、氯化物合并;然后是耗氧量、总磷合并成一类。最终所有类型聚成一类。由聚类过程可知,浑浊度和色度、锰和铁关系最为密切。由1.2.2中的相关系数可知,浑浊度和色度、锰和铁具有很强的线性相关性。
1.2.4 线性回归
为了进一步分析水质指标间的统计关系,对相关性较好的两组水质指标进行回归分析[17]。通过线性回归方程来描述和反映1.2.3中得到的相关性最为密切的水质指标的关系,为水质分析及预测提供科学依据。分别对浑浊度和色度、锰和铁进行线性回归拟合,拟合的过程与结果如图2和表6所示。
表6 线性回归过程Tab.6 Linear Regression Process
浑浊度和色度、锰和铁的线性回归关系,如式(5)~式(6)。
A=0.125×I+11.908
(5)
CMn=0.053×CFe+0.023
(6)
其中:A——色度,CU;
I——浑浊度,NTU;
CMn——水中锰的含量,mg/L;
CFe——水中铁的含量,mg/L。
由表6可知,两个线性拟合R2分别为0.819和0.793,Sig.均小于0.01,说明色度与浑浊度、锰与铁的线性拟合关系具有较好的拟合性且通过显著性检验。铁锰回归显著性检验中,常数项的Sig.为0.171,说明该表达式中常数项与0差异性不显著,即常数项接近于0,对拟合关系无其他影响。
利用回归方程,根据浑浊度和铁的监测值,分别得出色度和锰的计算值,并与实际监测数据进行对比,计算误差。表7为 2018年1月—2019年3月预测值与检测数据的对比,除个别点外,两者的误差均在合理范围内(预测色度与实测值的绝对误差的绝对值不超过5,预测铁与检测值的相对误差的绝对值不超过0.05),计算值可以一定程度上反应实测值大小,说明两个线性回归方程是可以接受的。
表7 监测数据对比Tab.7 Comparison of Monitoring Data
2 消毒副产物分析
氯是一种被广泛应用的传统消毒剂,具有对微生物杀灭能力强、在水中可以长时间维持一定数量余氯、可持续消毒等优点[18],但氯会与水中的有机物、无机物发生反应生成消毒副产物(disinfection by-products,DBPs)。目前,已发现有数百种DBPs,且预计还有大量未知的DBPs等待研究揭示。DBPs中三卤甲烷和卤乙腈因水中含量较高受到重视,已被确认具有致癌、致畸、致突变的特性,对人体具有严重的危害性[19-20]。相关研究表明,DBPs大都具有毒性,一般会对人体内脏有刺激作用或麻醉作用[21-22]。例如,人长期饮用经过氯消毒的自来水,其消化和泌尿系统癌变风险会比饮用其他消毒自来水要高[23]。
2.1 消毒副产物主要成分
为了更直观地反映水中主要的DBPs以及DBPs之间的关系,按照DBPs的分子结构与官能团进行归类,将水厂出厂水DBPs水质指标分为4大类,即三卤甲烷(三氯甲烷、一氯二溴甲烷、二氯一溴甲烷、三溴甲烷)、卤乙腈(二氯乙腈、溴氯乙腈、二溴乙腈)、卤代酮类(二氯丙酮等)、卤乙醛(三氯乙醛等),并对这4类消毒副产物进行统计分析(表8)。
表8 出水DPBs数据Tab.8 DPBs Data of Finished Water
2018年2月—2019年1月水厂出厂水水质中DBPs所占比例如图3所示。由图3可知,出厂水中DBPs的4大类所占比例呈阶梯分布,三卤甲烷类占据主要成分(约75%),卤乙腈类其次,卤代酮类再次,卤乙醛类最少,即该水厂出厂水中DBPs主要为三卤甲烷和卤乙腈两类物质。
图3 4类DBPs占比变化趋势Fig.3 Variation Trend of Four Types of DBPs
2.2 消毒副产物关联性
选取三卤甲烷与卤乙腈两项主要检出的DBPs与pH、耗氧量、氨氮、浑浊度、亚硝酸盐这5项,共7项水质指标进行相关性分析。对不同的水质指标进行标准化处理,再对生成的变量进行相关性分析,表9为利用SPSS软件计算水质指标的相关系数矩阵。
表9 主要消毒副产物与出厂水质指标相关系数Tab.9 Correlation Coefficients between Main DBPs and Finished Water Quality Index
由表9可知,当显著性水平α为0.01时,卤乙腈和三卤甲烷具有较强的线性关系。而显著性水平α为0.05时,氨氮与三卤甲烷、氨氮与卤乙腈具有一定负相关性;pH与三卤甲烷具有一定正相关性。
为进一步描述三卤甲烷与卤乙腈的统计关系,本文利用SPSS软件对卤乙腈和三卤甲烷进行拟合回归,拟合回归过程与结果如表10所示。
由表10可知,卤乙腈与三卤甲烷具有较好的线性拟合度(R2=0.926),符合拟合优度检验,且通过显著性检验(Sig.<0.05),其表达如式(7)。
表10 线性回归过程Tab.10 Linear Regression Process
CHANs=0.448×CTHMs-2.543
(7)
其中:CHANs——水中卤乙腈的含量,mg/L;
CTHMs——水中三卤甲烷的含量,mg/L。
利用回归方程,根据三卤甲烷和卤乙腈的监测值,得出卤乙腈的计算值,并与实际监测数据进行对比,计算误差,结果如表11所示。分析发现,以2018年2月—2019年1月数据为例,当样本数值较大(三卤甲烷总量>12 μg/L)时,绝对误差普遍较低,说明线性回归方程具有一定参考意义。
表11 监测数据对比Tab.11 Comparison of Monitoring Data
3 结论
(1)将水厂原水的11个水质指标简化为3个独立且功能明确的主成分,发现2018年1月—2019年3月,水厂原水水质明显提高,水中固体颗粒与有机污染物显著降低。
(2)通过相关性分析,发现水厂原水水质指标中浑浊度和色度、铁和锰具有较强的线性相关性。出水水质指标中三卤甲烷和卤乙腈具有较强的线性相关性。
(3)水厂出厂水的pH与三卤甲烷及卤乙腈呈现一定正相关性;氨氮与三卤甲烷及卤乙腈呈现一定负相关性。一方面,可以通过改进工艺流程,降低出水pH,影响并降低出厂水中DBPs的含量;另一方面,在保障出水水质安全的前提下适当减少臭氧投加量,从而提高出水氨氮并降低DBPs的含量,进一步提高饮用水水质。