基于主成分分析和水质标识指数的地下水评价
2021-08-27张明明刘耿炜滕祥帅
张明明,陈 刚,刘耿炜,滕祥帅,华 勇
(江苏省水文水资源勘测局盐城分局, 江苏 盐城 224051)
地下水是水资源中重要组成部分。随着城镇工业快速发展和人民生活水平的提高,盐城市对地下水需求量加大,多年来地下水过度开采造成地下水持续下降,形成巨大漏斗区,为实现涵养地下水资源,保护和改善地下水水质,减少地质灾害,盐城市实施压采地下水开采措施[1],了解和掌握水体污染影响程度和发展趋势,为水资源管理提供重要支撑,对盐城市地下水环境质量评价至关重要。
目前常用的水质评价方法有:单因子评价法[2]、综合指数法[3]、模糊综合评价法[4]、灰色系统法[5]、神经网络法[6]、主成分分析法[7]等。每种评价方法都有不同的理论基础,在实际评价中对结论侧重不同,具有不同的应用价值[8]。因此在实际评价过程中将各种方法结合是全面可靠了解水质的较好选择。主成分分析(PCA)可将多维因子纳入同一个系统中进行定量化研究,在不丢失原始变量数据信息的前提下,利用少数的综合指标反映多个变量的信息,避免人为确定权重的主观性,使得分析更加准确可靠[9],已被广泛地应用于水质评价中。但主成分分析的结果是相对值,不能判别具体的水质类别。水质标识指数法能明确指示水质类别,还可以在同一类别中比较水质的优劣。因此,本研究采用主成分分析和水质标识指数相结合对 2020 年盐城市18 眼地下水水质进行客观评价,为地下水治理和保护提供更加全面可靠的科学依据,为盐城市居民用水安全提供基本保障。
1 分析方法
1.1 主成分分析法
主成分分析法是利用降维的思想,把较多变量简化为少数几个互不相关的综合指标的一种统计方法,利用 SPSS25.0 统计软件进行分析,基本步骤如下:1)选取水质因子作为评价指标。2)数据标准化。对原始数据进行标准化处理,消除不同指标间的量纲和数量级影响。3)相关性检验。利用 Bartlett球形度和 KMO 检验(用于比较变量间简单相关系数和偏相关系数的指标)统计量判断指标的相关性,以判别原始变量是否适合进行主成分分析。当KMO 值大于 0.5 时,可进行因子分析,Bartlett 球形度检验对应的显著性小于 0.05 时,原始变量间存在相关性,可进行主成分分析。4)确定主成分个数和表达式。一般选取特征值大于 1 的成分,累计方差贡献率不小于 70%。5)水质评价。计算主成分分值,综合得分越高,表明水质污染越严重。
1.2 水质标识指数法
1.2.1 单项指标水质标识指数法
水质标识指数法主要分为单因子和综合水质标识指数法。
单项指标水质标识指数定义如下:
式中:ki表示第i项水质指标的水质类别,取值为1,2,…,6;Sik下为第i项水质指标第ki类水区间质量浓度下限值;Sik上为第i项水质指标第ki类水区间质量浓度的上限值;Ci为第i项指标的实测浓度。
式 (1) 和 (2) 分别适用于正向和逆向指标。正向指标值越小,水质越好;逆向指标值越大,水质越好。
1.2.2 综合水质标识指数法
综合水质标识指数由单项水质标识指数的平均值和最大值加权求得,可由公式计算:
式中:P为综合水质标识指数;P平均为各单项水质标识指数的算术平均值;θ为权重系数,取 1/2,既考虑了各种水质因子反映的水体综合状况,又兼顾了最差因子的影响[10]。
根据综合水质标识指数P,可判断水质级别,并对水质优劣进行排序。当 1.0 ≤P≤ 2.0 时,水质类别为Ⅰ类;当 2.0 <P≤ 3.0 时,水质类别为Ⅱ 类;当 3.0 <P≤ 4.0 时,水质类别为 Ⅲ 类;当4.0 <P≤ 5.0,水质类别为 Ⅳ 类;当 5.0 <P≤ 6.0时,水质类别为 Ⅴ 类。
2 实例研究
2.1 研究对象和数据来源
2020 年 10 月在盐城市开展了地下水现场采样调查工作,选取 18 眼地下水作为研究对象。根据水质评价参数选择的针对性、适度、监测技术可行原则,考虑到 GB/T 14848—2017《地下水质量标准》某些项目没有具体的水质类别评价标准且某些项目未检出,经甄别筛选,选取色度(ZX1)、浊度(ZX2)、总硬度(ZX3)、溶解性总固体(ZX4)、硫酸盐(ZX5)、氯化物(ZX6)、铁(ZX7)、锰(ZX8)、铜(ZX9)、锌(ZX10)、铝(ZX11)、阴离子(ZX12)、耗氧量(ZX13)、氨氮(ZX14)、钠(ZX15)、总大肠菌群(ZX16)、菌落总数(ZX17)、亚硝酸盐氮(ZX18)、硝酸盐氮(ZX19)、氟化物(ZX20)、碘化物(ZX21)、镉(ZX22)、铅(ZX23)等指标。
2.2 主成分分析结果
运用 SPSS 统计软件,对指标进行主成分分析。
2.2.1 监测数据的标准化
在进行分析前,由于各监测数据原始量纲和数量级不同对结果会产生影响,可利用 SPSS 统计软件直接对原始数据进行标准化处理。
2.2.2 KMO 检验统计量和 Bartlett 球形度检验
主成分分析以变量相关性检验为前提,地下水KMO 和 Bartlett 检验结果如表 1 所示。由表 1 可知,地下水 KMO 取样足够度度量值大于 0.50,Bartlett 球形检验显著性小于 0.05,表明原始变量之间存在相关性,适合做主成分分析。
表1 KMO 和 Barlett 球形度检验
2.2.3 确定主成分个数、表达式、命名
主成分的方差及方差累计贡献如表 2 所示。特征值大于 1 的只有 8 个成分,累计的方差占比为75.967%,基本满足主成分个数确定要求,8 个主成分能够反映全部数据的大部分信息。其中:第一主成分包含的信息最多,对水质变化影响最大。根据主成分荷载值,与第一主成分关系密切的是溶解性总固体、总硬度、氯化物、钠、耗氧量,主要表征地下水盐类物质、有机物和重金属的影响;与第二主成分关系密切的是浊度、色度,主要表征地表水的感官特征的影响;与第三主成分密切相关的是铝、镉,主要表征重金属的影响;与第四主成分密切相关的是氨氮、总大肠菌群、菌落总数,主要表征地下水的无机营养盐和微生物污染的影响;与第五主成分密切相关的是铜,主要表征重金属的影响;与第六主成分密切相关的是亚硝酸盐氮、氟化物、硫酸盐,主要表征无机营养盐的影响;与第七主成分密切相关的是锰,主要表征重金属的影响;与第八主成分密切相关的是硝酸盐氮,主要表征无机营养盐的影响。通过主成分分析结果,为了避免信息重叠,尽可能选用相对较少的地下水水质指标最大程度地反映全部信息,选取各主成分中荷载值较高的指标色度、浊度、总硬度、溶解性总固体、硫酸盐、氯化物、锰、铜、铝、耗氧量、氨氮、钠、总大肠菌群、菌落总数、亚硝酸盐氮、硝酸盐氮、氟化物、镉为新的评价指标体系用于水质综合标识指数分析,反映地下水中无机和有机污染、重金属、微生物等污染物的影响。
表2 特征值和主成分贡献率及累计贡献率
成分矩阵如表 3 所示。通过将成分矩阵除以对应的主成分特征值的平方根得到其对应的系数,再将所得系数矩阵与标准化处理后的数据相乘得到各主成分的评价函数及综合评价函数F。
表3 成分矩阵
2.2.4 评价综合主成分分值
根据综合评价函数F得分情况,给予水质污染程度的定量化描述,得分越高,表明污染程度越严重,各站点主成分分析法水质综合评价结果如表 4所示。
表4 各站点主成分分析法水质综合评价结果
主成分分析水质评价法结果表明:黄尖水质最差,其次为合德、南河、八巨、滨淮,黄尖以第一主成分中的溶解性总固体、总硬度、氯化物、钠、耗氧量为主要影响因子;合德以第二主成分中的浊度和色度感官指标为主要影响因子;南河以第五主成分中的铜、氨氮为主要影响因子;八巨以第二主成分中的浊度和色度为主要影响因子;滨淮以第一主成分中的溶解性总固体、总硬度、氯化物、钠、耗氧量为主要影响因子。富东水质最好,其次为宝塔、板湖,18 个站点的水质情况一目了然。
2.3 综合水质标识指数结果
2.3.1 单项指标水质标识指数
以主成分分析方法得构建的评价指标体系计算单因子水质标识指数,18 个站点的单因子水质标识指数如图 1 所示。就各单因子指标而言,浊度、总硬度、溶解性总固体、锰、总大肠菌群、菌落总数等 6 项指标较差,18 个站点的此 6 项因子的水质类别为 Ⅳ~Ⅴ类,铜、硝酸盐氮、氟化物 3 项指标较好,以Ⅰ~Ⅱ 类为主。
图1 各单因子水质标识指数
2.3.2 综合水质标识指数
综合水质标识指数评价结果如表 5 所示。18 个站点地下水水质类别为 Ⅳ~Ⅴ 类,其中 17 个站点水质类别为 Ⅳ 类,1 个水质站点为 Ⅴ 类。其中:合德水质最差,其次为黄尖、安丰、陈集,最大污染因子主要为氨氮、总大肠菌群、菌落总数;大有水质最好,其次为大圣、富东。
表5 各站点综合水质标识指数法评价结果
2.4 主成分分析和综合水质标识指数法预测结果比较
2 种评价方法总体趋势较为一致,排名略有差异。18 个站点中,有 14 个站点在 2 种评价方法中排序位置较为接近(排序名次相差小于 5),有 4 个站点排序名次差异较大。按照水质从优到劣排序,根据主成分分析结果,富东、宝塔、板湖水质较好,分别位居第1,2,3 位,在水质综合标识指数评价中,富东、宝塔、板湖分别为第3,6,7 位,排序名次较为接近。根据主成分分析结果,黄尖、合德、南河水质较差,位居第18,17,16 位,在水质综合指数评价结果中,分别位居第17,18,14 位,排序名次也较为相近。各站点主成分分析和综合水质标识指数结果比对如图 2 所示,2 种评价方法显示的水质变化趋势较为一致,排名略有差异,可能原因是多数站点为 Ⅳ 类水,本身综合水质标识指数差别不明显,还有 2 种模型预算不完全相同,导致 2 种预测模型在预测同一类水质排名时会有较大差异。
图2 各站点主成分分析和综合水质标识指数结果比对
同一站点,2 种评价方法得出的主要影响因子会有不同,主要原因在于同一站点中单因子水质标识指数较为接近,在主成分分析法中可能没有得到完全体现,主成分分析法更为注重指标之间的相关性。可以看出,水质标识指数识别的是主要污染因子,主成分分析法识别的是引起水质变化的主要影响因子。在选择主要污染因子时,以水质标识指数分析结果更为准确快速。在水质优劣排序上可结合2 种评价模型综合考量。
3 结论
本研究以盐城市 18 眼地下水为研究对象,运用主成分分析和综合水质标识指数对水质进行分析和评价,结论如下:
1)主成分分析快速对数据结构进行简化,可将23 个水质指标综合为 8 个主成分进行解释,解释率为 75.967%,水质综合控制指标为色度、浊度、总硬度、溶解性总固体、硫酸盐、氯化物、锰、铜、铝、耗氧量、氨氮、钠、总大肠菌群、菌落总数、亚硝酸盐氮、硝酸盐氮、氟化物、镉等 18 项指标,以此构建新的评价体系用于综合水质标识指数评价。
2)综合水质标识指数表明,18 眼地下水中,17 眼水质类别为 Ⅳ 类,1 眼为Ⅴ类,水质较差,影响因子主要为溶解性总固体、总硬度、浊度、锰、总大肠菌群、菌落总数,反映了地下水存在咸化、重金属、微生物等方面的污染,地下水可能受到工业废水及生活污水排放的影响。
3)主成分分析和综合水质标识指数对 18 眼地下水水质排名评估存有较小差异,18 个站点中,有14 个站点在 2 种评价方法中排序位置较为接近(排序名次相差小于 5),有 4 个站点排序名次差异较大。但总体趋势基本一致,不同站点的水质优劣排序 2 种模型结合使用综合考虑更加全面可靠。
4)同一站点,在 2 种评价方法中出现的主要影响因子存有不同,主要原因在于评价机理的不同,水质标识指数识别的是主要污染因子,主成分分析识别的是引起水质变化的主要影响因子。因此在选择主要污染因子时,以水质标识指数分析结果更为准确快速,与客观实际情况更为相符。
5)盐城市 18 眼地下水整体水质较差,尤以黄尖、合德水质最差,应当加强地下水污染防治工作。