主成分分析法在黔南河流水体环境质量评价中的应用
2024-01-11陆玉炯余跃生华灿城
陆玉炯,余跃生,程 骅,华灿城,孙 静
(1.黔南民族医学高等专科学校,贵州 都匀 558013;2.黔南州生态环境监测站,贵州 都匀 558000)
水体环境质量的影响因素较多,单因素分析难以全面反映水质现状,为此,国内学者采用TOPSIS法[1]、水污染指数法[2]、模糊聚类法[3]、灰色系统评价法[4]、因子分析法[5 ]等分析法对水体环境质量进行综合评价,取得了满意效果。本文试用主成分分析法[6]对贵州省黔南境内5条主要河流9个断面的水体环境质量进行综合分析。现将结果报道如下。
1 材料与方法
1.1 材料 资料来源于黔南州生态环境监测站对黔南漳江的回龙角和洗布河,都柳江的三都桥和交梨,清水江的茶园、营盘和川弓,红水河的罗羊,蒙江的边外河等5条河流9个断面枯水期水质监测数据,见表1。主要监测指标为溶解氧(X1)、氨氮(X2)、五日生化需氧量(X3)、高锰酸盐指数(X4)、砷(X5)、汞(X6)、铅(X7)、悬浮物(X8)和石油类(X9)。
表1 黔南州河流水体环境单元枯水期水质监测数据(mg/L)
2 结果
2.1 原始数据的同趋势化处理 河流水体环境质量评价指标中,除溶解氧(X1)为高优指标外,其他均为低优指标(表1),故将低优指标取倒数,均转化为高优指标,见表2。
表2 黔南州河流水体环境单元水质监测数据同趋势化(mg/L)
2.2 同趋势化数据的标准化处理 将表2中数据进行标准化处理,结果见表3。
2.3 相关系数 9个水质监测指标之间的相关系数,见表4。可见溶解氧与氨氮、五日生化需氧量、高锰酸盐指数和悬浮物,高锰酸盐指数与氨氮、五日生化需氧量和悬浮物,砷与石油类,以及汞与铅监测数据之间具有一定程度的相关性。
表4 水质监测指标之间的相关系数
2.4 特征值、贡献率、累计贡献率和特征向量 由相关系数,求出各个主成分的特征值、贡献率、累计贡献率,以及水质指标在各个主成分上的特征向量,然后根据主成分的确定原则,提取了3个主成分,见表5 。这3个主成分的贡献率分别为59.062%、20.732%和12.233%,累计贡献率达92.018%(>85%),它们代表了水体环境质量评价中原始指标提供的大部分信息。
表5 特征值、贡献率、累计贡献率和特征向量
2.5 主成分得分 根据特征向量可以建立主成分得分的线性方程式:
Z1=0.895X1+0.661 X2+ 0.844 X3+0.940X4+0.786 X5+0.576 X6+0.354X7+0.888X8+0.786X9
Z2=-0.343X1-0.602 X2-0.230X3-0.199X4+0.312 X5+0.531X6+0.903X7-0.034X8+0.312X9
Z3=-0.033X1-0.187 X2+0.352X3+0.020X4-0.514 X5+0.515X6+0.023X7+0.383X8-0.514X9
将9个水质监测指标的标准化数据代入Z1、Z2、Z3线性方程式中,相应得到各水体单元第一、二、三主成分得分,然后将主成分得分与其贡献率之积相加,可得各水体单元的综合得分。根据综合得分高低予以排序,因水质检测指标均转换为高优指标,所以综合得分越高,水体环境质量越好。见表6。
表6 水体单元主成分得分、综合得分及排序
3 讨论
主成分分析法是通过科学降维,将多个水质监测指标线性组合为少数几个彼此独立的综合指标,即主成分,根据主成分因子得分对水质进行综合评价。从表5中可以看出,前3个主成分的累计贡献率为92.018%(>85%),其特征值均大于1(分别为5.316、1.865和1.101),说明这3个主成分包含原有9个水质监测指标的大部分信息,是评价黔南地区河流水质的重要指标,因此,可根据这3个主成分对水体环境质量进行综合评价。第一主成分的贡献率(59.062%)明显大于第二、第三主成分(分别为20.732%和12.233%),可以认为第一主成分是评价黔南河流水体单元环境质量的主要指标。根据9个水质监测指标在各主成分上的特征向量,即与各主成分的相关系数,除铅外,其他8个指标与第一主成分均有较高的相关性,因此,第一主成分可看成是对水体环境质量的综合反映。其中高锰酸盐指数、溶解氧、悬浮物、五日生化需氧量与第一主成分的关联最为密切,为主要影响因子。高锰酸盐指数、悬浮物和五日生化需氧量主要来自于沿河村寨生活污水和医院的医疗废水,溶解氧主要是水体有机物多少的体现[7],即水体有机物含量越多,溶解氧消耗越多,水体环境自净能力越弱,甚至失去自净能力,水体污染程度越严重。这些均属于有机物污染评价指标,所以第一主成分主要反映水体有机物污染程度。第二主成分与铅、汞、氨氮的关系密切,尤其是铅和汞,呈高度正相关。铅、汞主要来自矿山开采废水,氨氮主要来自人畜粪便和农田排水,可见第二主成分主要反映水体重金属污染程度。第三主成分与汞、砷和石油类的关系密切,其中砷和石油类主要来自化工厂和冶炼厂的废水排放,从而认为砷和石油类对水质的影响不容忽视。
从各断面水质监测数据(表1)可以看出,茶园水体单元的溶解氧含量最高,高锰酸盐指数和悬浮物含量最低;川弓水体单元的溶解氧含量最低,高锰酸盐指数、氨氮、悬浮物、石油类,以及砷、汞、铅含量最高。经主成分分析,结果显示茶园水体单元的第一主成分得分最高(6.7156),川弓水体单元得分最低(-11.0126),因第一主成分的贡献率大,在各水体单元总得分中的权重大,所以茶园水体单元的主成分总得分最高(4.0599),川弓水体单元的总得分最低(-6.6393),说明茶园水体污染程度较轻,水质综合评价较好,川弓水体污染程度较重,水质较差,与实际情况相符。根据各水体单元主成分综合得分进行排序(表6),黔南境内5条河流9个断面的水质从好到差依次为茶园、洗布河、回龙角、边外河、罗羊、交梨、三都桥、营盘、川弓水体单元,与陆玉炯等[1]用TOPSIS法分析同一组数据的结果一致,说明主成分分析方法可用于水体环境质量综合评价,分析结果对河流水体环境的综合治理和生活饮用水资源的开发利用提供了重要的理论依据,值得推广应用。