基于主成份分析的安徽省淮河支流污染特征
2017-11-01耿天召
王 欢,耿天召
基于主成份分析的安徽省淮河支流污染特征
王 欢,耿天召
(安徽省环境监测中心站,安徽 合肥 230071)
采用主成份分析法,运用SPSS软件分析2011—2015年安徽省淮河流域主要支流水质污染特征。结果表明:主要支流的主要污染指标为BOD、COD和NH3-N,包河、黑茨河和赵王河等排名靠前的河流污染较重,水质较差,而黄尾河、西淠河、淠河总干渠等排名靠后的河流水质较好。评价结果吻合实际情况且更加客观准确。
主成份分析;淮河流域;地表水;安徽;SPSS
安徽地处淮河中下游,境内流域面积6.7万km2,人口4 000余万人,干流流经境内约430 km,支流众多,流域面积大于10 000 km2的一级支流有4条,大于1 000 km2的支流有37条。近年来,随着流域水污染防治工作的推进,淮河干流水质明显改善,2015年干流水质为优,但支流仍存在不同程度的污染[1],支流污染成为影响流域总体水质的主要因素。对安徽省辖淮河主要支流近年来水质数据进行主成份分析,识别主要污染指标,分析主要污染特征,为流域水污染防治工作提供支持。
1 研究对象及研究方法
1.1 研究区域
选取44条主要支流,其中一级、二级、三级支流分别为18条、18条和8条。所选支流覆盖整个流域,能够代表流域支流水质(表1)。按照水质断面的设置原则,44条河流共设置75个断面。
表1 安徽省主要淮河支流
1.2 数据来源
选取2011—2015年安徽省淮河支流75个断面的监测数据平均值,计算出每条支流的平均值。选取《地表水环境质量标准》 (GB 3838—2002)表1中的23项监测指标为备选指标。
1.3 研究方法
目前水质评价方法有单因子评价法[2]、综合污染指数法[3]、综合水质标识指数法[4]、模糊评价法[5]和主成份分析法[6-12]等。单因子法难以定量反映污染程度;综合污染指数法在分析方法不同和多指标未检出的情况下计算出的综合指数与实际情况偏差较大易造成误导;综合水质标识指数法和模糊评价法同时存在以上两种情况。地表水各项指标之间既相互独立,又存在关联,主成份分析法能够考虑到各指标间的信息关联,在最大限度保留原始信息的同时,对高维变量进行降维,且较客观地确定各指标的权重,从而使得评价结果更加客观。采用主成份分析法对水质进行评价。主要计算步骤如下:
1.3.1 数据标准化
把原始数据标准化为均值为0、方差为1的指标,公式为:
1.2.4 饮食护理:手术清醒之后,给患者进食少量水,确认无腹胀情况可多次少量进水;确认胃肠道蠕动恢复后,给予流质饮食,遵循少量多餐的原则,避免增加肠道负担。排气之后,多食用高营养、高热量的食物;排便之后,恢复正常饮食,并多食用含有高维生素、高热量、高蛋白、高纤维的食物,防止患者出现便秘。
1.3.2 进行适用性判断
主成份分析适用性判断采用KOM和Bartlett检验,KOM检验的依据是变量间的简单相关同偏相关的比较,一般认为,KOM值越逼近1,表明对这些变量进行因子分析的效果越好,0.5以下不宜作主成份分析。Bartlett球形检验判断各变量间是否有相关性,如果相关阵是单位阵,则各变量独立,因子分析法无效。
1.3.3 计算相关系数矩阵R的特征值及特征向量
解相关系数矩阵R的特征方程 λI-R=0(其中I是p×p阶单位矩阵),求出p个特征值及其贡献率,并按从大到小的顺序排列:λ1≥λ2≥…≥λp≥0。然后分别求出单位特征向量t,即:
1.3.4 确定主成份
计算特征值的贡献率与累积贡献率。
bi为第i个主成份Fi(i=1,2,…,p)的贡献率;
ak为前k个主成份的累积贡献率。一般以a≥85%来选取前k个指标变量作为主成份。
计算每个主成份的得分即:
其中bi为第i个主成份的方差贡献率,ak为前k个主成份的累积贡献率,根据综合得分进行评价。
2 结果与分析
2.1 数据标准化
监测数据来自多个监测机构,因此存在同一指标不同检出限的情况。剔除未检出数据以及水温、pH、总氮、粪大肠菌群等空值较多的项目,在23项备选指标中选取10项指标作主成份分析,分别为溶解氧 (DO)、高锰酸盐指数(CODMn)、五日生化需氧量(BOD5)、氨氮(NH3-N)、石油类(OILs)、挥发酚(V-PHEN)、化学需氧量(CODCr)、总磷(TP)、氟化物(F)和阴离子表面活性剂(AN-SAA)。利用单因子评价法进行验证,此10项指标与全指标评价结
计算综合得分,公式为:果一致,选取较为合理。由于DO为逆指标,先将其进行倒数变换再标准化,结果见表2。
2.2 数据适用性检验
KMO和Bartlett的检验结果显示(见表3),KMO值为 0.734>0.5,适合作主成份分析;Bartlett的球形度检验值为500.919,P值0.000<0.05,达到显著,代表相关矩阵之间有共同因素存在,适合作主成份分析。
表2 标准化数据
表3 KMO和Bartlett的检验
2.3 提取主成份
前3个成份的累积贡献率已达到85%(表4),特征值分别为 λ1=5.722,λ2=2.162,λ3=0.811,说明前3个主成份基本包括全部指标均有的信息,其因子载荷矩阵见表5。
从表5中可得出各指标的载荷向量,将因子载荷向量分别除以其对应主成份特征值的平方根,得到每个指标的特征向量如下:
表4 相关矩阵特征值及其方差贡献率
表5 主成份因子载荷矩阵
而将得到的特征向量与标准化后的数据相乘后相加得出综合评价值:
表6 安徽省淮河流域主要支流水质评价值计算结果
2.4 主成份解释与分析
提取的3个主成份的累计贡献率达到85%以上,其中主成份1贡献率达到50%以上,携带的信息最多,水质主要由第一主成份决定,与其相关联的因子主要是DO、BOD、COD和NH3-N,主成份2相关联的因子主要是OILS、V-PHEN和AN-SAA,主成份3相关联的因子主要是COD和TP,因此,可认为淮河支流主要污染指标为BOD、COD和NH3-N,即以有机污染为主,受生活污水和农业面源影响较大,工业污水的排放对水质的影响要小于生活污水和农业面源的影响。
从综合得分来看,得分排在前十位即污染最重的河流为包河、黑茨河、赵王河、武家河、奎河、小洪河、油河、惠济河、灌沟河和郎溪河,得分排在后十位即水质最好的河流为黄尾河、西淠河、淠河总干渠、漫水河、史河、东淠河、淠河、汲河和沣河,与单因子评价结果相吻合。水质主要由第一主成份所决定,因此第一主成份得分在前十和后十的河流与综合得分结果一致,在位次上有略微不同。
3 结论
BOD、COD和NH3-N为安徽省淮河流域主要支流水体污染的主要污染指标,河流水质状况主要由这三项指标确定。包河、黑茨河、赵王河、武家河、奎河、小洪河、油河、惠济河、灌沟河和郎溪河为污染最重的河流,黄尾河、西淠河、淠河总干渠、漫水河、史河、东淠河、淠河、汲河和沣河为水质最好的河流。与单因子评价相比,主成份分析法能够提供更多和更具体的水质信息,从而使水质评价结果更加客观、准确,可为具体的水环境管理提供更有针对性的技术支持。
[1]孙立剑.安徽省环境质量报告书(2011—2015)[M].合肥:合肥工业大学出版社,2016:75-81.
[2]孙伟光,邢佳,马云,等.单因子水质标识指数评价方法在某流域水质评价中的应用[J].环境科学与管理,2010,35(11):181-184,194.
[3]孙涛,张秒仙,李苗苗,等.基于对应分析法和综合污染指数法的水质评价[J].环境科学与技术,2014,35(4):185-190.
[4]胡成,苏丹.综合水质标识指数法在浑河水质评价中的应用[J].生态环境学报,2011,20(1):186-192.
[5]孙进书,冯海波.河北省集中式地表饮用水评价方法研究[J].中国环境管理干部学院学报,2016,26(1):53-56,64.
[6]李志辉,罗平.PASS/SPSS Statistics中文版统计分析教程[M].3版.北京:电子工业出版社,2010:442-455.
[7]韩雪.河北省子牙河流域水质变化趋势及影响因子分析[J].中国环境管理干部学院学报,2016,26(2):78-81.
[8]吕亚梅.基于主成分分析法的湖北省可持续发展水平综合评价[D].武汉:武汉理工大学,2012.
[9]林海明,杜子芳.主成份分析综合评价应该注意的问题[J].统计研究,2013,30(8):25-31.
[10]聂京,夏东升.丹江口水库及其上游流域水质污染特征及评价[J].环境监测管理与技术,2014,26(4):31-34,62.
[11]朱媛媛,田进军,李红亮,等.丹江口水库水质评价及水污染特征[J].农业环境科学学报,2016,35(1):139-147.
[12]魏善发.基于SPSS软件分析上海市金山区地表水污染特征[J].中国环境监测,2013,29(1):75-81.
Characteristics of Surface Water Pollution of Tributary of Huaihe River Drainage Area based on the Principle Component Analysis
Wang Huan,Geng Tianzhao
(Environmental Monitoring Central Station of Anhui Province,Hefei Anhui 230071,China)
In order to understand the pollution characteristics in Huaihe River`s tributary of Anhui Province,the water pollution characteristics of Huaihe River`s main tributaries from 2011 to 2015 were analyzed by the principal component analysis based on SPSS.The results indicated that the major contamination indexes of main tributaries are BOD,COD and NH3-N.The pollution of top-ranked rivers which include Baohe River,Heici River and Zhaowang River are heavier,while these low-ranked rivers,such as Huangwei River,Xipi River and Pi River General-channel,have better water quality.The evaluation results tally well with the fact,and are more objective and accurate.
principle component analysis,Huaihe drainage area,surface water,Anhui Province,SPSS
X824
A
1008-813X(2017)05-0074-05
10.13358 /j.issn.1008-813x.2017.05.19
2017-06-13
王欢(1980-),男,安徽宿州人,毕业于安徽医科大学公共卫生专业,工程师,主要从事环境质量综合分析工作。
(编辑:程 俊)