主成分分析法对滆湖水质的综合评价
2010-09-24张浩
张 浩
(常州市环境监测中心站 ,江苏常州 213001)
主成分分析法对滆湖水质的综合评价
张 浩
(常州市环境监测中心站 ,江苏常州 213001)
基于主成分分析理论,建立了水质综合评价模型,以常州市滆湖为例,对滆湖的水环境质量进行综合评价;结果表明,滆湖四个监测点位中,湖北区和湖南区水质相对较差,北干河口区与太滆河口区水质相对较好,评价结果与滆湖实际水质污染状况一致。
主成分分析 ;滆湖 ;水环境质量 ;综合评价
水环境质量评价是环境质量评价的主要内容。目前,常用的水环境质量评价的方法有指数评价法[1]、模糊综合评判法[2]、灰色数学法[3]、神经网络法[4]等。由于水质系统是由各种污染指标变量组成的复杂系统,各个因子之间具有不同程度的相关性,每一因子都只从某一方面反映水质质量[5],因此依据它们作综合评价有一定的难度。主成分分析方法正是一种将多维因子纳入同一系统进行定量化研究且理论比较完善的多元统计分析方法,在环境质量综合评价方面应用广泛。本文将主成分分析法应用于常州滆湖水质综合评价,以期能够为滆湖的水环境管理工作提供参考依据。
1主成分分析的原理与方法
主成分分析法[6]是将原来多个变量化为少数几个综合指标的一种统计分析方法,从数学的角度说,这是一种降维处理技术。
设原始变量为 x1、x2…xn,主成分分析后得到的新变量 (综合变量 )为 z1、z2…zm,它们是 x1、x2…xn的线性组合 (m 1.1数据标准化 为了排除数量级和量纲不同带来的影响,首先应该对原始数据进行标准化处理: 上式中,表示第 i个断面上的第 j个指标的监测数据,和分别表示第 j个指标的样本均值和标准差。 1.2计算相关系数矩阵 原始数据经过标准化处理后,得到标准化数据表 (x’ij)n×p,计算对应的相关系数矩阵 R=(rij)p×p。设 R=X’X,式中:rij是指标 Xi与指标 Xj之间的相关系数 ,记: 1.3计算特征值和特征向量 计算特征方程│R-λI│=0,求出 R的特征值λi(i=1,2…P)及其对应的正规化单位特征向量 ui(i=1,2…P)。其中每一特征值即为对应主成分的方差,方差越大,则对总变异的贡献越大;每一特征向量则是对应主成分的线性表达式中原始指标的组合系数。 1.4计算贡献率 1.5综合分析 将各待评断面的标准化数据分别代人各主成分的表达式中,便计算得到断面的各主成分得分值 Fk(k=1,2…m),以各主成分的方差贡献率 ek为权重,求和,即得到各断面的综合评价得分: 滆湖位于常州市西南 ,东经 119°44′~119°53′,北纬 31°29′~31°42′之间 ,湖泊面积 137.82km2。滆湖是常州武进区重要的水产养殖基地,在 2008年被省政府列为市区备用饮用水源地,在武进区的工农业生产及人民生活中起着重要的作用。本文采用主成分分析法,选取溶解氧、高锰酸盐指数、化学需氧量等 9项主要污染指标对 2008年滆湖 4个监测点位的水质进行综合评价见表 1。 2.1数据标准化 首先对 DO(溶解氧)数据进行预处理。这是因为:溶解氧是随着数据值的增大,表示水质越好,呈正相关关系;而其他因子则是随着数据值的增大,表示水质越差,呈负相关关系。在此,对于溶解氧根据地面水环境质量标准 (GB3838-2002),给Ⅱ类水(溶解氧 6mg/L)赋值为 6,V类水 (溶解氧 2mg/L)赋值为 10[7],求得线性变换函数 x’=12-x。 变换后的溶解氧及其他指标进行标准化处理见表2。 表 12008年滆湖各点位监测结果 mg/L 表 2标准化数据表 表 3主成分特征向量 (载荷值) 2.2相关系数矩阵计算 借助 SPSS13.0软件的相关分析功能进行计算,得到各评价指标的相关系数矩阵 R。 2.3特征值和构造主成分计算 进一步借助 SPSS13.0软件的因子分析功能计算得到相关系数矩阵的特征值和特征向量见表 3,并计算出各特征值对应主成分的方差贡献率见下页表4。 表 4特征值及主成分贡献率 由表 3可知,前 2个特征值对应主成分的累计方差贡献率已经达到 88.60%,故它们所对应的 2个主成分已经能够反映原始指标所提供的绝大部分信息,可利用它们对滆湖 4个点位的水质进行综合评价。 各主成分线性表达式中原始指标的系数取相应特征向量除以特征值的开根号后得到对应的正规化单位特征向量,因此,构造出 2个主成分和 ,如下所示: 2.4水质综合评价 各主成分得分与对应的方差贡献率乘积的总和即为综合得分。计算出滆湖 4个监测点位的各主成分得分及综合得分,给予各断面水环境质量状况以定量化描述,得分越大,表明污染程度越严重见表5。水质标准采用《国家地表水环境质量标准》(GB3838-2002),将相同指标的各个水质等级的标准值按上述方法计算,得出的各水质等级的综合得分判别标准见表 6,根据此判别标准确定出滆湖 4个监测点位的水质等级。 表 5滆湖水质主成分分析结果 表 6主成分分析法综合评价标准 由表 5可以看出,北干河口区水质最好,太滆河口区水质次之,两点位水质均满足滆湖Ⅲ类水功能区要求,湖南区、湖北区水质较差,水质均为Ⅴ类,已不能满足滆湖Ⅲ类水域功能区要求。 从各评价指标在主成分中的载荷值 (见表 3)可以看出,第一主成分 F1在高锰酸钾指数、生化需氧量、氨氮、石油类、挥发酚和总氮上具有很大的载荷,载荷值变化在 0.8895~0.9992之间。在这些指标中高锰酸钾指数代表的是湖泊中的有机污染,氨氮和总氮表示引起湖泊富营养化的营养元素污染状况,生化需氧量为综合类污染物,石油类和挥发酚为工业污染物。上述指标均为增长较快的污染物,因此,可将第一主成分看成潜力因子。随着该区人口增长和经济的发展,这一因子的增长会比较显著。第二主成分 F2代表了溶解氧、化学需氧量和总磷等的污染,这些指标表示一定的综合污染状况和湖泊富营养化状况。 目前,湖北区和北干河口区两个点位代表上游入湖水质。湖北区接纳扁担河及武南河来水,由于扁担河及武南河沿途大量工业、生活、农业污染流入河中,直接导致湖北区水质最差,现状水质为Ⅴ类;北干河口区接纳北干河来水,北干河水质常年保持Ⅲ类,因此,北干河口区水质最好。湖南区和太滆河口区两个点位代表出湖水质。湖南区位于滆湖南端,全湖绝大部分污染物最终均在此汇聚,虽然上游来水中污染物在湖水稀释降解作用下,浓度已有所下降,但污染情况仍较重,现状水质为Ⅴ类;太滆河口区水流方向不定,时而入湖时而出湖,水质仅次于北干河口区,现状水质为Ⅲ类。采用综合污染指数法对滆湖 4个监测点位水质进行综合评价,北干河口区、湖北区、湖南区、太滆河口区综合污染指数分别为 0.82、0.97、0.93和 0.84,污染程度与主成分分析结果完全一致。 本文采用主成分分析法对滆湖 4个监测点位的水质进行了综合评价,结果表明,湖北区和湖南区水质为Ⅴ类,污染较重,北干河口区和太滆河口区水质为Ⅲ类,满足滆湖水域功能区要求,所得评价结果与滆湖实际水质污染状况及其他评价方法结果完全吻合,说明主成分分析法在水质评价中具有可靠性。主成分分析法能够在保证原始数据信息损失最小的基础上,经过线性变化和舍弃部分信息,以少数的综 合变量取代原有的多维变量,简化了数据结构;并且能客观地确定权重系数,避免了主观随意性,因而成为环境质量综合评价的一种简单有效的方法。 [1] 徐祖信.中国河流综合水质标识指数评价方法研究[J].同济大学学报 (自然科学版),2005,33(4):482-488. [2] 宋 岩,董金梅,曲 玲,等.山东省水环境质量模糊综合评价及防治措施[J].山东农业大学学报 (自然科学版),2006,37(3):436-440. [3] 袁秀娟,毛显强,李 卓,等.用改进的灰色识别法评价地表水环境质量[J].城市环境与城市生态,2006,19(1):7-l0. [4] 郭小青,项新建.基于神经网络模型的水质监测与评价系统[J].重庆环境科学,2003,25(5):8-l0. [5] 王晓鹏.河流水质综合评价之主成分分析方法[J].数理统计与管理,2001,20(4):49-52. [6] 高惠璇.应用多元统计分析[M].北京:北京大学出版社,2005:265-289. [7] 李经伟,杨路华,梁宝成,等.改进的主成分分析法在白洋淀水质评价中的应用[J].海河水利,2007,(3):40-43. O652 B 1003-3467(2010)24-0050-04 2010-12-31 张 浩 (1982-),男,主要从事环境评价工作,电话:13407576647。2滆湖水质的主成分分析评价
3评价结果
4结束语