主成分分析法在渭河宝鸡段水质评价中的应用
2015-03-16靳美娟任一艳
靳美娟,任一艳
(1.宝鸡文理学院陕西省灾害监测与机理模拟重点实验室,陕西宝鸡 721013;2.宝鸡市环境监测中心站,陕西宝鸡721013)
渭河发源于甘肃鸟鼠山,自陈仓区凤阁岭镇建河村进入宝鸡市,其干流自西向东流经渭滨、金台、陈仓、岐山、眉县、扶风3区3县后,至扶风县绛帐镇南仵村流出。渭河宝鸡段以林家村宝鸡峡大坝为界,隶属渭河上游和中游段,全长224 km,占渭河总干流的27.4%。目前宝鸡市96%以上的人口和93%以上的国民生产总值都聚集在渭河流域,同时渭河也是宝鸡市重要的农业灌溉水源和川道地下水的重要补给水源,担负着泄洪、释污、维护生态平衡的重要任务,是宝鸡市当之无愧的经济社会发展“生命线”。然而,近年来由于气候变暖,加之经济发展耗水量的急剧增加,渭河流域水资源严重短缺,水污染加剧。
水质评价是水体污染防治的基础性工作,常用的水质评价方法[1]有综合指数法、灰色系统理论、人工神经网络法、模糊评价法等。其中综合指数法考虑了多种污染物的影响,能对整体水质状况做出定量评价,但在计算时采用单项指数取平均的方法,容易掩盖严重超标污染物的影响;灰色聚类关联分析法充分考虑了水质评价中的不确定性,但在评价过程中存在信息丢失问题;人工神经网络能够适应复杂系统的建模问题,但计算复杂、收敛速度慢的缺点限制了它的推广应用;模糊评价法能够对综合水质类别进行判断,但结论偏于保守[2]。此外,水质系统是由众多因子组成的一个复杂系统,且各因子之间存在一定的内在关联,每一因子都从一个侧面反映了水质的基本状况,这就使得上述方法的优势难以充分发挥。主成分分析方法是利用降维思想提取少数几个互不相关的新变量来代替原来较多变量进行定量化研究的一种统计分析方法,在解决很多实际问题方面取得了较好效果[3-5]。为此,本文尝试着运用主成分分析法,对渭河宝鸡段干流水质状况进行计算分析,找出各断面主要水质污染指标及其污染程度以期为渭河流域水污染治理和水环境评价提供一定参考。
1 研究方法简介
主成分分析法是利用降维的思想,把较多变量简化为少数几个互不相关的综合指标的一种统计分析方法。基本步骤[6]:(1)根据研究问题选取原始数据;(2)数据标准化,目的是为了消除不同指标之间的量纲影响;(3)计算相关系数矩阵,并进行相关性判定,确定待分析的原始变量是否适合进行因子分析;(4)确定主成分的个数m,主成分个数提取原则(特征根λ>1,累计贡献率达到85%以上);(5)确定主成分Fi的表达式;(6)求各主成分的得分并计算综合得分,并对其做出相应解释。
2 渭河宝鸡段水质的主成分分析
2.1 断面选择及数据来源
为了较全面地反映渭河宝鸡段水质状况,根据该段河流的自然特征及整体污染特点,沿渭河流向自西向东依次选取了林家村、胜利桥、卧龙寺桥、虢镇桥、常兴桥等5个监测断面,具体位置如图1所示。
图1 渭河宝鸡段干流监测断面示意图Fig.1 Monitoring Sections of Main Stream of Weihe River in Baoji
水质监测数据由宝鸡市环境监测站提供,采样和分析时间为2012年1月~12月,依据《地表水环境质量标准》(GB 3838—2002),监测项目共24项,本文所用数据取各月算术平均值。根据水质评价参数选择的针对性原则、适度原则、监测技术可行原则,结合渭河宝鸡段所受纳的主要污水类型及水质污染的主要影响因素,考虑到某些项目未检出和5个断面数据的一致性,经甄别筛选,有效数据为10项,具体如表1所示。分别为 pH(X1)、氟化物(X2)、高锰酸盐指数(X3)、COD(X4)、氨氮(X5)、TP(X6)、DO(X7)、粪大肠菌群(X8)、BOD5(X9)、阴离子洗涤剂(X10)。5个监测断面的10项数据组成的矩阵作为评价的原始数据。
表1 2012年渭河宝鸡各断面监测数据Tab.1 Datum of Each Section Monitoring in Baoji Section of Weihe River in 2012
2.2 水质计算及分析
利用IBM SPSS Statistics 19软件将表1中的原始数据进行标准化处理,得到标准化数据矩阵,如表2所示。在此基础上进行主成分分析,计算出相关系数矩阵,具体如表3所示。
表2 2012年渭河宝鸡段标准化处理后数据Tab.2 Standardized Data of Water Quality in Baoji Section of Weihe River in 2012
表3 相关系数矩阵Tab.3 Correlation Coefficients Matrix
由表3可知大部分系数大于0.30,其中高锰酸盐指数(X3)、COD(X4)、氨氮(X5)、TP(X6)、DO(X7)、粪大肠菌群(X8)、BOD5(X9)、阴离子洗涤剂(X10)之间的相关系数均达到0.850以上,说明各个变量之间相关程度较高,各变量存在信息重叠,适于主成分分析法。
同样利用主成分分析法,得出特征值、主成分贡献率及累计贡献率,具体如表4所示。
表4 特征值、主成分贡献率及累计贡献率Tab.4 Eigenvalues,Contribution Rates and Accumulated Contribution Rates of Principal Components
由表4可知第1、2主成分特征值分别为7.988和1.182,均大于1。另外累计贡献率为91.708%,满足≥85%的原则。为此,提取出前两个主成分,即主成分1和主成分2,这两个主成分基本包含了原来10个指标的所有信息,其中,第一主成分的贡献率为79.883%,对水质因素变化影响较大。
初始因子荷载矩阵由 SPSS软件直接给出,具体如表5所示,每一个载荷量表示主成分与对应变量的相关系数。
表5 初始因子载荷矩阵Tab.5 Initial Factor Load Matrix
主成分载荷矩阵是由初始因子载荷矩阵中的数据除以每一主成分所对应的特征值的平方根得出,其数值表示两个主成分相应的载荷值,具体如表6所示。
表6 主成分载荷矩阵Tab.6 Loading Matrix of Principal Components
一般认为大于0.3的主成分载荷值就是显著的[7],因此,与第一主成分F1密切相关的指标是高锰酸盐指数(X3)、COD(X4)、氨氮(X5)、TP(X6)、DO(X7)、粪大肠菌群(X8)、BOD5(X9)和阴离子洗涤剂(X10)等8个指标,与第二主成分F2相关的水质指标为pH(X1)和BOD5(X9)2个指标。
根据特征值 λ1=7.988 和 λ2=1.182,得出各指标与主成分之间的线性关系如下。
由公式(3)计算各监测断面的水质污染综合得分F,并依据相关标准[8]对水体污染程度进行分级,结果如表7所示。
表7 各监测断面水质综合评价结果Tab.7 Evaluation Results of Water Quality in All Monitoring Sections
F综合得分越高,排名越靠前,说明污染越严重。据此,渭河宝鸡段5个监测断面的综合污染排名依次为虢镇桥>常兴桥>卧龙寺桥>胜利桥>林家村,这与文献[9]研究结果基本一致。从分级来看,越靠近下游方向污染越严重,这与流经宝鸡主城区沿途的排放相关。
从第一主成分F1的排名来看,虢镇桥断面的得分远高于其他几个断面,说明此处高锰酸盐指数(X3)、COD(X4)、氨氮(X5)、TP(X6)、DO(X7)、粪大肠菌群(X8)含量相对较高。这是因为宝鸡作为陕西省第二大工业城市,老城区布局着大量污染严重的工业企业,主要污染企业分布在从宝鸡市区经卧龙寺至虢镇桥的河流区域,具体如表8所示。
在这些指标中,DO是衡量水体自净能力的一个指标,受水温、气压和溶质(如盐分)的影响;高锰酸盐指数主要代表了河流中的有机污染,COD代表了综合类污染物,氨氮、TP表示水体的富营养化水平,粪大肠菌群代表了生物污染;从第二主成分F2的排名来看,卧龙寺桥和胜利桥得分略高些,说明这两个断面pH和BOD相对较高,其中pH指示水体的酸碱程度,对水体中的氧化还原反应起着一定的控制作用,BOD代表了河流的有机污染。从污染级别来看,渭河宝鸡段各断面水质良好,为中、轻度污染,污染类型以有机物污染为主(见表7),其来源主要为沿途区段接纳的工业废污水、城镇污水、农药和化肥等。
3 结论
通过应用SPSS软件的主成分分析功能,对渭河宝鸡段5个断面进行了水质评价,结果表明虢镇桥断面污染最严重,且以高锰酸盐指数(X3)、COD(X4)、氨氮(X5)、TP(X6)、DO(X7)、粪大肠菌群(X8)为主要污染,常兴次之,林家村最轻。这是因为主要污染企业分布在从宝鸡市区至虢镇桥的河流区域,受工业污染较大。林家村属于宝鸡市区上游,因此污染较轻。从污染级别来看,渭河宝鸡段各断面水质良好,为中、轻度污染,且以有机物污染为主。
表8 渭河宝鸡段主要污染企业[10]Tab.8 Main Contaminative Enterprises in Baoji Section of Weihe River
评价结果与渭河宝鸡段实际情况一致。主成分分析法应用于水质评价方面,具有以下特点:
(1)该方法是采用数据统计分析反映了各指标间的内在结构关系,因此水质评价结果具有较好的客观性;
(2)能够确定对水质评价影响较大的因素指标,排除相对次要指标的干扰,提高水质评价的科学性和有效性。总之,主成分分析法较好地解决河流水质评价问题,具有一定的应用前景。
[1]汤爱中.水源地水质评价及预测方法研究[D].杭州:浙江大学,2013.
[2]尹海龙,徐祖信.河流综合水质评价方法比较研究[J].长江流域资源与环境,2008,17(5):729-733.
[3]徐建华.现代地理学中的数学方法(第2版)[M].北京:高等教育出版社,2002.
[4]Huang B R,FryJD. Root anatomical physiological and Morphological responses to drought stress for tall fescue cultivars[J].Crop Sci,1998(38):1017-1022.
[5]Bonos S A,Murphy J A.Growth response and performance of Kentucky bluegrass under summer stress[J].Crop Sci.,1999,39(8):770-774.
[6]吉祝美,方里,张俊,等.主成分分析法在SPSS软件中的操作及在河流水质评价中的应用[J].环保科技,2012,18(4):38-43.
[7]叶依广,周蕾.长江三角洲各城市综合实力的主成分分析[J].长江流域资源与环境,2004,13(3):197-202.
[8]伊元荣,海米提·依米提,王涛,等.主成分分析法在城市河流水质评价中的应用[J].干旱区研究,2008,25(4):497-501.
[9]易文利.渭河宝鸡段水质评价及变化趋势分析[J].中国农学通报,2010,26(24):353-357.
[10]李海红,张茜,郭雅妮.渭河宝鸡段水质现状调查及评价[J].电网与清洁能源,2009,25(8):81-84.