基于主成分分析法的南四湖流域水污染物排放水平空间布局分析
2013-04-29孙灵文闫中晓邵波贾永飞
孙灵文 闫中晓 邵波 贾永飞
摘要:本文基于2007年第一次全国污染源普查数据,运用主成分分析法,对南四湖流域山东省境内的28个县市区行政单元的水污染物排放水平进行了综合评价,结果显示:滕州市的污染物排放水平明显高于流域内的其他区域,济宁市中区、邹城市、菏泽市区、曹县的污染物排放水平也较高。因此这五个县市是今后南四湖流域治污的重点。
关键词:主成分分析;南四湖流域;污染物排放;空间布局
中图分类号: X5 文献标识码:A DOI: 10.3969/j.issn1003-8256.2013.06.013
1 引言
南四湖是南水北调东线工程的重要调蓄水库[1]。国家要求流域内的水质达到国家Ⅲ类水质要求[2]。这对南四湖流域来说是个严峻的挑战,如何在尽量不影响经济发展的同时保证调水的水质,是急需解决的问题。本文根据2007年的污染普查数据,对当时南四湖流域的污染物空间分布进行分析,提出了相应的对策建议。
南四湖流域北起大汶河左岸,南至废黄河南堤,东以泰沂山脉的尼山为分水岭,西至黄河右堤,属于淮河流域泗河水系。总流域面积约3.2万平方公里,包括山东、江苏、河南、安徽四省38个县(市、区)。本文研究范围为南四湖流域山东境内所有区域,流域面积约2.9 万平方公里,包括济宁市、枣庄市、菏泽市和宁阳县三市一县[3-6]。
全国污染源普查是为贯彻落实科学发展观,加强环境监督管理,了解各类企事业单位与环境有关的基本信息,建立健全各类重点污染源档案和各级污染源信息数据库,为制定经济社会政策提供依据,国务院决定开展第一次全国污染源普查所得数据。全国污染源普查对象是我国境内排放污染物的工业污染源(简称“工业源”)、农业污染源(简称“农业源”)、生活污染源(简称“生活源”)和集中式污染治理设施。普查内容包括各类污染源的基本情况、主要污染物的产生和排放数量、污染治理情况等[7]。
2 分析方法介绍
2.1 主成分分析法
主成分分析法最早是由美国心理学家 Charles Spearman在1904年提出。他将实测的多个指标所表达的信息用少数几个潜在的独立的主成分指标来表达,而这些相互独立的主成分指标是由实测指标的线性组合来表示,来反映原来多个实测指标所要反映的主要信息[8],即主成分分析法是把原来多个变量划为了少数几个综合指标的一种统计方法[9]。
2. 2 3σ法
3σ法通常用于测量误差的处理,它的基本思想是由于随机误差是服从于正态分布,误差的绝对值主要集中在均值 3σ附近,如有大于3σ的误差,是粗大误差,应予以剔除。从概率来看,有:
P(|d|>3σ)=0.0027 (4)
所测的数据大于3σ的概率为2.7‰,这一概率是非常小的。因此如果所测数据大于3σ,可以认为其是极端的水平。基于3σ法原理,通过计算各个指标数据系列的中心值和标准差,本文确定以偏离中心值0.5倍标准差的区间即[ E-0.5σ,E+0.5σ ]属于中;偏离中心值1.5倍标准差和0.5倍标准差的区间即[E-1.5σ,E-0.5σ]属于中低水平和[E+0.5σ,E+1.5σ]属于中高水平区间;偏离中心值1.5倍标准差以上的区间即[-∞,E-1.5σ]属于低水平和[E+1.5σ,+∞ ]属于高水平区间。这样就得到了水污染物排放水平的5个区间。
2.3 数据处理
由于南四湖是南水北调东线工程重要的调蓄水库,其水质的好坏直接影响着调水的成败。本文以2007年全国污染物普查的数据,选取四个与水质相关的生活源污染物排放量,即COD排放量X1(吨)、氨氮排放量X2(吨)、总氮排放量X3(吨)、总磷排放量X4(吨),和四个与水质密切相关的工业源污染物排放量:化学需氧量排放量X5(吨),氨氮排放量X6(吨),石油类排放量X7(吨)和生化需氧量排放量X8(吨)等。运用SPSS18.0统计软件对污染物普查指标数据进行主成分分析,利用SPSS求得特征值和方差贡献率及累计贡献率,见表1。
表1 相关主成分累计贡献率
成份 初始特征值
特征根 方差的 % 累积 %
1 4.308 53.847 53.847
2 1.445 18.068 71.914
3 1.019 12.735 84.650
4 .893 11.164 95.814
5 .201 2.510 98.324
6 .128 1.604 99.928
从表中得出前4个主成分的累积百分比即贡献率已达到95.814%大于85%,故取前4个样本主成分。污染指标载荷值见表4,每个载荷量表示主成分与对应变量的相关系数。
表2 污染指标载荷值
成份
1 2 3 4
X1 .661 .691 -.021 -.112
X2 .853 .310 -.007 -.184
X3 .765 .258 .222 -.461
X4 .339 .550 -.068 .749
X5 .895 -.423 -.076 .088
X6 .083 -.099 .973 .181
X7 .904 -.395 -.077 .132
X8 .904 -.398 -.077 .128
由载荷矩阵求特征向量T1、T2、T3、T4,将特征向量与标准化后的数据相乘,就可以得到各个主成分得分 Z1、Z2、Z3、Z4,然后求综合评价得分(见表3),其计算公式为Y=a1*Z1+a2*Z2+a3*Z3+a4*Z4。
表3 各区域污染物排放水平得分
行政区 枣庄市中区 薛城区 峄城区 台儿庄 山亭区 滕州市 济宁市中区
得分Y 0.161904 -0.59187 -0.91384 -0.26179 -0.99345 4.704583 0.696016
行政区 任城区 微山县 鱼台县 金乡县 嘉祥县 汶上县 泗水县
得分Y 0.278973 -0.23556 -1.30626 -0.67262 -1.1867 -0.66624 -0.6409
行政区 梁山县 曲阜市 兖州市 邹城市 宁阳县 菏泽市区 曹县
得分Y -0.89833 -0.87131 0.223119 0.73138 0.549499 1.044925 1.067746
行政区 单县 成武县 巨野县 郓城县 甄城县 定陶县 东明县
得分Y 0.523541 -0.3124 -0.0109 0.412391 -0.87827 -0.41041 0.456775
3 南四湖流域污染物排放水平空间分布
由于采用的数据都是污染物的排放量,所以主成分得分越高,其污染物排放水平越高,污染的程度越高。根据样本的平均值和标准差,计算出u-1.5σ,u-0.5σ,u+0.5σ,u+1.5σ作为划分污染物排放水平的等级,其结果如下:
表4 南四湖流域污染物排放水平分类
低 中低 中 中高 高
<-1.65407 -1.65407至-0.55136 -0.55136至0.551357 0.551357至1.65407 >1.65407
无 鱼台县、嘉祥县、山亭区、峄城区、梁山县、甄城县、曲阜市、金乡县、汶上县、泗水县、薛城区 定陶县、成武县、台儿庄区、微山县、巨野县、枣庄市中区、兖州市、任城区、郓城县、东明县、单县、宁阳县 济宁市中区、邹城市、菏泽市区、曹县 滕州市
结合ArcMap,对南四湖流域县级行政单元的污染物的排放量水平进行了空间表达(图1)。
图1 南四湖流域污染物排放水平分布图
结合表6、表7和图1可以看出,南四湖流域污染物排放水平的主成分得分值介于-1.31和4.91之间,排放水平最高是滕州市,其主成分得分值为4.704583,远远大于1.65407,且临近南四湖,对南四湖的水质污染威胁较大,是今后政府治理和调控的重点。济宁市中区、邹城区、菏泽市区和曹县的排放水平虽没有滕州市那么高,但相对于其他的县市来说,仍处于较高的水平,今后应适当加以控制和治理。其他县市的排放水平处于中、中下水平,是流域内污染程度较小的县市,相对来说对南四湖水质污染的威胁较小。流域内没有处于低水平的县市,说明要达到低水平的排放并非易事,是今后流域努力的方向。
参考文献:
[1] 赵群群,杨凯.南四湖污染物排放对南水北调东线水质的影响及治理措施[J].价值工程, 2010,(2):105-106.
[2] 张先军,姚辉勇.南水北调东线南四湖人工湿地建设与规划[J].南水北调与湿地科技,2010,08(3):21-24.
[3] 张祖陆,沈吉等.南四湖的形成及水环境演变[J].海洋与湖沼,2002,33(3):14-321.
[4] 储德义.合理配置水资源保护南四湖生物多样性[J].治淮,2003,(6):9-11.
[5] 武周虎,乔海涛等.南水北调东线工程对南四湖环境的影响及对策[J].青岛理工大学学报,2006,27(1):1-2.
[6] 邱红,曹冬云等.南四湖现状及治理规划探讨[J].山东水利,2003,(11):6-8.
[7]第一次全国污染源普查公报 中华人民共和国农业部 环保部 统计局.
[8]刘亚臣,吴振虎等.基于主成分分析法的沈阳市房地产业与国民经济协调度分析[J].建筑经济,2011(4):84-88.
[9]赵明华,朱明明.山东半岛城市群水资源可持续利用水平评价研究[J].水利经济,2011,29(3):34-37.
(责任编辑 张 萌)
Principal Component Analysis-based Study of the Spatial Distribution of Water Pollutant Emissions in Nansi Lake Basin
SUN Lingwen 1,2 ,YAN Zhongxiao3 ,SHAO Bo1,2 ,JIA Yongfei1,2
(1.Institute of Science and Technology for Development of Shandong, Jinan 250014; 2 scientific decision support Key Laboratory of Shandong Academy of Science, Jinan 250014;3 College of Population, Resources and Environment, Shandong Normal University, Jinan 250014)
Abstract: This paper applies the Principal Component Analysis Method to evaluate the water pollutant emission levels of the 28 counties of Nansi Lake basin. Results shows that pollutant emission levels of Tengzhou city are significantly higher than other areas of the basin. Jining City, Zoucheng city, Heze city, Cao county have high emission levels of pollutants, and therefore are recognized as the key areas for pollution control in Nansi Lake basin in the future. Suggestions on the entire river basin management and pollution control measures are also put forward.
Key words:Principal Component Analysis Method;Nansi Lake basin;Emissions;Spatial distribution