基于聚类分析和因子分析的我国各地区环境污染状况研究
2015-12-27崔雪杨
崔雪杨
(北京交通大学经济与管理学院,北京 100044)
基于聚类分析和因子分析的我国各地区环境污染状况研究
崔雪杨
(北京交通大学经济与管理学院,北京 100044)
本文利用多元统计中聚类分析和因子分析的方法,对我国31个省、自治区、直辖市的工业及生活排放污染物进行数据分析,通过借鉴已有的研究成果和相关文献,选取了能较好衡量我国环境污染的八项指标。在此基础上根据不同地区的因子得分情况提取出三个解释性较好的公共因子,并给出了每个因子的地区排名和合理解释,最后提出了几点对策和建议。
聚类分析 因子分析 环境污染评价
近年来随着城市发展的需要,人类从环境获取资源的数量越来越多,与此同时排放到环境中的气体、液体和固体废弃物也不断增加。我国经济快速发展的过程是大量消耗自然资源的过程,也是环境和资源破坏遭到巨大破坏的过程,尤其是建立在工业领域的“高耗能、高投入、高污染”的粗放型生产方式上,而粗放型经济发展方式必然会给我国各个地区环境和生态带来越来越大的冲击压力。环境污染、自然资源的破坏和再生能力的下降也在不断威胁着人类的生存,这也使人们越来越关注环境和生态成本,如何处理好环境和经济的和谐发展问题已成为一个亟待解决的课题。
1 指标的选取及数据来源
本文以全国31个地区为研究对象,通过借鉴已有研究成果及相关文献选取了能较好衡量环境污染状况的八项指标,分别为:X1:工业废水排放总量(万吨)、X2:工业废水中化学需氧量排放量(万吨)、X3:生活污水排放量(万吨)、X4:生活污水中化学需氧量排放量(万吨)、X5:工业废气排放量(亿标立方米)、X6:工业二氧化硫排放量(万吨)、X7:工业烟尘排放量(万吨)、X8:工业固体废物排放量(吨)。数据主要来源于2011年中国统计年鉴,并参考环保部网站公布的相关数据进行了核对和完善。
2 关于各地区环境污染水平的聚类分析
2.1 聚类分析的目的
为了对31个地区的环境污染水平及分类有大致的了解,首先对样本进行聚类分析。本文通过不同聚类数设定结果的比较将聚类数设为4,并采用系统聚类法进行了初分类。
表1 树状图分类结果
表2 提取的公共因子
表3 因子得分系数
2.2 聚类分析的过程
(1)聚类结果树状图见图1。
(2)树状图分类结果整理见表1。
2.3 聚类结果分析
由以上表格可以看出污染最严重的是山西和重庆,山西为我国的煤炭大省,由于以煤炭工业为中心的重工业体系,同时深处内陆地区,降水少,因而产生严重的环境污染。重庆也是煤炭资源比较丰富的地区,也是老重工业基地,再加上盆地地形,多丘陵,空气不流通等等原因导致其环境污染比较严重。
河北、河南、辽宁、山东、江苏、广西都是我国比较有名的工业区,再加上近年来经济发展势头都很猛,经济总量越大,需要的原料会越多,导致经济活动的副产品——污染物的排放就越多,而其环境污染状况也随之有恶化的趋势。同时环境污染状况应该还与产业结构有关,比如河北省、山东省以钢铁、建材等重工业为主、而广西省则有色金属开采和冶炼增长比较快。
3 关于各地区环境污染水平的因子分析
3.1 因子分析的目的
通过对各个环境污染指标变量的共同信息进行提取,将环境污染指标简化为几个可以被解释的潜在公共因子,从而能够大致了解各地区环境污染的主要原因,同时通过计算因子得分得到各个地区环境污染状况严重程度的排名。
3.2 因子分析的过程
首先经过原始变量相关系数、变量KMO和Bartlett球度检验和反映像相关矩阵验证数据适合做因子分析,提取的公共因子见表2。
提取方法:主成份分析。
根据表中的数据,前3个因子累计方差贡献率为85.338%,因此提取前3个因子作为公共因子。
由于初始载荷矩阵不够清晰,进而采用方差最大正交旋转得到了三个可解释的因子。第一个因子主要解释了工业废水排放总量、工业废水中化学需氧量排放量、生活污水排放量、生活污水中化学需氧量排放量,可解释为液体因子;第二个因子主要解释了工业废气排放量、工业二氧化硫排放量、工业烟尘排放量,可解释为气体因子;第三个因子主要解释了工业固体废物排放量,可解释为固体因子。最后计算因子得分系数见表3。
采用回归法估计因子得分系数,并输出因子得分系数,据此得出因子得分函数为:
F1=0.307X1+0.161X2+0.477X3+0.397X4-0.166X5-0.058X6-0.231X7+0.118X8
F2=-0.054X1+0.093X2-0.250X3-0.150X4+0.401X5+ 0.337X6+0.463X7-0.072X8
F3=-0.041X1-0.027X2+0.120X3+0.085X4-0.110X5+ 0.110X6-0.076X7+0.997X8
在此基础上不仅可以计算出各地区在各个因子上的因子得分,而且可以利用线性加权的方法计算各个地区环境污染状况的因子得分,用旋转后的方差贡献率作为总得分系数,公式为:综合得分=FAC1_1*36.567+FAC2_1*35.840+FAC3_1*12.931,按这3项得分和综合得分的排名见表4。
3.3 因子分析结果解释
通过对环境污染各项指标进行因子分析,提取出了三个解释性比较好的公共因子,分别为液体因子、气体因子、固体因子。
表4 因子得分和综合得分
按第一个因子液体因子排名,广东省得分最高,其次为江苏,最低为内蒙古,广东省在第一主因子方面排名较高主要是因为:广东省水系发达,水资源丰富,但由于工业废水和城市污水的排入,污染严重,水质性缺水的威胁加剧。
按第二个因子气体因子进行排名,可发现河北省,山西省得分比较高,它们之所以在第二主因子方面污染严重主要是因为河北、山西两省能源、资源丰富,但是由于经济增长率持续加快,产业结构属偏重型,如今能源消耗已大于能源生产总资源,工农业的发展和人口增加所带来的环境污染问题严重影响了两省的生态环境和可持续发展战略的实施。
按第三个因子固体因子排名,重庆市、山西得分比较高,最低为宁夏,重庆第三因子污染严重主要是因为重庆是中国重要的老重工业基地,现代制造业基地,国家高技术产业基地,随着经济和技术的飞速发展,如果没有良好的处理措施,必然会造成过多的固体废物存在。
最后的综合排名中,广东、江苏、山东、山西、河南、河北的排名都靠前,说明其环境污染状况比较严重,需要加大治理力度。
4 对策及建议
(1)各地区环保部门应根据污染状况有针对性的采取措施治理环境污染;(2)政府及有关部门应加强建设项目的监管,完善环境污染防治法制建设;(3)研发新技术,加大环境保护的科技投入,大力发展环保产业;(4)进一步加强环境保护的宣传工作,加强全社会对环境污染的广泛重视;(5)加快对老工业、污染严重的企业项目的产业结构调整,结合产业升级和技术改造,加快治理力度。
致谢:
感谢我的导师,她渊博的知识和人格魅力使我受益匪浅;感谢我的父母,他们的支持和鼓励才使我有了前进的动力;感谢我周围的同学和朋友让我收获了珍贵的友谊。
[1]黄桐城,李寿德,顾孟迪.因子分析法在环境污染检测与评价中的应用[J].工业工程与管理,2007(5):95-100.
[2]彭迪云,刘彩梅.江西省环境与经济可持续发展状况的实证研究[J].南昌大学学报(理科版),2011(6):602-606.
[3]刘照德,丁洁花.我国工业污染分布状况研究[J].数学的实践与认识,2009(1):99-104.
[4]周全.几种多元统计分析方法及其在生活中的应用[D].长江大学, 2012.
[5]邹本东,徐子优,华蕾等.因子分析法解析北京市大气颗粒物PM_ (10)的来源[J].中国环境监测,2007(2):79-85.
The purpose of this article is to investigate environmental pollution of 31 provinces in our country by referring the existing research results and related literature. This paper applied cluster analysis and factor analysis to 8 principal monitored indexes by the help of statistical software SPSS, and summed up 8 indexes to 3 factors, each of which had special meaning. On this basis it compared and evaluated the environmental pollution in China, using the final factor scores in different regions. The result of this paper is helpful for the Environmental protection department to adopt an effective policy and improve regional environmental pollution in China.
cluster analysis factor analysis environmental pollution evaluation
崔雪杨(1989—),女,汉族,山东聊城人,北京交通大学经济管理学院,硕士研究生,研究方向:企业管理。