基于多元回归分析影响北京市空气质量的因素
2020-08-31李晶
摘 要:随着冬天来临,供暖季启动,北京近日雾霾天气频发,空气污染严重,给人民的生产生活带来不良影响。本文选取2000年—2012年北京市的相关数据,运用多元回归建模分析,研究地区经济发展状况、人口规模、城市道路交通状况、能源耗费量、尾气排放及城市绿植覆盖率对北京市空气质量的影响程度。
关键词:空气质量;多元回归;模型检验
一、论文的背景与意义
空气,是人类每天都在呼吸的生命气体,是人类赖以生存的必要前提,空气质量的好坏对人类的生产、生活都将带来很大影响。随着改革开放以来工业的迅猛发展,环境污染严重,大气污染日渐突出,恶化的空气质量严重影响人类的健康生活。
北京市,作为中华人民共和国首都,是我国的政治中心、文化中心和国际交往中心,同时也是首批国家历史文化名城和世界上拥有世界文化遗产数最多的城市,旅游资源丰富,在国内和国际都有很重要的影响力。
近年来北京雾霾天气多发,空气污染严重,给人民的生产生活带来不良影响。本文基于多元回归建模分析,研究对北京市空气质量影响因素,以期能够提出合理建议改善北京市空气质量。
二、数据的来源与数据的介绍
2.1数据来源
本文研究数据空气质量达标天数取自于2000年—2012年《北京市環境状况公报》公布的全市空气质量二级和好于二级天数,地区生产总值、年末常住人口、
私人汽车拥有量、煤炭消费量、汽油消费量、城市绿地面积取自于2000年—2012年《中国统计年鉴》。
2.2数据的介绍
本文选取了几个可能影响北京市空气质量的变量,以北京市2000年—2012年的空气质量达标天数(Y)代表北京市空气质量,地区生产总值(X1)代表经济发展状况,年末常住人口(X2)表示人口规模,私人汽车拥有量(X3)代表城市交通状况,煤炭消费量(X4)代表能源耗费,汽油消费量(X5)代表尾气排放,城市绿地面积(X6)代表城市绿地植被覆盖率。通过建立多元线性回归方程分析影响北京市空气质量的因素。
2.3描述性统计分析
2000年—2012年北京市空气质量达标天数、地区生产总值、年末常住人口、私人汽车拥有量、煤炭消费量、汽油消费量、城市绿地面积等各变量的描述性统计如表2所示:
由表2的描述性统计分析可知,2000年—2012年北京市空气质量达标天数即全市空气质量二级和好于二级天数平均值为242天,占全年总天数(按365天计算)的66.30%,也即在2000年—2012年北京市空气质量平均不达标天数约占全年的三分之一。数据显示2000年的北京市空气质量达标天数最低为177天,约占全年总天数的48.5%,; 2010年和2011年北京市空气质量达标天数最高为286天, 约占全年总天数78.36%。
2000年—2012年北京市地区生产总值平均达到9128.62亿元,在全国范围内经济增长迅速,随之全市常住人口数量逐年增加,私人汽车保有量日益增多,汽油消费量逐年增大。虽然煤炭消费量仍占据能源消耗的很大比重,随着环保政策的实施和节能环保产品的替代作用,煤炭消费量呈现下降趋势。城市绿地面积的增加,也有助于缓解空气污染。
三、实证分析
3.1统计方法介绍
本文采用Stata 15.1软件做为统计分析工具,将表1中各项数据导入软件,进行回归参数处理,建立多元回归模型,以期实证分析经济发展状况、人口规模、城市交通状况、能源耗费、尾气排放、城市绿地植被覆盖率对北京市空气质量的影响。根据回归结果数据显示检验是否存在多重共线性,然后采用逐步回归法对数据进一步处理,得出最终回归模型,并进行模型检验,通过检验后得出结论。
3.2数据与模型相结合分析
3.2.1模型构建
建立多元回归模型如下:
其中Y代表北京市空气质量达标天数作为被解释变量,X1、X2、X3、X4、X5、X6为选取的影响因素指标作为解释变量,β为各解释变量相应系数,u为随机扰动项。
3.2.2参数估计
本文采用Stata 15.1软件做为统计分析工具,将表1中各项数据导入软件,进行回归参数处理,得出回归结果如下表所示:
从上述回归结果可以看出,拟合优度R2较高,调整的拟合优度也较高,通过F检验,但各个参数的t检验却不显著,此时考虑各解释变量间存在多重共线性。多重共线性可能会造成估计不准确或检验不准确,从而得出的结论也不准确,因此先做多重共线性检验,若存在多重共线性,则进行修正。
通过计算各解释变量的相关系数及方差膨胀因子(VIF值),发现各解释变量间存在严重的多重共线性。
通过Stata 15.1软件进行逐步回归,确定变量x1、x3、x5均不显著(0.05的显著性水平),剔除解释变量x1、x3、x5,保留解释变量x2、x4、x6。
3.3模型检验
3.3.1拟合优度检验
表4的数据显示拟合优度R2= 0.9569,调整的拟合优度= 0.9425,两项数据表明该模型较好地拟合了样本观测值。
3.2.2 F检验
给定显著性水平α=0.05,查询F检验临界值表得出Fα(3,9)=3.863,根据表6中数据显示F=66.56 > Fα(3,9)=3.863,F统计量的P值为0.0000,也明显小于α=0.05,说明回归方程显著,通过F检验。
3.3.3 t检验
给定显著性水平α=0.05,计算“显著性水平”为α的“临界值”,根据查询t检验临界值表得出自由度为n-m-1=9的临界值为tα/2(9)=2.262,而各解释变量X2、X4、X6的t统计量均大于2.262,通过t检验。
3.3.4 异方差检验
在Stata15.1软件中进行white检验,得出数据Prob > chi2 = 0.3224,通过检验。
回归模型通过检验,说明“年末常住人口”、“煤炭消费量”、“城市绿地面积”变量联合起来确实对“空气质量达标天数”有显著影响。
四、结论与建议
本文中关于人口规模对北京市空气质量影响程度的分析显示出,人口每增加一万人,空气质量达标天数将平均增加0.1174天,表明人口数量增加不一定会导致空气质量的直接恶化。近年来随着人们环保意识的提高,更多的人投入到环保宣传和实际环保行动中,对空气质量的改善有促进作用。
从本文中关于能源消耗量对于北京市空气质量的影响程度来看,煤炭消费量每增加一万吨,空气质量达标天数将平均增加0.0335天,北京市空气质量并未因能源消耗量而明显恶化。北京市于2011年制定了《北京市清洁空气行动计划(2011-2015年大气污染控制措施)》,坚持能源低碳清洁化,进行燃煤锅炉清洁能源改造工程,实现核心区无燃煤锅炉,污染物排放量大幅下降。2012年編制实施《北京市2012-2020年大气污染治理措施》,加大力度开展大气污染防治,推行绿色文明施工管理模式。北京市近年一系列的环保政策的制定实施和能源结构调整,即使能源消耗量增加,但清洁能源的投入使用对改善北京市空气质量也起到了一定作用。
从本文中对于北京市空气质量的显著因素分析,城市绿地面积每增加一万公顷,空气质量达标天数将平均增加9.7181天,由此可见城市绿地植被覆盖率对于北京市空气质量的改善有明显作用。众所周知,绿色植物能够通过自身的光合作用吸收二氧化碳释放氧气,吸收灰尘净化空气,因此建议扩大城市绿地面积,提高城市绿地植被覆盖率,改善城市空气质量。
总之,空气质量和人类的生活息息相关,基于本文前述实证分析结果,为改善北京市空气质量,减少空气污染天数,提出以下建议:
确切落实环保政策,增强人们的环保意识,改善传统能源结构,促进粗放型经济产业的转型,减少尾气排放,投入更多新能源和节能环保产品的使用,扩大城市绿地面积,提高植被覆盖率,与周边城市协同改善城市空气质量。
参考文献
[1] 李玉敏,李明丽,焦智康. 北京市空气质量影响因素计量经济分析[J].中国城市经济.2011.5.25.
[2] 冯朝军.基于多元回归分析的我国CPI影响因素识别[J].统计与决策,2017,(24).
[3] 李经路,曾天. 北京空气质量影响因素的主成分分析——来自于2000-2011年的经验数据[J].生态经济,2017,33(1).
[4] 陈强.计量经济学及Stata应用[M].北京:高等教育出版社,2015.
作者简介:李晶(1989-),女,对外经济贸易大学统计学院在职人员高级课程研修班学员。