长治市PM2.5含量的影响因素分析
2023-04-11韩浩田
党 红 韩浩田
(长治学院数学系 山西长治 046011)
引言
空气质量指数(Air Quality Index,简称AQI)就是根据环境空气质量标准和各项污染物对人体健康、生态、环境的影响,将常规监测的几种空气污染物浓度简化成为单一的概念性指数值形式,它包括了空气的洁净、污染程度以及对健康的影响[1]。一共分为六级,分别对应空气质量的六个类别,空气质量指数取值范围在0~500,当范围在0~100 时,对大多数市民正常活动没有影响,当空气质量指数在150 以上时,对儿童和老年人以及心脏病、肺病患者的户外活动有极大的影响。影响空气质量评估的主要污染物有细颗粒物(PM2.5)、可吸入颗粒物(PM10)、一氧化碳(CO)、二氧化氮(NO2)、二氧化硫(SO2)、臭氧(O3)等六项。PM2.5是指环境空气中直径小于或等于2.5 微米的颗粒物,又被称作可入肺颗粒物[1]。尽管PM2.5 在地球大气成分中所占比例很小,但是它却对空气的品质、能见度等产生了重大的影响。PM2.5 颗粒具有直径小,活性强的特质,并且在空气中可以停留较长时间,传输距离也比其它物质远,会吸附在口腔黏膜上,因此对人体健康和大气环境质量会产生很大的影响。
国内许多学者对于PM2.5 进行过大量的研究,利用主成分分析、相关性分析、多元线性回归分析等多种分析方法,研究了多个地区的空气质量,取得了一定的成果。宋红凤等通过对杭州地区的AQI 及其6 项指标建立多元线性回归模型,并对PM10、SO2、CO、NO2、O3五项指标进行主成分分析,消除强影响点得到回归方程,进行最终PM2.5 影响因素的研究[2]。李波等对长沙市的AQI 指标进行相关性分析,建立时间序列模型对长沙市的PM2.5 进行了短期预测,并通过最优模型提出相关建议[3]。丛琳等人建立了北京市PM2.5 与PM10、SO2、CO、NO2、O3的线性回归模型,同时基于主成分分析建立精确度更高的的多元回归模型,研究得出PM10、CO、NO2对北京市PM2.5 的影响最大[4]。
长治市近年来经济发展迅速,同时给环境带来了较大的破坏,大气环境被严重污染,譬如机动车废气带来的污染,施工带来的扬尘污染,燃煤导致的污染,凡此种种,对市民的正常生活及出行造成了一定的影响。近年来,通过实施秋冬季大气污染综合治理攻坚行动,长治市空气质量持续改善,为了彻底消除重污染天气,本文通过研究2021 年PM2.5 与PM10、SO2、CO、NO2、O3之间的关系,采用主成分分析法找到长治市空气质量被影响的关键因素,以便为政府部门的治理提供有参考价值的信息和有针对性的建议,打好重污染天气攻坚战。
1 长治市空气质量的基本情况
本文研究所用的数据全部源自中国空气质量在线监测分析平台,长治市2021 年每天的AQI 指数及其6项指标含量数据不存在丢失情况,研究数据中CO 的单位是mg/m3,而PM2.5 与PM10、SO2、NO2、O3单位是μg/m3,各变量单位不一致,因此要先将数据中心标准化,对CO 的数据乘以1000 进行单位换算,以此来消除量纲对数据分析所产生的影响。
对长治市2021 年空气质量评价进行汇总分析,从表1 中可以看到长治市2021 年空气质量为良的频率是63.01%,空气质量为优良的累计频率为79.17%,说明长治市空气质量较好,优良天气居多,轻度污染的频率为16.99%,中度污染的频率为2.19%,而重度污染和严重污染的频率仅为1.10%和0.55%。这表明,作为“2+26”城市大气污染防治城市之一,经过一年的“转型、减煤、降尘、控车、治企”,长治市空气质量得到稳步提升,但中度污染、重度污染及严重污染的情况还会不时发生,因此空气质量的改善和治理工作一刻也不能放松,仍然需要继续落实。
表1 2021年长治市空气质量情况
2 建立多元线性回归模型
2.1 相关系数计
在多元线性回归模型中,如果变量之间存在多重共线性,将对统计检验、参数估计及模型估计值的稳定性、可靠性产生不利的影响。因此,在建立多元线性回归模型时,检验变量之间是否存在多重共线性是非常有必要的。
皮尔森相关系数R[6]被广泛用于衡量两个变量间的相关性,相关系数R 的取值范围在1 到-1 之间。其中相关系数的绝对值愈接近1,两个变量之间的相关性愈强;等于1 表示这两个变量是完全相关的;相关系数的绝对值愈接近0,则两者的相关性愈低。
使用EVIEWS 软件录入原数据,得到了影响PM2.5 浓度的各项指标数据之间的相关系数矩阵如表2 所示。
表2 相关系数表
从表2 各变量之间的相关系数值可以看出,PM2.5 与PM10、CO、SO2、NO2、O3五个监测指标间都有着不同程度的相关性。具体表现为:PM2.5 与PM10 相关性系数R 为0.8962,是最高的,说明PM10 对PM2.5的影响最大;其次PM2.5 与CO 的相关性系数R 为0.7090,说明与CO 之间的相关性较高;另外PM2.5 与SO2、NO2的相关性系数R 分别为0.6662 和0.6434,说明PM2.5 与SO2、NO2之间也存在较大的相关性;以上相关系数均为正数,说明PM2.5 与PM10、CO、SO2、NO2之间的关系均为正相关,而PM2.5 与O3间的相关性系数R 为-0.2392,和O3之间的关系为负相关,表明现有的研究结果具有一定的合理性,即在PM2.5 形成之前,一氧化碳(CO)、二氧化氮(NO2)、二氧化硫(SO2)是主要的气态物质;而PM2.5 与O3间呈负相关关系,在降低PM2.5 时,保护大气层中的臭氧是非常关键的,分析表明,解释变量之间存在着严重的多重共线性关系,不能用线性回归方法来建立模型。因此,本文采用了主成分分析法[7],以克服多重共线对线性回归模型所造成的影响。
2.2 模型的建立和求解
多元回归分析方法可以对一个因变量与多个自变量之间的相关性进行分析,通过对不同因子组合的数值进行多元统计分析,得出因变量与自变量之间的数量关系[8]。本文针对PM2.5 与PM10、CO、SO2、NO2、O3五个因子进行多元统计,进而分析PM2.5 与这五个因子之间的具体量化关系。通过上文分析发现,PM2.5 与五个因子之间存在较为显著的相关性。但直接建立PM2.5 与PM10、CO、SO2、NO2、O3五个指标的多元回归模型时,SO2会由于显著性检验结果不显著而被剔除,这与SO2与PM2.5 的相关性很高的结论相违背。为了能够更好地解释SO2与PM2.5 之间的关系,需对PM10、CO、SO2、NO2、O3五个指标进行主成分分析,并建立主成分之间的多元回归模型。使用SPSS 软件对所得数据进行分析,并用最大方差法[9]进行旋转,提取出主成分,结果如表3 所示。
从表3 中可以看出,主成分的数量要少于原来的变量数目,且绝大多数的信息都能用主成分进行解释,减少了变量信息的损失,所以主成分提取的整体结果是令人满意的;第一个元素的主成分的特征值是3.068,它解释了总信息的61.361%,第二个元素的主成分的特征值是0.928,它解释了总信息的18.554%,第三个元素的主成分的特征值是0.528,它解释了总信息的10.553%,前3 个主成分的累计贡献率高达90.468%,远大于80%,这表明,主成分分析的结果较为理想,前面三个主成分所包含的信息较为完整,而损失的部分则是各变量间存在着相互重叠的信息,因此,选择前面三个主成分进行分析是合理的。
表3 解释的总方差
由表4 可以看出,PM10、NO2在第一个主成分上的载荷量比在第二、三主成分上的载荷量大,均大于0.85,接近于1;而O3在第二个主成分上的载荷量比在第一、三主成分上的载荷量大,大于0.85,接近于1,因此不能确定该变量属于哪个主成分。
表4 成分矩阵
为了使变量在三个主成分上的载荷量能清楚的区分,需要使用统计软件SPSS 对载荷矩阵进行旋转,从而使因子载荷系数[10]向0 和1 两极分化,使载荷大的旋转后变得更大,载荷小的旋转后变得更小,旋转后的因子载荷矩阵如表5 所示。
旋转后的各个主成分的含义更加突出,旋转成分矩阵表中的一行是一个变量在不同因子上的载荷,如果这些载荷都小于0.5(建议值),则考虑删除或修改这个变量[11];只要大于0.5,则认为该变量与这个成分有对应关系,由表5 可以看出,所有变量在自己所在行中的载荷值都存在至少有1 个大于0.5(建议值)的。PM10、CO、NO2这三个变量在成分一上载荷量最大,表明成分一对PM10、CO、NO2这三个变量影响最大,将该成分命名为工业因子;SO2变量在成分二上载荷量最大,表明成分二对SO2变量影响最大,相应的成分可命名为生活因子;O3变量在成分三上载荷量最大,表明成分三对O3变量影响最大,将该成分命名为环保因子。
表5 旋转成分矩阵
2.3 PM2.5与主成分的关系
利用SPSS 软件求出主成分的特征向量[12]。结果如表6 所示。
表6 特征向量矩阵
同时得到三个主成分与原始变量之间的关系式:
在主成分分析操作中,三个主成分之间保持相互独立,故对PM2.5 与三个主成分进行多元回归分析,结果如表7 所示。
表7 主成分回归结果
综上所述,得到如下多元回归方程:
由回归方程可知:PM2.5 与工业因子F1呈正比例关系,与生活因子F2呈正比例关系,与环保因子F3呈反比例关系,当生活因子F2、环保因子F3保持不变时,工业因子F1每变化一个单位会导致PM2.5 变化30.099 个单位;同理,当工业因子F1、环保因子F3保持不变时,生活因子F2每变化一个单位会导致PM2.5 变化19.804 个单位;当工业因子F1、生活因子F2保持不变时,环保因子F3每变化一个单位会导致PM2.5 变化3.231 个单位。同时也反映了PM10、CO、NO2这三个变量对PM2.5 的影响最大。
结语
文章对长治市2021 年AQI 指数和具体的监测指标进行整理,并进行统计分析,研究引起长治市空气质量问题的主要因素PM2.5 与PM10、SO2、CO、NO2、O3间的相关关系,利用主成分分析法消除了多重共线性的影响,提取三个主成分,并建立了多元线性回归模型,得到PM2.5 与PM10、SO2、CO、NO2、O3间的线性回归方程。
研究发现,PM2.5 与第一主成分工业因子存在较大的相关关系,即与PM10、CO、NO2的相关程度比较大,其中PM10 对PM2.5 的影响最大,二者同为空气中的颗粒物,PM2.5 与第二主成分生活因子也存在相关关系,即与SO2有一定的相关关系;而PM2.5 与第三主成分环保因子的相关关系就比较弱,即与O3间的相关程度不大。
为改善长治市的空气质量,需控制空气中尘土的含量,防治城市施工作业中的飞尘,减少煤炭开采运输过程中产生的扬尘;同时冬季煤炭燃烧会产生大量的SO2,为减少冬天煤炭使用量,可以使用新能源供暖替代烧煤供暖;汽车尾气及工业废气中含有大量的CO和NO2,因此,需降低汽车尾气的排放量,严格管控工厂的废气排放,低碳出行,减少私家车出行,大力发展公共交通。此外,政府还应该向大众讲解空气质量的相关知识,提升大众的环保意识;出台更加严格完善的监督管理制度,坚持“转型、减煤、降尘、控车、治企”,巩固现有空气治理成果的同时,积极利用科技改善人们赖以生存的环境,创建美好家园。文章只收集了2021 年的空气质量数据,存在研究数据不充足的问题,这也是后续研究需要完善的地方。