基于因子分析法的空气质量综合评价研究
2021-06-04周玉香徐爱兰
周玉香,徐爱兰,蒋 荣
(1.南京理工大学,江苏 南京 210094;2.江苏省南通环境监测中心,江苏 南通 226000)
0 引言
随着经济发展和城市化加快,能源消耗和大气污染物排放上升,以大气氧化剂和细粒子为主的大气复合型污染问题越来越突出[1]。大气污染会严重影响人们的生活质量和健康水平,人们越来越关注周围环境的空气质量情况。2018年是打赢蓝天保卫战三年行动计划的第一年,城市环境污染形势严峻,各相关部门深感任重而道远。《GB3095-2012环境空气质量标准》中规定了PM10、PM2.5、SO2、NO2、CO和O3共6项常规污染物[2],研究这些污染物的污染分布特征和综合评价城市的环境空气质量,对于改善城市大气环境、制定减排措施具有重要意义[3]。
环境空气质量综合评价中可以考虑多种评价方法,从而更客观更全面地反映空气质量水平。目前我国常见的是用环境空气质量指数法,其计算量较大,而且分析比较复杂[4]。多元统计分析中的因子分析法可以很好地诠释时间序列中的主因子,找出问题的成因[5],有针对性地提高和改进。基于因子分析法,借助SPSS 20.0软件,选取2018年南通市崇川区6项常规大气污染物进行分析,研究污染物的时间分布特征、内在联系,对空气质量进行综合评价,期望为南通市制定大气污染控制和治理策略提供科学依据。
1 资料与方法
1.1 资料来源
观测点位选择南通市崇川区现有国控点位,分别为虹桥、城中和南郊,其中南郊为清洁对照点不参与统计。数据选择6项常规污染物2018年的每日自动监测数据。
1.2 分析方法
因子分析法,旨在利用降维的思想,通过探究众多变量中间的内部依赖关系,寻求观测数据中的基本结构,并用少数几个抽象的变量来表示其基本的数据结构[6]。计算步骤如下:①对原始数据进行标准化处理;②计算各污染物相关系数矩阵;③确定初始主因子;④选取公共因子个数,计算因子载荷矩阵;⑤计算因子得分函数的系数;⑥计算公因子得分和综合得分。
2 结果与分析
2.1 大气污染物的时间特征
2.1.1 大气污染物的浓度水平
2018年,南通市崇川区环境空气质量SO2年均浓度为17.77μg/m3,NO2年均浓度为34.10μg/m3,PM10年均浓度为 63.23μg/m3,均达到二级标准;PM2.5年均浓度为40.61μg/m3,劣于二级标准;臭氧日最大8h滑动平均值为101.23μg/m3,CO年平均值0.710mg/m3。
2.1.2 大气污染物的浓度月份分布特征
由图1可知PM10、PM2.5、SO2、NO2、CO浓度月份变化似“V型”且月均浓度最小值都出现在8月份,但最大值出现月份各不相同。PM10月均浓度最大值出现在4月份,PM2.5月均浓度最大值出现在1月份,SO2月均浓度最大值出现在12月份,NO2月均浓度最大值出现在3月份,CO月均浓度最大值出现在2月份,可见全年夏季和秋季污染较轻,冬季和春季污染较严重。PM10、PM2.5、SO2、NO2、CO浓度月份变化曲线有相似性,与它们的来源有关,化石燃料燃烧等的工业污染是SO2和PM10的重要来源,机动车尾气是NO2和PM10的重要来源,燃煤主要排放硫化物、氮氧化物和烟尘。PM2.5的主要来源为煤炭燃烧、机动车尾气和工业污染源[7]。CO主要来源于内燃机排气,其次是锅炉中化石燃料的不充分燃烧。
图1 大气污染物浓度月份变化曲线
O3浓度月份变化似“M型”,月均浓度最小值出现在2月份,4月、5月、6月和10月的月均浓度较高,可见O3污染全年冬季污染较轻,春季、夏季和秋季污染较严重。由于气温升高,太阳辐射增强,O3在大气中与其他污染物发生复杂光化学反应更强烈[8]。该区属北亚热带气候区,四季分明,夏季的温度是最高的,但O3浓度在7月和8月不是最高,与相应月份强降水较多有关,夏季降水对O3湿清除作用最为明显[9]。
2.2 因子分析
2.2.1 相关分析
利用SPSS 20.0对原始数据用标准差标准化法消除量纲的影响,进行因子分析得到大气污染物间相关系数矩阵如表1。可以看出,PM10、PM2.5、SO2、NO2、CO呈显著正相关。这几种污染物除来源相似,变化机制也有相似性。大气中的 NO2和SO2通过气相或者多反应氧化形成酸性气溶胶,同NH3反应生成硝酸铵和硫酸铵气溶胶粒子,最终转化为硝酸盐和硫酸盐颗粒物,硝酸盐和硫酸盐是PM2.5和PM10中的重要组分[10]。O3仅与CO在0.05水平上呈显著相关,与其他污染物之间相关性都不明显,一方面是近地面臭氧主要来自于汽车尾气、石油化工等排放的氮氧化物和挥发性有机化合物的大气光化学反应[11],具有不稳定性,另一方面可能更多地因其强氧化性而与其他物质反应有关[12]。
表1 相关系数矩阵
考察变量是否适合进行因子分析,进行KMO和Bartlett球体检验,KMO检验系数>0.5,P值<0.05时,表示数据取自正态分布,变量之间的相关性得到认可,表明原始数据适合进行因子分析。如表2,本次分析得出KMO值为0.641,P值为0.00,表明可以进行因子分析。
表2 KMO和Bartlett的检验
2.2.2 求公因子及载荷矩阵
如表3所示,提取特征值分别为4.149和1.041两个公因子,其中因子1解释了69.153%的方差,大于总方差2/3,因子1对总变异起着支配性作用;因子2解释了17.352%的方差,因子1和因子2累积方差贡献率包含86.505%的信息,可提取2个因子,原有变量的信息丢失较少,分析结果较为理想。
表3 特征值和因子贡献率及累计贡献率
由主成分法得到初始因子载荷矩阵如表4,由表4可知,NO2、PM2.5、PM10、SO2、CO 在因子1上有较高的载荷,其中NO2影响最大,这些污染物主要来源于燃煤、工业污染和机动车尾气等,由污染源直接或间接排入环境,性质比较稳定,因子1可解释为初次污染物影响因子。O3在因子2上有较高的载荷,O3是由阳光照射污染物、污染物与大气成分发生化学反应形成,因子2可解释为二次污染物影响因子,说明该区存在一定的光化学污染。因子1和因子2典型代表变量突出,都能较好地赋予合理的解释,无需进行因子旋转。
表4 初始因子载荷值
2.2.3 计算因子得分
采用回归法估计得分系数矩阵如表5所示,因子得分函数表达式可以表示为:
表5 因子得分系数矩阵
F1=0.213X1+0.216X2+0.210X3+0.225X4+0.206X5-0.108X6
F2=0.338X1+0.048X2+0.067X3+0.238X4-0.286X5+0.837X6
根据以上表达式可以计算出各公因子上的得分及排名,再以提取的各公因子的方差贡献率占提取公因子总方差贡献率的比重作为权重,将各公因子得分加权汇总[13],计算各月份的综合得分见表6。
表6 各月份空气质量因子得分排名
2.2.4 结果与讨论
依据公因子上的得分由小到大依次排名,因子1得分排名第一在8月份、排名最后在1月份,表示初次污染物影响在8月污染最轻,1月污染最重。因子2得分排名第一在12月份、排名最后在4月份,表示二次污染物影响在12月污染最轻,4月污染最重。综合得分数值越小,排名越靠前,说明该月的空气质量越好。由表6可以看出全年只有6—10月的综合得分为负值,说明全年中6—10月空气质量较好,该区受季风影响明显,雨热同季,6—10月为夏秋季,受来自海洋上空清洁气团影响,各污染物浓度明显下降。综合得分最高的是1月和4月,说明全年1月和4月的空气质量较差,该区1月份要加强初次污染物的管控,4月份要加强二次污染物管控。
通过因子分析法计算的综合得分与空气质量综合指数值对比如图2,得出两种分析方法的趋势是一致的,因子分析法的评价结果具有较高的准确性。基于因子分析法空气质量综合评价,不仅反映出污染物间的相关性,还能简化为同类污染物的因子项进行分析,综合得分的结果直观明了,对管理部门掌握本地区大气污染物间关联性,有针对性地综合治理污染物,管控空气质量具有应用价值。
图2 综合得分与空气质量综合指数值对比
3 结论与建议
(1)2018年,南通市崇川区PM10、PM2.5、SO2、NO2、CO浓度月份变化似“V型”,夏季和秋季污染较轻,冬季和春季污染较严重。O3浓度月份变化是“M型”,冬季污染较轻,春季、夏季和秋季污染较严重。
(2)PM10、PM2.5、SO2、NO2、CO呈显著正相关,O3仅与CO在0.05水平上呈显著相关,与其他污染物之间相关性都不明显。
(3)基于因子分析法,提取特征值分别为4.149和1.041两个公因子,因子1和因子2累积方差贡献率包含86.505%的信息,原有变量的信息丢失较少。NO2、PM2.5、PM10、SO2、CO 在因子1上有较高的载荷,其中NO2影响最大,因子1可解释为初次污染物影响因子。O3在因子2上有较高的载荷,因子2可解释为二次污染物影响因子,说明该区存在一定的光化学污染。
(4)依据公因子上的得分由小到大依次排名,初次污染物影响在8月污染最轻,1月污染最重,二次污染物影响在12月污染最轻,4月污染最重,综合得分排名可以看出全年中6—10月空气质量较好,1月和4月的空气质量较差。
(5)南通市崇川区大气污染治理应以1月份PM2.5管控为首,在冬春季重点开展PM10、PM2.5、SO2、NO2综合治理攻坚行动,建议加强治理道路扬尘、建筑工地扬尘和工业粉尘,加强交通污染源的管理和控制,鼓励绿色出行。同时对南通市O3污染的形成机理进一步研究,管制其前体物的排放,以控制春季O3污染形势的恶化。