APP下载

近年来上海市空气质量的分析与预测

2019-04-11钱文洁

上海第二工业大学学报 2019年1期
关键词:天气情况残差空气质量

钱文洁,余 垠

(上海第二工业大学 文理学部,上海201209)

0 引言

近年来,人们越来越关注空气质量的好坏。分析与预测空气质量有利于人们研究空气污染的特征,并在此基础上寻找治理对策。上海作为我国经济最发达的中心城市之一,研究空气质量与气象因素之间的相关关系,对上海市空气质量的预测预报、空气污染的长效控制及应急措施的制定具有非常重要的意义。

2013年以来,上海市空气质量的研究主要从空气质量指数(AQI)、空气污染指数(API)及细颗粒物3个方面进行。范庆亚等[1]收集了上海市2006—2011年各个区的API,通过时间序列和空间分析,发现在此期间上海市夏季的空气质量最好,春季最差;金山区空气质量最好,普陀区和宝山区较差。皮帅帅[2]认为PM2.5等细颗粒物是影响空气质量的关键因素。俞华明等[3]通过分析2001—2016年上海市环境空气监测数据,发现上海市空气污染呈现出春冬季以PM2.5污染为主,夏季以O3污染为主,秋季PM2.5和O3污染共存的典型特征。孙嘉文等[4]观察了2014—2016年上海市PM2.5浓度的日观测数据,分析了上海市PM2.5浓度变化特征及其对气候变化的响应,研究发现冬季的PM2.5浓度最高、夏季的最低;同时发现PM2.5浓度与研究选取的最高温度、最低温度、降水量以及相对湿度4个变量呈负相关性关系。陈镭等[5]利用2013—2014年上海市6个空气污染物浓度和逐日空气质量分指数(7个变量),分析了上海市空气污染的变化特征及其气象影响因子,结果显示:上海市2013—2014年的AQI呈现出冬季空气质量较差、秋季空气质量较好的季节性特征。毛卓成等[6]分析了2015年大气环流背景下上海地区的空气质量状况及其变化特征,以及引起这种变化的气象因子的特征。分析显示:2015年上海地区的空气污染从S、N和PM10等传统煤烟型污染转为以PM2.5为代表的复合型污染以及以O3为代表的光化学污染,且春季和夏季PM2.5浓度明显下降,而易污染季节PM2.5浓度显著上升。

上海市政府于2013年开始开展《上海市清洁空气行动计划(2013—2017年)》,于2018年7月发布了《上海市清洁空气行动计划(2018—2022年)》,全面推进对污染物的协同控制与减排。那么,通过过去5年的治理,上海市空气质量的变化以及未来5年上海市空气质量监管的方向是什么?本文梳理了2013年以来已发表的文献,预测空气质量的研究很多,却鲜见上海市空气质量的预测研究。通过收集上海近5年来的空气质量数据,探究AQI与气象要素间的相关关系,建立基于气象数据的空气质量预测模型。

1 变量选取、数据来源及数据预处理

1.1 变量选取和数据来源

为了分析上海市AQI与气象因素之间的关系,通过对文献的梳理,首先确定了天气情况、最高气温、最低气温、平均气温、平均风速、最高风速、湿度、气压、能见度共9个气象指标。数据来源于全球天气精准预报网,该平台成立于1991年,由密歇根大学开发。本文收集了2013-01-01~2018-02-28共1 885条日气象数据。选取2013-01-01~2017-12-31的数据建模,2018-01-01~2018-01-08的数据来检验模型。

1.2 数据预处理

如表1所示,对天气情况进行重新分类,将其分为7种天气特征,并将处理后的数据用1~7表示。

表1 数据预处理Tab.1 Data preprocessing

2 2013—2017年上海市的空气质量特征

2.1 时间分布特征

一般 AQI分为 6级,1级优 (0~50),2级良(51~100),3级轻度污染(101~150),4级中度污染(151~200),5级重度污染(201~300)和6级严重污染(>300)。2013—2017年的月平均空气质量如图1所示。2013年的空气质量相对较差,尤其12月受多次区域性重污染过程影响,平均AQI为160,达到了中度污染。而2014年的空气质量较2013年总体有所改善,尤其是冬季的空气质量。然而,从2014年开始,夏季的大气污染却开始逐年加重。以变化最明显的7月为例,AQI从2014年的71逐渐上升到2017年的113。由图1可以看出,秋季尤其9、10月份,往往是一年中空气最佳的时段。

图1 2013—2017年上海市AQI指数变化情况Fig.1 AQI’s variation of Shanghai from 2013 to 2017

由于气温、光照、污染物排放等因素的变化,一天中的空气质量往往是不同的。以2016年浦东新区监测站获取的数据为例,对比分析空气污染较为严重的1月和7月的空气质量日变化情况如图2所示。1月,AQI在10:00左右达到峰值,平均AQI为102。在之后的3 h内,AQI持续下降,在13:00左右达到谷值88.4,紧接着又是一段波动上升的过程,在20:00左右达到第2个峰值97.7。然后,AQI继续下降,在凌晨3:00左右达到第2个谷值88.8。因此,10:00和20:00前后的空气污染最为严重。而在7月,6:00 AQI最低。在此之后,AQI开始持续上升,14:00左右达到峰值,紧接着又是一段持续下降的过程。

图2 2016年1月(a)和7月(b)各时刻平均AQIFig.2 Average AQI’s daily variation in January(a)and July(b)in 2016

图3 2013年(a)和2017年(b)大气中的主要污染物在每个季节所占的天数Fig.3 The number of days that main air pollutants occupied in each season of 2013(a)and 2017(b)

2.2 主要污染物的变化特征

已有研究表明,在不同的季节,空气中的主要污染物有着显著的差异。以5年中大气污染最为严重的2013年为例,如图3(a)所示。2013年夏季与秋季的大气中,主要污染物为O3的天数最多,其次为PM2.5。研究显示,地面附近的O3浓度的增加会影响人的眼睛、呼吸道及肺功能,较高浓度的O3对植物也有极大的伤害。而地面附近的O3源于人类活动、汽车燃料、石化等。如汽车及工业生产排放的挥发性有机物(VOCs)和氮氧化物,在阳光辐射及适合的气象条件下可以生成O3。随着汽车和工业排放的增加,O3污染成为世界上许多城市的普遍现象。

2013年的春季和冬季的大气中,主要污染物则为PM2.5,其次为O3、NO2。根据上海市环保局监测的数据,PM2.5来源中,来自本地的污染排放贡献占74%。其中,机动车、船舶、飞机等流动源的燃油排放占29.2%;非燃煤类的工业锅炉和窑炉、以煤为原料的工业生产过程以及石油、化工等工业生产过程排放占28.9%;以煤为燃料的电厂、工业锅炉和窑炉等燃煤源占13.5%;建筑施工、道路扬尘等扬尘污染占13.4%;农业生产、生物质燃烧、民用生活面源以及海盐、植物等自然源排放占15%。可见,PM2.5造成的污染天数居高不下主要是交通燃油排放和工业企业的生产排放所致。

2017年的大气主要污染物情况如图3(b)所示。在春季和夏季,主要污染物出现天数最多的仍为O3。秋冬两季的主要污染物为NO2,其次是PM2.5、O3。2017年也呈现出秋季空气质量较好的季节性特征[7]。人为产生的NO2主要来自于机动车尾气、锅炉废气的排放等,这也是酸雨的主要成因之一,并且NO2还会对O3的形成产生一定影响。

比较5年中PM2.5、O3和NO2所占的天数(见图4),发现大气中主要污染物为PM2.5的天数显著减少,但NO2和O3的天数却呈现上升趋势。因此,控制O3和NO2的排放是上海市下一阶段清洁空气的主要方向。

图4 3种主要污染物所占天数的变化Fig.4 Variation in the number of days covered by three major pollutants

3 AQI与关键气象要素的多元回归模型

分析天气情况、最高气温、最低气温、平均气温、平均风速、最高风速、湿度、气压和能见度9个指标与AQI的关系,基于天气预报信息建立AQI的回归预测模型。

表2 气象要素与lnk的相关分析Tab.2 Correlation analysis between meteorological factors and lnk

3.1 气象要素与AQI间的Pearson相关关系分析

首先,分析最高气温、最低气温、平均气温、平均风速、最高风速、湿度、气压和能见度8个气象指标与AQI的相关关系。对AQI值(k)进行了对数化处理。

由表2可知,最高气温、最低气温、平均气温与lnk的相关系数分别为0.009、-0.118和-0.053,对相关系数检验的双侧Sig.值分别>0.05、<0.01、<0.05,说明最低气温、平均气温与lnk之间的负相关具有统计学意义,最高气温与lnk没有相关关系。即随着最低气温和平均气温的增加,lnk呈现减小的趋势。平均风速、最高风速与lnk的相关系数分别为-0.406和-0.202,对相关系数检验的双侧Sig.值均<0.01,即平均风速、最高风速与lnk的负相关性均具有统计学意义。随着风速的增大,lnk呈现减小的趋势。气压、湿度、能见度与lnk的相关系数分别为0.067、-0.310和-0.553,相关检验的双侧Sig.值均<0.01,说明气压、湿度、能见度与lnk的相关性均具有统计学意义。即随着气压的上升,湿度和能见度的下降,lnk出现增大的趋势。在后续的建模过程中将选取最低气温、平均风速、气压、湿度和能见度5个变量用于模型。

图5 不同天气情况下的AQI均值Fig.5 Average AQI in different weather conditions

3.2 不同天气与AQI间的方差分析(ANOVA)

由图5可见,晴天和雷雨天气的AQI值较高,而雨雪天气较低。相比之下,多云天气的AQI值通常会低于晴天。通过单因素ANOVA及方差齐性检验,多重比较检验来分析不同天气情况对AQI的影响。

表3显示,7种不同天气情况下,晴时的lnk最高,雪对应的lnk最低,这与图5一致。表4为不同天气情况下lnk的单因素ANOVA结果。可以看到,lnk的总离差平方和为341.555。如果仅考虑不同天气情况单因素的影响,那么lnk总变差中,天气情况可以解释的变差为54.636,抽样误差引起的变差为286.919。而组间方差与组内方差相除所得的F值为57.730,P值为0.000,说明天气情况对AQI有显著性影响,对lnk值的影响效应不全为0。

表3 上海市不同天气下lnk的基本描述Tab.3 Basic description of lnk in different weather conditions of Shanghai

表4 上海市不同天气下lnk的单因素ANOVATab.4 ANOVA of lnk in different weather conditions of Shanghai

表5表明,不同天气情况下的方差齐性检验的统计量观测值1.472,概率P值为0.184(P>0.05)。显然,不同天气情况下的总体方差无显著性差异,满足方差分析的前提要求。

3.3 建立AQI与关键气象要素的多元回归模型

通过以上分析,选取最低气温、平均风速、气压、湿度、能见度和天气6个气象指标进行建模,其中被解释变量为lnk。由于天气属于分类变量,转化为哑变量,以“晴”为参照。

解释变量筛选策略选取逐步进入策略,并进行多重共线性检验。回归模型有9个,根据各个回归模型的拟合优度,模型9包含能见度、湿度、平均风速、气压、雷雨、大雨、小雨、多云和阴9个变量。表6是模型9中各变量的显著性检验结果(P<0.05),9个变量均通过检验且所有变量的方差膨胀因子(VIF)均小于10,说明变量间不存在多重共线性。

模型9的显著性检验结果如表7所示,被解释变量的总离差平方和为322.657,回归平方和与方差分别为179.095和19.899,残差平方和与方差分别为143.561和0.089,F值为223.167,概率P值近于0。因此,只要各回归系数不同时为0,被解释变量与解释变量全体的线性关系就是显著的,可建立线性模型。

表5 不同天气情况下的方差齐性检验Tab.5 Homogeneity of variance test in different weather conditions

表6 模型9中各变量的显著性检验Tab.6 Significance test of each variables in model 9

表7 回归模型的显著性检验Tab.7 Significance test of regression model

根据上述分析,建立回归模型的变量有:能见度(VI)、湿度(HU)、平均风速(AS)、气压(AP)、雷雨(TS)、大雨(HR)、小雨(LR)、多云(CL)和阴(OC),该回归模型为:

由式(1)可知,除雷雨(TS)这一变量外,其他变量均与lnk呈负相关关系,而能见度和雨天对lnk的变化有更多的贡献。

4 模型拟合效果的评价

4.1 残差分析

绘制残差序列图,如图6所示。由图6(a)可知,数据点的分布基本是随机的,不存在残差的方差随着解释变量的变化而变化的趋势。因此,可以认为残差序列不存在自相关性、异方差现象。图6(b)中,残差在整个时间段内均在0上下波动,且波动范围未超出±1.5,没有发现明显的方差不齐或者强影响点的线索。标准化残差的直方图以及关于标准正态分布的P-P图如图7所示,残差点在0附近随机分布,数据点围绕基准线并存在一定规律性,可以认为残差满足了正态性条件。因此,模型的拟合效果较好,且具有较好的稳健性。

图6 残差序列图Fig.6 Residual sequence diagram

图7 标准化残差的直方图和P-P图Fig.7 Histogram and P-P plot of standardized residual

4.2 预测效果分析

选用2018-01-01~2018-01-08的数据进行预测,模型预测结果如表8所示。实际等级和预测等级均是按照空气质量等级表进行划分,易知模型预测等级预测的准确率为75%。显然,还需对一些影响天气质量的因素寻找合适的方法进行更进一步地分析。

表8 模型预测结果Tab.8 Results of model forecasts

5 结 论

本文分析了近5年来上海市的空气质量以及与气象因素之间的关系。研究得出以下结论:

(1)2013-01-01~2017-12-31期间,上海市空气质量为优的天数是291天,良的天数是1 040天,空气质量的优良率为72.89%。近5年来,PM2.5的排放得到一定控制,但O3和NO2的污染天数却有比较大的增加。可见,上海市的空气污染已经从S、N和PM10等煤烟型污染转为以PM2.5和O3为主的复合型污染及光化学污染。

(2)上海市冬季的空气质量在一定程度上得到了改善,而夏季的污染却开始加重。夏季的主要污染物为O3,而冬季的主要污染物为PM2.5、NO2。从近5年空气质量与气象因素之间的关系来看,上海市大、小雨天的AQI往往较低,而雷雨天气时的AQI往往较高。多云和阴天的AQI通常会低于晴天。

(3)构建了以天气信息为控制变量的天气质量预测模型,预测准确率约为75%。说明利用天气预报数据一定程度上可以预测未来的空气质量。然而,由于没有考虑风向、逆温等污染物来源及扩散的影响因素,因此本文的预测模型还有待进一步优化。这也是本文下一步的研究内容。

猜你喜欢

天气情况残差空气质量
基于双向GRU与残差拟合的车辆跟驰建模
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
基于Logistic回归对晨跑制度的研究
车内空气质量标准进展
重视车内空气质量工作 制造更环保、更清洁、更健康的汽车
开展“大气污染执法年”行动 加快推动空气质量改善
快乐暑假
综合电离层残差和超宽巷探测和修复北斗周跳