邯郸重污染日空气质量预测研究
2020-06-22王彦林吴利丰
王彦林,李 孥,吴利丰
(河北工程大学 管理工程与商学院,河北 邯郸 056038)
在持续实施了一系列大气污染防治措施后,各地大气环境质量都有了不同程度的提升,空气质量优良天数不断增多,大气环境从长时间维度看呈现持续向好发展趋势[1]。但对于空气污染重灾区的河北邯郸来说,现在的大气环境质量距离国家标准和人民期盼仍存在一定的差距,时而出现的持续性极端重度污染天气不仅危害当地人民的身体健康,也加大了大气污染防治工作的难度,所以,对重度污染天空气质量的预测研究具有强烈的现实意义,能为及时应对及精准治理极端污染天气,全面改善大气环境,提供数据支撑。
目前,已有不同领域的众多学者对日空气质量进行了预测研究。比如:Jose等应用模糊逻辑和自回归模型对墨西哥城24小时空气质量指数进行了评价和预测[2];Feng等利用基于地理模型和小波变换的气团轨迹人工神经网络模型,对PM2.5的日浓度进行了预测[3];Sam等建立了基于随机森林、遗传算法和反向传播神经网络技术的文莱达鲁萨兰国的PM10日浓度预测框架[4];付亚丽等利用改进粒子群算法并行优化的极限学习机预测武汉市空气质量的日均浓度[5];Wang等开发了空气质量预警系统,用于预测成都、广州的PM2.5、PM10和SO2的24小时平均浓度[6];李萍等建立了基于分形流形学习的支持向量机空气污染指数预测模型对2015年1—4月北京、上海、广州120 d的大气污染指数进行预测[7];张楠等建立了改进灰狼算法优化的支持向量机模型对太原市2017年3月1日—3月30日30天的AQI进行预测[8];夏润等利用改进集成学习算法来预测未来24小时的空气污染[9];Hao等采用由数据预处理模块、优化模块、预测模块和评价模块组成的新型混合空气质量预警系统,对济南市、上海市、哈尔滨市6种空气污染物和AQI的日浓度进行预测[10]。
关于日空气质量预测的文献大多需要大量数据样本的支持,且需要进行非常复杂的计算,但专门预测重污染天的空气质量的研究较少。严重污染的天气一般不会持续很长时间,所以数据样本是非常有限的,上述需要大量数据样本的预测方法将不再适用。灰色预测模型是研究样本容量小、信息量有限数据的一种有效的建模方法,灰色预测模型在空气质量预测中也得到了广泛的应用:何俊等利用季节指数修正的GM(1,1)模型,预测郑州市二氧化硫季平均浓度[11]; Wu等人利用灰色Holt-Winters模型预测了石家庄和邯郸的AOI月平均值[12],并利用分数阶GM(1,1)模型预测京津冀地区各空气质量指标的年均浓度[13]。灰色预测方法对于空气质量的研究大多集中在年、季度及月份等维度的研究,对以天为单位的研究较少,故本文提出一种数据分组分数阶灰色预测方法,对邯郸地区重度污染天的空气质量指标进行预测。
1 DGFGM(1,1)模型
连续年份中连续几天的数据总体来看并不是连续的时间序列,比如2014—2017年12月的28、29、30日就是4个间断的时间序列,用每个时间序列进行预测可能存在数据量太少,或有异常值导致序列变化波动大等情况。但每年当中特定的某一天在一定程度上具有相似性,故可以采用基于数据分组的灰色建模方法[14],对间断的时间序列数据进行分组,转换维度,将以“天”为单位的时间序列转换为以“年”为单位的时间序列进行预测,比如将2014—2017年12月的28、29、30日的数据分为三组,将每一天不同年份的数据为一组序列进行预测。然后将各组得到的结果进行综合,形成相应连续的时间序列。鉴于分数阶GM(1,1)模型[15]相比传统的GM(1,1)模型预测效果更好,精度更高,故本文采用基于数据分组的分数阶GM(1,1)模型进行预测,建模过程如下:
设不连续的原始数据序列为
X1(0)={x1(0)(1),x1(0)(2),…,x1(0)(i),…,x1(0)(n)}
X2(0)={x2(0)(1),x2(0)(2),…,x2(0)(i),…,x2(0)(n)}
⋮
Xm(0)={xm(0)(1),xm(0)(2),…,xm(0)(i),…,xm(0)(n)}
m表示连续的年份,n表示连续的天数。
将原始的时间序列数据按天进行划分,得到以年为单位的新时间序列为
X(0)(1)={x1(0)(1),x2(0)(1),…xm(0)(1)}
X(0)(2)={x1(0)(2),x2(0)(2),…xm(0)(2)}
⋮
X(0)(i)={x1(0)(i),x2(0)(i),…xm(0)(i)}
⋮
X(0)(n)={x1(0)(n),x2(0)(n),…xm(0)(n)}
(1)
X(r)(i)的单变量一阶微分方程为
(2)
则该微分方程的解为
(3)
(4)
其中,
(5)
(6)
(7)
将预测序列还原成原始的时间序列维度,得到原始数据的预测序列为
⋮
⋮
利用平均绝对百分误差(MAPE)来考察模型的准确性和有效性,计算公式为
(8)
2 数据来源及实例分析
空气质量指数(Air quality index,简称AQI),是定量描述空气质量状况的无量纲指数,就是将常规监测的几种空气污染物浓度简化成为单一的概念性指数值形式,并分级表征空气污染程度和空气质量状况。根据《环境空气质量指数(AQI)技术规定(试行)》(HJ633-2012)规定,空气污染指数划分及对应的空气质量等级和空气质量状况,如表2所示。指数越大,级别越高,说明污染越严重,对人体健康的影响也越明显。
表1 MAPE评价标准
表2 空气污染指数划分及对应的空气质量等级和空气质量状况
位于河北省南部的邯郸,素有“钢城”之称,产业结构偏重,是国家老工业基地、资源型重化工城市。近年来,钢铁、煤炭等重工业的发展带来巨大经济效益的同时却导致了环境状况越来越差。在生态环境部发布的全国74个重点城市空气质量排名中,河北邯郸由于排名靠后、时常“倒数”而备受关注。持续的空气重污染已成为邯郸地区秋冬季较常出现的气象灾害。近年来,国家与当地有关部门高度重视,采取一系列措施治理邯郸的大气污染:全力调整能源结构,严格环保标准,开展污染源排查治理等,环境空气质量已得到大幅改善。但是,受季节因素及气象扩散条件的影响,持续几日的空气重污染现象在秋冬季节仍较常出现,严重影响着人们的正常生活及身体健康。精准预测空气重度污染情况的发生是大气污染防治工作和全面改善大气环境质量的重要一环。每年12月是空气重污染情况发生较为频繁的时段,故本文采用邯郸地区2014—2017年12月份的空气质量指标为研究对象,对重度污染频发的时间段进行预测研究。
对邯郸地区2014—2017年12月的AQI数据进行整理[16],并制作成散点图,如图1所示。
图1 2014—2017年12月1日—31日AQI数据散点图Fig.1 Scatter diagram of AQI in December (from 2014 to 2017)
由图1可知,2014—2017年12月的重度污染及严重污染天气主要集中在25日到31日之间,所以在未来几年的12月这几天发生重度污染或严重污染的可能性也是相当大的,对这一时间段的空气质量进行预测,对有效防范重度污染天气的发生具有强烈的现实意义。对原始数据进行观察,可知2014—2017年,12月28日—30日这三天,AQI均大于200,空气质量均处于重度污染或严重污染状态,PM2.5和PM10均超过了环境空气污染物基本项目浓度的二级限值(PM2.5的24小时平均二级浓度限值标准为 50 μg/m3,PM10的24小时平均二级浓度限值标准为150 μg/m3),NO2有部分天数超过了标准限值 (NO2的24小时平均二级浓度限值标准为 80 μg/m3)。故选取这12组数据为样本,进行DGFGM(1,1)预测,探知今后两年(2018—2019)这几天的空气质量状况及对应的空气质量指标浓度是否存在超标的情况,提前做好应对重度空气污染的准备。2014—2017年12月28—30日的AQI、PM2.5、PM10和NO2的浓度值如表3所示。
以AQI数据为例,对2014—2017年12月28、29、30日的AQI数据进行处理,分别利用本文所提的DGFGM(1,1)模型和基于数据分组GM(1,1)模型(The data grouping GM(1,1) model,简称DGGM(1,1))对AQI数据进行预测。两种模型计算的拟合结果如表4所示。
表4 DGFGM(1,1)和DGGM(1,1)模型对AQI值预测的拟合结果
表3 2014—2017年12月28—30日的AQI, PM2.5, PM10 and NO2的浓度值
由表4可知,DGFGM (1,1)模型的拟合结果与真实值之间的MAPE低于DGGM(1,1)模型,且MAPE低于10%,表明DGFGM (1,1)模型预测精度高,有良好的预测性能。故用DGFGM (1,1)模型对2018和2019年的AQI进行预测,预测结果如表5所示。AQI的实际值和预测值的变化趋势如图2所示。
表5 AQI 预测结果
由表5展现的预测结果可知,在2018和2019年的12月28、29、30日,AQI仍居高不下,除2019年的12月28日略低于200外,其他时间的AQI均在200~300之间,属重度污染状态。由图2可知,2018—2019年12月28、29日的AQI呈现下降趋势,30日的AQI仍在持续上升。
这表明,虽当前邯郸总体空气质量有明显改善,但个别极端的污染天气依然会发生,危害不容小觑。这三日连续多年均会发生空气的重度、严重污染,就足以警醒有关部门要加强对这一时段的空气质量监测及治理。提醒相关部门在制定宏观空气治理方案的同时,需加强对极端污染天气的重视,掌握有关极端污染天气的有效信息,提早预防,只有把每一天的空气质量都控制在合格范围以内,空气质量才得以全面改善。
以同样的方法,对2014—2017年12月28、29、30日的PM2.5、PM10、NO2的日平均浓度进行预测,探知DGFGM(1,1)模型在该三个指标上的预测性能以及这三个指标在2018、2019年的发展趋势。拟合结果如表6所示,预测结果如表7所示。图3—图5分别展示了PM2.5、PM10和NO2的实测值和预测值的变化趋势。
由表6可知,DGFGM(1,1)模型对于PM2.5、PM10和NO2的日平均浓度的预测,均呈现出较好的性能,MAPE分别为3.28%、3.83%及3.23%,都小于10%,预测精度显然较高。由表7可知,PM2.5在2018和2019年的12月28、29和30日的日均浓度大幅度高于标准限值,28日的日均浓度走向是下降的,但是29和30日的日均浓度是持续走高的,PM2.5的情况是非常不乐观的;与PM2.5相同,PM10在2018和2019年的12月28、29和30日的日均浓度也全部大幅度超标,值得欣慰的是有28和29日两天的浓度是呈现下降趋势的,且30日浓度升高不明显,只要加以有效的控制,相信PM10会很快达标;NO2虽在30日的浓度低于标准限值且呈现缓慢下降的趋势,但是在28和29日的浓度是陡然上升的,若不加以控制,污染会非常严重。当前的预测结果显示,在现有的治理力度下,各项污染物浓度有些不降反升,共同作用,使得AQI居高不下,造成连续重度污染天气的发生。
表7 PM2.5, PM10 and NO2日浓度的预测值 (单位:μg/m3)
图3 PM2.5日浓度的实测值与预测值的变化趋势Fig.3 Trends for measured and predicted value of daily PM2.5concentration
图4 PM10日浓度的实测值与预测值的变化趋势Fig.4 The change trend for actual value and predicted value of PM10 daily concentration
PM2.5和PM10是雾霾的主要污染物,PM2.5可随呼吸进入人体,引起人体一系列的病变;PM10由于长期漂浮在空气中,会严重降低能见度并扩大污染范围;NO2的污染影响更是不容小觑,NO2是二次颗粒物和光化学污染物的重要前体物,是产生二次污染重要因素。PM2.5、PM10、NO2得不到有效控制,空气质量就很难提升。准确把握各项污染物的发展趋势,是精准治理空气污染的必经之路,也是本文预测结果的重要现实意义。
3 结论
对于间断性数据的预测,本文提供了一个转换原本时间序列时间维度的新思路。在以原本时间维度序列预测数据量较少或受异常值影响较大的情况下,可以在其他时间维度找寻数据之间的规律,进行分组,组建新的时间序列进行预测。分数阶GM(1,1)模型相比传统的GM(1,1)模型能在更大程度上提高预测的精度,两者相结合,形成数据分组的分数阶GM(1,1)模型。DGFGM(1,1)模型克服了传统灰色预测模型需要大量数据样本和要求数据连续平滑的局限性,将灰色预测的应用范围扩展到更多种类的时间序列。
利用DGFGM(1,1)模型预测的AQI,PM2.5,PM10和NO2的MAPE分别为2.89%, 3.28%, 3.83%和3.23%。由此可见,DGFGM(1,1)模型具有良好预测性能,为空气质量指标日浓度的预测提供了更翔实的参考。
预测结果表明,在当前的治理力度下,重度污染天气的发生仍然不可避免,有些污染物浓度不降反升,存在大幅度超标的情况。虽然当前邯郸的空气质量总体来说在不断提升,相关部门仍应加强对重度污染天气的重视。本文的预测结果可为有效预防极端污染天气的发生提供数据支撑,也为空气污染的治理工作提供一个方向,只有有效遏制住极端污染天气的发生,空气质量才能得以全面改善。