基于数据分解的AQI的CEEMD-Elman神经网络预测研究

2019-11-28吴曼曼徐建新

中国环境科学 2019年11期

吴曼曼,徐建新,王钦

吴曼曼1,2,徐建新2,3*,王钦1

(1.昆明理工大学质量发展研究院,云南昆明 650093；2.省部共建复杂有色金属清洁能源利用国家重点实验室,云南昆明 650093；3.昆明理工大学冶金与能源工程学院,云南昆明 650093)

针对Elman神经网络在预测空气质量指数(AQI)时易受到数据非平稳性的影响导致预测趋势良好但准确度较低的问题,提出以互补集合经验模态分解(Complementary Ensemble Empirical Mode Decomposition, CEEMD)为基础的CEEMD-Elman模型.应用CEEMD对AQI序列分解成不同时间尺度上的本征模态函数分量和剩余分量,进而首次将对非平稳的AQI序列的预测研究转化为对多个平稳的本征模态函数分量的研究.分别与Elman单一模型、EMD-Elman模型、BP单一模型及CEEMD-BP模型进行实验对比.结果表明:应用该方法建立的模型的均方误差、平均绝对误差和平均绝对百分比误差分别为4.80、0.71、1.84%,均小于其他模型结果;对应空气质量等级预报正确天数的频率为94.12%.该模型能有效的降低非平稳性对实验预测结果的影响,实现对空气质量等级的准确预报;该研究为进一步预测AQI的走向提供了有效依据,也为政府决策和管理部门制定空气污染控制提供了更充分的参考.

空气质量指数；互补集合经验模态分解；偏自相关函数；Elman神经网络；空气质量等级

随着城市化和工业化的快速发展,大气污染已成为人类社会面临的严峻挑战.空气质量指数(Air Quality Index,AQI)作为衡量空气质量的重要指标,与人类健康息息相关[1-2].AQI旨在综合各种污染物(PM2.5、PM10、CO、O3、SO2、NO2)的综合指数,以数字的形式描绘空气质量状况,使公众能简明的了解空气质量的优劣,根据空气质量标准(GB3095- 2012)[3]和对人体健康的各种影响,空气质量指数分为6类.因此,如何准确预测AQI对控制大气污染、促进人类社会可持续发展具有重要意义.但空气质量指数的分析与预测是极其复杂的,主要是因为大气环境本质上是一个动态、非线性、非平稳、有噪声的系统[4-5],其走势容易受各种因素的影响:经济变量、环境污染物浓度、气象要素等[6-7].因此如何更准确地预测空气质量受到广泛关注.

目前大气污染预测方法主要分为三种:统计模型、数值模型和智能预测.统计模型常用的有自回归综合移动平均(ARIMA)模型[8]、多元线性回归(MLR)模型[9]、和灰色模型[10],但其显著的缺点是预测精度依赖于非线性过程中的线性映射能力[11],对非线性问题预测结果通常不太稳定;数值模型预测常用的有CMAQ[12]、CAMx[13]和WRF-Chem[14],然而,这类模型初始参数的要求较高,且大气化学演变过程非常复杂,从而使得模型在预测过程中存在不确定性,导致预测结果的精度较低;智能预测常用的有人工神经网络[15-16],人工神经网络因具备很强的非线性逼近能力和自适应、自学习等特点,在用来研究空气污染预测时具有特定的优势.

针对使用神经网络进行预测时,目前大多数采用的是基于BP(back propagation,BP)算法的静态前馈神经网络[17-18].但随系统阶次的增加或阶次未知,迅速扩大的网络结构使网络学习的收敛速度减慢且易陷入局部极小值收敛[19].相比之下,动态回归神经网络提供了一种极具潜力的选择,它能够更生动、更直接地反映系统的动态特点.Elman回归神经网络是一种典型的动态神经元网络,具有适应时变特性的能力.考虑到AQI序列具有动态性的特点,可采用Elman网络进行预测.但现有的研究大多从污染物指标和气象要素出发,先获取影响空气质量的关键指标进而实现对AQI序列的预测,而该研究工作量较为复杂且易受其他因素影响;且国内直接对AQI序列进行预测的研究较少,AQI预测的理论体系还不成熟;尽管神经网络模型具有更好的性能,然而在大多数实际情况下,AQI序列是非平稳或混沌的,因此,直接利用Elman神经网络对其进行建模时预测精度较低[20-21].

互补集合经验模态分解是经验模态分解家族中的一员,由EMD(Empirical Mode Decomposition)和EEMD(Ensemble Empirical Mode Decomposition)演变而来.EMD方法是Huang[22]提出一种基于“筛选”思想将不平稳信号分解成相对平稳的有限个本征模态函数(Intrinsic Mode Function,IMF)分量和剩余分量的方法,EMD方法适用于非线性信号分解,在非线性信号处理上具有很大的优势.该算法被认为是对传统方法的重大突破,但分解结果往往受到模态混合的影响.为了解决这个问题,Wu和Huang提出了EEMD[23],显著提高了EMD算法的稳定性,但在实现足够大的集成手段时,需要花费大量的时间,而且不能完全抵消增加的白噪声.Yeh等[24]引入CEEMD来解决EMD和EEMD问题,CEEMD方法不仅有效地解决了EMD分解的模态混合问题,而且几乎完全消除了残余白噪声的影响且提高了计算效率.为了提高模型的预测精度和稳定性,利用CEEMD消除原始数据中的噪声,将AQI序列分解为若干个IMF分量和剩余分量,并将其作为Elman神经网络的输入.

研究证实,将经验模态分解技术与神经网络的结合可以为时间序列预测提供良好的预测结果.例如,Wang等[25]将EMD与Elman相结合,建立了一种新的风速趋势预测分解模型,结果表明,该模型具有较小的误差,适用于风速预测;Yang等[26]将EEMD和Elman神经网络结合,构建一种新的空气质量监测预警系统,预测结果表明,该混合模型具有较高的预测精度和稳定性,Yu等[27]直接将CEEMD分解后的序列与集成极限学习机结合预测原油价格,实验结果表明,模型具有更好的预测性能模型的统计指标和预测精度.

本文从AQI序列本身出发,将用于处理时频信号的CEEMD分解技术与Elman神经网络相结合,以期改进Elman神经网络在预测大气污染准确度不高的问题.首先,用CEEMD对AQI序列进行分解成多个IMF分量和剩余分量;其次,用偏自相关函数求出AQI滞后期数,以确定Elman网络的输入和输出变量;再次,分别对各分量构建AQI的CEEMD- Elman预测模型;最后,将各分量的预测值相加得到最终预测值.并将该方法分别与Elman单一神经网络模型、BP单一网络、EMD-Elman模型、EEMD- Elman模型和CEEMD-BP模型的均方误差、平均绝对误差以及平均百分比误差进行对比分析.

1 原理与方法

本实验采用Windows7系统平台,处理工具为MATLAB和Eviews.

1.1 Elman神经网络基本原理

Elman神经网络是Elman提出的一种典型局部回归网络,主要结构是前馈链接,包括输入层、隐含层、输出层和承接层[28],网络示意如图1所示.一般情况下,输入层传输信号,输出层单元线性加权,隐含层的传递函数可采用线性或非线性函数,承接层是用来记忆隐含层前一时刻的输出值.Elman神经网络的非线性空间表达式为[28]:

图1 Elman神经网络示意

1.2 CEEMD基本原理

CEEMD(Complementary Ensemble Empirical Mode Decomposition,CEEMD)[24]是由EMD和EEMD演变而来,可解决EMD存在模态混叠的问题和EEMD中分解时间较长的问题.其分解过程如下:

②根据上下包络线求得平均曲线:

⑥用剩余序列重复上述①-⑤个步骤,可得到多个IMF,直到满足终止条件:

(3)两组IMF1和IMF2和的集成平均值即为最终的分解结果IMF.

1.3 偏自相关函数

偏自相关函数(Partial Autocorrelation Function, PACF)是辨识自回归滑动平均模型ARMA(,)中滞后阶数的常用方法,它可以反映时间序列中任意两个变量在排除了中间变量的影响后的相关性[29].本文利用 PACF 来确定各分量的滞后阶数,进而确定 Elman神经网络的输入层神经元个数、输出变量.

1.4 CEEMD-Elman模型的搭建

1.4.1 流程图 CEEMD-Elman网络预测模型的思路(具体流程见图2):首先利用CEEMD对AQI序列进行分解处理,该方法可将AQI序列分解成频率不同的多个IMF分量和剩余分量,分别将其作为CEEMD-Elman模型的输入变量;其次,利用偏自相关函数求AQI的滞后期,以确定各子模型的输入层神经元个数;再次,对各分量建模组成CEEMD- Elman预测模型,获得每个分量的预测值;最后,将各个子模型的预测结果相加得到最终预测结果.步骤如下:

①对上海市AQI序列进行CEEMD分解,得到多个IMF分量和剩余分量;

②利用PACF求得AQI序列的滞后阶数,进而确定子模型的输入变量;再通过多次训练并对比训练网络误差大小来确定隐含层的神经元个数,最终确定模型的输出变量;

④重复步骤二到步骤三,分别获得其他分量和剩余分量的预测结果;

⑤将各分量和剩余分量的预测值相加.

图2 CEEMD-Elman预测模型的流程

1.4.2 关键参数的设定在进行网络训练和预测中,由于权数和阈值是由随机数随机产生,因此每次运行软件时,网络的收敛速度会有所不同.经过反复对比,权的初始值域选择为(-0.1, 0.1)较好.在模型学习过程中隐含层传递函数采用tansig函数,输出层传递函数采用purelin函数,训练函数为traingdx,其中,最大迭代次数为5000次,最多验证失败次数为5次,误差容限为0.00001.

隐含层的节点数及神经元个数也同样是神经网络模型中关键参数之一.理论上,如果神经网络只要有足够多的隐含层节点就可以逼近任意的连续函数.但目前仍没有具体的计算标准,大多数是根据经验来设定隐含层神经元个数.有研究说明一个三层神经元的隐含层神经元个数应该是该神经网络输入神经元个数的75%[21];而有研究建议最优隐藏层的神经元个数应该为其输入神经元个数的1.5至3倍[22].笔者结合这两种经验,确定了各模型隐含层神经元个数的实验范围为对应其输入神经元数目的75%~ 300%.对CEEMD-Elman模型进行反复训练对比,通过比较网络误差的大小来判断隐含层最佳神经元数目.最终确定AQI序列的各子模型的隐含层神经元个数,如表2所示

1.5 方法的验证

为更准确地观察数据的处理情况,选取平均绝对误差、均方误差和平均绝对百分比误差3个指标.平均绝对误差表征预测误差的离散程度,数值越小表明预测结果越好;均方误差是反映预测值误差的实际情况的一种方法,可评价数据的变化程度,数值越小越好;平均绝对百分比误差说明预测值与原始值差别程度,数值越小,表明预测效果越好.

2 CEEMD-Elman预测模型的结果与分析

2.1 样本数据来源及预处理

选取上海市2017年3月10日至2019年3月10日每日空气质量指数(http://www.semc.com.cn/aqi/ Home/Index)共712个有效样本数据为研究对象.样本数据的基本统计特征如表1所示.表1可知,该样本数据的标准差为34.84,即该组数据的波动性较大;对应的偏度和峰度为1.19、4.68,J-B(Jarque-Bera)构造统计量结果为251.64,为0.00,说明要拒绝该序列与正态分布无显著差异的原假设,即AQI序列不服从正态分布.进一步对AQI序列做平稳性检验,得到ADF (augmented Dickey-Fuller)值为-0.98,大于临界值-1.94,也即有充分的理由说明AQI序列是非平稳的.综上检验,严格适合平稳序列的方法并不可行,而Elman神经网络可对非平稳非线性的AQI序列进行预测.

表1 样本数据的基本统计特征

表2 各分量模型的隐含层神经元个数

图3 上海市的AQI序列

选取上海市AQI序列进行CEEMD-Elman建模时,利用偏自相关函数求得上海市AQI序列滞后期为6,即用前6d的AQI来预测第7d的AQI,并将其作为Elman模型的输入层神经元个数;通过对比模型网络误差大小,最终确定隐含层神经元个数如表2所示.

上海市AQI(2017年3月10日~2019年3月10日)数据如图3所示.由图3可知,该序列呈现出较大的波动性和一定的趋势性,但并没有显示出清晰可循的规律性,若想对其进行准确预测则存在较大的难度.CEEMD是一种有效处理非平稳信号的方法,可应用到广泛的领域.对上海市AQI序列的CEEMD分解结果如图4所示,分解后共得到9个IMF分量,即对非平稳AQI的研究可转化为对9个平稳的IMF分量的研究.由图4所知,每一个IMF分量的频率成分都不相同,且每一时刻的幅值也不同,但非平稳和非线性性质都有所降低.

图4 上海市AQI数据的CEEMD分解

2.2 上海市AQI的预测结果

选取上海市AQI共712个有效样本数据为研究对象.以AQI的2017年3月10日至2018年10月19日共570个数据建立了CEEMD-Elman网络预测模型,并以AQI的2018年10月20日至2019年3月10日共136个有效数据作为检验数据用于模型的预测.分别对各分量IMF和剩余分量进行CEEMD-Elman建模训练,各分量预测结果如图5所示.

为更直观的观察CEEMD-Elman模型的预测情况,将各子模型预测值进行自适应叠加,并分别与Elman单一模型、BP单一模型、EMD-Elman模型和CEEMD-BP模型进行对比分析.各模型AQI的预测值与实测值的对比结果如图6所示;各模型的误差对比如图7所示.

根据《环境空气质量指数(AQI)技术规定(试行)》(HJ 633—2012)规定:空气质量指数划分为0~50、51~100、101~150、151~200、201~300和大于300六档,对应于空气质量的六个级别.为计算本模型对空气质量预报的准确率,按照空气质量划分标准,将各模型预测的上海市空气质量指数AQI变换成对应的空气质量等级;并与真实的AQI对比,用空气质量等级预报正确天数的频率表示预测准确率,统计可得各模型的预测准确率如表3所示.

图6 各模型的预测值与实测值对比曲线

图7 不同模型的误差对比曲线

表3 各模型空气质量等级预报正确天数的频率对比

注: -为真实值,无准确率和误报率.

2.3 讨论分析

由图5可知:CEEMD-Elman预测结果除IMF1外,其余分量预测结果基本与实际值保持一致,也即随着AQI序列非线性和非平稳性的程度降低,预测值与实际值的误差也越来越小.

图6可知:(1)对比单一神经网络,3种组合模型都能更好的预测出上海市AQI的趋势,预测具备较好的波动性和跟随性;(2)Elman网络相对BP网络表现出更好的预测趋势,即对具有动态性且非线性非平稳的上海市AQI进行预测时,Elman神经网络更合适;(3)CEEMD-Elman模型的预测趋势几乎与上海市AQI趋势一致,预测效果最好.

由图7可知:CEEMD-Elman模型的误差曲线在=0处上下波动,且波动性最小,说明该模型的跟随性最强,预测效果与真实值最为接近,模型精度最高.

由表3可知:原AQI序列按照空气质量等级分别为优、良、轻度污染和中度污染的比例分别是25%、55.88%、17.65%和1.47%;对比各模型的预测结果,CEEMD-Elman与真实值最为接近,预测比例分别是22.79%、56.62%、19.85%和0.74%,预报正确天数的频率为94.12%.

为进一步对比各模型的准确性,分别对比计算各模型的预测误差,如表4所示.

表4 各模型误差指标的比较

由表4可知:

(1)对比单一网络模型.BP模型预测值的均方误差MSE、平均绝对误差MAE和平均绝对百分比误差MAPE分别比Elman模型的高出61.31%、39.40%、34.04%,说明Elman模型的预测值变化较小,即对于时间序列预测时Elman模型的跟随能力要强于BP模型.

(2)对比组合模型.CEEMD-Elman模型的预测值的均方误差MSE、平均绝对误差MAE和平均绝对百分比误差MAPE分别比EMD-Elman模型低了93.80%、52.24%和83.33%;比CEEMD-BP模型96.89%、92.46%和86.83%.

综合上述误差指标来看,CEEMD-Elman模型预测精度最高,说明将AQI序列的预测研究转化为对多个IMF分量和剩余分量的研究是可行的.这是因为将数据分解技术与Elman神经网络结合应用到对大气污染的预测时,CEEMD很大程度上降低了AQI序列因非平稳和噪声导致的误差;且建模前利用PACF求得AQI序列的滞后期,考虑了AQI数值受前一天或者前几天的影响,因此,相比其他模型,CEEMD-Elman模型更适用于AQI序列的预测和空气质量等级的预报.

3 结论

3.1 通过CEEMD将非线性非平稳的空气质量指数AQI序列分解成一系列较为平稳的IMF分量和剩余分量,将对AQI序列的预测研究转化成对多个IMF分量的研究,进而进行建模,说明该模型可以处理非平稳的AQI序列.

3.2 将该方法分别与Elman网络模型、BP网络模型、EMD-Elman模型以及CEEMD-BP模型进行对比,选取上海市AQI序列为例,通过比较误差指标可知CEEMD-Elman模型预测值与实际值的平均绝对误差、均方误差以及平均绝对百分比误差分别为:4.80、0.71、1.84%,均比其他4种模型预测效果更好,反映CEEMD-Elman模型的预测精度得到了较好的改善;对应空气质量等级预报正确天数的频率为94.12%,说明了该方法的有效性.

3.3 通过模型的预测值与实际值对比,发现该方法下,可以得到较为准确的预测趋势和预测值,说明该模型适用于上海市空气质量的预测,从而验证了该方法在实际应用中具有一定的适用性.

[1] Gao Q X, Liu J R, Li W T, et al. Comparative analysis and inspiration of air quality index between China and America [J]. Environmental Science, 2015,36(4):1141-1147.

[2] Zhang Q J, Benoi L, Fanny V L, et al. An air quality forecasting system in Beijing-application to the study of dust storm events in China in May 2008 [J]. Journal of Environmental Sciences, 2012,24(1): 102-111.

[3] GB3095-2012 《环境空气质量标准》[S]. GB3095-2012 Ambient air quality standard [S].

[4] 赵猛.基于数据挖掘技术的大气环境预测研究[D]. 北京:北京交通大学, 2017.Chen J. Research on atmospheric environment prediction based on data mining technology [D]. Beijing, Beijing Jiaotong University, 2017.

[5] Kurt A, Oktay, A. B. Forecasting air pollutant indicator levels with geographic models 3days in advance using neural networks [J]. Expert Systems with Applications, 2010,37(12):7986-7992.

[6] 张洁琼,王雅倩,高爽,等.不同时间尺度气象要素与空气污染关系的KZ滤波研究[J]. 中国环境科学, 2018,38(10):3662-3672. Zhang J Q, Wang Y Q, Gao S, et al. study on the relationship between meteorological elements and air pollution at different time scales based on KZ filtering [J]. China Environmental Science, 2018,38(10): 3662-3672.

[7] 江琪,王飞,张恒德,等.北京市PM2. 5和反应性气体浓度的变化特征及其与气象条件的关系[J]. 中国环境科学, 2017,37(3):829-837. Jiang Q, Wang F, Zhang H D, et al. Analysis of temporal variation characteristics and meteorological conditions of reactive gas and PM2.5in Beijing [J]. China Environmental Science, 2017,37(3):829-837.

[8] Konovalov I B, Beekman M, Meleux et al. Combining deterministic and statistical approaches for PM10forecasting in Europe [J] Atmospheric Environment, 2009,43:6425–6434.

[9] Zhang H, Zhang W, Palazoglu et al. Prediction of ozone levels using a hidden markov model (HMM) with gamma distribution [J]. Atmospheric Environment, 2012,62:64-73.

[10] 肖鸣,李卫明,刘德富等.基于多重优化灰色模型的三峡库区香溪河支流回水区水华变化趋势预测研究[J]. 环境科学学报, 2017, 37(3):1153-1161.Xiao M, Li W M, Liu D F, et al. Prediction of algal bloom variation in backwater areas of tributaries in Three-Gorges based on multiple optimized grey model [J]. Acta Scientiae Circumstantiae, 37(3):1153-1161.

[11] Song Y, Qin S, Qu J, et al. The forecasting research of early warning systems for atmospheric pollutants: A case in Yangtze River Delta region [J]. Atmospheric Environment, 2015,118:58–69.

[12] Wang L T, Jang C, Zhang Y, et al. Assessment of air quality benefits from national air pollution control policies in China [J]. Atmospheric Environment, 2010,44(28):3449-3457.

[13] Huang Q, Cheng S Y, Perozzi R E, et al. Use of a MM5-CAMx-PSAT modeling system to study SO2source apportionment in the Beijing metropolitan region [J]. Environmental Modeling & Assessment, 2012,17(5):527-538.

[14] Egan S D, Stuefer M, Webley P W, et al. WRF-Chem modeling of sulfur dioxide emissions from the 2008 Kasatochi Volcano [J]. Annals of Geophysics, 2015,57:1593-5213.DOI:10.4401/ag-6626.

[15] Zhu. S L, Lian X Y, Liu H X, et. al. Daily air quality index forecasting with hybrid models: A case in China [J]. Environment Pollution, 2017,231(2):1232-1244.

[16] Li X, Peng L, Yao X J, et al. Long short-term memory neural network for air pollutant concentration predictions: Method development and evaluation [J]. Environment Pollution, 2017,231(1):997-1004.

[17] Bai Y, Li Y, Wan, X X, et al. Air pollutants concentrations forecasting using back propagation neural network based on wavelet decomposition with meteorological conditions [J].Atmospheric Pollution Research, 2016,7(3):557–566.

[18] 张恒德,张庭玉,李涛等.基于BP神经网络的污染物浓度多模式集成预报[J]. 中国环境科学, 2018,38(4):1243-1256. Zhang H D, Zhang T Y, Li T, et al. Forecast of air quality pollutants concentrations based on BP neural network multi-model ensemble method [J]. China Environmental Science, 2018,38(4):1243-1256.

[19] White. White. Economic prediction using neural networks: The case of IBM daily stock returns [C]//International Conference on Neural Networks, 1988,2(2):451-458.

[20] Wang P, Liu Y, Qin Z, et al. A novel hybrid forecasting model for PM10and SO2daily concentrations [J]. Science of the Total Environment, 2015,505(505C):1202-1212.

[21] Azman A, Hafizan J,Mohd E T, et al. Prediction of the level of air pollution using principal component analysis and artificial neural network techniques: A case study in Malaysia [J]. Water, Air & Soil Pollution, 2014,225(8):0049-6979.DOI:https://doi.org/10.1007/s11270-014-2063-1.

[22] Huang N E, Shen Z, Long S R, et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non- stationary time series analysis [J]. Proceedings A, 1998,454(1971):903-995.

[23] Wu Z, Huang N E. Ensemble empirical mode decomposition: A noise-assisted data analysis method [J]. Advances in Adaptive Data Analysis, 2009,1(1):1−41.

[24] Yeh J R, SHIEH J S, HUANG N E. Complementary ensemble empirical mode decomposition:a Novel Noise Enhanced Data Analysis Method [J]. Advances in Adaptive Data Analysis, 2010,2(2): 135-156.

[25] Wang J J, Zhang W Y, Li Y N, et al. Forecasting wind speed using empirical mode decomposition and Elman neural network [J]. Applied Soft Computing, 2014,23(Complete):452-459.

[26] Yang Z, Wang J. A new air quality monitoring and early warning system: air quality assessment and air pollutant concentration prediction [J]. Environment Research, 2017,158:105-117.

[27] Yu L, Dai W, Tang L. A novel decomposition ensemble model with extended extreme learning machine for crude oil price forecasting [J]. Engineering Applications of Artificial Intelligence, 2016,47:110-121.

[28] ELMAN J L. Finding structure in time [J]. Cognitive Science, 1990, 2(14):179－211.

[29] 宋菁华,杨春节,周哲等.改进型EMD-Elman神经网络在铁水硅含量预测中的应用[J]. 化工学报, 2016,67(3):729-735. Song J H, Yang C J, Zhou Z, et al. Application of improved EMD-Elman neural network to predict silicon content in hot metal [J]. CIESC Journal, 2016.67(3):720-735.

AQI prediction of CEEMD-Elman neural network based on data decomposition.

WU Man-man1,2, XU Jian-xin2,3*, WANG Qin1

(Quality Development Institute, Kunming University of Science and Technology, Kunming 650093, China；2.State Key Laboratory of Complex Nonferrous Metal Resources Clean Utilization, Kunming 650093, China；3.Faculty of Metallurgical and Energy Engineering, Kunming University of Science and Technology, Kunming 650093, China)., 2019, 39(11)：4580~4588

Elman neural network (ENN) is susceptible to the non-stationary of data when it is used to predict the Air Quality Index (AQI), resulting in a good forecasting trend but low accuracy. Based on complementary ensemble empirical modal decomposition (CEEMD), a new hybrid model related to ENNwas proposed in this paper. Firstly, CEEMD was employed to decompose the AQI sequence into a finite number of intrinsic mode functions (IMFs) at different time scales and one residue. Secondly, partial autocorrelation function was used to calculate the lag periods of the input variables of each IMF in ENN. Finally, the predicted values of each IMF were summed up to obtain the final predicted result. The study of the AQI without stationarity sequence was then transformed into the study of steady IMFs. The experimental results show that the mean square error, the mean absolute error, and the mean absolute percent error were respectively 4.80, 0.71, and 1.84% which were all less than those of the single Elman network, EMD-Elman model, BP network and CEEMD-BP model. Furthermore, the frequency of the correct forecast for the corresponding air quality grade was 94.12%. It has been concluded that the new model could reduce the volatility impact of real AQI data and effectively predict the air quality grade. This study not only provides an effective evidence to further predict the trend of AQI, but provides a better reference for government decision-making and pollution control formulation of management departments.

air quality index (AQI)；complementary ensemble empirical mode decomposition；partial autocorrelation function；Elman neutral network；air quality grade

X823

1000-6923(2019)11-4580-09

吴曼曼(1994-),女,安徽阜阳人,昆明理工大学硕士研究生,主要从事机器学习和时间序列预测研究.发表论文2篇.

2019-04-02

云南省高层次人才引进项目(50578020)

* 责任作者, 教授, xujianxina@163.com