APP下载

GM(1,1)-ARMA(p,q)组合模型下的PM2.5浓度预测

2022-07-06席小雅郑旭峰李小鸭

现代信息科技 2022年6期
关键词:残差颗粒物噪声

席小雅?郑旭峰?李小鸭

摘  要:随着经济的发展,空气质量问题日渐显露,雾霾天气不断增加,而雾霾形成的主要原因是细微颗粒物,细微颗粒物能够较长时间悬浮于空气中,其浓度越高危害越大。PM2.5作为直径小于等于2.5微米的颗粒物,被吸入体内后会引发哮喘、支气管炎以及心血管病等疾病,引起人們的广泛关注。因此,文章对西安市2013年12月到2021年3月的PM2.5浓度值共计88条数据进行了实证研究,分别采用灰色系统预测模型GM(1,1)、时间序列模型AR(2)以及二者的组合模型对西安市的PM2.5进行预测,研究结果表明组合模型的相对误差最小,预测效果最优。

关键词:PM2.5;灰色系统预测模型;ARMA(p,q)组合模型

中图分类号:TP391         文献标识码:A文章编号:2096-4706(2022)06-0015-05

PM2.5 Concentration Prediction under GM(1,1)-ARMA(p,q)Combined Model

—Take Xian City as an Example

XI Xiaoya, ZHENG Xufeng, LI Xiaoya

(Xian Eurasia University, Xian  710065, China)

Abstract: With the development of economy, air quality problems are increasingly exposed, and haze weather is increasing. The main reason for the formation of haze is fine particles. Fine particles can be suspended in the air for a long time, and the higher their concentration, the greater the harm. As particles with a diameter of less than or equal to 2.5 microns, PM2.5s inhalation will lead to asthma, bronchitis, cardiovascular disease and other diseases, which has attracted extensive attention. Therefore, this paper studies a total of 88 data of PM2.5 concentration values from December 2013 to March 2021 in Xian. The grey system prediction model GM(1,1), time series model AR (2) and their combination model are used to predict the PM2.5 in Xian. The study results show that the relative error of the combined model is the smallest and the prediction effect is the best.

Keywords: PM2.5; grey system prediction model; ARMA(p,q) combined model

0  引  言

近年来,随着工业化和城市化的迅速发展,人们的生活质量逐渐提高,能源的大量消耗以及污染物排放造成的空气污染问题也越来越严重。由空气污染引发的“雾霾”渐渐成为人们比较关心的话题。雾霾天气形成的主要原因是人为的环境污染,与此同时受自然条件的影响,污染物不易扩散。根据欧盟国家的不完全统计,PM2.5或将导致人们的平均寿命减少8.6个月,PM2.5还可能成为病毒和细菌的载体,导致呼吸道感染性疾病的传播,因此PM2.5已成为环境检测的重要指标。胡伟、胡敏、唐倩、郭松、闫才青(2013)在广州地区采样,从PM2.5的化学成分角度分析2010年广州亚运会期间颗粒物的污染特征。由于细颗粒物污染具有明显的空间时效性,因此PM2.5浓度的相关研究一般是在一定区域或一定时间内进行的。王勖之、曾沛、刘永辉(2017)利用PAGE检验和分析了上海市近年来PM2.5浓度的变化趋势,然后建立ARIMA时间序列模型对日PM2.5浓度数据进行拟合和预测。何承香、曾波、杨乐彬(2021)对GM(1,1)模型中的3个参数进行了优化,提出了新型GM(1,1,CSZ,ξ,γ)模型,通过模拟预测得出该模型的性能优良。上述文献中所提到的方法均有值得参考的地方,但也存在些许不足,如灰色模型适合预测近期数据,且对无规律数据的预测效果较差;ARIMA模型要求数据差分后是平稳的。

本文尝试建立灰色系统预测模型GM(1,1)和时间序列模型ARMA(p,q)的组合模型,对西安市的PM2.5进行预测,旨在为相关部门提供技术支持。

1  数据来源

本文数据来源于西安市空气质量在线监测分析平台,表1展示了从2013年12月到2021年3月,共计88条西安市PM2.5浓度值数据。

2  GM(1,1)模型预测

设原始序列,对其做一次累加生成新序列,其中有:

对新序列进行平滑处理得到,其中α为权重。由此建立GM(1,1)微分方程:

由最小二乘法可以得到参数, 的估计值,带入GM(1,1)微分方程得到序列的通解:3571FA44-9630-49C3-98A3-DB0897DBA874

还原成原始数列得到预测函数:

使用EXCEL软件可得估计值a=0.005 6、b=63.293 6,则GM(1,1)模型为:

其时间响应式为:

运用GM(1,1)模型计算拟合值,并将拟合值與真实值做差后的绝对值的平均值作为平均相对误差,表2展示了拟合后数据以及平均相对误差值。

根据表1及表2绘制拟合图,由图1可以看出GM(1,1)的拟合效果欠佳。

3  ARMA(p,q)模型预测

3.1  平稳性检验

为了确保没有随机趋势或确定趋势以防出现“伪回归”问题,需要进行序列平稳性检验。首先可以画出数据时间序列图,观察数据序列的趋势。通过观察图2,初步认为时序波动具有平稳性。

为进一步确认该序列的平稳性,需要对该数据进行ADF检验。ADF检验的原假设是序列PM2.5存在单位根,由表3可以看出,ADF检验的t统计量值为-5.06,小于1%显著性水平临界值-3.45。因此,在99%的置信水平下,可以拒绝原假设,判断出序列PM2.5不存在单位根,即序列是平稳的。

3.2  数据的白噪声检验

由图3可以看出,Q统计量的P值小于显著性水平0.05,序列为非白噪声,可以对序列建立ARMA(p,q)模型。

3.3  模型的识别

观察自相关及偏自相关图,自相关拖尾,偏自相关三阶后截尾,因此可以尝试建立AR(2)、AR(3)、ARMA(2,1)模型。

对三个模型的残差做进一步的白噪声检验。当检验出残差序列不是白噪声序列时,说明在残差序列中还有少量的重要信息没有被提取出来,这时需要对整个模型进行改进。模型的检验一般着重于检验残差序列是否具有随机性,图4、图5、图6分别为AR(2)、AR(3)、ARMA(2,1)残差序列的白噪声检验图。根据残差序列的自相关、偏自相关图以及P值,AR(2)、AR(3)模型的残差序列基本上可以视为白噪声序列。

分别计算AR(2)、AR(3)模型的AIC值与SC值,AIC值与SC值越小模型的效果越好。由表4可以看出AR(2)的AIC值和SC值在两个模型中最低,故选择AR(2)模型。

3.4  模型的构建

利用EViews7.2软件,采用非线性最小二乘法对AR(2)模型的参数进行估计,得到模型拟合结果,如表5所示。

根据结果得到AR(2)模型的方程:

3.5  模型的预测

同理,利用AR(2)模型进行预测,计算每一个预测数据与实际数据差的绝对值得到相对误差,对相对误差数据求平均后得到平均相对误差。经计算得到AR(2)模型的平均相对误差为0.448。使用AR(2)模型对原始序列进行预测,结果如图7所示。

4  GM(1,1)-ARMA(p,q)模型预测

通过对GM(1,1)模型和AR(2)模型进行线性组合,建立GM(1,1)-AR(2)组合模型,其基本形式为:

其中,ut和vt分别为GM(1,1)模型和ARMA(p,q)模型,w1和w2为组合权重,运用方差倒数法来确定组合权重,即,其中ci为第i个模型的误差平方和,k为模型个数。

经计算GM(1,1)-AR(2)组合预测模型为:

运用GM(1,1)-AR(2)组合模型对原始序列进行静态预测。由图8可得,GM(1,1)-AR(2)组合预测模型不仅保留了原始数据列的整体趋势,同时也体现出数据列的随机波动性。利用预测数据及实际数据计算得到组合模型的平均相对误差为0.323。

比较组合模型的预测效果,结果如表6所示。由表6可知,组合模型GM(1,1)-AR(2)的相对误差值最小,这说明组合模型的预测更加精准。

5  结  论

目前,对空气质量的研究主要集中于对各气体污染物浓度的预测,其中PM2.5浓度是主要的研究对象。本文通过对比GM(1,1)模型、AR(2)模型、以及GM(1,1)-AR(2)组合模型,发现组合模型的平均相对误差较小,预测效果更加优良。

参考文献:

[1] 胡伟,胡敏,唐倩,等.珠江三角洲地区亚运期间颗粒物污染特征 [J].环境科学学报,2013,33(7):1815-1823.

[2] 王勖之,曾沛,刘永辉.上海市PM2.5浓度的分析与预测 [J].数学的实践与认识,2017,47(15):210-217.

[3] 何承香,曾波,杨乐彬.基于灰色参数组合优化模型的重庆PM_(2.5)浓度预测与对比分析 [J].系统科学与数学,2021,41(10):2855-2867.

[4] 王赛兰.基于多元方法和时间序列的PM2.5浓度分析与预测 [D].长沙:湖南师范大学,2019.

[5] 李佳旭.成都市PM_(2.5)浓度的影响因素分析及预测 [D].兰州:兰州大学,2020.

作者简介:席小雅(1996.12—),女,汉族,河南开封人,助教,硕士,研究方向:市场调研及商业数据分析。

收稿日期:2022-01-28

基金项目:西安欧亚学院2018年度校级重点课程建设项目(2018KC022)3571FA44-9630-49C3-98A3-DB0897DBA874

猜你喜欢

残差颗粒物噪声
多级计分测验中基于残差统计量的被试拟合研究*
国六柴油机不同粒径颗粒物排放特性差异
“白噪声”助眠,是科学还是忽悠?
浅谈冬奥会前期朝阳市空气质量及细颗粒物变化及成因
用于处理不努力作答的标准化残差系列方法和混合多层模型法的比较*
住宅室内细颗粒物质量浓度及预测研究
固相萃取—离子色谱测定大气颗粒物的甲胺类及其氧化产物
要减少暴露在噪声中吗?
测量数据的残差分析法
有些噪声能让你深睡眠