基于ARIMA模型的北京市全社会用电量短期预测
2020-11-19郭松亮闫鹏君鄂浩坤
郭松亮,闫鹏君,鄂浩坤
(北京信息科技大学 经济管理学院,北京 100192)
0 引言
社会生活生产的方方面面都离不开电力能源,智慧互联、新能源汽车等的发展就更需要电力的稳定供应,电力与经济发展息息相关。而用电量是电力需求的重要指标,对其进行预测对于把握电力需求、制定相关政策具有重要意义。
国内外有很多关于用电量预测的研究,乔黎伟等[1]在考虑不同关联因素的基础上,利用随机森林算法对不同产业的中短期用电量进行预测;徐冰涵等[2]针对居民用户提出一种考虑分时电价的分类短期用电量预测方法,通过实验证明所采用方法的预测精度更高;王宏伟等[3]建立了基于高斯过程回归的居民店里消费概率预测模型,并以我国居民店里消费量为例证明了预测精确度的提高,为居民电力使用量预测提供了可行思路;孙颖[4]以2009—2016年的全社会用电量月度数据进行研究,构建了ARIMA(autoregressive integrated moving average model)(2,1,1)和(1,1,0)模型,在模型基础上对未来18个月的全社会用电量进行了预测;Erkan Erdogdu[5]通过建立土耳其用电量需求ARIMA模型,对土耳其的未来电力需求进行预测,发现土耳其的政府电力规划项目高估了用电量需求的发展;Wang Yuanyuan[6]提出了3种残差修正模型以提高季节性ARIMA模型的精度,研究发现中国的电力能源消耗未来将会呈现持续增长态势,并提出了相关的建议。
本文通过构建ARIMA模型对北京市全社会用电量进行短期预测。
1 理论基础
ARIMA模型全称为自回归积分滑动平均模型,它将随时间变化的数据看成是随机的序列,假设排除偶然因素的影响外,变量的变化仅与时间的影响有关。ARIMA(p,d,q)模型有3个参数:p为自回归项,记为AR(p);d为使得非平稳时间序列成为平稳时间序列所进行的差分次数,记为I(d);q为移动平均项数,记为MA(q)。ARIMA模型的构建主要分以下步骤:①通过差分对序列进行平稳化处理;②由差分后的自相关函数(ACF)及偏自相关函数(PACF)图确定p、q的阶数值;③确定模型的参数并检验;④验证模型拟合效果并对未来进行预测。
2 ARIMA预测模型构建
2.1 数据来源
从北京市统计年鉴局网站获取北京市1978—2018年的全社会用电量数据,绘制出折线图,如图1所示。
由图1可知,北京市全社会用电量总体趋势是逐年升高,1978年为7.35×106MkW·h,2018年为1.14×108MkW·h。
2.2 数据平稳性检验
图1显示用电量时间序列Y有明显的时间趋势。对该时间序列进行单位根检验,结果如表1所示,t统计量的值为-0.968 026,时间序列Y非平稳。
表1 序列Y单位根检验结果
图2是时间序列Y的自相关和偏相关图。序列Y的自相关图不是很快地趋于0,其降速缓慢,偏自相关图临界值超出范围,由此也可以判断该序列是非平稳的。
对序列Y进行一阶差分,生成的新序列记为Y1。对序列Y1进行单位根检验,输出结果如表2所示。t统计量的值为-9.069 801,其绝对值大于检验水平1%的标准临界值,P(支持原假设的概率)值为0.000 0。因此,经一阶差分处理后的序列Y1是平稳的时间序列,所以d=1。
表2 序列Y1单位根检验结果
绘制序列Y1的相关图,如图3所示。
由图3可知,序列Y1的自相关系数快速衰减,自相关系数和偏自相关系数后期虽有震荡,但是它们的数值都在置信区间范围内部,且P值的范围基本大于0.05,由此可以判定序列Y1为平稳的时间序列。
2.3 模型识别及检验
2.3.1 模型识别
时间序列要建立相关模型,需要确定ARIMA模型的相关系数,这就取决于序列的自回归函数和偏自回归函数,在模型中找出p和q的值。由图3可以看出一阶差分序列Y1必然不属于MA模型,所以q=0。为了确定p的值,分别建立AR(1)、AR(2)、AR(3)模型,然后比较ARIMA(3,1,0)模型、ARIMA(2,1,0)模型、ARIMA(1,1,0)模型,发现ARIMA(1,1,0)模型的拟合优度在所有的备选方案中是最高的,各项指标系数较之于其他模型高,具体比较结果见表3。
表3 各ARIMA模型指标系数统计
对于以上3个模型,综合确定选取最优模型为ARIMA(1,1,0),得到的ARIMA模型的具体方程为Yt=-959 685.6+1.056 761Yt-1+εt。
2.3.2 残差检验
对该模型残差序列进行单位根检验,其中ADF值为24.646 6,大于5%与10%显著性水平的临界值的绝对值,说明最优模型的残差为白噪声序列。再做出模型残差的相关图以及Q统计量,如图4所示。
可以看出,残差序列自相关与偏相关数值全部在95%的置信区间内,且自相关函数的概率值均大于0.05,说明最优模型估计结果的残差序列满足随机性假设,通过了白噪声检验。
3 全社会用电量预测
3.1 模型拟合
在模型已经建立的基础上,对1978—2018年北京市的全社会用电量数据进行拟合,检验模型的可靠性,结果如图5所示。北京市全社会用电量呈现持续攀升的趋势,每年的用电量预测值均在实际用电量值的两倍标准误差内,说明模型预测值可靠,与实际数值的拟合效果良好。
3.2 数据预测
利用模型ARIMA(1,1,0)对北京市2019—2021年的全社会用电量进行预测,预测结果如表4所示。
表4 2019—2021年北京市全社会用电量数值预测
4 结束语
本文通过对用电量数据进行平稳性检验、平稳化处理、模型系数确定、白噪声检验、模型可靠性验证等过程,构建了ARIMA(1,1,0)模型,对北京市的全社会用电量进行拟合,且拟合误差在合理范围内。用该模型对北京市全社会用电量数据进行预测,表明短期内北京市全社会用电量将持续增长。