中国生活能源热力消费的ARIMA模型及预测
2013-04-29张宁李星野
张宁 李星野
摘要:本文利用 ARIMA 模型,对1980-2009年中国生活能源热力消费量序列进行分析,建立了差分自回归移动平均模型ARIMA(1,2,0)。检验结果表明,ARIMA(1,2,0)模型对原始数据序列有着较好的似合效果,模型的预测效果良好 ,可用于短期内中国生活能源热力消费量的预测。在此基础上,对我国2010-2014年的生活能源热力消费量进行了预测,最后给出了结论及建议。
关键词:ARIMA 模型;生活能源热力消费;预测
1.引言
自改革开放三十年来,经济飞速发展,人们的生活质量水平也在飞速提升。在这样的情况下,一个越来越严重的全球性普遍的问题也凸显出来—能源匮乏。这几年来,我国政府已逐渐经意识到这个问题,在各个方面也纷纷提出节能方案,卓有成效。从近几年的数据来看,工业能源的增长趋势渐缓,且每单位GDP耗能量已呈现下降的趋势,可见在工业能源方面节能措施已开始深入并且见效,但是,在另一方面,生活能源消费量却在节节攀升,丝毫不见缓解的趋势。1980-2009年,我国生活能源热力消费量从4572万百万千焦上升至81143万百万千焦,可见节能观念还未深入人心,低碳生活的理念还需要不断推广提倡。
生活能源消费量包括有煤炭、煤油、液化石油气、天然气、煤气、热力、电力等七方面的能源消费。能源可分为一次能源和二次能源,所谓一次能源是指直接取自自然界没有经过加工转换的各种能量和资源,二次能源是指由一次能源经过加工转换以后得到的能源。一次能源可进一步分为再生能源和非再生能源两大类。生活能源消费量中所包括的七方面能源除煤炭、煤油、天然气外都是二次能源,且大多基本由石油支撑,且石油是非再生资源,虽然储量丰富,但对于地球上庞大的人口而言,依然非常有限。因此急需提倡使用一次能源中例如风能、水能、太阳能等新型的可再生资源,减少对非再生资源的使用,既为后代保留资源,又可减少环境污染。
为了能够给生活消费能源方面提出合理建议,我们选择生活能源消费中的热力消费量进行时间序列分析,对改革开放以来30年的生活能源热力消费量数据建立ARIMA时间序列模型,并以此为例,分析生活能源的总体消费趋势。
2.模型简介
时间序列是某一指标在不同时间上的不同数值组成的,按时间的先后顺序排成一串数列。时间序列具有四个方面的影响因素:长期趋势、季节变动、循环变动以及不规则变动。而建立在时间序列的定量预测法就是把预测对象、预测目标和对预测的影响因素都看成为具有时序的且以时间为自变量的函数,再根据历史数据拟合时间序列函数,研究预测对象自身变化过程及发展趋势。
本文选取1980-2009年的热力消费量的年度数据构造时间序列模型。传统的时间序列分析法,如移动平均法和指数平滑法,常因出现滞后误差而影响预测精度。而ARMA模型是描述平稳随机序列的最常用的一种模型,但现实中的时间序列往往是非平稳的,因此本文选取较为普遍的ARIMA模型进行数据处理。ARIMA(p,d,q)模型全称为差分自回归移动平均模型,是基于ARMA模型之上的加入了长期因素和季节因素的非平稳时间序列模型,其中AR是自回归模型, p为自回归项; MA为移动平均模型,q为移动平均项数;d为时间序列成为平稳时所做的差分次数。ARIMA模型是一种精度较高的时间序列短期预测方法,能够从本质上认识时间序列的结构与特征,达到最小方差意义下的最优预测。ARIMA模型可表示为:
ARIMA模型适用于具有长期趋势或季节性的单指标数据的短期预测,根据指标单一的历史数据就可以建立ARIMA模型进行预测分析,操作较为方便,是分析历史数据较为实用的一种方法。
Box和Jenkins提出了具有广泛影响的建模思想,能够对实际建模起到指导作用,其建模思想可分为如下四个步骤:
(1)对原时间序列进行平稳性检验,如果序列不满足平稳性条件,可以通过差分变换(单整阶数为d,则进行d阶差分)或者其他变换,如对数差分变换使序列满足平稳性条件。
(2)通过计算能够描述序列特征的一些统计量(如自相关系数和偏自相关系数),以确定ARMA模型的阶数p和q,并在初始估计中选择尽可能少的参数。
(3)估计模型的未知参数,并检验参数的显著性,以及模型本身的合理性。
(4)进行诊断分析,以证实所得模型确实与所观察到的数据特征相符。
3.实证分析
3.1 数据平稳化
图1为原数据的时序图,从图中我们可以看出数据具有明显的长期上扬的趋势,是非平稳序列,因此需要进行差分以消除长期趋势。图2为原数据二阶差分后的时序图,从图中可以粗略看出数据经过两次差分后已经基本呈现均值上下比较均匀的波动,没有明显的趋势性,接近平稳状态。
3.2 序列的平稳性检验
用自相关图等进一步检验平稳性。图3和图4是自相关图和偏自相关图,若自相关图和偏自相关图中均迅速衰减为零,则数据平稳。从图中可看出,数据大致平稳。
通过使用用单位根检验确定平稳性,判断数据是否有趋势性或季节性。
图5是单位根检验结果,从图中可以看出,P值均小于0.05,拒绝原假设,说明数据已平稳,且不具有长期趋势和季节性,可以继续建模。
3.3 ARIMA模型的建立
通过平稳性检验后,需对差分后的平稳数据进行白噪声检验,若不是白噪声就可建模。从图6的白噪声检验结果中可以看出,P值小于0.05,拒绝原假设,则认为处理后的数据不是白噪声序列。本文采用BIC最小准则法确定模型阶数(图7)。选择和的所有模型计算BIC,得出最小的BIC为AR(1)模型,即选择建立ARIMA(1,2,0)模型。
下面进行模型的参数估计,从图8中可看出模型中参数的参数是显著的,但常数项不显著,因此需要剔除常数项,更改程序,重新建模。从图9中可見,剔除常数项后的模型参数估计参数显著,模型基本建成。需要进一步对模型进行适应性检验。
4.模型的预测
本文基于所建模型所做的五步短期预测,包括在置性水平为95%下的区间估计,是对未来5年生活能源热力消费量进行预测,如图11所示。图12是模型在95%置性水平下的区间估计图。星号带表真实值,实线代表预测值,虚线代表估计区间。从图中可看出,模型拟合效果较好,与真实值偏离较小,在短期内预测有意义。
5、结论
從上述结果显示,自改革开放以来,全国生活能源热力消费量逐步攀升,特别是2003年以来上升速度更加迅猛。根据对1980-2009年全国生活能源热力消费量序列进行的分析和模型的建立,检验结果表明,本文所建立的ARIMA(1,2,0)模型对原始数据序列有着较好的拟合效果,且模型的预测效果良好,可用于短期内中国生活能源热力消费量的预测。
经过两阶差分后的数据显示当期数据只与上期数据以及当期的随机干扰有关,与前期的随机扰动无关。从模型方程来看当期数据与前三期的数据以及当期的随机干扰有关,与前期的随机干扰无关。可见每年的全国生活能源热力消费量主要和前几年的全国生活能源热力消费量以及当年的随机干扰有关,依照本文的预测,到2014年我国的全国生活能源热力消费量将达到122813万百万千焦,面对高消耗日益凸显的社会、经济和环境压力,应主要从每年的逐步控制做起,就可以慢慢影响后期的全国生活能源热力消费量的发展,缓解能源消费的大幅度攀升,同时号召居民走出高碳危机,营造绿色能源环境,培养良好的节能习惯,同时要提高能源的利用效率,优化能源消费结构,进而创造低能耗低消费的“低碳生活”。
参考文献:
[1]Granger, CW.J. and Morris, O. Time series Modeling and Interpretation[J] ,Journal of theRoyal Statistical Society, Series A, (1976),139,246-57.
[2]H.Tong, Threshold Models in Non-linear Time Series Analysis, Lecture Notes inStatistics[J], Springer-Verlag, 1983.
[3]胡百林等.基于 ARMA 模型的水电站概率性发电量预测[J].电力系统及其自动化学报2003.15(3):62-65.
[ 4]黄俊, 周猛, 王俊海. ARMA 模型在中国能源消费预测中的应用[ J] . 统计与决策, 2004, ( 12) : 49 - 50.
[5]刘贤赵,邵金花.烟台地区降水量的 ARIMA 随机模型研究[J].数学的实践与认识,2006,36(8).
[6]卢二坡.我国能源需求预测模型研究.统计与决策[J].2007,(20).