趋势外推与 ARMA组合模型对能源消费预测的应用
2010-07-09斯琴
斯 琴
(内蒙古财经学院 统计与数学学院,内蒙古 呼和浩特 010051)
一、引言
为了讨论内蒙古能源消费系统动态行为所具有的复杂性,首先需要建立能源消费系统动态预测模型,并对所需模型复杂行为和条件进行探讨。目前学术界尝试了一些对能源消费模型的构建,例如,多元线性回归模型、Logistic模型以及时间序列模型,但是,带有一定的局限性。在实际问题中系统现象大多为非平稳序列,由于非平稳时间序列的方差随着时间的推移而增加,并不符合经典回归模型的假设条件,拟合效果也不理想,所以无法使用回归模型来表示该种经济现象和预测未来变化。如何建立表现趋势性和季节性等复杂现象最合适的模型,需要进一步探讨。经过试算笔者认为,用时间序列趋势外推与 ARMA组合模型预测能源消耗总量精度较高,同时具有一定的可操作性及实用价值。本文就如何选择动态模型进行能源消费实证研究谈点个人的思路。
二、趋势外推与 ARMA组合模型构建思路
ARMA预测法是在时间序列和回归预测的基础上适应范围很广、很复杂的一种高级预测方法。它是由移动平均模型(MA)及自回归模型(AR)组成的。ARMA系统的建模思想是将预测对象随时间的推移而形成的数据序列视为一个随机序列。构成该时序的单个序列虽然具有不确定性,但整个序列的变化却有一定的规律性。如果某个时间序列与其前期值以及当前和前期的随机误差的关系可用以下公式表示:yt=φ1yt-1+φ2yt-2+…φpyt-p+εt-θ1εt-1-θ2εt-2-…θqεt-q,该时间序列即为 ARMA(p,q)序列,其中 φ和 θ分别为自回归系数和移动平均系数。如果该时间序列是非平稳序列通过差分后才能够达到平稳。在实际应用中要根据系统现象本身特征采用几种方法交叉使用,然后选择最为合适的阶数(p,q)作为待建模型。
(一)模型的选择判断
1.如果时间序列{yt}满足:yt=φ1yt-1+φ2yt-2+…φpyt-p+εt,则称时间序列{yt}服从 p阶自回归模型,即为 AR(p);
2.如果时间序列 {yt}满足:yt=εt-θ1εt-1-θ2εt-2-…θqεt-q,则称时间序列 {yt}服从 q阶移动平均模型,即为 MA(q);
3.如果时间序列{yt}满足 yt=φ1yt-1+φ2yt-2+…φpyt-p+εt-θ1εt-1-θ2εt-2-…θqεt-q,则称时间序列{yt}服从(p,q)阶自回归移动平均模型,即为ARMA(p,q)。
(二)利用 ARMA模型进行预测的具体步骤
一是平稳性检验。在确定或估计各种时间序列之前,为了获得可靠一致的结果,必须利用单位根检验以确定时间序列的单整阶数,以此确定时间序列为一稳态序列。(1)对原始时间序列的平稳性检验,通过观察时序图和 ADF单位根检验进行;(2)检验平稳性序列是不是白噪声序列。一般通过自相关函数(ACF)特点来判断,如果自相关函数基本上都落入置信区间内,则该时间序列为白噪声序列。如果是白噪声序列,说明序列的变动是纯随机的,即时间序列没有规律性可循。
二是模型的定阶,即确定 p、q值。如果平稳时间序列的自相关函数(ACF)拖尾,偏自相关函数(PACF)p阶结尾,则采用 AR(p)来拟合;如果平稳时间序列的自相关函数(ACF)q阶结尾,偏自相关函数(pACF)拖尾,则采用 MA(q)来拟合;如果平稳时间序列的自相关函数(ACF)拖尾,偏自相关函数(PACF)也拖尾,则采用 ARMA(p,q)来拟合。但是,模型的阶数(p,q)不能直接得到,需用结合其他方法进行定阶,通常对(p,q)进行试探性的识别,再通过检验确定。
三是对模型参数进行估计,然后评价模型的拟合效果。对于 ARMA(p,q)模型参数估计采用极大似然估计,由于其模型结构的复杂性,要通过迭代方法来完成。
四是利用模型对未来进行预测。设平稳时间序列{yt}是 ARMA(p,q)的过程,即 yt=φ1yt-1+φ2yt-2+…φpyt-p+εt-θ1εt-1-θ2εt-2-…θqεt-q,令当前时刻为 t,已知当前时刻 t和以前时刻的观测值 yt,yt-1,yt-2,……,将用已知观测值对时刻 t后的yt+1(L>0)进行预测记为 y^t。当 L>0时,预测值为:若把预测值⌒
yt(L)看作步长 L的函数,则预测函数的形式是由模型的自回归部分决定的,移动平均部分用于确定预测函数中的待定系数。
(三)趋势外推与 ARMA组合模型的利用
如果所研究动态系统存在明显的趋势,首先要根据数据特征分析(差分)判断拟合趋势外推模型,求出参差序列变为平稳新序列,然后通过对趋势外推模型的残差序列根据以上建模思路再建立 ARMA模型,并对残差项进行预测,最后将两个模型的预测结果进行叠加作为实际预测值(详细过程见后实证分析)。
三、实证分析——对内蒙古能源消费预测的应用
本文给出 1985-2008年内蒙古能源消费的动态资料进行实证分析,分析过程及结果借助统计软件 Eviews5.0,根据以上思路拟合内蒙古过去 24年能源消费总量序列。
(一)序列的平稳性检验
对样本数据绘制时序图:
图 1 1985-2008年内蒙古能源消费总量时序图
由图 1可知,内蒙古能源消费总量有明显的逐年递增趋势,所以初步认为原始序列即非平稳序列,为进一步判断序列的平稳性,利用 ADF对序列进行单位根检验,结果见表 1。
表 1 1985~2008内蒙古能源消费总量序列的单位根检验
ADF检验结果表明,原序列经过二阶差分(d=2)后是平稳的,即对二阶差分后序列可以建立 ARMA(p,q)模型。
(二)ARMA(p,q)模型的定阶
在此利用自相关系数和偏自相关函数来确定ARMA(p,q)中的 p和 q的值,使用 Eviews5.0对序列 s作自相关和偏自相关系数分析结果如图 2。从图 2可以看出,自相关系数在 k=2后迅速衰减到零,偏自相关系数很小,在 k=1时几乎落在置信区间内。鉴于此可以考虑用 p=0、1、2,q=2,d=2试算拟合,估计结果如表 2:
表 2 ARMA模型拟合序列y的结果
以上 ARMA模型拟合结果精度很低,许多变量系数不显著,在此不宜用表 2中的模型预测内蒙古能源消费问题。下:
t0.005(21)=208314。以上模型经过检验在统计上均是显著的。但由 DW统计量可知残差项存在着序列相关性,如果用此趋势外推模型预测将会产生较大预测误差。因此考虑通过对趋势外推模型的残差序列建立 ARMA模型并进行预测,最后将两个模型的预测结果进行叠加作为实际预测值,从而达到提高预测精度的目的。对上述趋势外推模型残差序列作自相关函数图和偏相关函数图分析:
图 2 序列y经过二阶差分后自相关和偏自相关分析图
四、趋势外推与 ARMA组合模型的应用
由上述的时序图可知,内蒙古能源消耗总量呈曲线上升趋势,根据时间序列建模思想:当预测对象依时间变化呈现某种上升或下降趋势,并且没有明显的季节变动时,有可能找到一条合适的函数曲线反映这种变化趋势时,则以时间 t为自变量,时序值y为因变量建立趋势外推模型:y=F(t)。同时有理由相信这种趋势能够延伸到未来时,赋予变量 t所需要的值,可得到相应时刻的时间序列未来值。根据内蒙古能源消费随时间变化的情况可用二次抛物线趋势外推模型 yt=b0+b1t+b2t2+et来模拟,其中t=1,…,24。对该模型运用最小二乘估计结果如
自相关系数在 k=2后迅速衰减到零,偏自相关系数在 k=1后都落在置信区间内并速衰减到零。鉴于此可以考虑用 p=2,q=1来拟合,估计结果如表 3。很明显,ARMA(2,1)模型对残差序列拟合效果很好,该模型具体形式如下:
图 3 残差序列自相关和偏自相关分析图
表 3 残差序列 ARMA(2,1)模型的估计结果
将趋势外推模型(1)和 ARMA模型(2)结合得到内蒙古能源消费总量的预测值见表 4。
表 4 内蒙古能源消费的趋势外推与ARMA组合模型预测(万吨标煤)
由表 4可知,用趋势外推与 ARMA(2,1)组合模型来预测内蒙古能源消费总量其相对误差很小,最大相对误差也不超过 1.37%,平均相对误差仅为 0.94%,所以,趋势外推和 ARMA(2,1)组合模型的预测效果比单独运用趋势外推或 ARMA模型更为理想。
五、结束语
本文分析了 24年来内蒙古能源消费总量的数据特征,经过定量分析最终得出趋势外推与 ARMA(2,1)组合模型能更好的模拟能源消费总量。运用所建的模型进行预测,数据显示预测结果具有精度高、稳定性好的特点,同时具有一定的可操作性和实用性。这正是能源消费预测中所必需的,只有对能源消费进行更准确的预测,才能找到更为有效的解决能源消费问题的途径,为资源的合理配置提供依据,也为今后能源消费的中长期预测提供科学、有效的方法。
[1] [美]弗雷德里克.S.希利尔.数据模型与决策[M].北京:中国财政经济出版社,2008.
[2] 易丹辉.数据分析与 Eviews应用[M].北京:中国统计出版社,2002.
[3] [美]罗伯特 S,平狄克.计量经济模型与经济预测[M].北京:机械工业出版社,2003.
[4] 易丹辉.统计预测方法与应用[M].北京:中国统计出版社,2001.
[5] 孙芳.内蒙古经济增长与能源消费的协整性和因果关系分析[J].内蒙古财经学院学报,2009,(5).