基于BL时间序列模型的发展过程
2017-04-15王泽祎
王泽祎
(山东科技大学数学与系统科学学院 山东 青岛 266590)
基于BL时间序列模型的发展过程
王泽祎
(山东科技大学数学与系统科学学院 山东 青岛 266590)
通过总结时间序列模型ARMA模型的参数估计方法以及识别问题,进一步推出BL模型,给出了模型的定义以及各个变量的含义,然后再进一步的引出BL模型的发展现状,并引出最近比较热的算法——遗传算法。
BL模型;ARMA模型;遗传算法;发展过程
一、时间序列模型
我们日常生活中的经济活动比如股票金融的价格波动都与时间序列模型息息相关,除了经济领域,在自然人文领域都能使用到时间序列模型。那么,什么是时间序列模型呢?就是使用当前或者过去的数据建立相应的模型结构,并根据相应的模型预测此领域的未来情况。对于时间序列的分类情况,时间序列分为线性和非线性时间序列两种,在线性时间序列模型中,有自回归模型,滑动平均模型和自回归滑动平均模型,并同时提出了其分辨方法、参数估计以及检验方法的等一系列的原理,体现出时间序列的日渐成熟,但是在现实生活中,时间序列呈现出非线性的情况比较多,所以下文具体总结一下非线性的模型的一个特例——BL模型。在总结BL模型的理论之前,我们回顾一下下ARMA模型。
二、ARMA模型介绍
回归滑动平均模型(ARMA模型,Auto-RegressiveandMovingAverageModel)是研究时间序列的重要方法,由自回归模型(简称AR模型)与滑动平均模型(简称MA模型)为基础构成。其基本思想是:依赖时间一族的时间变量是某些时间序列的特点,虽然在单个序列值的序列上有不确定性,但是还是有一定的规律性在整个序列的变化上,近似序列可以应用相应的数学模型。对于应用的此数学模型的研究分析,可以对时间序列的结构和特征具有更深层的理解,在最小方差意义下达到最好的预测。当时间序列y(t)是它的前期值的线性函数和当期和前期的随机误差项,那么表达为:
Yt=φ1Yt-1+φ2Yt-2+…+φpYt-p+ut-θ1ut-1-…-θqut-q
ARMA模型的识别分为以下几种:
(1)若平稳序列xr的自相关函数是拖尾的,偏自相关函数是截尾的,则序列xr是AR序列。(2)若平稳序列xr的自相关函数是截尾的,偏自相关函数是拖尾的,则序列xr是MA序列。(3)若平稳序列xr的自相关函数与偏自相关函数都是拖尾的,则xr是ARMA序列。
时间序列模型是建立在线性模型基础上,以参数化模型处理动态随机数据的一种实用方法。AR模型、MA模型和ARMA模型是平稳时间序列模型中最常用的三种形式。在时间序列分析中,矩估计是一种常用的模型参数初步估计方法。矩估计方法,尤其是低阶ARMA模型场合下的矩估计方法具有计算量小、估计思想简单直观,且不需要假设总体分布的特点。但是矩估计方法是一种比较粗糙的估计方法,它的估计精度一般较差,因此它常被用做极大似然估计和最小二乘估计迭代计算的初始值。
在极大似然准则下,认为样本来自使该样本出现概率最大的总体。因此未知参数的极大似然估计就是使得似然函数(即联合密度函数)达到最大的参数值。使用极大似然估计必须已知总体的分布函数。
极大似然估计充分应用了每一个观察值所提供的信息,因而它的估计精度高,同时还具有估计的一致性、渐近正态性和渐近有效性等许多优良的统计性质,是一种非常优良的参数估计方法。
在时间序列分析中,序列总体的分布通常是未知的。为了便于分析和计算,通常假设序列服从多元正态分布。
三、BL(p,q,P,Q)模型
自回归滑动平均模型(ARMA模型)的非线性推广模型之一就是BL模型。产生的残差信息在预测过程中能够被BL模型利用。模型结构、参数少和拟合能力强等特点常常是BL模型的优势方面,因而它是有现实应用价值的非线性时间序列模型。
BL(p,q,P,Q)模型的一般形式为:
其中,εt~IID(0,σ2);aj为自回归(AR)模型项的系数;bk为滑动平均(MA)模型项的系数;cjk为双线性项的系数:p,q,P,Q分别为这三项的阶数。显然,BL(p,q,0,0)是目前在时间序列中应用最广泛的自回归滑动平均模ARMA(P,Q)。BL模型的主要特点就是能够在ARMA模型的基础上进一步考虑了预测残差的过去值εt-k与系统数据的过去值xt-j之间的交互作用对当前值xt的影响,当xt固定时,BL模型就成为了关于εt-k的线性模型:同理,当εt-k固定时,BL模型就成为了关于xt-k的线性模型,因此BL模型成为双线性模型。可见,BL模型实质上就是ARMA模型的非线性推广形式。
四、BL(p,q,P,Q)模型相关研究现状
自回归滑动平均模型的非线性推广模型之一就是BL模型,因为BL模型本身就有简单的,并且可以准确的估计未来的残差,所以BL模型是较具对于线性时间序列模型,矩估计、极大似然估计和最小二乘估计是常用的线性估计方法,对于BL模型的参数估计,以前的学者已经做了很多的工作,现在主要的方法有以下三种:
SubbaRao(1981)对于BL时间序列模型利用Newton-Raphson方法进行参数估计,有很多优势可以体现在这里,例如,BL模型可以提供满意的结果通过公式的简单表示。但是运用这种方法不能确定是否收敛,或者不能确定是否是局部收敛还是完全收敛,所以用BL方法需要学者们亲自验证其收敛性。但是为了能够确保其收敛,我们提出以下估计方法。
反复残差法的提出对于BL模型是一种特别好用的参数估计方法,然而反复残差法是反复使用最小二乘法的前提下估计参数模型,所以计算程序多,过程复杂,不易操作。所以看出BL模型在某种程度上限制其发展和使用,为了能够优化BL模型,遗传算法由Holland(1975)提出。
一种基于生物进化过程的组合优化方法是遗传算法的核心,遗传算法是计算机和生物学科学的融合。物竞天择,适者生存是生命进化的真理,也是形成遗传算法的理论核心,即是从数据中选取最满足的方式组成新的团体满足子集的需要,通过这样可以优化BL理论模型。这样我们可以从遗传算法中弥补BL模型的弱点,实现高效便捷的新方法,同时也弥补了反复残差法的不足,不但可以估计参数,而且收敛可以得到局部最优解。
基于这一思想,可以利用遗传算法来优化BL模型,优化过程主要分为以下三步:
第一步,先用自相关分析技术确定BL模型的自回归项的阶数。
第二步是根据自回归项和建模经验确定BL模型的滑动平均项和双线性项。
最后一步就是利用遗传算法(G助优化BL模型参数
从以上BL模型归纳中可以发现,BL模型随着时代的发展而发展,不断满足人们经济、文化、社会的需要,并且未来的发展前景被世人看好。
[1]谭理想.双线性时间序列模型的Lasso方法定阶[D].南京大学,2012.
[2]安潇潇.ARMA相关模型及其应用[D].燕山大学,2008.
[3]贾民平,黄仁.双线性时间序列BL(n,m,p,l)模型的平稳性和可逆性[J].东南大学学报,1991,(05):81-87.
王泽祎(1993-),女,汉族,山东诸城人,经济学硕士在读,研究方向:保险精算与风险管理。