APP下载

Copula相依序列与Copula自回归模型探讨

2018-07-16李述山

统计与决策 2018年11期
关键词:相依参数估计时变

李述山

(山东科技大学 数学与系统科学学院,山东 青岛 266590)

0 引言

时间序列分析在自然科学、管理科学和社会、经济、金融等领域具有广泛应用,针对平稳时间序列,经典的线性模型是自回归滑动平均模型(ARMA),这些线性模型的最大优点是简单并且只要不多的参数就能很好地拟合平稳时间序列。但是这些模型只能部分地利用时间序列不同期间的线性相关性信息,而不能利用非线性相关性信息,也无法解释金融统计及一般经济学中观察到的“波动集聚性”、分布的“厚尾”等现象,不能刻画条件异方差性,为此恩格尔等发展了条件异方差类模型[1]以解释上述现象,然而,这些模型同样无法充分地利用时间序列中蕴含的非线性相关信息。

Copula理论[2,3]在非线性相依性分析[4]、金融风险管理[5-7]、资产组合优化[8,9]、非线性回归预测[10]等方面具有广泛的应用。本文通过对严平稳序列有限维分布族的相关结构的研究提出了Copula相依序列的概念,对Copula相依序列的性质进行了探讨,研究了Copula相依序列与严平稳序列之间的关系。针对Copula相依序列,以Copula与Pair-Copula为工具建立了一类新的非线性模型——Copula自回归模型,该模型能够更充分地利用序列中的非线性相关信息。探讨了模型的参数估计方法、相依阶数的确定方法,给出基于Copula自回归模型的点预测、区间预测方法以及时变风险估计方法。并以实际算例说明Copula自回归模型的有效性。

1 Copula相依序列及其性质

1.1 Copula相依序列的定义

首先由严平稳序列的定义及Copula理论可知引理1及引理2。

引理1:设{Xt,t∈N}为一严平稳序列,具有相同的一维分布密度 f(x)及一维分布函数F(x),则:

(1)对任意正整数m,存在唯一的m+1元Copula函数 Cm,1(相应的 Copula密度函数为 cm,1),使得 (Xt-m,Xt-m+1,···,Xt)的联合分布函数与联合密度函数不依赖于t,分别为:

(2)对 任 意 正 整 数 k<m ,Cm,1(1, ···1,u1,···,

(3)在 (Xt-m,···,Xt-1)=(x1,···,xm)条件下,Xt的条件密度函数不依赖于t,且为:

(4)在 (Xt-m,···,Xt-1)=(x1,···,xm)条件下,Xt-m-1的条件密度函数不依赖于t,且为:

引理2:设{Xt,t∈N}为一严平稳序列,具有相同的一维分布密度 f(x)及一维分布函数F(x),则:

(1)对任意正整数m及l,存在唯一的m+1元Copula函数 Cm,-l( cm,-l为相应的 Copula 密度函数)使得(Xt-m-l,Xt-m,Xt-m+1,···,Xt-1)的联合分布函数与联合密度函数不依赖于t,分别为:

(2)在 (Xt-m,···,Xt-1)=(x1,···,xm)条件下,Xt-m-l的条件密度函数不依赖于t,且为:

在时间序列的建模中,如何充分地利用时间序列以前(t-1及其以前)的信息对将来(t及以后)进行点预测、区间预测等统计推断是建立时间序列模型的关键,如果在已知Xt的若干个滞后期的取值信息的条件下,Xt与其他滞后期无关,那么,这些滞后期包含了所有滞后期中包含的关于Xt的信息,从而利用这些滞后期的信息可以对Xt进行优良的统计推断,为此本文提出如下Copula相依序列的概念。

定义1:设{Xt,t∈N}为一随机序列,具有相同的一维分布密度 f(x),若存在正整数k使得:

(1)对任意的 t>k,t∈N ,(Xt-k,Xt-k+1,···,Xt)具有相同的Copula函数;

(2)在 (Xt-k+1,···,Xt-1)已知条件下,Xt与 Xt-k不条件独立;

(3)对任意的 l>0,在 (Xt-k,···,Xt-1)已知条件下,Xt与Xt-k-l条件独立,

则称{Xt,t∈N}为 k 阶Copula相依序列(CDS(k)),正整数k称为相依阶数。所有k(k≥1)阶Copula相依序列统称为Copula相依序列(CDS)。

由定义1可以看出,若{Xt,t∈N}为 k阶Copula相依序列(CDS),则有:

(4)对任意的 t>k,t∈N ,(Xt-k,Xt-k+1,···,Xt)具有相同分布,且不依赖t;

(5)对任意的 l>0,在 (Xt-k,···,Xt-1)已知条件下,Xt与 (Xt-k-1,···,Xt-k-l)条件独立。

1.2 Copula相依序列的性质

由定义1、引理1、引理2及数学归纳法易知定理1及定理2。

定理1:若{Xt,t∈N}为严平稳随机序列,且满足定义1中的条件(2)及条件(3),则{Xt,t∈N}为 k阶Copula相依序列。

定理2 :{Xt,t∈N}为Copula相依序列,则{Xt,t∈N}为严平稳序列。

推论1:{Xt,t∈N}为Copula相依序列,引理1及引理2中的结论全部成立。

推论2 :{Xt,t∈N}为 k阶Copula相依序列,则对任意的l≥1,在 (Xt-k-l,···,Xt-k,···,Xt-1)=(y1,···,yl,x1,···,xk)条件下与 (Xt-k,···,Xt-1)=(x1,···,xk)条件下 Xt的条件密度函数相同且不依赖于 t,且为 gk,1(y|x1,x2,···,xk)。

推论3:{Xt,t∈N}为k阶Copula相依序列,且二阶矩存在,则在 (Xt-k,···,Xt-1)条件下 Xt的条件数学期望及条件方差分别为:

推论3表明,Copula相依序列可以刻画分布的条件异方差性。

1.3 相依阶数的确定

根据定义1,一个Copula相依序列为k阶Copula相依序列的充要条件为:在 (Xt-k+1,···,Xt-1)已知条件下,Xt与 Xt-k不条件独立,而对任意的 l>0 ,在 (Xt-k,···,Xt-1)已知条件下,Xt与Xt-k-l条件独立。要解决这一问题,首先要确定相应的联合分布及条件分布,为此根据Pair-Copula理论给出引理3。

引理3:{Xt,t∈N}为 k 阶Copula相依序列,具有相同的一维分布密度 f(x)及一维分布函数F(x),{xt,t∈N}为序列的一个实现,记分别为在条件下(Xi,Xj)的条件Copula密度函数与条件Copula分布函数条件下 Xi的条件分布函数,则对任意的t>k,t∈N 有:

(1)(Xt-k,Xt-k+1,···,Xt)的联合分布不依赖 t,具有相同的Pair-Copula分解

其中等式右端的xk+1=y。

(2)对任意的 t,在 (Xt-k,···,Xt-1)=(x1,···,xk)条件下,Xt的条件密度函数不依赖t,且为:

(3)对任意的 t,在 (Xt-k,···,Xt-1)=(x1,···,xk)条件下,Xt-k-l的条件密度函数不依赖t,且为:

其中等式右端的xk+1=y。

引理4:(Xt-k,···,Xt-1)已知条件下 Xt与 Xt-k-l条件独 立 的 充 要 条 件 为 Gk,1(Xt|Xt-k,···,Xt-1) 与Gk,-l(Xt-k-l|Xt-k,···,Xt-1) 独立。其中 Gk,1与 Gk,-l分别为 gk,1与 gk,-l相应的条件分布函数,可由条件Copula公式获得[3]。

因此阶数是否为k的检验问题可以转化为如下的假设H01与H02同时为真的检验问题:

H01∶ Gk-1,1(Xt|Xt-k+1, ···,Xt-1) 与 Gk-1,-1(Xt-k|Xt-k+1,···,Xt-1)不独立;

H02∶ Gk,1(Xt|Xt-k,···,Xt-1) 与 Gk,-l(Xt-k-l|Xt-k,···,Xt-1)独立,l≥1;

引理 5:设 (X,Y)为二维连续型随机变量,(xi,yi),i=1,2,···n 为样本观察值,记(yi-yj),则在原假设“H0∶ X与Y独立”成立时有:

由引理5,对于Copula相依序列{xt,t=1,2,···,T},针对假设 H01的检验问题 ,可 以以 (Gk-1,1(xt|xt-k+1,···,xt-1),Gk-1,-1(xt-k|xt-k+1,···,xt-1)),t=k+1,···,T 为样本对其 进 行 检 验 ,而 以 (Gk,1(Xt|Xt-k, ···,Xt-1),Gk,-l(Xt-k-l|Xt-k,···,Xt-1)),l≥1,t=k+l+1,···,T 为样本对假设 H02进行检验。

2 Copula自回归模型

2.1 Copula自回归模型的建立

设 {Xt,t∈N}为 k 阶 Copula相依序列(CDS(k)),{xt,t=1,2,···,T}是长度为 T 的时间,由定理2可知,在t-1及其以前的信息已知的条件下,xt仅与 xt-1···xt-k相关,而与 xt-k+1,xt-k+2···无关,因此,如果仅仅利用时间序列t-1及其以前的信息对序列t时刻的取值进行预测,那么通过建立以xt为因变量,以xt-1···xt-k为自变量的回归模型就可以达到最优预测,相应的回归函数:

其中 gk,1(xt|xt-k,xt-k+1,···,xt-1)由式(9)给出。

于是建立如下k阶自回归模型:

由于回归函数通过Copula理论获得,故称模型(13)为k阶Copula自回归模型(CAR(k)模型)。

2.2 参数估计

Copula自回归模型(13)包括两部分参数,一部分为相关结构参数,即Copula函数及条件Copula函数参数,另一部分为一维分布参数,因此,其参数估计可以借鉴Pair-Copula的参数估计方法,比如极大似然估计法、拟极大似然估计法、分步估计(IFM估计)、参数法以及半参数法等[1,2]。其中极大似然估计的似然函数为:

其中θ为式(2)涉及的所有参数组成的参数向量。

本文采用两步法。第一步估计边缘分布的参数;第二步确定相关的Copula参数,采用极大似然估计法,其似然函数为:

3 Copula自回归模型的应用

3.1 基于Copula自回归模型的点预测

由于点预测值为Copula自回归模型相应的回归函数,是分布 gk(xt|xt-k,xt-k+1,···,xt-1)的数学期望,因此可采用数值积分法或随机模拟法进行估计。本文借鉴文献[10]的思想建立下列不用产生随机数的随机模拟法。

由于 xi,i=1,2,···,T 可以视为随机变量 xt的样本,由大数定律知在t时刻序列的预测值Eh(Xt|xt-k,xt-k+1,···,xt-1)近似为:

3.2 基于Copula自回归模型的区间预测

同结论 1,以 h(xj|xt-k,xt-k+1,···,xt-1),j=1,2,···,T为样本,记mα2与m1-α/2分别为该组样本的α 2与1-α/2样本(下)分位数,则t(t>k)时刻变量均值的置信度为1-α的区间预测近似为式(17),可以作为t(t>k)时刻变量取值的置信度为1-α的近似置信区间。

3.3 基于Copula自回归模型的时变VaR估计

若序列{Xt,t=1,2,···,T}为 k 阶Copula相依序列,且在t时刻的值Xt表示某金融资产在t时刻的收益,则-Xt为对应的损失。可以以样本 h(xj|xt-k,xt-k+1,···,xt-1),j=1,2,···,T 的α(下)分位点mα作为t(t>k)时刻变量均值的置信度为1-α的单侧置信下限的估计,其负值-mα作为t(t>k)时刻置信水平1-α下的时变风险价值VaRt(1-α)的估计。即:

4 实例

4.1 样本选取

本例选取1996年1月2日至2016年6月15日共4955个交易日上证综指的每日收盘数据 pt,t=0,1,···,4954 ,以对数收益率序列 xt=lnpt-lnpt-1,t=1,2, ···,4954为研究对象。数据处理采用Matlab软件。

4.2 边际分布的确定与参数估计

首先,由ADF检验法易知序列为平稳序列。

其次,经计算序列的偏度与峰度分别为-0.0453及7.6851,因此边际分布为有偏的,且具有显著的尖峰厚尾特征。鉴于带位置参数及尺度参数的有偏t-分布与带位置参数及尺度参数的有偏广义误差分布都能在一定程度上刻画上述特征,因此本文采用这两种分布的混合分布来拟合边际分布。

采用EM算法进行估计得到:带位置参数及尺度参数的有偏t-分布、带位置参数及尺度参数的有偏广义误差分布的权重分别为0.5415与0.4585,两个分布的分布参数分别为(0.0001,0.0070,4.1132,0.9591),(0.0001,0.0041,1.2487)。(注:第1、2、4分量分别为位置参数、尺度参数及偏度系数,第3分量为t-分布的自由度或广义误差分布参数)

4.3 相依阶数的确定与Copula参数估计

4.3.1 Copula函数形式的确定

由于所涉及的变量间的非线性相关性较弱,而BB1 Copula[1]能够较好地刻画非对称的尾部相关性,因此本文统一选用独立Copula[1]与BB1 Copula[1]的混合Copula对涉及的Copula及条件Copula进行拟合。由于该混合Copula只能刻画正相关性,因此采用结论2进行转换,其参数估计采用EM算法。

结论2:CX,Y(u,v)=u-CX,-Y(u,1-v),其中CX,Y(u,v)与CX,-Y(u,v)分别为(X,Y)与(X,-Y)的Copula函数。4.3.2 相依阶数的确定及Copula参数估计

采用上文给出的方法,在检验水平0.05下,结合上文给出的参数估计方法确定相依阶数为k=12,同时得到式(9)所涉及混合Copula的权重及BB1 Copula中参数,结果列于表1(为方便递推,变量顺序为(12,11,10,9,8,7,6,5,4,3,2,1,13)。

表1 Copula参数估计表

4.4 点预测与区间预测

由于相依阶数为12,故建立12阶Copula自回归模型(CAR(12)),采用式(16)对序列在时刻13及以后的点预测值,图1给出了最后500个时刻点上预测值与实际值的散点图。为了显示点预测的效果,本文将点预测结果与12阶平稳自回归模型的点预测结果进行对比,比较指标为平均绝对误差与最大绝对误差,结果如表2所示。

图1 预测值与实际值的散点图

表2 基于Copula自回归模型与基于平稳自回归模型的点预测比较

由式(17)给出时刻13及以后的序列的置信度为95%区间估计与置信度为90%的区间估计,图2给出了最后500个时刻点上95%区间估计曲线及序列值散点的图形。

图2 95%置信区间曲线图及实际值的散点图

同样为了显示点预测的效果,将所得区间估计结果与12阶平稳自回归相应结果进行对比,比较指标为置信区间的平均长度与序列值落入置信区间的比例,比较结果列于表3。

表3 基于Copula自回归模型与基于平稳自回归模型的区间估计比较

从表2与表3可以看出,基于Copula自回归模型的点预测比平稳自回归模型的点预测效果好,表现在平均绝对误差小,最大绝对误差基本相当;区间预测比平稳自回归模型的区间预测显著优,表现在置信度90%的平均预测区间长度显著小,且预测区间包含实际值的频率更接近置信水平,而置信度95%的平均预测区间长度虽然稍大,但预测区间包含实际值的频率更接近置信水平。从图1与图2可以看出,基于Copula自回归模型的点预测与区间预测显示出了显著的时变性。

4.5 时变VaR的估计与检验

由式(18)分别给出置信水平分别为0.99、0.975、0.95及0.90的时变VaR的估计,散点图见下页图3。并采用Kupic检验法进行检验,表4列出了在4个置信水平下突破时变VaR的比率及Kupic检验统计量的值。

图3 99%、97,5%、95%、90%的时变VaR曲线及实际损失的散点图

表4 时变VaR估计及Kupic检验统计量值

从表4及图3可以看出,VaR估计具有显著的时变性,且在4种不同置信水平下的时变VaR估计的Kupic检验统计量值非常小,说明基于Copula自回归模型的时变VaR估计具有很高的准确性,显示了基于Copula自回归模型的时变VaR估计方法的有效性。

5 结论

(1)本文通过对严平稳序列及其相依性质的研究提出了Copula相依序列(CDS)的概念,探讨了Copula相依序列的部分性质以及与严平稳序列之间的关系;给出了Copula相依序列的条件分布,在此基础上,给出了Copula相依序列相依阶数的确定方法、条件均值及条件方差的表达式,说明了Copula相依序列具有一定的刻画条件异方差性的能力。

(2)基于Copula相依序列建立了非线性自回归模型——Copula自回归模型(CAR),给出了相应的参数估计方法。基于Copula自回归模型,给出了一种不用产生随机数的随机模拟点预测方法、区间预测方法以及时变VaR的估计方法。

(3)采用1996年1月4日至2016年6月15日共4954个对数收益率数据构成的序列建立了Copula自回归模型,进行了点预测、区间预测及时变VaR估计,实际计算结果说明了Copula自回归模型及相关方法是有效的。并且通过采用更适合的边际分布及更适合的混合Copula函数还可以提高预测及估计得精确度。

(4)Copula自回归模型是平稳时间序列的一种特殊的非线性模型,模型通过变量与其若干个滞后期变量间的相关结构确定,构造简单、直观;Copula自回归模型相比传统的时间序列模型(线性及非线性模型),具有严格的理论依据,以Copula相依序列为理论基础,能够充分利用相关信息;但Copula自回归模型需要较大的序列长度,且计算量大。

对于Copula自回归模型尚有一些值得探讨的问题:

(1)在理论上,任一个严平稳序列是否一定是一个Copula相依序列?或者是否任一严平稳序列可以由一个Copula相依序列进行近似?

(2)探索Copula相依序列相依阶数的简易判别方法;

(3)基于Copula回归模型与Copula自回归模型,解决其他问题,比如研究时间序列变量间的非线性因果关系等问题。

猜你喜欢

相依参数估计时变
基于新型DFrFT的LFM信号参数估计算法
一种GTD模型参数估计的改进2D-TLS-ESPRIT算法
相守相依
血肉相依
基于自适应参数估计的三轴磁传感器实时校正方法
基于时变Copula的股票市场相关性分析
基于时变Copula的股票市场相关性分析
浅谈死亡力函数的非参数估计方法
浅谈死亡力函数的非参数估计方法
非完整性约束的平面多智能体位置时变一致性控制