基于Copula模型的股市收益率与成交量的相关分析*
2013-09-12江松明昌春艳
江松明,王 沁,刘 曦,昌春艳
(西南交通大学数学学院,四川成都 610031)
基于Copula模型的股市收益率与成交量的相关分析*
江松明,王 沁,刘 曦,昌春艳
(西南交通大学数学学院,四川成都 610031)
建立了基于AR(1)-GARCH(1,1)的Gumbel Copula模型,并以此为基础刻画了中国房地产股市收益率与成交量之间的相关性.通过AIC信息准则进行拟合优度检验发现,Gumbel Copula函数模型能够更好地刻画收益率与成交量之间的相关结构,收益率与成交量之间存在上尾高的非对称相关,以及很弱的正相关的特征.
Copula函数;收益率;成交量;相关性
近些年来,有市场“晴雨表”之称的股市逐渐成为人们关注的焦点.在股票市场迅速发展的同时,学术界和投资界对中国股票市场的理论和实践研究也在不断地深化.价格是股市讨论的核心问题,其中股市的风险问题也是围绕股价来展开的.
但是在现实证券市场交易中,成交量一直是一个不可忽略的变量,它代表股市在一段时间内多空双方力量的对比和对后市信心的强弱表现.等到证券分析技术性指标的出现,如MACD,KDJ,RSI等,它们在实际上的应用,其最为基本的就是结合了量价关系,在量价关系不正常时会出现背离,应用技术指标就可判断出相应的买点或者是卖点.Clark[1]根据信息流理论提出混合分布假说(MDH,Mixture Distribution Hypothesis),认为收益率和成交量是由一组潜在的、不可观测的信息流变量共同决定的,其中价格与成交量的波动由信息流的冲击产生.Wang J[2]通过分析信息不对称建立模型,利用该模型分析了量价之间的动态关系,结果显示成交量可以提供关于未来预测收益的信息,还检验了成交量是如何与信息流入市场相关联的.Terry A Marsh等[3]基于GARCH-M模型对7个国际证券市场的量价关系进行了实证研究,发现在绝大多数市场中,成交量都能解释为相当数量的条件回报方差.Embrechts P等[4]运用Copula函数对股市的相关结构进行了分析.关静[5]、夏天[6]、易文德[7]等学者也对股市中量价关系作了研究.
由于中国股市才成立短短20年的时间,股市容易受到外部环境因素和国家宏观政策调控的影响,因此股市中价格与成交量的关系是复杂且非线性的,任何错误或者不适的模型或者研究方法都会导致严重失真,引发投资决策出现重大错误;所以,需要较为准确地刻画它们之间的关系,才有利于金融序列的风险分析和投资决策.
笔者在前人对收益率与成交量的相关关系的研究的基础上,应用Gumbel函数[8]建立Copula模型研究收益率与成交量的相关关系和相依结构,并对结果及其现象进行了分析.
1 Copula模型与研究方法
在构建金融模型时,可以将Copula函数随机变量的边缘分布和它们之间的相关结构分开来研究,而且其中边缘分布的选择不受限制.经过众多的研究表明,金融序列多数为高峰厚尾性,与正态分布的假设不吻合,并且当股市出现较大波动时,线性的相关系数无法准确反映出价格曲线以及成交量的尾部特性.而阿基米德Copula函数具有对称性和结合性,含有适合牛市与熊市相关性的刻画的各种类型Copula模型,所以在收益率与成交量相关关系的研究中得到广泛应用.
1.1 阿基米德Copula函数(Archimedean Copula)
阿基米德Copula函数[9]的具体表达式为
Gumbel Copula函数的分布函数和密度函数分别为
参数θ与尾部系数有如下对应关系:
Gumbel Copula的密度函数具有非对称性,其密度函数分布图呈“J”字型,即为上尾高、下尾低的形状,因此它对变量在分布上尾处的变化非常敏感,可用于描述具有上尾相关特性的金融市场之间的相关关系.例如股票市场的收益率序列为正的极值时,股票中的各种变量之间会呈现更高的相关性.
1.2 Copula模型参数的估计
模型的参数估计[10]是进行统计分析的重要过程,Copula函数的参数估计方法分别为参数估计方法和非参数估计方法.在这里选择的是2阶段极大似然估计法.
对于时间序列{Rt}与{Qt},t=1,...,T,令它们的边缘分布分别为Ut(rt;φ)和Vt(qt;γ),则Copula函数为Ct(Ut(rt;φ),Vt(qt;γ);θ),其中φ,γ,θ分别表示相应的参数,那么采用2阶段极大似然估计法可以将Copula模型的参数估计分为2个步骤[9]:
首先根据(1)(2)式估计出其边缘分布的参数φ与γ,然后将估计值和带入Copula函数中((3)式),利用极大似然估计,来估计Copula函数中参数θ的值.
2 实证
2.1 数据及统计描述
选择2007年1月4日至2012年6月4日的地产指数(DC)作为研究对象.股票的每日收盘价为Pt,将收益率定义为Rt=100×(ln Pt-ln Pt-1),t=1,2,...,T,每日成交量为volt,对数变化率为Qt=ln volt-ln volt-1.
表1 房地产股市的收益率与成交量变化率的统计分析
从表1可以看到,该房地产股市的收益率序列和成交量变化率序列都存在偏斜与尖峰的特征.由它们的均值和标准差可知,成交量的变化率波动要大一些.收益率序列的偏斜为负,说明有明显的负拖尾现象,负极值比正极值占主导地位;而相反地,在成交量变化率序列中,偏斜为正,说明正极值比负极值占主导地位.收益率序列与成交量变化率序列的峰度都大于3,有较明显的厚尾特征,而且收益率的尾部比成交量变化率的更厚.再从各序列的JB统计值得知各序列都不服从正态分布.最后从ADF检验值得知,它们都是平稳时间序列.
2.2 边缘建模
在金融市场中,波动是其重要的特征.金融的时间序列的波动多呈现时变、聚类等特性.通过对序列{Rt}与{Qt}进行序列相关性检验和ARCH效应检验,发现{Rt}没有明显的序列相关性,而序列{Qt}有较强的序列相关性,并且它们都存在异方差性.图1和图2分别为收益率与成交量的折线图,从图可知,收益率与成交量具有明显的波动聚集性.为此消除以上的影响,应用GARCH模型来描述序列{Rt}与{Qt}的条件边缘分布.
图1 收益率折线
图2 成交量折线
对序列{Rt}建立如下AR(1)-GARCH(1,1)模型:
其中et分别服从正态分布、t分布、广义误差分布(GED).
AR(1)-GARCH(1,1)模型在不同分布下的参数估计值如表2所示.
综合来看,虽然它们都能捕捉股市收益率的波动特征,但存在差异,当扰动项服从t分布时,能更好地刻画股市收益率的波动.
表2 收益率AR(1)-GARCH(1,1)模型在不同分布下的参数估计值
对序列{Qt}建立如下ARMA(2,1)-GARCH(1,1):
其中et分别服从正态分布、t分布、广义误差分布(GED).
表3给出成交量基于ARMA(2,1)-GARCH(1,1)建立的模型在不同分布下的参数值.同样,它们都捕捉到股市成交量的波动,但是也存在差异,当扰动项服从t分布时,能更好地刻画股市成交量的波动.
2.3 模型的参数估计及分析
收益率序列与成交量对数变化率序列分别用GARCH模型来刻画,将收益率与成交量对数变化率的GARCH模型的残差用概率积分变换成均匀分布,图3为转化成均匀分布后的散点图.
从图3可以看出,散点大致集中于主对角线与副对角线上,反映出收益率与成交量对数变化率的相关结构存在复杂的关系,即收益率的上涨可能会引起成交量的增加或减少,收益率的下跌也可能引起成交量的增加或减少.2个序列同时取极大值的概率比较大.当股市处于牛市时,收益率与成交量相关性加强.从Copula函数的特性来看,Gumbel Copula的函数形式对上尾相关性敏感,它对数据的拟合程度较好,可以更直观地看出收益率与成交量的非对称结构.
用Gumbel Copula模型来刻画数据之间的关系,用极大似然估计方法对其进行估计,结果列于表4.从表4可以看出,Gumbel Copula函数参数值与上尾相关系数较大,说明地产指数的收益率与成交量之间存在上尾高且非对称相关现象.而它们的Kendall秩相关系数较小,表明收益率序列与成交量对数变化率序列的相关性不是太强.图4示出地产指数股票的Copula函数模型的密度分布图.从图4可以清晰直观地观察它们的收益率与成交量对数变化率的相关结构.
表4 Gumbel Copula模型参数估计值
图3 股市收益率与成交量对数变化率的散点图
图4 地产指数股市的收益率、成交量对数变化率与Gumbel Copula模型的密度函数
2.4 模型的拟合优度检验
文中用Akaike’s Information Criterion(AIC)来确定拟合程度.通过与Gumbel Copula,Clayton Copula,Frank Copula之间的比较,发现Gumbel Copula能更好地刻画收益率与成交量之间的相关关系.各个模型的AIC值见表5,它们之间的AIC值相差比较大,是因为Clayton Copula的密度函数也成非对称性,但是与Gumbel Copula函数相反,呈现“L”型,对下尾处的变化十分敏感;而Frank Copula的密度分布是对称的,尾部都是渐进独立的.
表5 各个模型的AIC值
3 结果与讨论
对地产指数的收益率和成交量对数变化率的相关关系的实证研究表明,它们之间呈上尾高的非对称相关及较弱的正相关性,比如Gumbel Copula函数的Kendall的秩相关系数的值很小.因为在数据的选取上存在局限性,所以会导致这种情况.例如在现实股市中价格的上涨既可能拉升成交量,也可能导致成交量的减少,那么量价之间的相关程度就会相互抵消,并且股市中的个股的每日成交量是线性正向叠加的,这也是导致相关程度较弱的原因之一.
总体来说,政策因素是价格与成交量产生波动的原因之一,就地产指数而言,2007年央行与银监会联合发布“二套房”新策,经过1年的观望后,房价开始大涨,而2008年的下半年金融危机、2009年与2011年大力度的房价调控政策,使得房地产股市价格大大下跌与成交量明显缩减.信息也会对价格与成交量产生正面或者负面的影响.收益率与成交量对数变化率之间的呈上尾高的非对称现象,其原因为:在某种极端情况下,一般股市因为价格上涨而导致成交量增大的概率要大于价格下跌而导致成交量减少的概率.作为股市中的参与者多空双方,其双方力量对比也是影响因素之一.当多方力量大,致使价格上涨和成交量增加;反之,空方力量占主导地位时,致使价格下跌而成交量也会增加.但是,当多空双方在均衡点时,总的来说有2类情况:第一,投资者交易参与意愿不强烈并且其对股票价格的估计与预期在同一方向时,股票价格会发生波动而成交量变得稀少;第二,当投资者参与交易的意愿很强且同时对股票价值的平均预期没有发生任何变化时,就致使价格不会发生波动而成交量变大很多.所以,收益率与成交量对数变化率之间的相关关系相当复杂,股市中的投资者“追涨”的现象较“杀跌”现象更为普遍.当股市处于牛市时,投资者的交易行为更为频繁活跃.
4 结语
在Gumbel Copula模型的刻画下,对中国房地产股市中收益率与成交量相关关系及相关结构的问题进行初步的探讨.收益率序列与成交量对数变化率序列都呈现尖峰厚尾的特征,构建Gumbel Copula模型后,用极大似然估计法,对它们的相关结构及关系进行估计.结果表明,它们之间的相关关系较为复杂,并且存在上尾高的非对称关系.对于动态的相关结构和市场的微观结构在文中尚未涉及,如何研究价量之间的动态关系等问题还需要进一步的探讨.
[1] CLARK P.A Subordinated Stochastic Process Model with Finite Variance for Speculative Prices[J].Econometrica,1973,41:135-155.
[2] WANG J.A Model of Competitive Stoek Trading Volume[J].Journal of Politcal Economy,1994,102(1):127-168.
[3] TERRY A MASH,NIKLAS WAGNER.Return-Volume Dependence and Extremes in International Equity Markets[D].Hass School of Business,UC Berkeley,May 2000,Working Ppaper RPF-293.
[4] EMBRECHTS P,LINDSKOG F,MCNEIL A L.Modeling Dependence with Copulas and Applications to Risk Management[C].ETH,Preprint,2001.
[5] 关 静,史道济.沪深股市风险的相关性分析[J].统计研究,2003,20(10):45-47.
[6] 夏 天.基于CARR模型的交易量与股价波动性动态关系的研究[J].数理统计与管理,2007,26(5):887-895.
[7] 易文德.基于Copula函数模型的股市交易量与股价相依关系[J].系统工程,2010,28(10):36-41.
[8] NELSEN R.An Introduction to Copulas[M].New York:Springer,1999.
[9] 韦艳华,张世英.Copula理论及其在金融分析上的应用[M].北京:清华大学出版社,2008.
[10] MBERTO CHERUBINI ELISA LUCIANO,WALTER VECCHIATO.Copula Methods in Fianace[M].Chichester:John Wiley &Sons,Ltd.,2004.
(责任编辑 向阳洁)
Dependence Relationship Between the Returns and Volume of Stock Based on the Copula Model
JIANG Song-ming,WANG Qin,LIU Xi,CHANG Chun-yan
(College of Mathematics,Southwest Jiaotong University,Chengdu 610031,China)
This paper establishes Gumbel Copula model based on AR(1)-GARCH(1,1),and then portrays the correlation between the real estate of return and volumes through Gumbel Copula model.By AIC information criterion for testing goodness it is found that the Gumbel Copula is better to describe the dependence structure between the price return and volumes.Results show that there is an asymmetrical dependence of higher upper tail between them,but the positive dependence is not strong.
Copula;returns;trade volume;correlation
F224;F830.91
A
10.3969/j.issn.1007-2985.2013.04.007
1007-2985(2013)04-0026-05
2013-01-22
2009教育部人文社会科学研究项目(09YJCZH104);西南交通大学“希望之星”资助;中央高校基本科研业务费专项资金资助(SWJTU12ZT14)
江松明(1987-),男,四川绵竹人,硕士生,主要从事金融时间序列分析研究.