APP下载

中国股票市场行业组合风险研究

2017-04-19韩超严太华

重庆大学学报(社会科学版) 2017年2期

韩超 严太华

摘要:

股市是经济的晴雨表,股市中不同行业风险的组合计量对于金融市场和实体经济投资意义重大。文章采用高维动态C-Vine Copula前沿技术计量多维行业组合风险,并且与静态C-Vine Copula作比较。结论显示:高维动态C-Vine Copula计量的VaR每次都能通过UC检验和稳定性测试,而静态C-Vine Copula方法每次都不能通过回溯检验,表明高维动态C-Vine Copula优于静态C-Vine Copula,可以作为股市行业风险组合计量的一种新方法。

关键词:高维动态C-Vine Copula;GPD;组合风险计量;VaR

中图分类号:F830.91 文献标志码:A 文章编号:

10085831(2017)02004011

单一金融时间序列往往具有偏斜的尖峰厚尾特征;多维金融时间序列的联合分布不一定是椭圆分布。对于多维金融时间序列来说,其内部相关很可能不是线性的,传统的线性相关计量可能会导致错误结论。Sklar[1]引入的Copula函数能够较好地解决非线性、非对称相依计量问题,契合了多维金融时间序列的统计特征。自Embrechts[2]以来,Copula函数逐渐应用于金融研究领域,如Bouyé等[3]、Rockinger等[4]、Romano[5]、Embrechts等[6]、Rodriguez[7]、Ghorbel和Trabelsi[8]等。近期的文献表明:高维化和动态化是Copula理论研究的前沿动向。在Copula函数行之有效的多维化拓展中,Vine-Copula代表了典型研究方向,Vine-Copula借助于Pair-Copula-Construction(PCC)构造可以实现降维目的,使“维度诅咒”问题得以克服,而PCC构造使得降维后多元变量之间两两相依的Copula种类选择和参数拟合更为灵活。进一步赋予Vine-Copula参数以动态化,则产生高维动态Vine-Copula这一最新的研究方法,相关文献主要有So和Yeung[9]、Reboredo和Ugolini[10]、杜子平等[11]、曹洁和程希骏[12]等。在Vine Copula的研究文献中以C-Vine和D-Vine两种特殊的Regular Vine(R-Vine)类型最为常见,本文采用C-Vine Copula结构进行多元相依建模。

股市数据作为金融时间序列的重要组成部分,采用Copula函数对其相依性计量的文献也很多,如曹洁和程希骏[12]、Berger[13]、李强等[14]、Domino和Bachowicz [15]等。股市由各行业组成,各行业之间存在着复杂的作用机制,行业风险的组合计量方法可以扩展于测定股市整体风险,股市行业风险的研究为众多学者所关注,如刘琼芳和张宗益[15]、赵宁等[17]、张帮正和魏宇[18]、Righi和Ceretta[19]、Bartram和Wang[20]等采用Copula函数对股市行业风险进行了相依性研究。以往的股市行业风险研究方法,多数止步于传统多元Copula,或者仅用Vine Copula对数据进行拟合,运用仿真尤其是动态仿真进而进行风险组合计量的研究较少。针对这一研究现状,本文采用高维动态C-Vine Copula进行研究,边缘分布通过极值理论的GPD模型拟合,有效刻画金融时间序列的极值特征,C-Vine結构能够突出高维变量中主导变量的作用,以PCC模块突破“维度诅咒”,实现灵活的高维动态建模目的。研究过程中采用二阶段建模方法:第一阶段利用GJR-GARCH模型过滤原始序列,以GPD模型对过滤所得新息序列进行概率积分变换(PIT);第二阶段对PIT序列分别进行动态和静态的C-Vine Copula建模比较。之后,通过(动态)Vine结构的仿真技术计量四维行业组合风险,对于投资者组合风险控制与监管层多维风险监管具有一定的启示意义。举一反三,希望此方法还可以推广到更高维的甚至其他领域的研究之中。

一、理论基础

(一)Copula、Vine Copula与风险计量

相较于传统的建立在线性相关和正态分布基础上的研究方法而言,Copula函数能够把具有非正态分布特征和非线性相依关系的多维变量“连接”起来,Copula函数的这一优越特性满足了相互联系的多维世界的大数据数理分析要求,使其获得大范围的运用,尤其在多维风险组合计量方面颇有价值。Copula函数的多维化具有广阔的现实意义,传统的多元Copula却极不灵活,Vine Copula则可以实现降维目的,借助Pair Copula形式进行成对建模,赋予建模以模型种类和模型参数的灵活性,使多元Copula的计算大为简化、更为可行,具有多重优点。基于此,Vine Copula用作多维风险建模就有了现实意义,其利用Copula的连接属性把若干风险变量以特殊的Vine结构粘连起来,能够用来进行高维风险组合计量,这一用途逐步获得认可,逐渐应用到金融风险研究领域。

(二)Vine的类型与排序

在Vine Copula的研究文献中以C-Vine和D-Vine两种特殊的Regular Vine(R-Vine)类型最为常见,其中C-Vine可以用来组织存在关键变量风险因子之间的多维Copula函数关系,而D-Vine则主要用来对不存在关键变量的多元Copula函数进行描述,而介于C-Vine和D-Vine之间也有很多其他的Vine类型。在Vine的排列中,第一棵树的排列尤为重要,它决定了之后树的结点和边的构造。对于第一棵树,C-Vine需要将关键变量置于根部,其余变量按照与根部的紧密关系依次排列;D-Vine也面临着变量之间相关强度大小的问题,依据相关度大小排列成对变量,据以构成树形图,需要注意的是D-Vine中当一个变量被选择两次的时候,它不能在第一棵树上形成新的Pair Copula对。本文的着重点在C-Vine类型的排序上。

二、高维动态Vine Copula的构建

赋予Vine Copula的参数动态化,即可得到动态Vine Copula。动态Vine Copula在赋予Copula函数特殊结构的同时,也赋予了Vine的结点、边与Copula参数以动态化特征,是目前该学术领域的前沿研究方法。高维动态Vine Copula的构造根据Vine的类型不同而变化,高维动态Vine Copula的h函数的求解与数据仿真是一个难点,决定了该方法能否得以顺利应用。h函数提法引自Aas等[21]。本文采用t-Copula函数形式开展研究,其动态h函数如式(4)。

本文采用两阶段建模方法拟合Vine结构,第一阶段根据边际分布模型参数进行概率积分变换,得到PIT序列,第二阶段进行Vine结构的拟合。模型构建步骤如下。

(1)用GJR-GARCH-SKewT模型对多元收益率序列进行过滤,模型如式(1)所示:

继而以相应阈值和参数的GPD模型去刻画上下尾分布形态,以Epanechnikov核函数对数据中间区域进行平滑处理,得到较为满意的PIT(概率积分变换)序列。

(3)对PIT序列进行动态Pair Copula建模,求出相应的时变相关系数序列,对其求均值。这里采用的是Pair-t-Copula函数,模型表示为式(3),其中,

(4)比较高维PIT序列的两两相关系数均值,分析是否存在主导变量,以确定Vine的类型和关键变量,如果存在主导变量,则采用C-Vine。

(5)本文选择的是C-Vine结构,进而拟合边和节点的参数。其中,一棵树的边是下一棵树的节点,下一棵树的节点由上一棵树连接对应边的两节点拟合的(条件)Copula函数所对应的h函数求出。由此,不断迭代,直到求出所有树上的边和节点的对应参数。当然这里的Vine结构参数和h函数值都是动态数组,其中动态化的h函数表示为式(4)所示:

这里带有下标的ρij,t是时变的,其动态化演进服从式(5)所示的AR(1)过程:

三、高维动态Vine Copula的仿真

理论上,C-Vine Copula和D-Vine Copula的仿真算法形式是一样的,如式(6)所示:

分别表示独立的均匀分布元素和待仿真变量。由式(6),h逆函数对于Vine结构的倒推和数据仿真至关重要。对于动态Vine Copula,h逆函数是动态的。动态h逆函数的条件信息集存在多个变量,求解较为复杂,我们可以通过层层推导把条件变量一一剔除,求出最終解。本文采用C-Vine Copula结构开展研究,着重介绍C-Vine Copula的数据仿真方法。对于C-Vine来说,求解xit的推导过程如式(7),其中,xit表示要仿真的第i维变量,令w

但是,式(7)的嵌套表述是隐晦的、不直白的。接下来,为了表述方便,以静态的第四维xi求解为例,展示这一求解过程,如式(8),动态的思路是一致的,只不过参数是动态的。

对于高维动态C-Vine的数据仿真来说,其计算过程是动态化的,动态参数由相应的动态型h函数和时变Copula函数求得,动态参数服从式(5)中的动态演进式。为了更为直观地表达仿真计算过程,以x4t为例,画出C-Vine的动态仿真路径图1,其中,W4为w4t的集合向量,X4为x4t的集合向量。

当通过式(7)、式(8)和图1仿真出四维xit变量以后,对其按照两阶段建模法第一阶段的模型和参数进行返回倒推,即可仿真出高维动态相关收益率序列,本文的仿真次数以10 000次为1组。

四、VaR与回溯检验

VaR表示资产收益率序列在一定显著性水平下的分位数。求解VaR有历史模拟法、方差—协方差方法和蒙特卡罗模拟法等。本文基于对高维数据动态C-Vine-Copula结构的Pair Copula分解,如果通过复杂的多重积分表达式采用方差—协方差方法,理论上是可以求出显著性水平α下t时序的风险价值VaRt(α)的,然而这个方法在实际计算上不太可行。因此,本文借助Matlab编程实现蒙特卡罗模拟,按照拟合的高维动态C-Vine结构仿真多维数据,倒推出模拟收益率序列,每10 000个数据模拟实现之后,通过计算机按照相应的显著性水平自动选择位于数据排序左端的对应数据作为此10 000个数据组的1个VaR值,如此得出分别包含318个元素的VaR随机序列组,将其与样本外318个数据分别进行返回检验,观察比较高维动态与高维静态C-VineCopula的风险效果。VaR的回溯检验通过R语言编程实现,理论基础是Kupiec[22]的UC检验理论,进而验证模型的有效性。

五、数理分析

(一)数据预处理

本文对沪深300指数中的基建、银行、运输和地产四大行业指数从2006年1月4日到2014年4月30日的数据开展研究,研究对象为日间对数收益率rt=ln(Pt/Pt-1)100%,共2 018组数据。其中前1 700组四维数据用于模型拟合,后318组数据用来进行VaR的样本外返回检验。研究过程中借助R和Matlab语言编程实现。本文选择的四大行业具有典型特征:基建和地产是典型的资本密集型行业,是GDP投资乘数效应的主要因素,包含了政府直接投入和撬动的民间资本,运输是实体经济繁荣程度的典型代表,银行是实现货币乘数效应的典型中介,其造血和输血功能对经济繁荣起到催化作用。这四大行业之间不是孤立的,基建的风险和地产风险本身具有交叉重叠部分,基建的增长显然会为地产打造增值基础,地产的繁荣会创造税收,为基建形成资金来源,地产与基建的共同发展会创造就业、提高收入,借助于GDP的加速度效应为实体经济产生投资动能;同时地产与基建的投资增长也会对实体经济产生挤占效应,遏制实体经济投资增长;实体经济的兴衰会体现到运输行业上来,运输行业又会对基础建设产生需求变化,而银行以信贷收缩与扩张的形式为三大行业的兴衰产生顺周期的或者熨平周期的货币行为,在此过程中实现息差利润。如此,四大行业之间一定存在着某种复杂的关系,这四大典型行业的风险研究对于整个国家的经济风险具有指示意义。本文的研究数据取自国泰安数据库。表1为四维序列的统计量表,显见四维数据的尖峰厚尾性,Jarque-Bera统计量强烈拒绝正态性假定,数据分布具有左偏特性。

(二)平稳性检验

本文运用模型对数据进行过滤之前必须对数据进行平稳性检验,平稳性是金融时间序列建模和预测的前提,相应的单位根ADF检验结果如表2所示,可见四种金融时间序列均强烈拒绝了单位根存在的原假设,没有理由认为数据不是平稳时间序列。

(三)自相关检验与波动性聚类判别

为了更好地进行数据建模,进行数据特征分析很有必要。以基建和地产为例,如图1和图2所示,序列显示出轻微的自相关性和波动性聚类持久记忆特征。本文采用GJR-GARCH模型对数据进行处理,可以看到模型实现了预定效果。

(四)单个时间序列的模型提炼与数据过滤

由Glostern等[23]、Peiró[24]等文献可以知道,GARCH过滤金融时间序列后的标准化残差分布显著偏斜,再加上股指收益率序列的波动性聚类和对正负新息冲击的非对称性特征,因此,本文采用GJR-SkewTQUOTE模型对序列进行拟合。结合本文研究数据,四种对数收益率序列均为尖峰厚尾的偏态分布,具有平稳性,有轻微的序列相关性和偏斜特征,存在GARCH效应,同时对数据进行ARMA识别,发现均为0阶。故而,本文采用ARMA(0,0)-GJR-SkewTQUOTE模型对序列进行拟合,相应的数学表达式见式(1),其中λi,ηi分别表示SkewT分布的偏斜度和形状参数,拟合参数见表3 。

为了验证ARMA(0,0)-GJR-SkewTQUOTE模型的实际效果,本文对过滤所得的标准残差序列分别绘制自相关图4和波动性聚类图5,仍以基建和地产为例,从图形中我们可以看到自相关性有进一步的削弱,而波动性聚类则基本消除,可以认为模型设定初步达到了预定效果。

(五)广义帕累托分布(GPD)参数估计与拟合检验

金融序列尾分布的刻画对于Vine Copula求VaR的准确性极其重要,合适的尾分布拟合对于研究结论很关键。为了进一步准确刻画数据特征,本文对过滤的标准残差再进行GPD尾部拟合,相应的GPD拟合参数如表4所示,其中括号内的阈值为上尾阈值,其余GPD参数均为下尾参数。

然后,本文对过滤得到的标准化残差序列进行概率积分变换(PIT)。在PIT过程中,以相应阈值和参数的GPD模型去刻画上下尾分布状态,以Epanechnikov核函数对数据中间区域进行平滑处理,得到一个整体的序列特征分布组合(分布组合的拟合效果如图6所示,仍以基建和地產为例),进而以此对残差序列进行PIT,并进行K-S检验,结果显示四组PIT序列均不能拒绝服从U(0,1)分布的原假设,如表4右半部分所示。这也就为高维动态Vine-Copula建模做好了准备工作。

(六)高维动态C-VineCopula结构的Pair-Copula分解

在接下来的研究中,为简化起见,均选用t Copula函数进行研究分析。t Copula属于椭圆类Copula的一种,能够捕捉序列间的对称性和厚尾性特征。本文选用t Copula只是一个次优化选择,感兴趣的研究者完全可以把选择的视野放宽,追求更优拟合的Copula类型。尽管如此,我们仍然画出四维行业变量两两t-copula的概率图(7),显见两两关系的对称的厚尾形态,说明选择t Copula开展研究是较为合理的。

在进行动态化建模之前需要确定Vine的类型,将t Copula参数的动态过程设为式(5),定义ρ=1n·nt=1Rij,t作为归一化相关关系的测度指标,表5为四维变量动态归一化相关表。由表5,可以比较出基建在与其他变量的相关关系中处于强势地位,进而根据两两动态相关强度的大小可以依次排序为基建、运输、地产和银行。这一排序与我们的先验知识相符,基建的投资规模最为宏大,运输处于行业发展的纽带与指示地位,超过了地产排在第二位,而地产和银行则紧紧绑在了一起,说明地产的资本运作属性,银行为地产的信贷扩张所牵制。因此可以把基建确定为关键变量,这也就说明了Vine Copula的类型是C-Vine,根据强弱关系可以绘制出图8的C-Vine结构图,其中,数字1,2,3,4分别表示基建、地产、银行和运输四种行业指数收益率。

从参数表6可以看出,动态模型拟合效果较为理想,系数比较显著,在考虑到条件Copula的因素以后,自由度明显增大,对数似然绝对值明显减少,参数显著性有所下降,进一步说明了在以基建为条件变量时,地产和运输,银行和运输,地产和银行的相关性显著减弱,进而表明基建在四维变量联合分布中的主导作用。值得注意的是第一棵树上的参数拟合值αij与βij的和都很接近于1,说明动态因素在动态相关系数的决定中相当活跃,βij远大于αij,且参数估计很显著,说明动态相关的一阶滞后在动态相关的求解中起到了决定性作用;而第二、三棵树上的系数显著性较第一棵树明显降低,说明拟合参数值的波动域更宽,动态因素更强,也说明在第二、三棵树上以基建为条件变量时,动态参数的影响增大。根据四维C-Vine动态结构的具体参数,画出相应的两两动态相关图9,可以看出考虑到条件因素后的相关图波动更为剧烈,从某个方面说明基建变量在动态趋势中的支配作用。以上分析与我们的先验知识也是一致的,佐证了拟合结果的合理性。

(七)VaR的仿真与回溯检验

在确定了四维动态C-Vine Copula结构之后,按照该结构进行318×10000次的动态仿真,并且按照第二节中步骤(2)(1)的对应参数进行还原,模拟出包含318×10000个收益率仿真数据的数据集合,对于318次中每10 000次的仿真数据,通过计算机程序选择排序左端对应显著性水平的数值作为每10 000次仿真产生的一个VaR值,如此得到包含318个元素的VaR值序列组,然后运用318组样本外数据进行返回检验,并且与静态C-Vine的结果进行比较。

为了使研究更具有一般意义,随机选取两种组合比例分别为(25%,25%,25%,25%)与(10%,30%,20%,40%),所产生的对应的组合风险序列分别为VaR1和VaR2。

按照如上的方法進行仿真,求得1%,5%,10%三种显著性水平两种比例的VaR序列组VaR1和VaR2,与相应的样本外数据比较。以5%显著性水平VaR1的超越情形为例分别绘制动态和静态模型的超越图10-图11,比较发现,动态模型较之静态模型更能灵活捕捉变化的风险。最后运用Kupiec Test方法进行回溯检验,得到无条件覆盖(UC)检验结论,如表7所示。而表8则证明了动态C-Vine模型风险计算结果的稳定性。表7中可以看出,动态C-Vine模型每次都能通过回溯检验,而静态C-Vine每次都不能通过检验,尽管其稳定性较好,仍然认为动态C-Vine可以用于股市行业风险组合计量,静态C-Vine模型则不符合风险建模要求。

根据投资学理论,我们知道马科维茨投资组合有效集的最优边界即为有效前沿。结合上文,基于动态C-Vine Copula模型的VaR能够在相应的显著性水平下准确地捕捉到左尾极端风险事件,据此可以绘制出原始投资组合和动态C-VineCopula的资产组合有效前沿图12。图中与静态C-Vine Copula作比较,发现动态和静态C-Vine的资产有效前沿相较于原始投资组合均发生了形状改变。静态C-Vine由于模型设定问题,对于原始投资组合的风险倾向没有准确刻画,而动态C-Vine则完全摆脱了原始投资组合的轨迹,显示理性投资者因为更准确地捕捉到风险而表现出风险厌恶,资产组合有效前沿完全左移,投资者因此采取保守型投资策略,规避风险带来的损失。也进一步说明基于动态C-Vine Copula模型的风险计量对于投资者来说具有重要的现实意义。

七、研究结论与意义

本文运用两阶段建模方法开展研究:第一阶段采用ARMA-GJR-GARCH模型和GPD模型拟合实现PIT序列;第二阶段进行四维变量的动态C-Vine Copula建模。之后进行风险变量的仿真逆运算,并且与静态C-Vine Copula的风险效果作比较,进一步分析资产组合前沿曲线的移动情形。

本文研究得出如下结论:(1)动态C-Vine Copula模型可以用于股市行业组合风险计量,而静态C-Vine Copula模型则不满足行业组合风险计量要求;(2)动态C-Vine Copula模型的有效前沿摆脱了原始投资组合的轨迹完全左移,显示理性投资者因为更准确地捕捉到风险而表现出风险厌恶;而静态C-Vine由于模型设定问题,无法准确刻画资产组合有效前沿,相较于原始投资组合没有固定的风险偏好或者厌恶倾向。

本文的研究意义在于:(1)研究过程中首次将极值理论GPD模型与高维动态C-Vine Copula结合起来开展研究,并与相应的静态C-Vine Copula模型结论作比较;(2)研究结果为揭示多维行业风险之间的相依性提供了一种高效可行的方法,具有广阔的经济含义,可以借助高维动态C-Vine Copula方法进行有主导变量的多维风险组合计量,以此计量结果为依据进一步估算经济资本。结合当前的巴塞尔新资本协议的全面风险管理要求,该研究结论对于金融监管部门的多维行业风险监测与调控具有一定的借鉴价值。参考文献:

[1]SKLAR AFonctions de répartition à n dimention set leursmarges[J].Publication de IInstitut de Statistique de LUniversit-é de Paris,1959(8):229-231

[2]EMBRECHTS P,McNEIL A,STRAUMANN DCorrelation: Pitfalls and alternatives[J].Risk,1999,12(5):69-71

[3]BOUY E,DURRLEMAN V,NIKEGHBALI ACopulas for finance:A reading guide and some applications[R].Working Paper,Financial Econometrics Research Centre,City University Business School,2000

[4]ROCKINGER M,JONDEAU EConditional dependency of financial series:An application of copulas[R].Working paper,HEC School of Management, France,2001

[5]ROMANO CApplying copula function to risk management[R].Rome:University of Rome,2002

[6]EMBRECHTS P,Hing A,JURI AUsing copulae to bound the valueatrisk for functions of dependent risks[J].Finance and Stochastics,2003(7):145-167

[7]RODRIGUEZ J CMeasuring financial contagion:A copula approach[J].Journal of Empirical Finance,2007,14(3):401-423

[8]GHORBEL A,TRABELSI AOptimal dynamic hedging strategy with futures oil markets via FIEGARCH-EVT copula models[J].International Journal of Managerial and FinancialAccounting,2012,4(1):1-28

[9]SO K P,YEUNG Y TVinecopula GARCH model with dynamic conditional dependence[J].Computational Statistics and Data Analysis,2014,76:655-671

[10]REBOREDO J C,UGOLINI ADownside/upside price spillovers between precious metals:A vine copula approach[J].North American Journal of Economics and Finance,2015,34:84-102

[11]杜子平,閆鹏,张勇.基于“藤”结构的高维动态copula的构建[J].数学的实践与认识,2009,39(10):96-102.

[12]曹洁,程希骏.基于时变Paircopula的多资产投资组合VaR分析[J].中国科学技术大学学报,2011,41(12):1047-1051.

[13]BERGER T.Forecasting valueatrisk using time varying copulas and EVT return distributions[J].International Economics, 2013,133:93–106.

[14]李强,周孝华,张保帅.基于Copula的我国台湾和韩国股票市场相关性研究[J].管理工程学报,2014,28(2):100-107.

[15]DOMINO K,BACHOWICZ T.The use of copula functions for modeling the risk of investment in shares traded on the Warsaw stock exchanges[J].Physica A:Statistical Mechanics and its Applications, 2014,413:77-85.

[16]刘琼芳,张宗益.基于 Copula 房地产与金融行业的股票相关性研究[J].管理工程学报,2011,25(1):165-169.

[17]赵宁,Winston T Lin,孙雪卿.基于Copula贝叶斯估计的行业风险差异分析[J].数学的实践与认识,2015,45(10):17-27.

[18]张帮正,魏宇.基于 R_Vine Copula 方法的上证行业指数相关性研究[J].北京理工大学学报(社会科学 版),2015,17(3):100-108.

[19]RIGHI M B, CERETTA P S.Analyzing the dependence structure of various sectors in the Brazilian market:A Pair Copula Construction approach[J].Economic Modelling,2013,35:199-206.

[20]BARTRAM S M,WANG Y H.European financial market dependence:An industry analysis[J].Journal of Banking and Finance,2015,59:146-163.

[21]AAS K,CZADO C,FRIGESSI A,BAKKEN H.Paircopula constructions of multiple dependence[J].Insurance:Mathematics and Economics,2009,44(2):182-198.

[22]KUPIEC P.Techniques for verifying the accuracy of risk measurement models[J].Journal of Derivatives,1995(2):73-84.

[23]GLOSTENL R,JAGANNATHAN R,RUNKLE D E.On the relation between the expected value and the volatility of the nominal excess return on stocks[J].The Journal of Finance,1993,48(5):1779-1801.

[24]PEIR A.Skewness in financial returns[J].Journal of Banking and Finance,1999,23(6):847-862.