基于重现时间间隔分析的极端收益预测及交易策略研究
2020-06-23蒋志强周炜星
吴 婧, 蒋志强, 周炜星,
(1.华东理工大学理学院,上海 200237;2.华东理工大学商学院,上海 200237)
1 引言
随着经济全球化和金融工具的不断创新,金融市场取得了突飞猛进的发展,与此同时其不稳定性也显著增加,风险暴露日益明显。1997年后,陆续爆发的亚洲金融危机、次贷危机和欧债危机等金融危机,不仅给投资者造成巨大的损失,也严重地破坏了各国金融体系,甚至损害了实体经济。中国股市在2015年和2016年也经历了大起大落,并出现千股涨停、千股跌停和千股停牌等历史奇观,以及熔断机制引发的交易停牌等恐慌现象,这给我国金融监管当局带来了巨大的挑战。因此,如何有效地预测并防范潜在的风险,尤其是资产价格极端下跌所引发的金融风险,是社会各界都非常关注的热点问题[1]。
目前,许多研究基于早期预警模型(Early Warning Models)来预测金融风险,旨在确定引发金融危机的主要指标,用各种不同的方法或技术将这些指标转化为未来出现危机的风险概率,从而得到早期预警信号。现有研究表明,市净率[2]、全球流动性[3]和通货膨胀率[4]等不同的指标都有早期预警金融极端事件的能力。学者们运用LPPLS模型[5-6]、支持向量机[7-8]、神经网络[9]、信号法[10]和逻辑回归[11-12]等方法,在极端金融风险的预测中都取得了较好的效果。然而,这些方法却存在指标值样本较少、条件过于苛刻和过度学习等缺陷。
近年来,金融物理学基于重现时间间隔分析(Recurrence Interval Analysis)提出了更为简便的金融风险评估方法。重现时间间隔分析法只需要分析数据的内在规律,而不用考虑数据种类和任何相关性指标,比采用总收益或部分收益估计分布的传统方法更加准确[13]。Jiang等[14]采用重现时间间隔分析法建立了一种早期预警模型,通过预测中国股市大波动率重现的风险概率,证明该模型具有一定的预测有效性;最近,又使用道琼斯工业指数对极端收益率进行短期预测[15],在样本外检验中证明了其良好的预测能力。与已有研究相比,该模型只需要计算一个相应的分布参数,在实际应用中更加简便,但是目前还没有对中国股市的极端收益率进行样本外检验,也没有将这个模型的应用进一步拓展。
基于以上研究,本文拟采用重现时间间隔分析法对极端收益率进行预测,通过预测极端正收益和极端负收益的重现概率,分别构造看涨与看跌的交易策略,并对交易策略的结果进行统计性分析。本文选取了中国上证指数(SHCI)、法国CAC40指数、英国富时指数(FTSE)、香港恒生指数(HSI)和日本日经指数(N225)在内的5个股市的指数作为研究对象,进行较为全面的实证分析,因篇幅限制而论文列出了上证指数的模型测试结果。考虑到极端收益率多出现在重大的金融危机阶段,因此本文依据中国股市2001年、2008年和2015年所经历的金融危机,为上证指数确定了三个用于样本外预测的区间,具有重要的实践意义。交易策略的最终检验结果表明,该模型具有良好的预测能力,且对于具有买空卖空交易的证券市场的现实意义更加重大。
2 模型与方法
2.1 确定极端收益
在金融危机的实证研究中,很难确切地定义“危机”一词。各个领域对极端事件定义的方法有很多,在极值理论常见的POT(Peaks Over Threshold)模型[4,16-17]中,极端值一般定义为样本标准差的m倍,参数m是一个预先设定的值。本文采用相对阈值来确定极端值,设定最大或最小的某个百分比值为阈值rt,超过阈值rt的值被认为是极端值,该事件称为极端事件,即为概率分布中的小概率事件。这种定义方法不仅考虑了不同样本的差异性,避免了难以用同一标准进行比较的问题,而且计算非常简便。
2.2 确定风险概率
在只考虑极端值出现时间的情况下,我们使用风险概率W(Δt|t)来预测极端收益,即测量在t时间前出现极端收益后等待Δt时间会再次出现极端收益的概率。Sornette和Knopoff[18]以及Bogachev[19]等已经由极端事件的重现时间间隔分布,从理论上得到了风险概率W(Δt|t)的表达式:
(1)
其中,p(τ)是重现时间间隔的概率分布,只要我们得到p(τ)的分布形式,W(Δt|t)的公式就能立即由公式(1)得到。
内在过程的记忆性是决定重现时间间隔分布形式的关键因素,无记忆性过程的重现时间间隔分布一定呈指数型,例如泊松过程在Δt给定的情况下,可以得到连续型风险概率分布[19-21]。然而,金融过程总是呈现出非泊松特性,例如收益率具有多标度行为特征[22],波动率具有长程相关性和多重分形特性[22-23]。非泊松特性的主要结果是重现时间间隔不再服从指数分布形式,这使得重现时间间隔的分布形式在实证分析中产生了一定的分歧。在已发表的文章中,所使用的分布函数有拉伸指数分布、具有指数截断的幂律分布、q指数分布和Weibull分布等。这里,我们选择文献中使用较多的三种函数来拟合重现时间间隔的分布,这三种分布的公式列举如下:
拉伸指数分布:
psE(τ)=aexp[-(bτ)μ]
(2)
q指数分布:
(3)
Weibull分布:
(4)
通过把以上的三个概率分布公式(2-4)代入公式(1),我们分别得到以下的风险概率公式:
WsE(Δt|t)
(5)
(6)
(7)
其中,Γl(s,x)和Γμ(s,x)分别是低阶和高阶不完全Gamma函数。对于固定的Δt,这三种风险概率都随t的增大呈现下降的趋势,符合金融收益和波动率中极端值的聚集现象。
为了使用风险概率W(Δt|t)来预测极端值,我们也需要设定一个风险阈值wt做为下一个极端事件的早期预警指标,即当风险概率W(Δt|t)大于风险阈值wt时,在Δt时间后产生极端收益的预警信号。这个风险阈值wt并不是随便给定的值,而是基于投资者的风险偏好,通过平衡未警告率和错误警告率的优化得到。
2.3 分析预测信号
通过重现时间间隔分析得到极端收益预测模型后,本节采用一种信号分析法来分析模型的预测有效性。风险概率W(Δt|t)被转化为一个二元极端值预测,如果W(Δt|t)的值超过风险阈值wt,就令W(Δt|t)的值为1,否则为0。为了比较极端值的预测情况和实际情况,我们会观察到以下四种情形:(1)正确预测到极端收益出现;(2)正确预测到极端收益未出现;(3)极端收益出现而未发生预警;(4)未出现极端收益而错误预警。
以上四种情况出现的次数分别记为n11、n00、n01和n10,通过计算每一种结果出现的次数,能得到各项预测指标值。其中,本文只计算正确预测率D和错误预测率A,其定义分别为:
(8)
根据Gresnigt等的模型[24],我们采用KSS(Hanssen-Kuiper Skill Score)方法来评价极端值预测的有效性。KSS值定义为上述D与A的差值,该值结合了第(3)种和第(4)种情形中所出现的未预测到事件的比率和错误预测的比率,减少这两种错误率都能增加KSS值。
如果投资者在I型错误和II型错误之间有相对偏好,那么我们的信号评估方法能帮助投资者找到平衡,并且无论他们是否使用该预测信号,都具有一定的用处。根据Alessi和Detken[3]的文章,当给定一个风险概率阈值来进行极端值预测时,可以定义一个损失函数:
L(θ)=θ(1-D)+(1-θ)A
(9)
其中,1-D表示未预测到事件的比率(I型错误),A表示错误预测的比率(II型错误),参数θ表示投资者避免I型错误或II型错误的偏好程度[25]。
我们进一步定义极端值的预测有效值为:
U(θ)=min(θ,1-θ)-L(θ)
(10)
其中,min(θ,1-θ)表示忽略预测信号时投资者面临的损失。U(θ)测量了使用极端值预测模型比不使用模型时产生的更好的效果,如果U(θ)>0说明预测是有用的,意味着预测后的损失比不预测的损失要小。这里,预测有效值的定义没有考虑数据不平衡的潜在影响[26-27],即非极端事件的数量远远超过极端事件数量的影响。
给定了风险概率W(Δt|t),我们需要选择一个让有效值U(θ)最大化的风险阈值wt[27-29]。Christensen和Li[30]也通过最小化信噪比(D/A值)来优化阈值,这种对预测有效性的优化显然降低了I型错误和II型错误之间的边际替代率。然而,这种边际替代率在信噪比的优化中降低地并不明显,有时会导致对投资者的I型错误和II型错误不可接受。
2.4 估计分布参数
(11)
其中,Γ(x)表示Gamma函数。Podobnik[31]和Bogachev与Bunde等[13]指出,平均重现时间间隔和极端值的百分比之间存在一一对应关系:
(12)
其中,Q是用来定义极端值的分位数。需要注意的是,以上公式用于正极端值的计算,对于负极端值,我们可以取其相反数转为正数。Chicheportiche和Chakraborti[21]认为,无论潜在的过程是否存在相关性,平均重现时间间隔都是可用的。从期望的定义来看,平均重现时间间隔也可以表示为:
对于拉伸指数分布,我们有
(13)
通过联立方程(11)和(13),可以由μ和τQ分别表示出参数a和b:
(14)
这使得待估计的参数从三个减为一个,有效地提高了策略的计算效率。
对于q指数分布,我们得到τQ的均值为1/[λ(3-2q)],为了保证均值存在,q的值一定小于3/2。显然,参数λ可以由q和τQ表示如下:
(15)
对于Weibull分布,时间间隔τQ的期望可表示为βΓ(1+1/α),类似地,参数β可以由α和τQ表示:
(16)
显然地,如果我们用三个分布函数来拟合重现时间间隔,都分别只需要估计一个参数即可。这里,我们采用极大似然估计法(MLE)来估计分布参数。对数化的似然函数分别如下所示:
(17)
lnLqE
(18)
lnLw
(19)
其中,n表示重现时间间隔的次数。
2.5 交易策略
基于前文对极端正收益和极端负收益的重现进行预测之后,本文分别提出相应的看涨交易策略或看跌交易策略,以便进一步评估该预测模型的有效性。这种方法的基本思想是:当极端正收益大于样本内的正收益阈值时,发出买入信号,交易者看多,若极端正收益在Δt时间后再次出现的风险概率小于风险阈值,发出卖出信号,将买入的仓位平仓,此时记为看涨策略;当极端负收益小于样本内的负收益阈值时,发出卖出信号,交易者做空,若极端负收益在Δt时间后重现的风险概率小于风险阈值,发出买入信号,将卖出的仓位归还,并记为看跌策略。看涨策略和看跌策略的交易过程如图1所示。
图1 看涨策略(a)和看跌策略(b)的交易示意图
为了检验盈利的显著性,本文采用常见的t检验法。我们将买入至卖出阶段称为持有阶段,卖出至买入阶段称为空仓阶段,其对应的时间长度和日均收益率分别记为nh、ns和μh、μs,并且用Δμ表示买卖区间的日均收益率之差。当检验交易规则下的日均收益率(μh或μs)与整个样本期的日均收益率μ是否有显著性差异时,t检验的原假设为μh=μ或μs=μ,t检验统计量分别为:
(20)
(21)
其中,n为观测值的总数,σ2为整个样本内日均收益的方差。如果持有(空仓)阶段的日均收益率为正(负)值且与日均收益率μ有显著性差异,则说明交易策略有良好的盈利能力。
若检验持有阶段的日均收益率μh与空仓阶段的日均收益率μs是否有显著性差异,则t检验的原假设为μh=μs,t检验统计量:
(22)
若μh显著大于μs,则表明交易策略是有效的。
3 实证分析
3.1 数据与描述
本文选取上证指数为研究对象,考虑到中国股市1996年底开始有涨跌幅限制,因此以1997年1月2日至2016年12月31日间的日收盘价作为研究数据。在进行样本外检验时,依据中国股市2001年、2008年和2015年所经历的金融危机,确定了三个样本外区间,分别为2000-2002年、2006-2009年和2014-2016年,其对应区间在图2(a)中均用阴影部分表示。本文在计算指数收益率时采用对数差分法,计算方法如下:
r(t)=lnI(t)-lnI(t-1)
(23)
如图所示,图2(a)展示了上证指数的对数价格及其收益率。从图2(a)可以看出,指数在1997年以后总体呈上升趋势,在阴影部分均包含明显的趋势上升和趋势下跌的阶段,而其他部分以震荡为主。从收益率图看出,股指的对数收益率在局部时间段内会出现较大的波动幅度,而在其他时间段的波动幅度都相对较小,说明它具有波动集聚性。
图2 应用重现时间间隔分析法对上证指数的实证分析结果。(a)上证指数的对数价格和收益率图。(b-d)极端负收益的重现时间间隔在阈值分位数95%的概率分布图像:(b) A区间;(c) B区间;(d) C区间
3.2 重现时间间隔分析
为了测试极端收益预测模型的有效性,我们使用每个危机阶段之前的数据做为样本内数据来估计分布参数,再对样本外数据进行预测。在每个样本内区间,先使用阈值分位数确定极端值的阈值rt,再由rt得到相应的极端值。本文选取95%、97.5%和99%作为三个阈值分位数,对于每组极端值,计算其相邻极端值之间的间隔时间,即重现时间间隔。除此以外,还分别计算大于正收益阈值(rt>0)和小于负收益阈值(rt<0)的极端收益,因为收益的种类和特定的交易策略可能有潜在的联系,例如股市中只持有长线的投资者可能对极端负收益更敏感,反之亦然。
如表1所示,本文对上证指数在不同样本区间和不同阈值下的重现时间间隔进行了描述性统计分析。发现所有样本内数据的均值均明显比中位数大,偏度大于0且峰度大于3,说明重现时间间隔的分布具有尖峰胖尾特征,这与重现时间间隔服从拉伸指数分布或q指数分布的结论是一致的[32]。由公式(12)得出,三种阈值分位数Q下的平均重现时间间隔理论上应分别为20、40和100,但是实际情况下,由于第一个极端值出现之前总有时间未被计入重现时间间隔,所以均值往往更小。在进行自相关性检验时,当滞后阶数为1时,重现时间间隔的自相关系数都为正,而且部分结果在10%水平下显著;当滞后阶数为5时,自相关系数在数据较多的情况下也基本为正。这说明极端收益的重现时间间隔存在一定的正相关性,并不是独立和随机的,这符合重现时间间隔由DFA方法得出的长记忆性特征[17,33-34]。虽然相关系数并不大,但是这个结果是可以理解的,因为上证指数的样本数据相对较少,而且极端收益的重现时间间隔总是太长或者太短,所以自相关系数不会很大。
在每个样本内区间,分别用拉伸指数分布、q指数分布和Weibull分布来拟合重现时间间隔。当极端负收益的阈值分位数为95%时,三个样本内区间的重现时间间隔概率分布图像如图2(b-d)所示。为了更直观地进行比较,在图中用实线表示出三种分布下的最佳拟合分布,结果表明A区间内由拉伸指数分布拟合地最好,而当B区间和C区间内的样本数据增多时,q指数分布拟合的效果最好,这也反映在表2中对应的q指数分布具有最大的极大似然值上,与中国股市波动率的重现时间间隔分布是一致的[14]。因为其它条件下的概率分布曲线与图2(b-d)中的概率分布曲线相类似,所以本文未全部展示。
表1 重现时间间隔的描述性统计量
注:acf(1)和acf(5)分别表示滞后阶数为1和5时的自相关系数;其中,*、**和***分别表示10%、5%和1%的显著性水平。
如表2所示,本文计算了重现时间间隔在三种拟合分布以及不同阈值和不同收益下的估计参数,并采用极大似然法估计拟合的有效性,最大的极大似然值对应拟合效果最好的分布。除了A区间的样本内数据在极端负收益下都由拉伸指数分布拟合地最好以外,在其它样本区间,当阈值分位数Q逐渐增大时,重现时间间隔最好的拟合分布形式逐渐由q指数分布变成拉伸指数分布,这种分布的变化现象也存在于中国股市分钟波动率的重现时间间隔中[14]。当样本数据从A区间至C区间增多时,发现最好的拟合分布形式更多地变为q指数分布,这与Ludescher等[30]在极端损失的重现时间间隔研究中发现q指数分布拟合最好的结论是一致的。
除此之外,在表2的每个样本内区间,发现特定收益下的待估计参数和分位数阈值之间存在一定的单调趋势。例如,拉伸指数分布的参数μ和Weibull分布的参数α随着阈值分位数的增加而减少,q指数分布的参数q随着阈值分位数的增加而增加。由于上证指数的样本数据相对较少,这种趋势在有上百年历史的道琼斯工业指数的研究中更加明显[14]。该结果不仅否定了重现时间间隔存在标度行为,而且有效地证明了重现时间间隔分布和阈值分位数的相关性。与此同时,在同种收益的相同阈值分位数下,也发现不同区间的估计参数比较接近,说明重现时间隔分布只取决于分位数。
表2 重现时间间隔拟合拉伸指数分布、q指数分布和Weibull分布的估计参数和最大对数似然值
注:加粗表示三种分布下最大的对数似然值,表明对应的分布拟合程度最好。
为了将拟合的风险概率与实际风险概率进行比较,本文依据公式(1)计算实际风险函数Wemp,方法如下:
(24)
其中,分母#(τ>t)表示极端值的重现时间间隔大于t的数量,分子#(t<τ≤t+Δt)表示重现时间间隔在(t,t+Δt]范围内的数量。
如图3(a)所示,取Δt=1,作出阈值分位数95%下的极端负收益在1997-2013年间的重现时间间隔关于时间t的风险概率W(Δt|t)的图像。从风险概率图像可以看出,虽然三种分布对应的拟合曲线没有完全重合,但是它们和实际风险概率一样,都关于时间t呈现出下降趋势。这种趋势也出现在能源期货[33]、股指期货[34]和股票收益率[35]等之中,意味着下一个极端收益出现的概率随着时间t增长而降低。风险概率的这种特征体现了极端收益的聚集性和触发过程中潜在的相关性,可以由投资者的羊群行为和金融体系的内在不稳定性解释[24]。由于统计性较弱,实际风险概率呈现出较大的波动,但是对于给定的时间t值,由解析公式得到的风险概率仍然接近于实际风险概率,表明风险概率的解析公式能用于估计实际风险概率。因为其它条件下的风险概率图像与图3(a)中的风险概率图像相类似,所以本文未全部展示。
3.3 预测极端收益
为了预测金融市场在一段时间内是否会再次出现极端收益,本文基于风险概率和优化的风险阈值进行样本外预测。首先,根据样本内数据估计重现时间间隔的分布参数,从而得到风险概率W(Δt|t)的公式,再以风险概率做为早期预警指标,通过有效值U(θ)的最大化来确定优化的风险阈值wt。当风险概率W(Δt|t)大于风险阈值wt时,认为Δt时间后会再次发生极端事件,反之认为不会发生。
图3Δt=1时,极端负收益的重现时间间隔在C区间及阈值分位数95%下的预测图像。(a) 风险概率图像;(b) ROC曲线;(c) 预警示意图。
为了确定优化的风险阈值wt,需要在[0,1]内取遍尽可能多的w值,计算出对应的错误预测率A和正确预测率D,再通过最大的效用值U(θ)找到样本外预测所需的风险阈值wt。通过作D关于A的图像,得到预测评估中常用的受试者工作特征曲线(Receiver Operating Characteristic,ROC),ROC曲线可以用于评价二分类算法的性能。其中,对角线(y=x)表示随机猜测的结果,若ROC曲线在对角线的左上方,说明预测的准确性比随机分类更高,而且最靠近左上角的点对应错误最少的阈值。
如图3(b)所示,作出上证指数在第三次金融危机及阈值分位数95%下的样本内和样本外区间对极端负收益预测的ROC曲线。从图3(b)可看出,三种分布下的ROC曲线在样本内区间和样本外区间分别都近似落在同一曲线上,说明模型的预测结果与重现时间间隔拟合的分布形式无关。其次,所有的ROC曲线都在对角线的上方,表明样本内和样本外的预测效果都比未采取预测时的情况更好。除此之外,样本外的ROC曲线比样本内的ROC曲线更高,表明样本外的预测效果比样本内的检验效果更好。
为了更直观地描述风险预警信号的预测效果,本文以上证指数2014-2016年间极端负收益的预测为例,作出阈值分位数95%下的预警区间。如图3(c)所示,阴影部分表示预测指数会持续下跌的阶段,投资者应在该区间做空头寸。若采用此模型,在2015年和2016年的股灾中,该预警信号能有效地避开下跌阶段。
由于三种拟合分布所得的ROC曲线非常接近,所以后文只在q指数分布下估计极端收益预测模型的表现。其中,计算其四个重要的预测度量指标,分别为错误预测率A、正确预测率D、有效值U和KSS值。
如表3所示,预测的有效值U均为正值,这意味着当对未预测到事件发生和错误预测的偏好相同时,与不采用预测结果相比,我们的模型提供了统计性的收益。在有效值U为正的情况下,所有的KSS值也都大于0,而随机猜测时的KSS值为0,说明正确预测率大于错误预测率。其次,在C区间发现样本外区间的有效值U和KSS值均大于样本内的结果,说明此时样本外的预测效果比样本内更好,表明该预测模型有良好的预测能力。除此之外,当阈值分位数从95%逐渐增加到99%时,样本外的错误预测率A逐渐减小,表明越高的分位数产生越低的错误预测率,而正确预测率D并没有随分位数产生明显的变化趋势。当阈值分位数增大时,极端负收益在样本外区间的有效值U和KSS值也更大,表明高分位数下能更加准确地预测极端事件,这与道琼斯工业指数的预测结果是一致的[14]。本文的模型忽略重现时间间隔序列潜在的相关性结构,符合阈值分位数越大,极端值记忆性越弱和预测效果越好的现象。
3.4 交易策略
样本外检验结果表明,该模型在预测极端收益时具有一定的有效性和准确性。为了进一步评估该模型的预测能力,本节在不考虑交易成本的情况下,计算两种交易策略在不同阈值分位数下的收益,并对结果进行统计性检验。除了上证指数以外,还选取法国(CAC40)、英国(FTSE)、香港(HSI)和日本(N225)的四个股指为研究对象,由于没有涨跌幅限制,均以1990年至2016年间的日收盘价作为样本数据。在计算交易策略的过程中,为了有效地降低对历史数据的过度拟合,仍然采用样本外测试的方法。设定交易区间为2000年1月3日至2016年12月30日,先使用2000年以前的样本数据计算初始的分布参数,在交易区间内进行模拟时,每次交易结束后将结束前的样本外数据增加到样本内,再重新计算风险阈值和分布参数。
表3 极端收益预测模型的样本内与样本外检验
注:加粗表示样本外预测效果好于样本内效果。
表4为五个股指在看涨交易策略和看跌交易策略下的检验结果,第二列对应于阈值分位数Q,第三列和第四列分别为持有天数和空仓天数。每个指数在看涨策略下的持有天数都会随阈值分位数的增加而逐渐减少,在看跌策略下的空仓时间也会随阈值分位数增加而减少,这说明阈值分位数越大,得到的早期预警信号越少,故相应持有或空仓阶段的时间会越少。
表4 交易策略的检验结果
注:收益率μh,μs和Δμ已经乘以因子104,标准差σh和σs已经乘以因子102;加粗表示t检验结果显著,其中*、**和***分别表示10%、5%和1%的显著性水平;无风险利率为2002-2016年中国1年期国债收益率的平均值2.50%
持有阶段的日均收益率μh如第五列所示。从五个指数的结果看出,看涨交易策略下的日均收益率均为正值,并且与整个样本的日均收益率μ之间的差异都具有显著性,由于中国股市没有直接的做空机制,持有阶段的收益率表明看涨交易策略具有良好的盈利能力。在看跌策略的交易规则下,15个持有阶段的日均收益率中有11个为正值,只有上证指数在阈值分位数95%下的结果具有统计显著性,其它结果与整个样本内的日均收益率μ之间的差异均不具有显著性,说明看涨交易策略获得收益的能力比看跌交易策略更加稳定,而且当极端负收益再次出现的风险概率小于阈值时,指数可能继续下跌,只是没有出现极端值。
第六列列举了空仓阶段的日均收益率μs。由表中数据可知,五个股指在看涨交易策略和看跌交易策略下的日均收益率都为负值,并且15个样本条件下分别有14个和10个与整个样本的日均收益率μ的差异具有显著性,说明两种策略在卖出区间总是能有效地避开下跌阶段,具有良好的预警作用,并且看涨策略的效果更好。看涨交易策略的μs总是比看跌交易策略的μs更小,说明当极端正收益重现的风险概率小于阈值时,指数有下降的可能性,而当极端负收益出现以后,指数不一定会持续性下跌,可能在极端负收益重现的风险概率小于阈值之前,就已经反弹并超过买入的价格。除此之外,两种交易策略在空仓阶段的最小日均收益率均出现在上证指数及其阈值分位数为95%的情况下,说明上证指数的极端负收益可能比其它股指更具有聚集性,即极端负收益出现后,上证指数持续下跌的可能性更大。
持有阶段与空仓阶段的日均收益率之差Δμ如第七列所示,可以视为证券市场允许做空时的投资收益。看涨交易策略下的收益率之差均为正值,并且全部具有统计显著性,说明这种策略能产生一定的超额收益。在看跌交易策略中,有14个样本条件下的日均收益率之差为正值,然而只有4个在10%的水平下显著,表明看跌交易策略具有一定的盈利能力,但是看涨交易策略的盈利性更加显著。其次,当阈值分位数为95%时,上证指数在看涨策略和看跌策略下均得到最大的日均收益差0.005409和0.013161。从μh、μs和Δμ的显著性水平看出,对于具有买空卖空的证券市场,本文的交易策略具有预测市场趋势和赚取超额收益的能力。
持有阶段和空仓阶段日均收益率的标准差分别如第八列和第九列所示。在看涨交易策略下,持有阶段收益率的标准差都小于空仓阶段收益率的标准差,说明持有阶段的日均收益率更加稳定,极端正收益出现后对走势的预测也比较准确。在看跌交易策略下,15个样本条件下有10个表现为空仓阶段收益率的标准差更大,说明对极端负收益出现后的预测不太稳定。然而,当超额收益显著性为正时,持有阶段收益率的标准差都大于空仓阶段收益率的标准差,说明这时更高的收益会产生更大的波动。
交易策略的夏普比率SR和最大回测率MDR分别如第十列和第十一列所示。两种策略的夏普比率都接近于10,说明该策略承担单位风险得到的超额回报率较高,且看涨交易策略的夏普比率总是比看跌交易策略更高,说明看涨策略具有更好的盈利性。两种策略的最大回测率都在40%左右,说明持有期风险较高,看涨策略的最大回测率也总是大于看跌策略,这符合高风险、高收益的规律。
综合以上分析,看涨交易策略具有良好的盈利能力和预警能力,当市场没有做空机制时,恒生指数在阈值分位数99%下获得最高的日均收益,当市场允许做空时,上证指数在阈值分位数95%下获得最高的超额收益。看跌交易策略也具有良好的预警能力,但是盈利效果不如看涨交易策略,在不同的指数下盈利的稳定性也较差,最高的持有期收益和超额收益均在上证指数的阈值分位数为95%时获得。
4 结语
本文基于重现时间间隔分析法,以中国上证指数、法国CAC40指数、英国富时指数、香港恒生指数和日本日经指数为研究对象,对极端收益的重现时间间隔进行拟合,计算了不同分布函数下的估计参数和风险概率,比较了模型在样本内与样本外的预测效果。通过对极端收益的预测,分别提出对应于极端正收益和极端负收益的交易策略,并讨论了两种策略在不同指数和不同阈值分位数下的统计性检验结果。
研究结果表明,基于重现时间间隔分布所计算的风险概率与实际风险概率非常接近,预测模型在样本内与样本外均具有良好的预测效果,两种交易策略在实证中也具有良好的盈利能力和预警能力,而看涨交易策略的盈利性更加显著和更加稳定,说明投资者更倾向于指数上升。重现时间间隔分析法具有参数少和计算简便的优点,不仅不依赖于其他解释变量,而且适用范围广泛,对于股票、期货、基金和外汇等金融市场的预测和风险预警都可使用,同时也丰富了交易策略的方法。本课题在后期研究中考虑时间序列潜在的相关结构,可以进一步提高模型的预测能力和相应的盈利水平。