基于上证50股指期货日内高频统计套利策略的分析
2019-10-30栾春旭洪晨杏
栾春旭 雨 林 洪晨杏
(华东政法大学,上海 210062)
我国股指期货诞生于2010年,是由中国金融期货交易所(以下简称中金所)推出的沪深300股指期货合约。5年后,中金所又推出了上证50、中证500股指期货。这三大股指期货品种构成了我国股指期货市场的基本格局。一直以来,我国股指期货品种单一、不完善,发展缓慢,较国外同类产品有较大差距。股指期货有套期保值、价格发现、对冲现货市场等功能和作用。因此,股指期货的成长与成熟对整个金融市场的影响不言而喻。股指期货套利的基本思想就是认为市场中资产价格之间的错配是暂时的,并且认为这种错误定价会很快消失,价差会趋于合理区间,由此而获得利润。统计套利是其中重要的一种策略。
一、文献综述
国内外对统计套利的研究开展时间较长,对四种基本统计套利模式的研究均取得了一系列成果。
国外方面,自1990年起就陆续产生了对资本市场统计套利的相关研究。Vidyamurthy(2004)从统计套利的原始形式——配对交易角度进行了详细论述,同时强调协整关系在统计套利策略中的重要性。
国内方面,由于国内股指期货产品比国外同类产品晚很长时间,因此国内学者的研究主要集中在对国外股指期货的相关研究,以及对国内股指期货的仿真交易方面。韩广哲、陈守东(2007)借鉴协整方法,构建了统计套利模型对上证50成份股进行研究,发现存在稳定的长期均衡关系,表明了统计套利的可行性。刘华(2008)进一步对上证50ETF与沪深300股指期货之间的长期均衡关系进行研究,结果表明二者之间存在长期均衡关系,实证结果表明了统计套利策略的有效性。霍睿刚(2014)构建不同的投资组合,利用沪深300指数对期现与跨期套利两种交易策略加以实证,认为在中国股指期货市场这两种套利交易策略都具有可行性。
二、股指期货统计套利策略研究
(一)统计套利的定义
统计套利的基本思想是通过追踪投资品种过去一系列连续的价格序列,分析可能存在的规律,利用这些规律构建相对应的策略模型来作为将来一段时间内投资的依据与参考。因此,统计套利策略的重点就在于能够找到资本市场上长期趋势显著相关、价差趋于均衡的一组金融资产,通过寻找金融资产在短期内价差异常波动的机会,从而构建套利策略。统计套利策略主要有跨期套利、跨市套利、期现套利和跨品种套利等四种。
跨期套利指的是同一股指期货的不同到期日合约之间,由于各种难以预料的因素而产生较大价格差异,进而产生了金融资产价格的错配,此时可以通过买入被低估的合约、卖出被高估的合约的方式套取利润,直到其价差恢复正常区间的一种套利方法。
跨市套利指的是同一股指期货合约在不同交易所上市交易时,由于地域差异、时间差异、投资者差异等因素的存在和复合,总会使在各交易所上市的同一股指期货合约价格之间存在一定的差异。当价差偏离正常区间时,即可进行套利活动获得利润直到价差消失。
期现套利指的是期货市场与现货市场间的套利行为,其基本思想是:同一标的资产在两市场中价格表现应该趋于一致。当市场行情出现较大幅度波动,从而导致标的资产在两个市场价格走势相背离或价格趋势出现较大差异时,我们可以买入此时价值被低估的股指期货,卖出被高估的股指期货,当价差消失后,进行反向平仓,从而实现整个套利过程。但在实际套利过程中,由于不同交易所和地区对其上市的合约产品有不同的规定和限制,因此在现实中应用并不广泛。
跨品种套利的思想在于探寻不同品种的期货合约价格走势之间的内在关系,当产生破坏不同品种的期货合约价格协同性的行情时,通过对不同品种期货合约进行做多或做空操作,从而达到套利交易的目的。
S.Hogan等(2004)从数学方面指出,统计套利的前提是无初始成本,且融资来源为自由资金。在此情况下,用v(t)表示t时刻的累计收益,以无风险收益折现的现值为v(t)。当v(t)符合以下条件时,则称该投资为统计套利策略。
(1)v(0)=0
其中,第一个条件说明统计套利策略无初始投入,即无初始成本;第二个条件说明统计套利策略收益要求不能出现亏损;第三个条件说明该策略亏损概率尽可能小,经过较长一段时间尽可能接近于零;第四个条件说明在某一时点如果有亏损情况发生,则从此时往后的较长一段时间,收益v(t)波动率不会被无限放大。因此,统计套利并不是完全没有风险的。统计套利的确存在风险,有损失的可能性。
本文使用的是统计套利中的跨期套利策略。跨期套利的交易品种为同一标的的股指期货,只是它们之间的到期交割日互不相同。相同标的的股指期货有多个不同到期交割合约在同时进行交易。以沪深300股指期货为例,目前上市的有当月、下月以及随后两个季月的合约,共四张。但这四张合约的标的均为沪深300股指期货,具有同一性。同一标的的合约具有同质性、稳定性,因此,在市场行情不发生较大波动时,同一标的不同到期交割日合约价格走势具有趋同性。这些合约之间的价差会保持在一个较为平稳的区间内运行,不会发生较大波动。而当价差发生较大变化与波动时,则意味着市场预期出现分化与差异,此时有跨期套利的操作机会。但这种跨期套利并不是无风险的,从实际角度考虑,实际套利需要对不同到期交割日合约的历史价差进行统计分析,同时也需要对未来一段时间价差的实际区间、走势进行预测。跨期套利的风险来自于未来难以预料的行情可能会突破以往历史行情所计算出的价差区间。因此,在实际策略运行过程中,只有在实际价差与套利者预计价差区间、走势等保持基本一致时,才意味着套利活动成功,否则意味着套利交易的失败与亏损。但由于跨期套利所交易的标的——不同到期日交割的合约的标的是相同的,因此价差区间在大部分市场行情中总保持着稳定性,这意味着跨期套利风险是可控的,总体风险程度较小。
(二)协整检验
协整检验的概念由Engle 和Granger(1987)首先提出,二人指出,协整检验反映的是变量之间的长期均衡关系。协整关系指的是非平稳时间序列经过某种线性变化后,组合整体表现为平稳序列。这种组合表现出来的平稳序列可反映非平稳的经济变量之间的长期均衡关系。而对时间序列所做的平稳性检验,一般采用ADF单位根检验,而用EG两步检验法进行协整性检验。在协整检验完成之后,我们即可通过协整方程中的价差序列来搭建合适的策略模型。
协整检验的基本方法包括基于回归系数检验和基于回归残差检验两种。前者主要以Johansen检验为代表;后者有DF检验、ADF检验、EG检验等,以ADF检验和EG检验最为常用。通常EG检验法适用于两变量存在一个协整关系的情况,而Johansen检验则适用于多变量存在多个协整关系的情况。由于本文选取两个经济变量,因此下面仅对EG检验思想进行基本阐释。
Engle和Granger(1981)指出,EG检验核心是对回归方程中残差的检验。下面用两变量的回归方程进行阐述:
yt=k1xt+ut,t=1,2,…,T
(1)
(2)
Δyt=α0+α1(yt-1-k1xt-1)+β0Δxt+εt
(3)
(4)
再次用OLS法估计式(4)。
因此,若两变量存在协整关系,即长期均衡关系,则协整方程中的残差应表现为平稳序列。所以,EG检验法巧妙地将多变量间的协整检验转化为对回归方程残差序列的稳定性检验。这时,我们再借助ADF检验来完成对其平稳性的分析。
在实际运用中,通常将残差序列称为价差序列Spread,并将其进行去中心化处理,即:
Mspread=Spread-Mean(Spread)
进行去中心化处理的目的在于使Mspread均值为零,从而可以通过分析Mspread波动情况来更好地分析价差区间、设置相应的进出场信号和止损信号。
(三)交易信号的选取
交易信号设定的阈值并没有统一的标准。交易信号的阈值设定关系到何时进出场以及止损情况,直接影响到套利模型最终的盈利表现。关于交易信号的阈值问题,本文最后有做进一步探讨。Vidyamurthy G.(2004)指出,去中心化后的价差序列Mspread表现为白噪声过程。其根据标准差,将开始交易的信号设定为±0.75σ,结束交易的信号为价差序列标准差≤0.25σ,止损点根据经验做法设定为两倍标准差。
三、实证研究
(一)数据选取
本文数据选取上证50股指期货当月连续合约IH00和下月连续合约IH01进行统计套利,时间段为2018年12月17日至2018年12月21日。数据频率为1分钟高频数据,共1 328对数据。2015年“股灾”后,证监会加强了对股指期货交易条件的限制,使股指期货作用难以有效发挥。2018年12月3日,证监会宣布对股指期货交易松绑,大幅下调了交易保证金,引导股指期货恢复常态化交易,所以选取12月4日之后的交易数据能够更清晰有效地反映股指期货市场套利的实际效率。
(二)检验过程
首先,我们检验IH00和IH01的序列的平稳性。两序列在3个置信水平下都没有通过ADF检验。接下来,我们对原序列先一阶差分处理,对差分后的序列继续进行平稳性检验,相关结果如图1和图2所示。
图1 IH00序列的ADF单位根检验
图2 IH01序列的ADF单位根检验
由图1和图2可知,经一阶差分后,两序列在1%、5%、10%水平下均拒绝原假设,说明差分后序列是稳定的,并且通过了ADF检验。IH00序列和IH01序列都存在单位根,但经过一阶差分处理后,都变为一阶单整序列,表明它们之间存在协整关系。
接下来,我们使用EG检验法对IH00和IH01序列进行OLS回归,结果如图3所示。将OLS方程中的残差项继续进行平稳性检验,如图4所示。结果表明,原假设同样被拒绝,残差序列平稳,这证明两个序列之间存在协整关系。
图3 IH00和IH01的OLS回归
图4 残差序列的ADF检验
将方程变形后,我们最后可以得到价差序列Spread。将Spread去中心化之后即可得到Mspread序列,根据经验将进出场点设置为0.75σ,将止损点设置为2σ,如图5所示。
图5 日内1分钟的高频交易
(三)统计套利策略的实证
由方程参数可知,通过对价差序列的回归得到套利组合的比例为1∶0.998 99,即价差序列:Mspread=IH01-0.998 99IH00。考虑到合约实际交易情况,投资组合的比例等于1∶1,即卖出一手IH00合约同时买入1手IH01合约,或买入1手IH00合约同时卖出1手IH01合约。
综上所述,在参考经验做法与实际表现后,本文所搭建的套利策略规则如表1所示。
表1 股指期货套利策略交易规则
本文对历史真实交易行情回测结果表明,套利交易次数为70次,其中20次成功,50次被迫止损。最低成交保证金为合约金额的8%,成交手续费为0.01%。因此,完成套利的成本为0.02%,当交易行情冲破上下止损线时,进行止损了结的成本为0.01%。通过计算,交易成本为0.9%(20×0.02%+50×0.01%),剔除交易成本后,该股指期货高频套利投资组合期间收益率为1.5%。而同一时期内沪深300指数对应的收益率为-4.31%,因此,我们可以在股指期货交易中采取统计套利高频交易策略,以便更好地实现对冲风险以及锁定盈利的目的。
四、结论和政策建议
(一)结论
本文简要介绍了我国股指期货市场的发展状况、我国股指期货品种与功能,然后重点介绍了统计套利的概念、原理,协整检验的思想和过程,最后通过实证分析,检验了协整思想下高频交易套利策略在股指期货交易中的实际表现情况。
而基于协整的股指期货高频套利策略在实际运用中会存在四个不可忽视的问题,需要我们进一步加以思考。第一,模型具有一定的滞后性。由于高频套利模型根据历史数据进行协整检验与分析,所以随着时间、环境等因素的改变,模型的参数会出现或多或少的变化,因此这就需要我们不断根据实际情况,对模型参数做出实时调整和修改,不断完善模型。第二,关于交易信号临界值的选取问题。由于模型采取不同的临界值作为入场、出场以及止损操作的依据,会产生不同的盈亏效果,因此临界值指标的选取直接关系到股指期货高频套利策略的最终表现情况。第三,值得注意的是,统计套利存在一定的风险,并非无风险套利,同时由于股指期货交易本身对投资者有一定的门槛要求,所以要求投资者为风险偏好型,同时具有一定的资金能力。第四,文中研究的价差序列,其本身的动态波动率对合约未来趋势具有领先的预测作用。但对动态波动率的讨论已超出本文所研究的范围,还需在后续进一步研究分析。
(二)关于股指期货高频交易监管的建议
自股指期货产品问世至今的9年间,高频套利交易一直受到机构投资者的热烈追捧和深入研究。高频套利交易的影响力正在逐步显现。在法律方面,有关部门对股指期货高频套利交易的监管基本处于缺失状态。虽然证监会起草了《证券期货市场程序化交易管理办法(征求意见稿)》等一些部门规范,但整个高频交易方面仍存在法律法规缺失、监管不到位等情形。因此,针对目前我国监管现状,给出以下建议:
一是建立高频交易信息的登记与报备机制。对所有使用高频交易进行套利的机构和个人,要求其上报高频交易的程序相关信息和说明材料等。同时,由于高频交易的程序代码和信息包含了相关机构和自然人的技术知识成果,具有较大的商业价值和无形价值,因此监管部门应对上报的信息做好保密和安全工作。
二是加强对高频交易程序实际行为人的监管。一方面,要求实际行为人做好登记备案在册;另一方面,要加强对行为人的风险监管,无论对法人还是自然人投资者,都应进行最高资产负债率要求,从而杜绝高杠杆交易。
三是赋予监管机构展开调查的权力。这就既要求所有高频交易程序使用者依法登记备案,也要求监管机构能够依法行使法律赋予的权力,严格执法,加大对违法高频交易的处罚力度,同时也要求监管机构能够对扰乱市场秩序、开展不当竞争等行为进行及时调查和查处。
四是尝试建立跨市场监管平台和信息共享平台。由于金融衍生品众多、创新速度日新月异,股指期货套利方法众多,跨品种套利势必涉及不同市场相关金融产品交易行为。而目前监管主体单一,监管难以全面高效,因此建立跨市场监管平台和信息共享平台就势在必行。在提高股指期货监管效率的同时,提高监管的透明度,杜绝灰色执法、钓鱼执法,将重大金融风险扼杀于摇篮之中。
五是尝试建立负面清单制度。高频交易作为程序化交易的一员,对整个资产市场走向成熟、规范、高效具有重要意义。因此对待高频交易,我们不应加以扼制、束缚,而是应鼓励、支持、引导高频交易的发展。我们需要制定明确、统一的监管规则,减少监管真空,同时建立负面清单制度,对违法、扰乱市场交易行为、现阶段可能造成重要影响的交易行为列入负面清单,对负面清单之外的行为则不加限制。通过这种方式,来促进我国高频交易向健康、创新、正确的方向发展。