大数据时代下程序化交易研究现状及风险监测方案探讨
2015-12-23刘伟
刘伟
摘 要 近年来,大数据在各行业开始得到充分重视,以高频数据为基础的程序化交易不仅在海外市场蓬勃发展,在国内市场也悄然兴起,日益成为各方关注的热点。伴随着美国股市“闪电崩盘”、国内“816光大事件”等风险事件的发生,程序化交易的利弊也成为各方热议焦点。文章从程序化交易的数据基础、数据模型、风险管理出发,对国内外学术界关于程序化交易的理论和实证研究进行梳理,同时针对程序化交易引发的系统性风险提出了两种监测方案,以期为我国证券市场的程序化交易监管提供参考。
关键词 程序化交易;系统性风险;风险监管
[中图分类号]F222 [文献标识码]A [文章编号]1673-0461(2015)12-0065-04
一、引 言
近年来,在商业、金融及其他诸多领域,决策日益基于数据和分析而作出,而非基于经验和直觉,进而带来思维、生产和生活方式的巨大变革,由此开启了所谓的大数据时代。对于天然具有数据属性的资本市场来说,大数据能够为证券投资提供充分的信息技术支持。但同时,大数据滋生的新型证券生态对资本市场安全也带来了新的挑战。其中,程序化交易就是资本市场中基于大数据的一个典型范例。
所谓程序化交易(Program Trading),又称篮子交易(Basket Trading),是现代证券交易方式的重大创新,它是近年来证券交易市场结构变迁和技术创新的自然结果,也是证券交易市场竞争的必然产物。程序化交易的业绩回报在国内外均表现优异,但其交易过程中所引致的风险事件也层出不穷。2010年5月,道琼斯30种工业股票平均价格指数在20多分钟内暴跌约1000点,降幅达9%;2012年3月,美国第三大交易所BATS在首次公开募股阶段发生闪电崩盘;2013年8月,光大证券因系统设置缺陷导致天量错单,成为国内首例程序化交易风险事件。这些程序化交易中的焦点事件,势必引起金融监管部门的思考和关注。2010年9月,美国SEC正式提议禁止闪电交易;2012年9月,德国政府通过规范程序化交易的立法草案;同年10月,欧洲议会通过欧洲金融工具市场指令II草案;光大“8.16事件”也引起了我国监管部门的高度重视,对券商程序化交易系统的排查工作已经展开。考虑到程序化交易作为一种新型交易模式,在我国起步较晚,背后可能存在的风险尚未充分释放,一旦市场开放而监管没有同步,将会形成巨大的漏洞,建立起切合中国实际、跟踪市场走向的程序化交易风险监管方案,具有重要的意义。本文将立足于金融高频数据,对程序化交易的研究现状进行梳理,并针对如何防范程序化交易引发的系统性风险提出量化分析方案。
二、程序化交易研究现状
(一)程序化交易的数据基础研究
程序化交易往往建立在金融高频数据行情基础之上。研究金融高频数据,对于准确把握程序化交易意义重大。
Robert Wood(2000)是研究金融高频数据库创建领域的先驱,其成果阐述了日益增长的股市交易以及股票价格数据库对市场结构的影响[1]。考察我国金融高频数据库建设现状,专业金融资讯软件发展迅速,如万得(WIND)资讯数据库、锐思(RESSET)金融研究数据库等。同时,各大金融机构建立高频数据发布窗口,对专业数据库进行了补充和完善。
基于繁荣的金融衍生品市场和灵活的交易体制,国外在金融高频数据挖掘方面成果较成熟。结果表明,高频数据可用来比较不同交易系统(如NYSE公开叫价系统和NASDAQ计算机交易系统)在价格发现方面的有效性[2];还可用于研究某支特定股票买卖报价的动态性[3],相关研究如J.Hasbrouck(1999)、Zhang M.Y.等(2001);在一个指令驱动的股票市场(如中国台湾股市交易所),高频数据还可用于研究指令动态,Cho,D.等(2003)利用在中国台湾股市交易所中交易的340多只股票的5分钟收益率数据研究了设定日股价上下限的影响,并发现了向股价上限趋近磁效应的显著证据[4]。该方向也引起了国内学者的重视,朱建平(2011)在方法论框架下,将金融高频数据单独作为研究对象进行讨论,并对金融高频数据挖掘研究做了展望[5]。
(二)程序化交易的数据模型研究
随着金融数据挖掘工作的展开,如何建立数据模型,成为学术界关注的一个重要问题。现有金融高频数据模型大致可分为三类:
第一,价格变化模型。基于金融高频数据具有离散化和集中于“无变化”特征, Hauseman,Lo和Mackinlay(1992)提出了顺序概率值模型(Orderd probit model),将价格和波动的取值看作是价格本身、交易持续期、交易额、收益率的当期和延迟期的线性函数[6]; Rydberg和Shephard(2003)提出分解模型(Decomposition model),将价格波动分解为标志有无变动、变动方向和变动大小的随机变量的乘积[7]。国内学者对此也进行了探索,如郭名媛等(2008)借助正交ARFIMA模型对高频价格数据进行建模及应用推广[8]。
第二,持续期模型。该方向的发展相对成熟,Engel,Russell(1998)首次提出自回归条件持续期(Auto-regression conditional duration model, ACD)模型[9],后续研究改变白噪声的分布假定,提出了一系列扩展ACD模型如EACD、WACD、GACD,并将其广泛应用于各种高频数据建模。徐国祥等(2007)针对金融高频数据久期ACD模型的假定进行了统计检验[10]。
第三,价格波动和持续期二元模型。针对导致价格变化的交易,这类模型可同时描述价格变动和相应时间持续期的二元动态变化(Price change and duration model, PCD)。 McCulloch和Tsay(2001)将PCD模型扩展至分级结构框架,并基于IBM股票数据进行了实证研究[11]。国内对该类模型的研究尚不多见。endprint
(三)程序化交易的风险管理研究
多年来,金融市场风险管理一直是国内外学术界研究的焦点,但是针对程序化交易风险管理的研究成果尚不多见。国外已有文献大多利用金融高频数据特征,对现有风险管理方法进行拓展探讨。如Francis X. Diebold等(1999)针对外汇收益率的高频行情,对金融风险管理的多元密度预测方法进行评估和校准[12];Tim Bollerslev等(2003)利用高频数据对因子定价模型的系统性风险进行测度和建模[13];Andrea Beltratti等(2003)对马克—美元汇率的日间数据和日内高频数据的VaR值进行了比较[14]。在国内,彭实戈等(2006)以芝加哥商业交易所(CME)交易的S&P500期货及期权的历史高频数据为研究对象,建立 GRM风险度量模型[15];邵锡栋等(2009)使用中国股市日内高频数据计算出高频波动率UHFV,用于预测金融市场风险[16]。
综观国内外研究现状及发展动态,我们可以看到,国内程序化交易的现有研究成果,大多停留在策略制定和系统设计层面。随着程序化交易的发展,其风险集聚效应越发凸显,而国内相关监控体系尚未建立,如何防范程序化交易引发的系统性风险亟需解决。
三、程序化交易系统性风险监测方案
按照涉及的市场主体进行划分,资本市场风险分为系统性风险和非系统性风险。发生在投资者、经营机构等层面的风险事件属于非系统性风险,发生在交易所层面的风险事件即可称为系统性风险。本文重点研究程序化交易可能带来的系统性风险,我们选取两种典型风险监测指标加以介绍,同时给出实证分析结果,以期为程序化交易的系统性风险监管提供思路。
(一)同质化交易倾向
所谓同质化交易,是指市场中大量投资者按照相同或者类似的策略进行交易,从而在出现异常事件时放大市场波动,造成系统性风险。追溯同质化交易产生的起源,利用程序化交易进行的量化投资是其出现的重要原因。在国外,对冲基金行业通过数量化统计分析工具构建相应的数据模型、借助计算机科技手段进行程序化交易。由于作为程序化交易基础的数学模型大多类似,在市场波动时基于模型给出的操作建议往往趋同,而短期内积聚的大量类似交易可对市场造成巨大的冲击,这已被很多人认为是近年来历次股市异动的诱因之一。
Marcello Pericoli & Massimo Sbracia(2010)于2010年提出一种方法,他们以对冲基金行业为研究对象,利用各对冲基金的月度收益率数据,分析了该行业的同质化交易程度[17]。我们以采用程序化交易为主要交易方式的量化基金为研究对象,选取了资产规模超过5亿元的10支量化基金,考察了其自2013年1月至2014年3月的复权单位净值增长率数据,用其行业指标和股市指标建立回归模型,用回归分析残差列代表各量化基金个体投资策略所带来的收益增长,用残差列之间的Spearman秩相关系数代表各量化基金个体策略的同质化程度,用过程能力指数Cp监测相关系数序列进行过程,由此建立起同质化倾向增加的预警方法。
为了达到以上研究目标,需要将量化基金收益率进行线性回归,具体做法是,将各个量化基金收益率关于标准化的市场影响因素进行回归,然后取其回归残差进行相关分析,具体模型如下:
Ri,t=αi+βi'Xi,t+εi,t
其中,反映基金收益率的常用指标是净值增长率,考虑到分红再投资情况,此处Ri,t表示第i支量化基金在时间t时的复权单位净值增长率,即(区间尾日复权单位净值—区间首日的上一个交易日复权单位净值) / 区间首日上一个交易日复权单位净值*100%,;αi表示第i支量化基金的阿尔法指数;Xi,t表示在时间t影响第i支量化基金收益率的所有市场因素组成的向量;βi'表示影响因素的权重向量;εi,t表示回归残差,可解释为除市场影响因素之外由第i支量化基金的个体策略所带来的个体收益[18]。
实证分析结果表明,我国量化基金的个体交易策略相关系数整体处于较低水平,这说明我国量化基金同质化交易程度总体尚不严重,该现象也可能与量化基金整体资产规模偏小有关。但在个别月份,该相关系数有明显增加趋势,说明量化基金所采取的交易策略有趋同的倾向,极端事件仍有可能发生[18]。
(二)条件在险价值
美国纽约联邦储备银行的Adrian和Brunnermeier(2008)首次在金融机构系统性风险研究中提出条件在险价值(Conditional Value at Risk,CoVaR)指标,该指标可用于衡量单个机构对整个金融体系的风险溢出,从而便于监管部门识别出重点关注机构。其基本思想是利用VaR风险度量技术,对每个机构首先计算出其在正常经营条件下整个金融系统的VaR值,再计算其在经营困难条件下整个金融系统的VaR值,二者之差(ΔCoVaR)即为该机构对整个金融体系的系统性风险贡献程度[19]。
记Ri为金融机构i的某经济变量(如市场化总资产增长率),VaR 定义为Ri的q分位数(0 P(Rj≤CoVaR |Ri=VaR )=q,金融机构i对金融机构j的风险贡献可表示为: 将定义中金融机构j的经济变量Rj换成系统变量Rsystem,则金融系统的条件在险价值CoVaR 可表示为: P(Rsystem≤CoVaR |Ri=VaR )=q,金融机构对金融系统的风险贡献可表示为: 我们以基金公司发行的量化基金产品为研究对象,主要考察单只量化基金发生极端事件时量化基金市场的系统性风险变化情况(如某只量化基金砸盘,造成其他基金的重仓股股价跌停,进而引发基金市场整体净值下跌),同时将对各量化基金对基金市场的风险贡献进行排序,并对分析结果给予统计检验。 研究结果表明,自2013年1月以来,我国量化基金市场的系统性风险有增加趋势。由于量化基金投资方向趋同、投资行业集中且交易模式类似,在一定程度上存在着金融交易同质化倾向,故各基金对系统的风险溢出效应均较为显著,但各基金之间的系统性风险差异仅存在于个别基金之间,从整体来看差异并不显著。同时,基金的系统性风险溢出效应大小与基金本身风险大小并无明确的一致关系,主要还是与基金的投资规模及股权配置等特点有关[20] 。 四、结 论 近年来,程序化交易高速发展,其引发的一系列风险事件也引起了各方争议。本文讨论了两种程序化交易的系统性风险的衡量方法,为监测系统性风险提供思路。考虑到程序化交易在我国市场中的比重还不大,我们仅针对量化基金产品展开了实证研究,其中提到的方案可应用于更广泛的金融产品开展类似研究。随着国债期货、股指期权等新型金融产品的推出,各种成熟市场的组合及对冲交易策略也将逐步出现在国内市场,程序化交易将会迎来更大的操作空间,加之运用策略的金融机构可能在经验和风控等方面有所不足,这其间孕育的风险不容小觑。如何依托行业和学术界的风险度量理论,建立起切合中国实际、跟踪市场走向的程序化交易风险监管方案,将是我们长期探索的方向。