适用于A股市场的高频交易算法
2016-03-24吴迪
作者简介:吴迪(1990-),男,汉族,湖北武汉市人,工学硕士研究生在读,贵州大学管理学院管理科学与工程专业,研究方向:金融工程。
摘要:高频交易算法是利用计算机实现短期的量化投资策略,通常用于股票,期货和一些电子交易,需要设计一个适应性很强的交易算法。由算法的技术指标要求,本文以移动平均数、相对强弱指标等一系列函数为基础,并基于Matlab语言环境下选用相应函数,设计金融模型,再由所提供的数据通过最优化模型扫描得出最优参数,由此实现高频交易算法的设计与实际一般性的运用。
关键词:高频数据;程序化交易;遗传算法;技术指标
一、引言
算法交易指的是通过使用计算机程序来发出交易指令遗传算法可以解决各类问题,而不论这个问题本身是否有明确的函数表达式。因此,它在各个学科都有所应用。遗传算法在金融学的应用已经屡见不鲜,在资产定价、风险对冲等方面都有很好的应用。本文采用遗传算法更多的是基于数学的层面,是为了寻求最优。的参数组合,使投资策略的累积收益率尽可能大。本文采取的类似遗传算法中基因编码的序列,将交易信号及之间的逻辑关系以二进制表示,本文所使用二进制组合,对于每一种信号以“1”表示可以使用,以“0”表示无法使用;信号之间存在两种逻辑关系,即“AND”(用“00”表示)和“OR”(用“01”表示)“AND”表示信号之间同时使用,“OR”则表示只能选取一种类别的信号。
二、技术指标说明
(一)移动平均线,原本的意思是移动平均,由于我们将其制作成线形,所以一般称之为移动平均线,简称均线。
(二)相对强弱指标:RSI强弱指标是由尔斯.怀尔德最早应用于期货买卖,后来人们发现在众多的图表技术分析中,强弱指标的理论和实践极其适合于股票市场的短线投资,于是被用于股票升跌的测量和分析中
(三)廉指标这个指标是一个振荡指标,是依股价的摆动点来度量股票/指数是否处于超买或超卖的现象。
三、交易策略的判断依据
本文采取夏普比率和作为策略的判断指标,在既定风险范围之内策略年化收益率与夏普比率越高则代表策略越优化。
四、实证部分
对于每一种技术指标而言,本文都将80%的数据用于建模数据,20%的数据用于验证数据。这次使用的数据是同花顺(300033)三年来每日收盘价和近三个月每分钟收盘价,数据来于万得数据库。
(一)移动平均数
指标及变量的说明:lead提前指标;lag滞后指标;movavg移动平均指标;frequency交易频率sharpe ratio没风险单位能够换取的平均收益率;final return最终回报(率)。
模型的建立与求解,调用matlab中movavg函数,设定lead=5,lag=20,做为原始测试,到大致以下规律,当lead位于lag之上股价上行,当lead位于lag之下股价下行。由此设立交易信号当s(lead>lag)=1时视为买入信号;当s(lead 参数扫描确定最优值,依次确定提前与滞后指标,提前指标设置为1,滞后指标设置为m,从1-200之间取值,利用for循环获得最大sharpe ratio。由图5可知,当lead=65,lag=67时,Maxsharpe ratio=2.32,Maxfinal return=927%。利用穷举法对lead和lag同时进行扫描。 模型的完善,设置cost=0.2%,现在利用2015年06月30日—2015年08月27日每分钟收盘价的高频交易数据进行模型的扫描统计,将数据分为80%的建模数据,20%的检验数据。同时引入f(交易频率)这一参数,扫描变量为lead/lag/f,扫描范围相应增加,检测结果如下:当lead=1,lag=11,f=28时,sharpe ratio=5.84,final return=78.7%。 (二)RSI相对强弱指标 指标及变量的说明:rsi相对强弱指标;threshhold阀值。RSI交易策略:交易信号的产生当RSI的值高于或者低于阀值。现在利用2015年06月30日-2015年08月27日每分钟收盘价的高频交易数据进行模型的扫描统计,将数据分为80%的建模数据,20%的检验数据,同样考虑交易成本。 RSI通常被用于更长的时间趋势中从而到达优化的目的,当RSI=2时,sharpe ratio=6.53,final return=84.5%。 (三)MA+RSI交易策略 设置参数N=1,M=11,threshhold=55利用遗传进化算法重复以上过程,交易信号的产生并用遗传进化算法确定交易信号, best=100111 这里对结果进行说明,MA与RSI之间的逻辑关系是“00”,既并列,最后连续的“11”表示两种交易信号可以使用。利用参数扫描确定最优化数值,sharpe ratio=9.87,final return=80.1% 五、结语 本文采取科技类股票进行模拟交易,基于选择的几只股票的2015年的高频交易数据,首先利用技术指标模型构建交易量持续期预测模型,确定交易时点。而投资策略的设计则结合理论和实践,充分利用了本论文的参数,根据技术指标给予关键参数以阈值,只有当参数都达到阈值时,交易信号才能够被触发,这样就能在给定的范畴内最大程度的保证交易信号的高质量,从而提高收益率。然后分别建立交易量分布预测模型和股票价格波动预测模型,并根据价格波动的预测对交易量进行修正,进一步,本文引入了遗传算法的思想,利用这种科学计算法,以求能够快速的寻找出最优的参数组合,与此同时采取for循环进行参数扫描,大大缩短了参数确定的时间并提高了精确度。(作者单位:贵州大学管理学院) 参考文献: [1]张连华.基于高频数据的股指期货期现统计套利程序交易[J].计算机应用与软件,2011,28(9):93—95. [2]谢中华.MATLAB统计分析与应用:40个案例分析[M].第1版.北京:北京航空航天大学出版社,2010.187-213. [3]Eric P.Xing,Qirong Ho,Pengtao Xie,Wei Dai.Strategies and Principles of Distributed Machine Learning on Big Data[D],School of Computer Science,Carnegie Mellon University,2016. [4]W.Dai,A.Kumar,J.Wei,Q.Ho,G.Gibson,and E.P.Xing.High-performance distributed ml at scale through parameter server consistency models[Z].In AAAI,2015. [5]C.J.Hsieh,H.-F.Yu,and I.S.Dhillon.Passcode:Parallel asynchronous stochastic dual co-ordinatedescent[J].In ICML[Z],2015.