基于短时相关性的股票推荐算法研究
2020-07-09丁小军
丁小军
摘 要:股票市场作为多人参与的复杂系统,具有很大的随机性。随着信息技术的普及,如何通过计算的方法来选股是很多股民都感兴趣的。本文针对中国股市的股票具有短时政策性、新闻性、概念性、关联性等特点提出用短时相关性来推荐股票的方法。通过实际的沪深股市数据,发现这种推荐方法确实能带来较大的利润,且不需要人们去耗费巨大精力选股。当然,此方法仍有一些不足,需要改进。
关键词:股票;推荐;相关性
1 引言
股票是金融市场中的一个重要组成部分,受到广大投资者的热切关注。在股票市场的长期跟踪研究中发现,股票之间也会有明显的相互影响作用,尤其是在地区板块、行业板块内,这种相互影响关联作用更加明显[1]。甚至有时候,在不同板块、不同概念及不同行业股票之间也会出现同涨同跌等现象,学者将其称为联动[2]。总而言之,某一支股票的价格也会随着其它股票价格的波动而波动,某一支股票价格的波动也会使别的相关股票的价格随之波动[3]。这种相互作用也可以称作股票之间的相關性,是许多投资者研究的热点之一。本文分析了用原始股票涨跌幅来分析相关性的缺陷,提出了用量化方式来强调涨跌的同步性,弱化涨跌幅度的差异,同时将概念行业相关性加权,得到了适应于股票的相关性计算方式,并以此设计出了一个股票推荐算法,在沪深股市2020年1月到4月的数据上进行了回测,取得了较为满意的效果。
2 方法
相关系数最早是由统计学家卡尔·皮尔逊提出的用来研究变量之间线性相关程度的量,两个向量x,y的皮尔逊相关系数p(x,y)定义如公式(1)所示。其中ux,uy分别为xi,yi的均值。
皮尔逊相关系数相关系数范围是[-1,1],相关系数不同的值体现了不同的意义。当相关系数越等于1时候,表示两个向量完全正相关,当相关系数等于-1时,表示两向量完全负相关。当系数接近0时,表示两向量不相关。首先本文取股票20日的涨跌幅作为股票的指标x,(x[i]为每一日涨跌幅),计算他们的相关系数,但是发现在这种情况下大涨或大跌的股票相关系数非常高,即直接使用原始涨跌幅的话,相关系数更看着涨跌幅度。为此,本文将涨跌幅量化如公式(2)所示
在这种量化指标下,涨跌幅度对相关系数影响就没有那么高。两只股票具有高相关性更在于他们涨跌的同步性。同时我们定义一支全为零向量的股票与其他股票相关性为0,即20日不涨不跌的股票不再关注。接下来,本文定义股票所属板块和概念的向量Cx,若股票属于某一概念i,则对应Cx[i]=1,否则Cx[i]=0。
综合股票行业概念和走势,我们定义了如下相关系数计算公式。
根据公式(3),我们可以算出任意两只股票20天的相关性。这种相关性一般能维持一段时间。
在每日开盘后,每只股票根据自身涨跌幅度对与其相关性排在前十的股票进行推荐(涨)或者反对(跌),推荐力度与自身涨跌幅成正比,然后将推荐票数比较多的股票反馈给投资者。如果一支股票得到了较多的推荐,那么可以知道必然有一批围绕此股票的相关性较高的股票都是涨的,这一批股票很可能就反映了当天的热点。同时,当一批高度相关的股票有启动的苗头的时候,因为推荐,这种苗头会被放大,从而可以在热点还没有启动的时候就能提醒投资者。而在热点概念之外的且自身板块内很多股票是跌的股票,会因为得到较多的反对票,从而提醒投资者放弃。
3 实验与结论
本文以2020年1月到4月的沪市深市的股票为实际数据,进行了回测,发现股票涨跌确实是有联动效应的,即部分大涨的概念股确实具有很高的相关性。如图所示万象德农和顺鑫农业两只股票,他们每日涨跌的幅值相差比较大,但是涨跌的同步性较好,所以用本文提出的相关性计算方法可以得到他们是高度相关的。因此,本文提出的方法也可以用来研究团体股票的走势,从而可以分析出一群高度相关的股票具备了什么样的走势后,更有可能大涨,提高人们买股的成功率。
参考文献
[1]汪玉环.股票间相关性测量方法的研究及应用[D].哈尔滨工业大学,2017.
[2]牛红丽,王军.基于选举模型理论研究股市特性[J].北京交通大学学报,2012,36(3):138-144.
[3]陈花.基于复杂网络的股票之间有向相关性研究[D].北京邮电大学,2012.
[基金项目]玉林师范学院博士科研项目G2018014