APP下载

沪深300指数成分股的多因子量化选股策略研究

2018-06-13彭馨胡艳英

科学与财富 2018年13期

彭馨 胡艳英

摘 要:本文通过对多因子选股模型的背景、理论、方法等方面做了介绍。并以Fama-French三因子模型为理论基础,构建针对沪深300指数成分股构建候选因子库,选用2007年01月01日至2017年12月31日的全部交易数据和财务数据为研究对象进行有效因子的筛选及冗余因子的剔除。在选用的27个因子中,发现市盈率、市净率、流通股本和投资收益四个因子对投资收益率有显著影响,且收益可观。

关键词:量化选股 Fama-French三因子模型 有效性检验

1 绪论

由于我国的资本市场还存在很多缺陷,信息不对称和内幕交易等情况时常发生,因此,对于投资者尤其是个人投资者来说,怎样筛选出高品质、高价值、低价格的股票就变得尤为重要,多因子选股的优势也就逐渐体现出来,它可以综合大量数据,并且可以根据投资者的偏好进行分析,为投资者理性投资提供了很大帮助。

2 相关概念与理论基础

2.1 因子有效性检验

本文主要采用排序的方法对候选因子的有效性进行检验。首先,对于候选因子库中的任意一个因子,从选定的数据期的第一个月初开始,计算对应板块的每只正常交易股票的该因子大小按照从小到大的顺序进行排序,然后平均分成n个组。分组后持有到月末,下个月重复操作,直到数据期结束。

组合构建完成后,计算n个组合的年化复合收益率、相对于业绩基准的超额收益,在确定选股因子的有效性上,采用如下的数量标准:

(1)判断因子是否有效,假设序数为i的组合年化复合收益为xi ,那么xi 与i的相关性绝对值应满足如下关系:

其中,MinCorr为模型所设定的收益和序数最小相关性阈值。

(2)设第1组合和第n组两个极端组合相对于基准收益的超额收益分别为AR1 和ARn ,如果AR1 > ARn ,表示因子越小,收益越大,那么二者应满足如下条件:

(3)无论在上涨、下跌还是整个模型形成期,第1组和第n组的两个极端组合中,较高收益的组合应该能以较高的概率跑赢市场,而较低收益的组合则能以较高概率跑输市场。

符合以上3个条件的因子说明在过去的一段时间内表现出较好的选股能力,可以作为有效的选股因子。

2.2多因子量化选股的一般模型

本文的多因子选股主要是基于Fama-French的三因子模型作为理论基础。模型认为,一个投资组合(包括单个股票)的超额回报率可由它对三个因子的暴露来解释,这三个因子是:市场资产组合、市值因子、账面市值比因子。但是,三因子模型并不代表资本定价模型的完结,根据有关学者最近的研究发现,三因子模型中还有很多未被解释的部分,如短期反转、波动、赌博等因素。本文在此基础上,选取众多因子,力求更好的解释收益率的影响因素。

3 实证检验

3.1 因子组合设计

3.1.1候选因子库设计

本文从上市公司的基本面因子进行分析、研究,在因子的选择上,主要按照价值、成长性、规模等角度,选取了如下10个指标构建因子库,具体的因子选取如表1所示。

3.1.2数据处理

为了使模拟交易贴近实际,需要对模型参数进行设置,主要有以下几个方面:

(1)股票选择。过滤掉ST、退市和停牌的股票;

(2)买卖条件。调仓周期为20个交易日,等权重买入,根据前人理论,最大持股数量为75只股票,调仓阶段,欲再买进的股票不卖出。

(3)其他参数。买卖滑点为0.02元,买卖佣金为3‰,最低佣金5元,卖出印花税为1‰,采用动态复权模式,成交比例为100%。

3.2检验结果

对沪深300成分股收益有显著影响的有效因子分别为价值因子:①市盈率(PE)、②市净率(PB),规模因子:③流通股本(circulating_cap),其他因子:④投资收益(investment_income)。由收益相关性的正负判断,除投资收益降序排列,其他都为升序排列。本文主要基于三因子选股,所以可能出现的有效因子组合有①②③、①②④、②③④和①③④四种,带入模型可得如下结果。

4 结论

通过将各个因子组合带入模型得到的结果可知,选择的4个因子总体上对沪深300指数成分股的收益率都有较为显著的影响,每个组合的累计收益率都达到200%以上,是基准收益的10倍左右,且年化收益均超过10%,普遍高于金融市场中的众多理财产品,有比较稳定的盈利能力。其中,第2组市盈率、市净率和投资收益三个因子的组合表现最为突出,累计收益257.70%和年化收益12.64%均为最高。在风险指标上,整体的波动请况和基准相当,由于受到资金分配方和个别年份暴跌的影响,略微高出基准,并且也导致了最大回撤为70%左右,因為是每月轮动,所以最大回撤并不代表实际损失。所以,总体而言,对沪深300指数成分股的多因子选股策略是可行的。

尽管选股策略的收益很好,但是在因子选取和参数设计方面,还有一些不足之处,比如有些技术面因子没有被包含进来、模型没有对风险采取规避措施等,还有待进一步的研究和改进。

参考文献:

[1]王瑞. A股市场多因子量化选股研究[D].山西财经大学, 2016.

[2]张利平. 基于多因子模型的量化选股[D].河北经贸大学, 2014.

[3]李姝锦,胡晓旭,王聪. 浅析基于大数据的多因子量化选股策略[J]. 经济研究导刊, 2016, (4):106.