风格轮动的多因子选股模型
2018-09-25张丁漩王博栋西安交通大学陕西西安710000
张丁漩 王博栋(西安交通大学,陕西 西安 710000)
本文利用量化投资思想,采用统计检验的方法,筛选出市场投资的有效因子,并结合风格轮动与多因子模型选择应持有的股票,策略回测期内累计收益超过大盘收益,投资效果较明显。
正文
较为成功的投资策略有两大类:主观判断型交易策略和量化交易策略。
前者是操作的核心是人的大脑,各种信息进了大脑,出来的是买卖交易指令,后者是靠数学公式、理论定律来投资,公式具有高度一致性:同样的信息输入同样的公式,得出的结果是一样的。
但二者并不是完全的对立存在,量化投资模型很多是基于基本面因素,同时考虑市场因素、技术因素。
投资标准方面,量化投资有众多模型,比较有代表性的有多因子模型、风格轮动、行业轮动与资金流模型、动量反转模型、一致预期模型、趋势追踪模型和筹码选股模型等。
本文投资策略是在风格轮动的基础上建立多因子选股模型。
一、原理介绍
1.风格轮动
风格投资[1]可以简单地分为大盘股和小盘股两种投资风格,也可以分为价值型和成长型两种投资风格,不同的投资风格会轮流受到投资者关注,从而表现出风格轮动的现象。大小盘轮动是大盘股和小盘股之间存在风格轮动现象,即大盘股价格和小盘股价格之间存在轮番变动的现象。
本文即选取在大小盘股之间轮动,大盘股和小盘股的区分就是根据公司的流通股本的多少,大盘股通常指流通股本大于1亿的上市公司股票,而小盘股则与大盘股相对,通常指流通股本不足3000万的股票。沪深300通常可以近似表示大盘股的整体走势,中证500指数近似表示小盘股的整体走势。因此,本文以沪深300指数成分股为大盘股初始股票池,以中证500指数的成分股为小盘股的初始股票池,并加上创业板指的成分股,通过一定标准在三个初始股票池之间轮动选择所要投资的股票。
2.多因子模型
多因子模型旨在用各种因子的数据(如基本面因子、技术因子等)解释某支股票的合理价格,其理论的原始基石是CAPM模型,通过构造资本市场线方程与证券市场线方程,说明了有效组合的期望收益率包括无风险收益率和市场风险的价格与组合标准差的乘积。
总之,多因子模型的目标是找到解释能力强的因子并用这些因子过去的数据对当前的股票价格进行评估,判断股票价格未来的走势最后筛选出具有投资价值的股票组合。
本文对股票池的筛选即采用多因子模型,模型的因子采用在样本集中进行因子有效性检验,选择出比较显著的因子,选股具体方法为打分法。
二、选股步骤
1.因子有效性检验
(1)备选因子选择[2]
因子基本可以分为四类:估值因子、资本结构因子、成长因子与技术因子。从这四类中选取常用的12个因子:
表1 12个备选因子
(2)因子有效性检验步骤:
A.样本时段为2010年1月1日至2012年12月31日。
对每一个备选因子,从样本时段第一个月开始,每个月的月初计算市场每只股票该因子的大小,按因子值从小到大对样本股票池排序,平均分为10个组合,一直持有到月末。每月初用同样的方法调整股票池。
B.有效性量化指标
以沪深300指数为基准,对于每个因子,计算其值从小到大对应的10个组合的年化复合收益、超额收益、不同市场情况下高收益组合跑赢沪深300指数和低收益组合跑输沪深300指数的概率。具体检验标准如下:
a.序列1-10的组合,年化复合收益应满足一定排序关系,即组合因子大小与收益具有较大相关关系。假定序列i的组合年化收益为Xi,则Xi与i的相关性绝对值。此处为给定的最小相关阀值,比如0.5。
以上条件保证因子最大和最小的两个组合,一个明显跑赢市场,一个明显跑输市场。
c.在任何市场行情下,1和10两个极端组合,都以较高概率跑赢或者跑输市场。
符合以上三个条件的因子被视为在过去一段时间内有效的因子。
因此,计算12个备选因子的因子与组合收益的相关性、赢家组合与输家组合的超额收益、赢家组合跑赢沪深300指数的概率,计算结果如下:
表2 因子有效性检验
表2 因子有效性检验
上表中指标1是各因子大小与其对应组合收益的相关性,指标2的两个数据分别是各因子产生的组合中赢家组合与输家组合的超额收益,指标3是赢家组合超过沪深300指数的概率。
本文筛选因子主要使用了指标1与指标3,即因子大小与组合收益的相关性和赢家组合超过沪深300指数的概率,指标1的阈值设定为大于0.5或者小于-0.5,指标3的阈值设定为大于等于0.4,按此标准对以上因子进行筛选,结果如下:
表3 因子筛选
从上表可以看出,筛选的有效因子为流通市值(CMV)、主营毛利率(GP/R)、净利率(P/R)、换手率(TR),只包含了资本结构因子、成长因子与技术因子,并没有选择估值因子。同时可以看出主营毛利率(GP/R)与净利率(P/R)的指标数值基本一致,说明二者的选股效果相近,如果同时作为选股因子,选股结果会有重叠,因此只用选择二者中的一个即可。所以选择的有效因子为:流通市值(CMV)、净利率(P/R)、换手率(TR)。同时,这三个因子与组合收益的相关性都为负相关,即因子越小,所选择的股票组合收益越高。
2.风格轮动
承接前文,选择轮动的股票池为沪深300指数成分股、中证500成分股和创业板指的成分股。轮动的标准如下:
(1)对比每个交易日收盘数据与二十个交易日前的收盘数据,以沪深300指数、中证500指数与创业板指的涨幅作为轮动的标准,选择涨幅最大的指数所对应的股票池进场;
(2) 如果三个指数与前20日比均为下跌,则选择空仓。
3.多因子选股
采用打分的方法,使用筛选的三个有效因子分别所选择的股票池中的股票进行排序,然后将各股票的三个排名相加,得到各股票的分数,选择分数最好的20支股票。
4.总体操作思路
(1)调仓周期选择:调仓周期确定为13天。按上文轮动标准的大小盘轮动是个较短期的策略,多因子选股是个较中期的策略,权衡二者,调仓周期选择在每个月交易天数的一半。
(2)轮动选择 :按上述轮动标准,每个调仓日,对比三个指数的涨幅,选择涨幅最大的指数对应的股票池,按所筛选的三个因子对此股票池中的股票进行排名,因子值越小的股票排名越靠前,最后选择排名最前的20支股票。
(3)空仓调整:如果三个指数均为下跌,则卖出所持有的股票。
三、效果分析
因为因子有效性检验时段为2010年1月1日至2012年12月31日,所以回测区间紧接有效性检验时段,为2013年1月1日至2016年6月30日,对比基准为沪深300指数策略,运行平台为JoinQuant。本文从收益及风险方面对该策略进行分析。
策略总体情况如下图:
图1 策略总体情况
在回测时段,沪深300指数收益为25.01%,本策略累计收益为424.48%,年化收益为63.09%,夏普比率为2.508,最大回撤为28.06%。
策略整体收益是超过基准沪深300指数的收益。回测期内,2013年年初至2014年中期的收益浮动较小;从2014年的下半年与2015年上半年的时段收益增幅较大,累计收益从80%左右爬升至340%左右;紧接着的2015年6月开始,本策略有一段空仓期,正好避开了大盘快速下跌的区段;在2015年的10月之后,策略的累计收益又有一段较快的增加;进入2016年后,策略的累计收益基本没有明显的增加。
本策略从2013年至2015年的年度收益呈递增状态,但在2016年的上半年内策略收益为负值;月度收益方面也呈现类似的状况,2016年之前的策略收益基本为正值,高月度收益集中于2014年与2015年,策略月度收益在2016年年初为负值。
结合每日收益与累计收益的分析以及策略因子有效性检验来看,策略2016年开始出现亏损的原因可能是:因子有效性检验的时段为2010年至2012年中间的三年,与2016年的时间间隔较远,市场上有效因子的风格种类很有可能在2016年前后已经发生变化 ,即原先认为有效的因子可能已经失效,从而导致策略的收益情况改变。
四、策略总结及改进方向思考
本文以风格轮动作为择时标准,在沪深300指数成分股、中证500指数成分股和创业板指成分股这三个风格的股票池中轮动,并在用三年时段对有效因子筛选的基础上,利用打分法确定每个调仓周期时目标股票池中最终的投资组合。相对于沪深300指数,策略整体收益较高,风险水平较低,风格轮动有效的选择了近期涨幅最好的股票池或者规避了近期的市场风险,多因子选股保证了投资组合的超额收益。
策略的不足之处在效果分析部分也已做了具体阐述,总结而言就是从2016年开始可能因为因子有效性开始变得不显著,导致策略收益下滑,解决方案是每过一段时间应该用之前的市场数据重新筛选有效因子,把新的因子作为之后多因子选股的标准。
同时,策略中风格轮动的股票池可以进行增加,轮动标准可将本策略中的指数在20日内的增幅,改为使用宏观经济指标、基本面指标和其他指标判断等方法。风格标准可以采取其他方法,如价值法,即将股票分为价值型、成长型和混合型。
另外,本文因子有效性检验是对所有股票进行的,更科学的方法应该是对每种风格的股票池分别做因子有效性检验,因为不同风格股票的价格的解释变量或其显著程度应该是不同的。