中国私募证券投资基金的生存偏差效应研究
2020-11-06孙毅
孙毅
【摘 要】 为了解中国私募基金的真实收益情况,选取2011年1月至2017年12月中国私募证券投资基金作为样本,将期末存活的基金定义为生存基金,使用等权重方法构建投资组合,基于平均超额收益模型、单因子模型、三因子模型和五因子模型测算了私募基金的收益情况,并进一步计算了生存偏差。主要得到以下结论:整体而言,中国私募基金不能战胜市场获得超额收益,但是生存基金能够战胜市场;如果忽略消失基金,中国私募基金收益会出现向上的偏差,月生存偏差大小為0.02%~0.13%;在股市投资过程中,私募基金并不遵循价值投资和长线投资理念。
【关键词】 私募基金; 生存偏差; 生存基金; 消失基金; 五因子模型
【中图分类号】 F830.91 【文献标识码】 A 【文章编号】 1004-5937(2020)21-0025-07
一、引言及文献回顾
私募基金是中国资本市场不可忽视的重要力量,但目前对于中国私募基金的研究大多停留在制度层面,实证研究较少。在实务层面,由于较高的投资门槛以及无需披露数据等原因,使得私募基金对于普通投资者而言蒙上了一层神秘的面纱,其投资业绩更是被高度神话。基于此,有必要对中国私募基金进行深入研究,本文私募基金单指私募证券投资基金。
由于无须进行严格的信息披露,私募基金管理者会倾向于只公布收益优良基金的信息,而选择性地不公布收益较差基金的信息,因此生存偏差成为了研究私募基金时必然面对的问题。在研究某类基金的整体收益或者收益持续性问题时,如果只考虑生存基金,忽略了消失基金,那么会导致基金整体收益研究结果的不准确,基于生存基金的研究结果和真实结果之间的差异即为生存偏差。
公募基金有信息披露的要求,其消失原因多为收益太差,因此消失基金的收益通常低于生存基金,忽视消失基金会使结果产生向上的偏差。但不同学者计算得出的公募基金生存偏差大小存在较大差异,其范围为1—270个基点[1],可能的原因为计算方法和样本选择的差异。由于对冲基金没有信息披露的要求,因此学术界对于其偏差方向没有得出一致的结论,多数学者认为对冲基金是由于收益太差而从数据库消失,但也有研究认为对冲基金是由于不再需要新的资金而停止披露信息。国外学术界对于对冲基金生存偏差大小的计算结果为16—300个基点[2],造成结果差异的原因是多方面的,生存基金的定义方法[3]、投资组合的计算方法[4]以及数据库选择的不同[5]都是产生差异的原因。
国内学者对于基金的研究较少针对于生存偏差问题,仅有个别学者从生存偏差的视角研究了封闭式基金和阳光私募基金的收益,研究结论同样存在差异。史仕新等[6]对中国封闭式基金的生存偏差进行了研究,其结论同国外学者接近,消失封闭式基金的收益更糟糕,生存偏差为正,如果忽视消失基金,封闭式基金的收益会出现向上的偏差,结果被高估。朱波等[7]并不赞同史仕新和范孟君的观点,他们重新定义生存基金,并使用不同的加权方法对中国封闭式基金的生存偏差进行了测算,最终得出了相反的结果,他们认为退市封闭式基金的收益更高,忽略已退市基金会导致基金收益被低估。杨艳林[8]也认为忽略消失封闭式基金的有偏组合会导致结果被低估,并进一步分析了其中的原因,他认为退市基金规模小、收益优良是产生向下偏差的主要原因,消失基金收益更高的原因是这些封闭式基金存续期满后有转为开放式基金的要求,为吸引更多投资者,这些基金倾向于在收益更好时“封转开”。陈道轮等[9]和刘建和等[10]测算了中国阳光私募基金的生存偏差大小,并分析了生存偏差对基金收益的影响,他们认为中国阳光私募基金的消失率较高,消失基金收益较差,如忽略消失基金会导致基金收益产生向上的偏差,结果被高估。
宽松的监管使得私募基金无需进行严格的信息披露,其消失率往往更高,如果忽略消失基金,更易出现生存偏差,但目前学术界关于中国私募基金生存偏差的定量研究较少,因此本文将对现有研究形成有益补充,同时也将对投资者的投资策略形成重要参考。
二、生存偏差的界定和测算模型构建
(一)生存偏差界定
1.生存偏差计算方法
常用的生存基金定义方法有两种,第一种把期初和期末都存在数据,且整个样本期内数据较为完整的基金定义为生存基金,第二种把考察期末存在数据的基金定义为生存基金。后一种定义是在前一种的基础上加入了“虽然整个样本期内数据不完整,但在样本期末存在数据”的基金,显然,第二种定义考虑到了考察期内新出现的基金,在研究基金整体收益时更为全面和准确,因此本文使用第二种方法定义生存基金。
只考虑生存基金,忽略消失基金会使得样本成为有偏组合,本文的全部基金组合由以上第二种方法定义的生存基金和消失基金共同构成,全部基金为无偏组合。生存偏差是指生存基金投资组合与全部基金投资组合的收益差,如果生存偏差大于零,那么生存基金投资组合的收益高于全部基金,消失基金的收益低于生存基金,生存偏差的存在使得私募基金收益被高估;如果生存偏差小于零,那么生存基金投资组合的收益低于全部基金,消失基金的收益优于生存基金,生存偏差的存在使得私募基金收益被低估。
2.投资组合的构建
常用的投资组合加权方式有两种:等权重加权和市值加权。考虑到本文样本的时间跨度大、基金数量多,相对整个基金行业而言,单只基金市值较小,对于整个市场的影响程度有限,因此本文采用等权重方法计算基金投资组合收益。
(二)模型选择
现有研究中,通常使用平均超额收益模型、单因子模型和以此为基础发展起来的Fama-French三因子模型、Carhart四因子模型来测算基金收益,但不同学者对于中国资本市场是否存在Carhart动量效应仍未达成一致意见,因此本文放弃使用四因子模型。Fama-French三因子模型是研究资产定价问题的经典模型,但用于解释股市收益存在诸多异象,基于此,Fama和French通过加入新的因子,构建了五因子模型,以此提升模型的解释能力及使用范围。综上所述,为使结果更加准确,本文分别使用平均超额收益模型、单因子模型、Fama-French三因子模型和Fama-French五因子模型来计算私募基金收益。其中平均超额收益模型计算所得的基金收益没有考虑风险因素,其余模型所得到的基金收益为综合考虑风险因素后的风险调整收益。
1.平均超额收益模型
超额收益率是指私募基金超过市场预期收益率的部分收益,它等于基金收益减去同时期市场的预期收益,通常用无风险利率表示市场预期收益。不少学者使用算术平均收益作为基金的平均收益,这显然不符合资本市场的复利特点及收益计算方法,本文使用几何平均收益来计算私募基金的超额收益,其模型表示为以下形式:
αp=■(1+rp-rf)■-1 (1)
其中,αp為平均超额收益,rp为基金的收益率,rf为无风险利率。
2.单因子模型
单因子模型单独使用市场因子解释基金收益,其模型表示为以下形式:
rp-rf=α+β(rm-rf)+εt (2)
其中,截距项α为私募基金的alpha收益,通常被称为Jensen α,用来描述基金收益是否能够战胜市场基准组合,如果α显著为正,说明私募基金能够战胜市场,否则意味着私募基金不能战胜市场,以下三因子模型和五因子模型中α的含义亦是如此,rm为市场基准组合的收益率,(rm-rf)通常被称为市场因子,ε为误差项,β为回归的斜率,通常被用来描述市场风险。
3.三因子模型
Fama和French通过在单因子模型中加入规模因子和价值因子,构建了经典的Fama-French三因子模型[11],三因子模型可用以下方程表示:
rp-rf=α+β(rm-rf)+sSMBt+hHMLt+εt (3)
其中,SMB为规模因子,HML为价值因子,通过加入规模因子和价值因子,可以考察基金投资过程中对于上市公司规模和价值的偏好情况。
为计算规模因子和价值因子,把所有非ST和上市超过1年的股票进行分组,先按市值大小分成2组,每组再按账面市值比高低分成3组,共得到6组股票(表1)。价值因子HML由高账面市值比组收益率减低账面市值比组收益率得到,规模因子SMB由小市值组收益率减大市值组收益率得到。HML系数显著为正意味着私募基金更青睐高账面市值比上市公司股票,SMB系数显著为正意味着私募基金更青睐小市值上市公司股票。
4.五因子模型
通过在三因子模型中加入利润因子和投资因子,Fama和French构建了五因子模型[12],五因子模型可用以下方程表示:
rp-rf=α+β(rm-rf)+sSMBt+hHMLt+rRMWt+cCMAt+εt
(4)
其中,RMW为利润因子,CMA为投资因子。通过引入利润因子和投资因子,可以考察私募基金投资过程中对于上市公司利润和投资水平的偏好情况。
为计算各因子(以五因子2×3模型为例),把所有非ST和上市超过1年的股票分别按照规模、账面市值比、利润、投资指标进行分组,具体方法如下[13]:按规模指标分为小市值组(S)和大市值组(B);按账面市值比指标分为低账面市值比组(L)、中账面市值比组(N)和高账面市值比组(H);按利润指标分为利润疲软组(W)、中等利润组(N)和利润稳健组(R);按投资指标分为投资保守组(C)、投资中庸组(N)和投资激进组(A)。
两个规模分组分别与三个账面市值比分组、三个利润分组和三个投资分组进行交叉组合,得到三个规模因子:SMBB/M、SMBOP和SMBlnv,三个规模因子的算数平均值即为规模因子SMB,具体方法如表2所示。使用同样的方法得到价值因子HML、利润因子RMW和投资因子CMA。HML系数显著为正意味着私募基金更青睐高账面市值比上市公司股票,SMB系数显著为正意味着私募基金更青睐小市值上市公司股票,RMW系数显著为正意味着私募基金更青睐高利润上市公司股票,CMA系数显著为正意味着私募基金更青睐投资保守的上市公司股票。
(三)数据来源
不同于公募基金,私募基金无需进行信息披露,其披露行为完全出于自愿,因此消失基金不能简单地被认同为退市基金,也可能是私募基金管理者出于某种目的不想继续公开信息。由于相关管理规定,禁止私募基金在公共媒体进行广告宣传,因此私募基金进行信息披露的可能原因是吸引投资者。根据现有研究,私募基金停止信息披露通常是由于两方面的原因:一是由于私募基金的收益太差,导致被清算、清盘或合并到其他基金,基金的消失导致没有数据可供披露。收益太差还可能导致私募基金虽然没有消失,但继续披露信息已无法达到吸引投资者的目的,甚至会给投资者留下较差的印象,因此停止披露信息。二是私募基金已经募集到足够的资金,无需接受新的投资,因此停止信息披露,不再进行“广告”宣传。除此之外,由于没有信息披露要求,为了达到吸引投资者的目的,私募基金还会选择披露时机,在收益好时进行披露,收益差时停止披露。
对于从没有进行信息披露的私募基金,也存在多种情况,可能是由于收益太差,公布信息无法达到吸引投资者的目的,也可能是通过其他途径已经募集到足够多的资金,无需通过信息披露的方式进行广告宣传,例如通过身边熟人或者基金经理的品牌效应募集资金。
私募基金因收益糟糕不披露信息会导致结果产生向上的偏差,因收益优良不披露信息会导致结果产生向下的偏差。对于以上从没进行信息披露的基金,在没有获得有关数据的前提下,难以对其具体收益进行分析,对于这个问题,学术界通常假设以上情况产生的向上和向下的偏差相互抵消,或把研究范围限定在特定的数据库,不考虑这些从未公布信息的基金。考虑到中国资本市场的成熟度较低,私募基金仍处于快速发展阶段,私募基金信息披露的规范性仍有待提升,如假设向上和向下的偏差相互抵消,可能导致结果同实际情况存在较大差异,因此本文采用第二种方法,选择特定数据库进行研究。Wind数据库是我国金融证券数据最为完整、规模最大的金融财经类数据库之一,在国内具有一定的代表性。相比于其他数据库,Wind数据库中的私募基金信息更全面,因此,研究结论在一定程度上也就能够较准确描述我国私募基金的整体特征,因此本文以Wind数据库中的私募基金作为研究对象。Wind数据库2011年以前的私募基金数据很少,和实际情况相差较大,本文选择2011年1月至2017年12月作为考察区间,选取成立一年以上、非结构化股票型私募基金的月度数据作为样本,经筛查,样本包括生存私募基金3 037只,消失私募基金843只。
根据相关规定,公募基金资金总量的最低20%需用于投资国债,因此现有研究中多使用沪深A股所有上市公司股票价值加权收益率(通常为沪深300指数或上证指数收益率)和国债收益率共同构建市场收益,两者比重通常为80%和20%。对于私募基金而言并没有投资国债的要求,因此本文使用能够代表沪深两市综合走势的沪深300指数作为市场收益指标,并使用一年定存基准利率作为无风险利率。数据整理和模型分析分别使用Matlab和EViews软件完成。
(四)结果分析
1.私募基金收益分析
分别使用以上超额收益模型、单因子模型、三因子模型和五因子(2×3)模型对包括全部基金的无偏组合和只包括生存基金以及消失基金的有偏组合进行回归,其中各因子的数据来自国泰安数据库,得到表3—表5。
由表3—表5可知,第一,生存基金、消失基金和全部基金的平均超额收益都显著为正,生存基金的平均超额收益明显高过全部基金和消失基金。消失基金组合的月平均超额收益并不为负值,这说明私募基金和公募基金不同,其数据的消失并不全是因为糟糕的业绩,也可能存在收益并不差,但无需募集更多资金而停止披露信息的情况。
第二,各模型不同解释变量的系数中,市场因子系数均为最大,这说明市场因子对于被解释变量的影响最大,私募基金获取收益仍主要依赖于市场的整体行情。虽然私募基金的投资模式和对象有更多的选择,还可以灵活地控制仓位,但从本文结果来看,私募基金没有能够有效规避来自资本市场的系统性风险。这可能是由于中国资本市场成立时间较短,私募基金的运作和管理较为粗犷,不同私募之间呈现同质化特征,而且资本市场缺乏足够的做空手段,导致私募基金难以进行风险对冲。
第三,生存基金组合在单因子、三因子和五因子模型中的截距项都为正,且通过了1%统计水平的显著性检验。生存基金存在明显的正alpha收益,三个模型中,alpha收益大小分别为0.32%、0.28%和0.16%,生存基金能够战胜市场。消失基金三个模型的截距项均没有通过显著性检验。总体而言,消失基金的收益更为糟糕,虽然平均超额收益为正,但不存在明显的风险调整收益,很大一部分消失基金的风险调整收益甚至为负,消失基金中收益较差的仍占有较大比例。全部基金截距项的显著性较低。包括生存基金和消失基金的全部基金组合并不存在明显的alpha收益,也就是说,中国私募基金不存在超额alpha收益,即不能战胜市场。
第四,生存基金、消失基金和全部基金在三因子和五因子模型中的规模因子SMB系数均为正,且都在1%的统计水平显著。整体而言,中国私募基金在股市投资过程中更喜欢小盘股,这同公募基金喜欢大盘蓝筹股的投资方式有所不同[14]。公募基金的规模通常较大,且有着仓位不能低于65%的硬性要求,短期内难以快速大规模更换投资标的,因此投资过程中更喜欢市值较大、交易冲击成本较小的大盘蓝筹股。私募基金由于没有仓位要求,其规模也较小,因此更喜欢价格波动剧烈的小盘股。
各模型中,价值因子HML的显著性均较差,总体而言,中国私募基金并不偏好高账面市值比股票,消失基金甚至更加青睐低账面市值比的上市公司股票。账面市值比是上市公司的股东权益与公司市值之比,理论上讲,高账面市值比意味着公司股价被低估,上涨的可能性较大,因此投资高账面市值比股票反映了格雷厄姆的价值投资理念,买入暂时被低估的股票,以等待估值的回归来获取收益。但本文结果表明,中国私募基金并没有遵循价值投资理念,消失基金的价值因子系数为负,意味着消失基金更喜欢低账面市值比股票,即喜欢被高估的股票,这类股票通常为市场中被炒作的题材概念股,可以看出消失基金更喜欢参与题材概念股的炒作,这可能也是消失私募基金收益较差的原因之一。
第五,生存基金、消失基金和全部基金的利润因子(RMW)系数都不显著,投资因子(CMA)的系数显著为正。利润因子是考察上市公司盈利能力的指标,但由本文结果可知,利润因子对于生存私募基金和消失私募基金收益的影响均不显著,中国私募基金在选股时并不太关注上市情况的盈利水平,这可能是由于上市公司盈利能力同投资其股票收益的相关性较低所致[15]。从投资因子的系数来看,私募基金更加偏好投资更为保守的公司。利润因子和投资因子衡量了上市公司未来的发展前景,在某种程度上反映了公司的未来价值,符合菲利普·費雪的购买并长期持有成长股的投资理念。但从以上结果可知,私募基金在投资过程中并不看重上市公司未来发展前景,也就是说,私募基金并不偏好长线投资。
综上所述,中国私募基金在股市投资过程中并没有把上市公司的估值水平和未来发展前景作为选股参考指标,可能的原因如下。
第一,中国股市的有效性较低。中国资本市场自成立以来发展迅速,在不到30年的时间里总市值已经高居全球资本市场第二位。但由于成立时间较短,中国资本市场仍为弱有效市场,其规范程度同欧美发达国家相比仍然较低,由此带来了上市公司信息披露机制不健全、投资行为非理性、不同市场主体之间的信息严重不对称等诸多问题。由于缺乏现代化的公司管理制度,以及监管制度的不完善,导致众多上市公司信息披露缺乏完整性和真实性,这进一步加剧了市场中的信息不对称,增加了掌握信息者的逆向选择风险,最终导致市场中炒作现象频发,投资者对上市公司的信任度较低。
第二,中国股市换手率过高。中国资本市场中盈利的主要手段为股票价格波动带来的价差收益,这同欧美成熟资本市场通过股票分红获益存在较大差异。中国资本市场中投资者持股时间通常较短,中长线投资者相对较少,且多数投资者并不注重上市公司的经营和财务状况,市场中缺乏价值投资和长线投资理念。中国资本市场中机构投资者比例较低,个人投资者比例较高,比较而言个人投资者的投资知识更为匮乏、理性程度更低,这在一定程度上加剧了股市的价格波动。此外,中国资本市场存在明显的“羊群效应”,不同股票同涨同跌现象较为明显,使得市场系统性风险成为中国资本市场的主要风险,而个股风险被投资者选择性忽视。
以上原因使得私募基金更加倾向于参与题材概念类股票的短线操作,而非进行价值投资和长线投资。私募基金偏好小盘股和炒作题材概念的投资方式呈现出了“散户”特征,作为机构投资者,私募基金这种“散户式”的投资方式显然不利于中国股市稳定。
2.生存偏差测算
使用前文模型的生存私募基金收益减全部私募基金收益,得到生存偏差的大小,结果如表6所示。
由表6可以看出,生存私募基金投资组合的收益为0.16%~0.38%,消失基金投资组合的收益为-0.06%~0.08%,全部基金投资组合的收益为0.14%~0.25%。整体而言,生存基金投资组合的收益大于消失基金和全部基金的收益,虽然部分私募基金可能由于募集到足够多的资金而停止信息披露,但消失基金的整体收益仍然较差。生存基金投资组合同全部基金投资组合的收益之差为0.02%~0.13%,也就是说,本文基于Wind数据库计算得到的私募基金的生存偏差大小为0.02%~0.13%,生存偏差为正,意味着如果忽略消失基金,私募基金的收益会被高估,出现向上的偏差。
三、结论及展望
为考察中国私募基金的整体收益情况,本文从生存偏差的视角,基于Wind数据库的信息,对私募基金收益进行了分析。首先把考察期期末存在数据的基金定义为生存基金,使用等权重方法构建投资组合,然后基于超额收益模型、单因子模型、三因子模型和五因子模型,考察了生存私募基金、消失私募基金和全部私募基金的收益情况,并进一步对生存偏差进行了计算。结果表明,第一,生存私募基金的收益高于消失私募基金。中国私募基金并不能战胜市场获取超额收益,但生存基金可以战胜市场。第二,在计算私募基金收益时,如果只考虑生存基金,基金收益会出现向上的偏差,生存基金和全部基金之间的生存偏差大小为0.02%~0.13%。第三,中国私募基金并不偏好价值投资和长线投资,而是偏好于题材概念炒作和短线投资,这显然不利于中国资本市场的稳定。
针对以上结论,本文提出以下建议:对监管者而言,加强对于私募基金的监管。可通过提高行业准入门槛来扩大私募基金的资金规模,通过加强行业自律组织管理来进一步加大私募基金行业的内部管理及约束;还应进一步完善私募基金信息披露制度,对其信息披露的透明性和准确性做出明确的规范。对于资本市场而言,在市场不断扩容的同时,还应逐步增加做空手段,在监管机制趋于完善时,逐步将融券标的范围扩大至市场中的全部股票,一方面可增加资本市场的风险对冲渠道,另一方面可通过市场机制使做假的上市公司彻底失去生存的土壤。对私募基金公司而言,應根据自身运作特点连续向数据供应商提供信息,减少信息披露的随意性,坚决杜绝虚假披露。对投资者而言,应明确认识到基金投资为中长线投资,选择私募基金时应注重其长期收益以及收益的稳定性。此外,还应重点关注私募基金的风险调整收益,尽量避开“靠天吃饭”的私募基金。
本文虽然对私募基金的生存偏差问题进行了实证分析,测算了中国私募基金的真实收益情况,但所用数据只是Wind数据库中进行披露的部分私募基金,整个行业仍有大量私募并没有披露业绩信息。基于生存偏差理论,可以通过这部分基金的信息了解私募行业的业绩情况,但对于整个行业而言,仍需通过掌握更多的数据进行进一步的研究。另外,鉴于数据的可获取性和全面性等条件约束,并未考虑私募基金的费率,私募基金的费率通常较高,也会对其真实收益产生影响,这也是本文进一步的研究方向。
【参考文献】
[1] ROHLEDER M,SCHOLZ H,WIKENS M.Survivorshipbias and mutual fund performance:relevance,significance and methodical differences[J].Review of Finance,2010,15(2):441-474.
[2] ACKERMANN T,ANDERSSON G,SODER L.Distributed generation:a definition[J].Electric Power Systems Research,2001,57(3):195-204.
[3] FUNG W,HSIEH D A.Performance attribution and style analysis:from mutual funds to hedge funds[J].Paradigm Financial Products,1998,12(3):95-104.
[4] BROWN S J,GOETZMANN W N,IBBOTSON R G.Offshore hedge funds:survival and performance,1989—1995[J].Journal of Business,1997,72(1):91-117.
[5] LIANG B.Hedge funds:the living and the dead[J].Journal of Financial and Quantitative Analysis,2000,35(3):309-326.
[6] 史仕新,范孟君.中国封闭式基金的生存偏差效应[J].财经科学,2008(10):49-54.
[7] 朱波,匡荣彪,王珏.我国封闭式基金生存偏差效应研究[J].财贸研究,2010(1):76-83.
[8] 杨艳林.考虑生存偏差现象的我国封闭式基金绩效持续性研究[J].上海金融学院学报,2011(4):60-70.
[9] 陈道轮,陈欣,陈工孟,等.阳光私募基金经理具有卓越的投资能力吗?[J].财经研究,2013(12):85-99.
[10] 刘建和,朱启勉,林鲁森.生存偏差对阳光私募基金业绩持续性的影响[J].财会月刊,2017(8):111-117.
[11] FAMA E F,FRENCH K R.Common risk factors in the returns on stocks and bonds[J].Journal of Financial Economics,1993,33(1):3-56.
[12] FAMA E F,FRENCH K R.A five-factor asset pricing model[J].Journal of Financial Economics,2015,116(1):1-22.
[13] 郑亮亮.A股超额收益率影响因素的实证研究[D].福州:福建农林大学硕士学位论文,2019.
[14] 郭滨辉.有限合伙私募股权基金所得税穿透问题研究[J].会计之友,2019(10):138-140.
[15] 赵胜民,闫红蕾,张凯.Fama-French五因子模型比三因子模型更胜一筹吗——来自中国A股市场的经验证据[J].南开经济研究,2016(2):41-59.