APP下载

变动基数投资组合中的系统误差与估计误差权衡

2022-06-11廖科智

运筹与管理 2022年5期
关键词:系统误差夏普基数

齐 岳, 廖科智

(1.南开大学 中国公司治理研究院,天津 300071; 2.浙江工业大学 管理学院,浙江 杭州 310005; 3.南开大学 商学院,天津 300071)

0 引言

如何根据投资目标选择合适的投资组合模型一直是财务金融领域关注的重要问题。Markowitz[1]提出均值-方差模型,在给定期望收益和协方差矩阵信息的情况下,可以为投资者计算理论上最优的投资组合权重。而在投资实践中,期望收益与协方差矩阵的信息不可直接观测。作为替代方案,根据历史数据估计的样本期望收益和样本协方差矩阵常被用作投资组合优化的输入参数。

但Michaud[2]指出,由于历史观测数据不足,基于历史矩估计量的均值-方差优化结果可能包含估计误差。DeMiguel等[3]系统地检验了投资组合模型的结果,发现估计误差导致主要的优化模型均不能在样本期外超越均权重(以下简称EW)策略。

由于均值-方差模型在样本期外表现出较差的绩效,部分研究将关注点转向较少依赖于历史矩估计量的EW策略[4]。但根据Chen和Yuan[5]的论证,EW策略可能会导致严重的系统误差。Qi等[6]则发现随着基数增加,EW的配置结果与有效边界的距离逐渐扩大。Zhao等[7]指出,尽管增加权重约束能够降低估计误差,但约束条件也可能排除理论上的最优配置结果。

上述研究表明,系统误差与估计误差的权衡问题存在于投资组合选择过程中,且与投资组合面对的资产基数密切相关。随着资产基数N向估计窗口M的逼近,基于历史矩估计量的均值-方差优化收敛于真实均值-方差优化结果的概率也趋近于0。而Qi等[6]和Qi[8]的研究结果也侧面印证了系统偏差与N存在的正向关系。由此,本文的研究问题是:对于不同基数约束的投资者,在构建投资组合时,应当首要考虑系统误差还是估计误差的影响。

由于系统误差和估计误差不能直接观测,参照DeMiguel等[3]和吴文生等[9]的研究,本文以样本期外表现探究系统误差与估计误差的权衡结果。此外,Merton[10]指出基于历史数据估计的期望收益比协方差矩阵存在更大误差。为了使研究问题更加明确,本文主要考虑EW策略与最小方差投资组合(以下简称GMV)的差异。此外,已有研究的样本集中于高度分散化的因子组合或行业组合。周忠宝等[11]指出,投资者在构建投资组合时面临现实的基数约束。从投资实践的角度看,个人和机构投资者都要以个股为基础资产形成投资组合。

针对以上问题,本文以A股上市公司2007年1月~2019年12月的月收益率为研究对象,滚动求解包含5只到100只股票的投资组合,形成关于其收益率和尾部风险状况的多维度绩效数据,为变动基数下的系统误差与估计误差权衡问题提供实证依据。本文的研究创新主要包括以下几个方面:

首先,以真实市场数据呈现了系统误差-估计误差权衡对于资产基数的敏感性。已有研究在探讨此问题时常对股票收益进行独立同分布的假设,但这与个股收益非正态的分布特质存在明显差异。其次,以中国股票市场数据为基础,补充了个股收益尖峰厚尾特征影响投资组合绩效的经验证据。最后,研究方法上,将Bootstrapping方法由计算后的统计测试延伸到了样本的筛选过程,从个股层面得出了投资组合样本期外绩效检验的稳健结果。

1 投资组合选择理论回顾

1.1 投资组合选择理论

在均值-方差效用函数的假设下,Markowitz[1]将投资组合选择表示为如(1)所示的双目标参数规划问题:

(1)

其中Σ为收益协方差矩阵且满足半正定性质,μ为期望收益向量。为了进一步研究(1)的性质,Merton[12]将可行域设定为S={x∈Rn|1Tx=1},并引入(2)的定义,求解集为(3),并证明了其在(z1,z2)二维空间的映射是一条平滑的抛物线,并将其定义为最小方差边界(4):

(2)

(3)

(4)

其中λ是一个大于或等于0的参数。在(4)上,给定期望收益率,投资者可以在有效边界上获得最小方差的投资组合。因此,在理论上投资者可以通过(1)实现最优的风险-收益均衡。

1.2 系统误差与估计误差权衡

(5)

(6)

(7)

(8)

相对于均值-方差模型,简单分散化则为投资组合选择提供了一种不包含参数估计误差的思路。已有研究以模型平均[4],范数约束[14]等方法对均值-方差模型中包含的估计误差进行控制。但上述方案可能对优化的结果带来其他负面影响。Chen和Yuan[5]将投资组合优化的目标定义为(9),同时将误差修正方案一般化地定义为(10):

(9)

(10)

其中Ω是定义在实数域Rn上的一个d维线性子空间,AΩ是一个N×d维的矩阵,其列向量是Ω空间的正交基。结合Kan和Zhou[13]的推导,可以将(10)的估计值表示为:

(11)

(12)

(13)

由此,在以个股为投资对象的投资组合优化中,系统误差的影响不容忽视。但优化求解的结果又不可避免地集中于少数股票之中,加剧估计误差对优化结果的影响。目前,理论研究往往基于模拟和样本期内的结果,没有考虑到个股现实中收益率非正态分布和尖峰厚尾等特征。基于以上论述,本文提出如下两个对立假设:

H1a若估计误差的影响强于系统误差的影响,则EW的样本期外夏普比率优于GMV的样本期外夏普比率。

H1b若系统误差的影响强于估计误差的影响,则GMV的样本期外夏普比率优于EW的样本期外夏普比率。

此外,估计误差随N的扩大而扩大,但关于系统误差与N的关系在已有研究中并未取得一致结论。由此,本文在同基数组的情况下对GMV和EW的夏普比率做差,形成一个新的变量Gap-SR,通过非线性回归的方法探究Gap-SR与N之间的关系。考虑非线性关系的原因在于,估计误差和系统误差在理论上随N的变化方向相反。因此,本文提出以下假设:

H2Gap-SR与N之间存在倒U型的相关关系。

1.3 投资组合选择与尾部风险

对于投资组合选择与尾部风险的关系,Hwang等[15]基于收益序列rt独立同分布,且满足对数正态分布的假设,推导了EW与均值-方差模型的VaR差异。在收益序列独立同分布的假设下,EW和均值-方差模型的条件价值分别表示为(14)和(15):

(14)

(15)

其中,β是对应的置信区间。根据Marshall和Olkin[16]的推理,在收益率序列存在尖峰厚尾特征时,(16)成立。进一步可得到(17)的结论:

(16)

VaRβ(Rx*)

(17)

而齐岳和廖科智[17]则发现,中国股市存在明显的尖峰厚尾特征。鉴于此,本文提出如下假设:

H3EW所导致的尾部风险显著高于GMV所导致的尾部风险。

2 研究样本及算法设定

2.1 研究样本与模型设定

本文以沪深两市上市公司为样本空间,删除在2007年1月~2019年12月收益率具有缺失值的研究样本,共得到425只股票156个月的平衡面板数据。在计算夏普比率时,本文以一年期定存利率作为无风险利率。本文数据来源为CSMAR数据库。

为了呈现系统误差与估计误差随N的变化,本文选取GMV和EW进行比较。获取权重的计算过程如下:

(18)

(19)

为了验证误差修正方法对系统误差与估计误差权衡的影响,本文对协方差矩阵进行线性变换,观测变换后样本期外绩效的变化。参考DeMiguel等[14]的做法,本文对权重空间施加范数约束。同时,Boyd和Vandenberghe[18]指出,定义在实数域Rn上的a范数‖x‖a均可由二次范数‖x‖p渐进表示:

(20)

其中:

‖x‖p=(xTpx)1/2=‖p1/2x‖2

(21)

因此,本文采用二次范数约束的方法对GMV进行估计误差修正:

(22)

其中δ表示约束强度的系数,本文取δ=0.05,与样本协方差矩阵的方差元素保持在相似的数量级水平。本文选取单位矩阵I,样本协方差矩阵的对角矩阵D和等相关系数矩阵EC作为矩阵P的备选。对应的投资组合模型命名为GMV-I,GMV-D和GMV-EC。

2.2 算法设定

本文采用样本期外滚动检验的方法对投资组合绩效进行计算。具体计算过程可参照DeMiguel等[3]。对每一个投资组合,本文滚动计算96个权重向量,并在此基础上形成投资组合样本期外绩效的各项测度指标。选择2007年1月作为估计窗口开始时间的原因是:大部分上市公司在2006年底完成股权分置改革,较大程度地解决了流通股与非流通股市场分割的问题。

为了呈现系统误差与估计误差权衡在N下的变化动态,本文以5只股票为起点,100只股票为终点,5为步长,构建了20组具有不同N的投资组合。将N的范围设定在[5,100]的原因在于:已有关于投资组合估计误差的理论分析主要聚焦于N与估计窗口长度M的关系,算法设定中需要涵盖N大于,等于和小于M的样本。

为了避免特定股票池样本所导致的样本选择问题,本文将Bootstrapping应用到优化取样的过程中。具体来说,本文以N为分组标准,425只股票为资产池,对每组投资组合进行了100次抽样,最终求解了10000个投资组合选择问题。最后,按照基数组和投资组合模型类别对计算结果取均值,得到样本期外权重。

2.3 投资组合绩效测度标准

为了探究投资组合样本期外绩效随N的变化,本文采用如表1所示的投资组合绩效测度标准对EW、GMV及其误差修正模型的样本期外绩效进行测度。篇幅所限,具体指标计算过程请参见表1中列示的相关文献。

表1 投资组合绩效测度标准

3 样本期外绩效结果

3.1 样本期外期望收益,标准差和夏普比率

本文首先汇报变动基数下各投资组合的样本期外收益,标准差和夏普比率。GMV-P是GMV-I,GMV-D和GMV-EC的平均计算结果。图1中,GMV的期望收益在所有的N下均高于EW,同时标准差持续低于EW,故GMV的夏普比率也持续高于EW。但GMV与EW的差距受到N取值的影响,当N小于M时,随着N的扩大,EW和GMV夏普比率的差距在逐渐扩大。

表2进一步汇报N取值为20,40,60和80的具体指标。从标准差上来看,当N小于M时,GMV的样本期外的标准差随N扩大逐渐降低,并在均在10%的显著性水平下低于同基数组的EW。GMV-P的样本期外标准差也显著低于EW,但高于同基数组的GMV。而当N大于M时,GMV与EW标准差之间的差值在统计上无法拒绝零假设,GMV-P与EW标准差之间的差值仍可在10%的显著性水平下拒绝零假设。从夏普比率来看,当N小于M时,GMV的样本期外夏普比率随着N的扩大逐渐扩大,并在均在10%的显著性水平下低于同基数组的EW,研究结果支持了假设H1b。而当N大于M时,GMV样本期外夏普比率数值仍大于EW。

进一步,为了验证假设H2,本文以2000组投资组合的计算结果为样本,用二次函数表达式对Gap-SR和N的关系进行拟合。拟合结果如(23)所示。

Gap-SR=0.0083+0.1236N-0.0007N2

(23)

其中,一次项系数0.1236对应的t值为6.66,二次项系数-0.0007对应的t值为-4.29,均在1%的显著性水平下拒绝零假设。研究结果验证了假设H2,即Gap-SR与N之间存在倒U型的相关关系。当N的取值较小时,系统误差随N上升的增量大于估计误差随N上升的增量。

综合来看,随着N的扩大,GMV投资组合的样本期外夏普比率经过了一个逐渐增加然后趋于平缓的过程,而EW的样本期外夏普比率对N的变化则不敏感。GMV在各基数设定下均取得了较高的夏普比率,但夏普比率的提升是由样本期外标准差的降低所驱动的。

表2 样本期外收益,标准差和夏普比率

图1 样本期外收益,标准差和夏普比率

3.2 样本期外尾部风险

图2汇报尾部风险的相关指标。计算VaR和CVaR时,本文将显著性水平β选定为1%。图2中,EW的VaR和CVaR均处于较高水平,且随N的变化幅度较小。在N较小时,GMV的CVaR也较高,在N等于5时高于EW。但随着N的提升,GMV的VaR和CVaR均呈持续下降的趋势。在N大于30后,GMV在1%情形下的VaR为0,而CVaR则围绕4%上下波动。研究结果初步验证了假设H3。

表3 样本期外尾部风险

表3汇报了具体结果。当N大于20时,GMV在1%的极端情况下损失为0,对应的EW的VaR维持在0.3%左右。当N等于5时,GMV的CVaR为0.0468,高于对应的EW。但当N逐渐扩大时,GMV的CVaR逐渐降低,在N大于20后GMV的CVaR围绕0.04上下波动,明显低于同基数组的EW。考虑到EW和GMV的尾部风险对N的敏感性较低,本文利用均值t检验直接比较所有的EW和GMV尾部风险。经过计算,2000组样本中,EW的平均CVaR为0.0495,GMV的平均CVaR为0.0433。EW的平均CVaR在1%的显著性水平下高于GMV,对应的t值为40.53。研究结果支持了假设H3,即EW所导致的尾部风险显著高GMV所导致的尾部风险。

图2 样本期外尾部风险

3.3 样本期外集中度,换手率和确定等价收益

图3汇报了集中度,换手率和确定等价收益,图中汇报的确定等价收益对应的系数等于1。图3中,EW的集中度随N的增加迅速下降,由0.2下降至接近0。但当N取值较大时,GMV集中度随N增加的变化速度明显降低,表明GMV的边际分散化收益在逐渐降低,均值-方差优化会导致相对集中的优化结果。而从换手率来看,GMV和GMV-P的换手率随N增加呈现线性上升的趋势,由于现实的股票交易会产生一定的交易成本,高换手率会导致较高的交易成本。结合前文中对样本期外夏普比率的分析,在N超过M后,N的增加无法带来样本期夏普比率的提升,但却会导致更高的交易成本,形成无谓损失。

表4进一步汇报了具体结果。表4中,随着N的取值由5变化到100,EW的集中度由0.2下降至0.01,而GMV得集中度从0.4016下降至0.2286。当N处于[0,20]时,GMV集中度由0.4016下降至0.2977。而当N处于[20,100]时,GMV集中度由0.2977下降至0.2286。研究结果部分解释了Chen和Yuan[5]的理论分析与样本期外夏普比率数据出现差异的原因。Chen和Yuan[5]指出,当N足够大时,增加约束条件并不会造成严重的信息损失。而计算结果表明,即使在100只股票的组合中,GMV的分散化程度仍然较低。GMV与GMV-P的差异说明,增加约束条件仍会导致较大的信息损失。

从换手率来看,EW不存在权重调整的问题。然而,GMV的换手率随N的增加逐渐上升,含有5只股票的GMV换手率是0.0726,而含有100只股票的GMV换手率是0.1644。进一步,本文以2000组投资组合的换手率为基础,线性拟合了GMV换手率与N的关系,结果如(24)所示:

TurnoverGMV=0.0977+0.0007N

(24)

其中,一次项系数0.0007对应的t值为5.76,在1%的显著性水平下拒绝了零假设。研究结果表明,N每增加1个单位,GMV的换手率大约增加0.0007。当N取值较高时,基数增加所带来的分散化收益会被估计误差带来的损失所抵消,同时投资组合的换手率也会持续提高,带来较高的交易成本。

最后,γ=1和γ=5对应了低风险厌恶和高风险厌恶的投资者。对于高风险厌恶投资者来说,仅有部分GMV和GMV-P取得了正的确定等价收益,EW的样本期外确定等价收益均为负。对于低风险厌恶者来说,GMV也取得了较高的确定等价收益。

表4 样本期外集中度,换手率和确定等价收益

图3 样本期外集中度,换手率和确定等价收益

4 不同市场状态下的进一步讨论

为了得到更稳健的研究结论,本文在不同的市场状态下继续讨论系统误差-估计误差权衡与N之间的关系。基于上证指数的走势,参考赵慧敏等[21]的计算,本文将2012年1月~2019年12月的市场状态划分如下:

表5 市场状态划分

基于表5,本文进一步讨论研究结果在牛熊市下的差异,主要对EW和GMV的样本期外夏普比率和CVaR进行比较。

4.1 不同市场状态下的样本期外夏普比率

表6汇报了不同市场状态下EW和GMV的样本外夏普比率。由表6可知,三轮牛市中,GMV均取得了高于EW的样本期外夏普比率。其中,在第二轮牛市中,GMV与EW的差距最大,平均达到了0.5738。并且,当N处于[5,40]时,系统误差在投资组合样本期外绩效中产生了较大影响。但当N处于(40,100],GMV与EW差距随N的增速逐渐放缓。综合来看,GMV策略在牛市中呈现了较好的样本期外表现。而在第一轮和第二轮熊市中,GMV的样本期外夏普比率不再持续地高于EW。在熊市状态下,估计误差的影响占据主导,导致GMV的夏普比率不再持续高于EW。

表6 不同市场状态下的样本期外夏普比率

4.2 不同市场状态下的样本期外CVaR

表7汇报了不同市场状态下EW和GMV的样本期外CVaR。由表7可知,三轮牛市中,GMV的尾部风险均低于同基数组的EW。其中,在第一轮牛市中,GMV与EW的差异最大,平均达到了0.0297。当N处于[5,40]时,CVaR的下降速度最快。在第二轮和第三轮牛市中,GMV和EW的差距较小,且在变动基数下维持在相对平稳的水平。

表7 不同市场状态下的样本期外CVaR

而在四轮熊市中,GMV的尾部风险均低于同基数组的EW。其中,在第二轮熊市中,GMV与EW的差异最大,平均达到了0.0256。当N处于[5,40]时,CVaR的下降速度最快。在第四轮熊市中,GMV和EW的样本期外CVaR处于相对平稳的水平。研究结果表明,GMV能够为投资者规避极端损失,降低牛熊市中的投资组合尾部风险。

4.3 研究结果的稳健性讨论

为了增强研究结论的可靠性,本文进行了一系列的稳健性分析。首先,本文计算了不同估计窗口长度对研究结果的影响,包括的情形M={45,75},研究结果与表2,表3反映出的趋势基本一致。其次,本文计算了卖空约束,上下界约束和压缩估计方法对GMV的影响。上述投资组合模型与GMV-P取得了相似结果,误差修正方法的使用导致GMV优化结果的权重更加分散,样本期外夏普比率处于EW和GMV之间。最后,本文加入了市值加权策略作为对比,得到了与前文类似的研究结论。限于篇幅在此不再汇报具体数据结果。

5 结语

本文在变动基数的设定下研究了投资组合选择中的系统误差与估计误差权衡问题,以沪深两市425只股票月度收益率为研究样本,基于Bootstrapping和样本期外滚动的方法,检验了GMV,GMV-P和EW在样本期外绩效,尾部风险和交易成本等方面的差异,并在不同的市场状态下讨论了计算结果的差异。

研究结果发现:(1)从样本期外绩效来看,GMV与EW的样本期外夏普比率差异与N存在倒U型的关系。总体来看,系统误差对投资组合样本期外绩效的影响强于估计误差。(2)从尾部风险来看,GMV的样本期外CVaR在大多数基数组中小于EW。(3)GMV的投资权重较为集中。同时,GMV的换手率与N正相关,在N超过M后,N的增加无法带来样本期夏普比率的提升,但却会导致更高的交易成本,形成无谓损失。

投资组合选择模型的理论研究对投资组合优化是否能增加价值仍存在着激烈的争论。本文的研究结果表明,由于估计误差和系统误差的存在,简单地追求资产基数的增加并不能给投资组合带来更优的样本期外绩效,投资者在配置资产时应充分考虑估计可用历史数据的窗口长度。

猜你喜欢

系统误差夏普基数
一次性伤残就业补助金的工资基数应如何计算?
千万不要乱翻番
社保缴费基数合理化可探索更多路径
巧妙推算星期几
基于ADS-B的航空器测高系统误差评估方法
基于Bagging模型的惯导系统误差抑制方法
用系统误差考查电路实验
基于奇异谱的精密离心机空气轴承主轴回转系统误差分析