APP下载

夏普比率:估算方法、适用性与实证分析

2022-01-08林红梅杜金艳张少东

统计学报 2021年6期
关键词:夏普比率方差

林红梅,杜金艳,张少东

(上海对外经贸大学统计与信息学院,上海 201620)

一、引言

在经济全球化深入发展的今天,中国证券市场作为一个新兴证券市场,虽然起步较晚,但成长迅速,目前已经取得了举世瞩目的成就,它在促进国有企业改革、推动我国经济结构调整和技术进步方面发挥了重要作用。证券投资基金是市场上重要的投资渠道和理财产品,投资者通过将资金同时交给基金管理公司中的基金经理进行管理达到分散投资风险和提高收益的目的。随着人们投资意识的增强,越来越多的投资者倾向于将可自由支配的资金用于投资股票和基金,以期快速获得更高收益。证券市场为了满足不同消费者的需求,大幅增长基金规模和不断增加基金种类。截至2021 年9 月,全市场公募基金产品共有8 866 只,基金管理公司有151 家,对应资产净值合计为23.90 万亿元,较2019 年末的19.89 万亿元增长了4 万多亿元,由此可见基金业发展迅猛。目前,中国的证券投资基金已成为股票市场中最有实力的机构投资者,已步入以基金为代表的机构化投资时代。但应当注意,我国股票、期货市场的投资者以散户为主,大多缺乏专业投资知识和市场投资经验,且证券投资基金的各种法规不健全,再加上证券市场会同时受到经济周期、国家政策、人为操纵、市场内部因素、通货膨胀、投资者情绪等多种因素的影响,导致投资者难以准确把握未来市场变化的内在规律而进行盲目投资,增加了投资风险。那么,如何从不断变动的金融市场中挑选出优秀的投资组合就成为了投资者重点关注的问题,为此,如何利用科学的指标对基金绩效做出客观合理评价进而引导投资者进行有效投资就成为了学者重点研究的问题。为了在投资中给投资者提供更专业的指导,目前金融研究工作者针对基金的业绩评价问题、选股与择时能力、业绩持续性等方面展开了进一步研究,研究发现市场中存在低波动率异象,即波动率低的投资组合在长期投资中会比波动率高的投资组合获得更高收益,这与马科维茨组合理论中波动率越高则收益率越高的理论相违背。当投资者获得证券市场知识的普及后,理性的投资者会意识到面对众多基金产品仅用收益来衡量基金业绩是不全面的,只关注高收益而忽视风险对投资的影响会导致投资决策错误,可以通过选择不同的投资组合来分散风险,得到收益最大化和风险最小化的投资组合,因此使用风险对收益进行调整是基金业绩评价的重要转变。特雷诺比率(Treynor ratio)、詹森指数(Jensen index)和夏普比率(Sharpe ratio)是基于均值-方差模型调整的收益指标,可以对投资绩效做出有效评价。夏普比率作为评价基金收益和风险的经典三大指标之一,反映了投资组合总体波动获得的风险补偿,能够对投资组合进行资源配置和绩效评判,从而提供有效的决策方案,规避投资风险,这对维护证券交易市场稳定和促进经济快速发展有重要指导意义。

二、文献综述

Markowitz(1952)[1]将概率论和线性代数方法应用于证券投资组合研究,建立了均值-方差投资组合模型,提高了投资者在投资时要同时关注收益和风险两个指标的思想,其中投资收益用投资回报的期望值表示,投资组合收益的风险用方差表示。Markowitz 还提出,投资者在预期收益相同时要选择风险承担小的投资,在承担风险相同时要选择预期收益高的投资,这种思想为现代西方证券投资理论奠定了基础。同年,国外学者Roy(1952)[2]首次提出使用风险报酬指标评价投资组合的表现,结果显示具有高回报率投资组合的排名更好。之后,Sharpe(1994)[3]简化了Markowitz 的均值-方差模型,在资本资产定价模型(CAPM)的基础上提出了夏普比率,其以资本市场线为评价基点,当投资组合的夏普比率大于市场基准组合的夏普比率时,该投资组合就位于资本市场线之上,表现好于市场,反之则该投资组合位于资本市场线之下,表现劣于市场。夏普比率是风险调整后的收益率,能够同时衡量投资组合的收益与风险,已在金融领域得到了广泛应用,Sharpe 也因此获得了诺贝尔经济学奖。夏普比率的基本思想为,当收益相近时选取风险水平较小的基金,当风险水平相近时选取收益较高的基金,这可以帮助投资者跳出高收益必然要承担高风险的误区,由此解决了基金在不同风险和收益率情况下绩效难以排名的问题。夏普比率的计算方法为,用基金净值增长率的平均值减去无风险利率再除以投资组合收益率的标准差,代表单位总风险上的超额收益,反映了单位风险内基金净值增长率超过无风险利率的程度。根据定义,传统夏普比率的计算公式为:

其中,SR 为投资组合的夏普比率;μ 为投资组合的预期收益率;Rf为无风险利率,通常假设为常数;σ 为投资组合收益率的标准差,为投资组合总风险的数学度量,同时考虑了系统风险和非系统风险。从公式(1)可以看出:当SR 大于1 时,超额收益大于风险;当SR 小于1 时,超额收益小于风险;当SR等于0 时,超额收益为0;当SR 小于0 时,投资后平均净值增长率低于无风险利率,表示投资是无意义的。在使用夏普比率时需要注意:单只基金夏普比率值的大小并无实际意义,需要在同类型基金中进行比较才有意义,基金的夏普比率值越大,在单位风险内获得的超额收益也越大,投资价值越高。

夏普比率的适用性很好,也在研究中得到了进一步发展与应用。Whitelaw(1994)[4]将夏普比率加入到了时间序列中并首次提出了时变夏普率(Timevarying sharpe ratio),与夏普比率相类似,都表示单位风险的超额收益。但是,时变夏普比率的收益率与方差关系是通过回归方法得到,因此呈现出随时间而改变的特性,可以根据其变动趋势进行有效择时,也可以对市场的涨跌方向做出有效判断。目前学者们用滚动回归模型结合ARMA 模型计算时变夏普比率,证明了时变夏普比率对买卖时机有一定的预测能力,能帮助投资者做出择时策略。Vinod and Morey(1999)[5]研究了夏普比率的性质,认为夏普比率在小样本分布下是非正态的,此时利用超额收益除以标准差的方法是有偏差的。由于夏普比率的抽样分布和实现渐进分布的样本大小难以确定,因此无法在夏普指数点估计值中生成置信区间和进行假设检验。为解决计算夏普比率存在的抽样误差,Vinod and Morey(1999)[5]利用自助法(Bootstrapping Methodology)从原始收益率中重新抽取样本,并用再生样本估计风险,提出了一个新的包含估计风险的复夏普比率(Double Sharpe ratio),这是对夏普比率的一个改进,它可以解释组合风险和估计风险,且利用自助法计算出的夏普比率总是略高于传统夏普比率的点估计。当两个不同的投资组合有相似的夏普比率点估计时,可以利用自助法计算得到估计风险,从而选择估计风险较小的投资组合。Vinod and Morey(1999)[5]利用复夏普比率在实证分析中发现,30 只最大的成长型共同基金的夏普比率和双夏普比率的排名有很大不同。余润等(2003)[6]通过对复夏普比率和夏普比率进行比较说明了复夏普比率的统计优越性,验证了其在实证中的科学性和可行性。孙静和邱菀华(2003)[7]对传统夏普比率进行了推广,提出了用于投资基金绩效评价的新决策准则,该准则放宽了对自相关的要求,可以有效解决投资决策中的相关性问题,虽然其比传统夏普比率的适用范围更广,但该准则依然会受到均值-方差模型的限制,当收益率序列呈非正态分布时是不适用的。高全胜(2005)[8]通过对传统夏普比率进行深度理解重新对夏普比率进行了结构性解释,认为夏普比率计算公式中的分母应与分子部分保持一致,应为投资组合风险与无风险资产风险之差的标准差,对相容风险测度下和纯粹风险资产组合下的夏普比率进行了推广,并提出了VaR (Value at Risk) 和CVaR(conditional value at risk)意义下的结构夏普比率,且通过实证研究表明结构夏普比率可以充分考虑投资组合结构对风险的影响。宋红雨(2006)[9]提出,以市场指数为基准用超额收益的标准差作为指数化投资的跟踪误差可得到信息比率,同时指出夏普比率并非越大越好,若基金相对于基准为负,则会导致夏普比率为负值,此时就需要对其进行修正后再进行比较排名。目前夏普比率不仅被用于基金绩效评估,还在多个领域得到了广泛应用。张海英(2008)[10]基于经济学中投资组合理论的相关内容,提出了一种基于夏普比率的信息检索系统性能评价方法,将信息检索中的查全率和查准率类比为经济学中的收益和风险,该评价方法有利于信息检索系统的开发和改进。黄文强(2017)[11]以三年内数据为标准计算了夏普比率,研究了债券市场各投资品种在买入持有策略下的夏普比率及其变化趋势,得出利率债以及中等级、高等级信用债投资在短久期品种中具有更高的夏普比率和更好的投资绩效,信用债的等级越低夏普比率值越高,由此提出了在债券市场投资时如何构建具有更高夏普比率投资组合的策略。叶志强等(2010)[12]采用夏普比率和BDSS 模型从安全性、盈利性和流动性三个方面分析了我国企业债券市场和股票市场之间的关系,探究了企业债券市场不活跃的原因。邓洪武等(2021)[13]针对提高深度学习模型的泛化能力提出了一种基于时不变稳定性和夏普比率的深度学习模型泛化能力优化方法,过程中可以利用夏普比率和注意力机制对模型中间输出的分布进行收益分析和组合优化:首先利用Wasserstein 距离找到每个特征与最优表达之间的最优传输路径,之后基于夏普比率的选择性池化与连接思想选择性构建神经元聚合结构的最优资产组合,这种优化方法能够降低模型泛化优化过程中对于训练集规模和算力的要求,可以有效提高训练效率。吕之安和李少育(2021)[14]首次从企业投资的风险-收益角度出发对影响企业夏普比率的因素进行了研究,通过构建夏普比率衡量了企业投资效率和资产配置的有效性。王一如和韦宏耀(2021)[15]用夏普比率衡量了家庭资产配置效率,并运用Tobit 模型探究了数字金融对家庭资产配置效率的影响。

虽然传统夏普比率的计算方法比较简便且易于理解,但随着在实践中的频繁使用,人们认识到夏普比率本身存在一定的缺陷和限制条件,例如:夏普比率是一个点估计值,会受到不同统计特征样本量的影响;均值-方差模型隐含的假设为收益率序列需服从正态分布,如此才可用股票收益率的均值和方差来衡量股票的收益和风险,然而金融时间序列通常不满足正态分布且方差具有时变性;在对冲基金中盲目使用夏普比率会忽略大量的极端风险;利用标准差衡量风险忽视了收益率的高阶矩信息,且对时间序列的要求是平稳的;夏普比率容易受人为操纵而创造出高左尾风险分布的收益率序列,在这种情况下会产生“虚高”夏普比率,这样利用夏普比率评价投资组合业绩的结果会失去意义。丁庭栋和李富军(2011)[16]基于这些问题总结了国内外学者对夏普比率进行的修正与调整方法,并介绍了不同版本的夏普比率。黄金波等(2018)[17]指出目前对传统夏普比率的修正思路主要分为两个方面:一方面,放松收益率需服从正态分布的假设并寻找更合适的分布函数,如Laplace 分布、Levy Tempered Stable 分布、Skewed-t 分布;另一方面,寻找符合尖峰厚尾和有偏性的其他风险度量指标代替标准差。学者认为投资者通常更关心下跌的风险,Dowd(2000)[18]证明了利用风险价值衡量风险的优势,其用下限风险(Downside Deviation)取代夏普比率中的标准差,由此得到了修正的广义夏普比率,经研究发现广义夏普比率对基金绩效的评估结果要优于传统夏普比率。施炳宽(2018)[19]提出,基于VAR 的修正夏普比率和基于预期损失(Expected Shortfall,ES)修正的夏普比率可以弥补用标准差衡量风险的不足。宋光辉等(2013)[20]和李雪(2017)[21]利用多重分形波动测度指标代替标准差衡量风险对传统夏普比率进行了修正,并证明了基于多重分形波动测度指标的夏普比率能够提高评估的准确性。杨爱军和孟德锋(2012)[22]研究发现,基于传统夏普比率和考虑收益率高阶矩的广义夏普比率的排名基本一致,表明传统夏普比率在评价基金绩效时仍能发挥重大作用。余湄等(2014)[23]提出了夏普概率值,即在收益率满足非正态分布时计算得到的夏普比率高于给定基准值的概率,它可以筛选出夏普比率“虚高”的投资组合和拒绝夏普比率存在“虚高”原假设所需要的最小样本量,进一步研究发现,延长样本区间或提高抽样频率能降低收益率在非正态分布下夏普比率存在的“虚高”现象。Tajdini and Mehrara(2019)[24]采用条件标准差代替无条件标准差,为了克服传统夏普比率引入的其他缺点,采用双面均衡条件夏普比率(Double-sided balanced conditional Sharpe ratio)解决了盛衰周期的时间不对称问题,这可以使投资者无论在繁荣时期还是衰退时期都能实现持续稳定的利润。

综上所述,虽然传统夏普比率在使用时会有一些限制条件,但在实际应用中能有效反映基金分散风险的能力,能够对投资组合绩效做出有效的理论解释并解决资产最优配置问题。而且,在夏普比率基础上发展出的不同版本夏普比率指标在实际应用中也能作为基金绩效评价方法,但不同版本的夏普比率与传统夏普比率相比缺乏一定的金融理论基础。基于此,找到准确计算夏普比率函数的方法就成为了学者们不断研究的对象。目前国内外学者通过提出不同收益率序列的假设条件来不断修正和完善计算方法,并使用参数法、非参数法、时间序列分析法、交替方向乘子法(Alternating Direction Method of Multipliers)算法等多种方法对其展开研究,得到了更为准确的夏普比率估计值。本文将在之前学者研究的基础上对夏普比率指标以及夏普比率函数的计算方法进行研究综述,以了解夏普比率的研究现状。

三、夏普比率计算方法

通过查阅文献,本文对现有计算夏普比率函数的主要方法进行综述,主要分为间接法和直接法。因夏普比率是超额收益与投资组合波动率的比值,若采用间接方法则问题转化为分别求解收益率序列的均值和标准差后再进行比值来计算得到夏普比率函数,若采用直接法则问题转化为将收益率序列均值和方差的比值作为一个整体来直接计算得到夏普比率函数。目前计算均值和方差的方法有很多,其中最简单的为矩估计法,具体是利用样本一阶矩来估计总体期望,利用二阶样本中心距来估计方差,即利用历史收益率序列数据分别估计总体的均值和方差(Lo,2002)[25]。随着异方差非参数回归模型和非参数方法的引入,可以计算出收益率序列在异方差情况下的条件均值函数和条件方差函数(Fan and Gijbels,1996)[26]。Liu and Chen(2020)[27]提出,对对数收益率序列构建ARMA-GARCH 模型可以分别对超额收益的均值和方差进行预测,该方法和上述方法都是通过间接方法计算夏普比率。但随着学者的进一步研究,发现可以直接将均值和方差的比值作为整体进行估计。Kim et al.(2018)[28]利用异方差非参数回归模型的极大似然估计法将条件均值和条件方差的比值作为一个整体,重新参数化后将不易求解的非凸夏普比率函数转化为等价的凸函数, 并证明了其定义域也是凸的,之后利用多项式样条法计算了夏普比率函数。Lin et al.(2021)[29]进一步研究了异方差非参数回归模型的局部极大似然估计问题,其利用局部线性估计直接估计了夏普比率函数,并利用牛顿迭代法和回切算法得到了收敛的夏普比率函数值,通过比较发现直接计算夏普比率得到的估计值与真实值之间的误差减小,且计算效率较高,但随着数据维度的增加可能会因样本数据过少而遇到维数祸根问题,在高维空间下可能会有一定局限。刘媛媛(2020)[30]从数学角度求解金融问题,其把夏普比率的求解问题转化为等价的二次规划问题,将非凸的夏普比率函数转化为凸函数,并在证明函数有凸的定义域后针对最小化非因子回报以及最大化夏普比率这两个问题使用ADMM 算法将一个问题分成可分布式的多个问题,进一步同时对多个问题进行交替求解,找到全局最优解,并通过数值实验验证了算法的有效性和收敛速度较快,此方法适合求解大规模分布式优化问题,解决了在高维数据下最大化夏普比率问题。

比较各方法可见:参数法计算简便但准确度不高;非参数法计算效率高且能得到夏普比率函数的全局最优解,但可能会因样本量不足而造成维数灾难;时间序列分析法中构建的ARMA-GARCH 模型可以消除收益率序列的异方差性,能更准确地预测收益率和方差的变化,能够利用估计出的参数直接带入公式来估计夏普比率函数,计算简便快捷;小波分析法通过设置不同的尺度参数计算多期夏普比率,解决了多期基金业绩评价问题,实用性较强;ADMM 算法可以解决高维数据下的最大化夏普比率问题,并且在二次规划算法中收敛速度较快。

(一)参数估计法

由此可见,利用参数方法计算夏普比率简单快捷,但只利用了样本低阶矩,忽视了高阶矩的信息。而且,在收益率服从独立同分布的条件下,利用样本数据计算出的夏普比率越高,越会产生较大标准差,导致夏普比率的置信区间不准确。当收益率不服从正态分布时,会增加夏普比率的方差,进而缩短点估计的置信区间,导致产生误差。

(二)非参数法

1.异方差非参数回归模型介绍。非参数统计方法对总体分布的假定要求条件较宽泛,不需要事先给定解释变量与被解释变量之间的函数关系,而是通过未知函数建立响应变量与解释变量之间的关系。该方法根据从数据中获取的信息进行拟合,对整个回归函数进行估计,减小了因对模型直接进行设置而产生的误差,具有较好的稳定性和适应性。在利用非参数法求解问题时,可以采用样条方法将问题转化为参数估计问题进行全局估计,也可以使用局部线性或局部多项式估计对参数进行局部估计。异方差非参数回归模型中的异方差体现在方差会随观测变量而改变,具有一定的灵活性。例如在证券市场中,由于受各种因素影响,股票价格在持续变动,其收益率序列的均值函数和方差函数也会发生改变,而异方差非参数回归模型可以反映数据间的异方差性和序列相关性,因此异方差非参数回归模型被广泛应用于金融、医疗等多个领域。

建立异方差非参数回归模型:

其中,εi是独立同分布,服从均值为0、方差为1的高斯分布,且εi与样本点{(xi,yi),i=1,2,…,n}相互独立,则E(y|x)=μ(x),Var(y|x)=σ2(x),这里μ(x)为收益率的条件均值函数,σ2(x)为恒正的条件方差函数。

2.核函数与窗宽相关理论介绍。核函数是一个具有有界支撑的对称密度函数,常用的核函数有均匀核函数、Epanechnikov 核函数、Quartic 核函数、Gaussian核函数、Triweight 核函数和Cosine 核函数。k(u)为非负的核函数,需要满足五个条件:(1)对称性,k(u)≥0,k(u)=k(-u);(2)正则性,∫k(u)du=1;(3)∫uk(u)du=0;(4)0<∫u2k(u)du<∞;(5)∫k2(u)du<∞。

对于窗宽h,在对目标函数进行估计拟合时应选择合适的窗宽,因为:当窗宽h 过大时,估计的偏差会变小,但方差会增大,会得到过分光滑的估计曲线;当窗宽h 过小时,估计的偏差会增大,方差会变小,会得到欠光滑的估计曲线。选取窗宽的一个合理办法就是综合考虑估计偏差和方差的影响,即通过极小化均方误差(MSE)来平衡偏差和方差,以获得最优的窗宽h,使估计效果最佳。常用的选择光滑参数的方法包括:交叉验证和广义交叉验证。交叉验证(CV)是选择窗宽h 的一种简单实用的方法,可通过如下目标函数选取窗宽:

其基本思想为:通过去掉第i 个样本的(Yi,Xi)排除在观测点x=Xi处过分夸大的作用,提高其他观测点的重要程度,从而提高估计效果。在交叉验证中,对于每一个检验的光滑参数估计量的计算都需要拟合n 条曲线,造成计算量巨大,但经过研究已可以应用软件宏包里的交叉验证法选取最优窗宽。

3.非参数方法计算夏普比率函数的具体应用。对于异方差非参数回归模型中的均值函数μ(x)和方差函数σ2(x),目前关于这些参数计算方法的研究成果较丰富,可以利用非参数法分别进行估计(Fan and Gijbels,1996)[26],如可以利用光滑样条法、局部多项式回归、局部常数回归计算得到收益率的条件均值函数,基于残差方法或基于差异方法计算得到条件方差函数。虽然对均值函数和方差函数的研究有很多,但目前没有人将二者联合起来进行比值计算从而间接估计出夏普比率函数,其具体方法包括四步。

第一步,建立异方差非参数模型:

yi=μ(xi)+σ(xi)εi,i=1,2,…,n

第二步,计算条件均值函数μ(x),取独立随机样本点(xi,yi),可以利用光滑样条法、局部多项式回归或局部核估计方法计算条件均值函数。

Kim et al.(2018)[28]联系金融背景,将夏普比率建模为一个时变市场的光滑函数,并对该函数提出了一种带有粗糙度惩罚的直接最大似然估计。在计算夏普比率函数时引入异方差非参数回归模型,利用极大似然函数法将均值函数和方差函数的比值(夏普比率)作为一个整体,重新参数化,将夏普比率函数和逆波动率函数转化为凸函数,并将同方差和异方差情况下的夏普比率估计问题转化成求解有限维凸优化问题,从而得到全局最优解。该方法首次将夏普比率作为整体进行求解,比分别计算均值函数和方差函数的两步式间接计算方法的效率更高,且提高了计算的准确性,该方法具体包括三步。

第一步,利用异方差非参数回归模型通过扰动项的假设条件计算响应变量y 的分布。

E(y)=E(μ(x)+σ(x)ε)=μ(x)

Var(y)=Var(μ(x)+σ(x)ε)=σ2(x)

则y~N(μ(x),σ2(x))

第三步,在同方差和异方差条件下,将问题转化为最优化约束问题,并利用非参数三次样条估计法构造样条空间和基函数进行求解,得到f(x)的多项式样条估计。

Kim et al.(2018)[28]只研究了夏普比率函数的估计方法,并未对其理论性质进行证明,而Lin et al.(2021)[29]则在此基础之上利用局部线性回归估计了夏普比率函数并进行了理论证明。同样采用异方差非参数回归模型,并将条件方差函数取对数,从而保证σ(xi)满足其非负性,计算过程为:首先,选择核函数并利用最小二乘交叉验证法使积分均方误差达到最小,选择出最优窗宽,并通过局部线性估计法估计夏普比率函数,此处局部回归的思想为利用核函数在离x 较近的样本点赋予较大权重,提取出更多关于密度函数的信息;其次,利用回切算法给定初始值,与牛顿迭代法一起计算得到收敛的夏普比率估计值,进一步研究出估计量的渐进正态分布。Lin et al.(2021)[29]通过蒙特卡洛模拟仿真和实例比较说明了该方法的有效性,并得到在样本容量很大时估计的夏普比率值与真实值之间的误差比Kim 提出的三次样条估计法的误差更小,且计算更加精确快捷。但需注意,当局部区域内数据太少或者带宽较小时,Hessian 矩阵会成为奇异阵使模型失真,导致维数灾难,算法收敛缓慢。该具体方法包括四步。

为了得到两个目标函数的有效值,分别选取两个窗宽h1和h2,此处涉及核函数的选取以及最优窗宽的选择。

第三步,将f(xi)、g(xi)在X=x 处进行泰勒展开,则有:

第四步,利用回切法和牛顿迭代法计算参数值,具体为:

此目标函数可以利用局部线性回归计算出窗宽h1,并得到f(xi)的估计值,同时得到夏普比率函数f(x)的估计值β0,再利用回切法和牛顿迭代法对所估计的函数值进行迭代修正,计算参数值,直到得到两个收敛的函数估计值。最后得到夏普比率函数即β0的计算结果为:

Lin et al.(2021)[29]利用局部线性估计方法进行蒙特卡罗模拟实验,研究了这种方法在有限样本中的估计性能,与之前提出的三次样条法、分别估计均值函数和方差函数的间接法以及当方差函数已知时的夏普比率函数的oracle 估计进行比较,可得估计的总体性能会随着样本量的增加而提高,验证了利用局部线性估计方法的有效性。

(三)时间序列分析法

在估计夏普比率函数时需要对均值函数和方差函数进行建模,目前对波动率的预测模型可分为历史信息法和隐含波动率法。历史信息法中的GARCH模型可以利用金融市场中已有的历史数据找到时间序列之间隐藏的规律。GARCH 模型是在ARCH 模型的基础上进一步研究后建立的,它比ARCH 模型更加简便,它加入了误差项条件方差的滞后期,将影响因子扩展为均方误差和条件方差前期值,相比于ARCH 模型能够在较低阶数对高阶的滞后过程进行描述,能够更好地解决波动集群问题,可有效排除资产收益率中的过度峰值。而且,建立GARCH模型可以解决收益率序列存在自相关性时的ARCH 效应,能够有效衡量波动集聚分布下股票收益率的风险水平,从而更好地描述金融时间序列。目前,GARCH 模型已被广泛应用于经济金融时间序列的波动性研究。

Liu and Chen(2020)[27]将收益率序列建模为带有条件异方差的随机扰动的自回归时间序列,在已知t 时刻的信息下,利用ARMA(p,q)模型计算出t+1 时刻的超前一步预测值,在假设预测值满足正态分布后,根据随机扰动项、原收益率序列、超前一步预测的收益率之间的方差关系推算出超额收益的方差,从而计算出夏普比率函数的表达式。然而,Liu and Chen(2020)[27]研究对数收益率在ARMA(p,q)-GARCH(r,s)模型下计算出的夏普比率估计值后发现,GARCH 模型虽然能够衡量收益率的波动性,但夏普比率的结果不受GARCH 过程的影响,且只与ARMA 模型部分(均值方程)的系数有关,因此在对收益率序列建立最优的ARMA(p,q)-GARCH(r,s)模型后,只需要利用均值函数部分的系数就可以计算出夏普比率。该方法具体包括九步。

第一步,设股票的收盘价序列为p0,p1,p2,…,pn,计算得出对应的对数收益率为:

第五步,设预测原点为t,Ft为在t 时刻所能得到的信息合集,则在已知t 时刻及t 时刻之前信息的条件下t+1 期的超前一步预测为:

第七步,制定投资策略。在假设无风险收益率和成本交易率为零的条件下,t 时刻使单期超额收益期望值最大化的策略可以表示为:若ARMA-GARCH模型的超前一步预测值r^t+1>0,则为在收盘价买入该指数;若r^t+1<0,则为在收盘价卖出该指数。

第八步,根据投资策略计算出的单期超额收益μg与单期超额标准差σg分别为:

此处以ARMA(1,1)模型rt=φ1rt-1+εt+θ1εt-1为例,计算夏普比率:

(四)小波分析法

目前学者认为,用VaR 作为风险计量方法可以更加直观、准确地度量金融风险。金融领域的时间序列不但具有趋势性、周期性等特征,还存在随机性、突变性以及“多时间尺度”结构,具有多层次演变规律。小波分析具有时频多分辨功能,适合处理非平稳信号,可以更好地研究时间序列问题,能够清晰揭示出隐藏在时间序列中的多种变化周期,充分反映系统在不同时间尺度中的变化趋势,并对系统未来发展趋势进行定性估计。金秀和刘洋(2009)[31]基于小波分析和VaR 衡量风险的优点提出了多期夏普比率的计算方法:首先,采用VaR 代替标准差衡量风险,当收益率不满足正态分布时,利用偏度和峰度修正VaR,并用得到修正后的风险价值(MVaR)来衡量风险(Gregoriou and Gueyie,2003;Amédée-Manesme and Barthélémy,2020)[32,33];其次,根据小波具有多分辨率的特点,进一步将小波分析引入到夏普比率的计算问题中,将收益率函数分解为不同尺度下的收益率函数,提取出尺度函数的系数,计算出不同尺度下的收益率,由此得到基于MVaR 和小波分析计算多期夏普比率的方法,该方法包括五步。

第三步,计算风险价值VaR。风险价值是在一定的持有期和给定的置信水平下,利率、汇率等市场风险要素发生变化时可能对某项资金头寸、资产组合或机构造成的潜在最大损失。VaR 的金额表明在未来N 天内,投资组合的损失不会超出VaR 的金额(c为显著性水平)的概率理论上应该只有1-c。在数学上的表达式如下:

其中,Prob 代表一个概率函数,ΔP 代表投资组合在持有期内的损失金额,VaR 是置信水平1-c 条件下的风险价值,其大小主要取决于持有期天数和置信水平。目前的估计方法主要有历史模拟法、方差-协方差方法和蒙特卡罗模拟法。

当投资组合收益率Rt(t=1,2,…,q)服从均值为μ 和方差为σ2的正态分布,P0为投资组合的初始价值,zc是置信水平为c 的临界值时,依据正态分布的性质,在概率1-c 下能产生的最大波动幅度为zcσ,则风险价值为:

第四步,计算无风险利率Rf。无风险利率采用投资期限内中国人民银行个人储蓄存款的年利率,若期间银行年利率进行调整,可以用天数进行加权平均计算得到年无风险利率,再根据周期之间的关系计算不同尺度下的无风险利率。例如,若2010 年1月1 日—2020 年12 月31 日期间银行年利率进行了12 次调整,则分别计算每次调整期限内的天数和该期限内的年利率,再进行加权平均后计算得到年无风险利率为2.41%。

第五步,将MVaR 及小波分析引入传统夏普比率,使用不同尺度对应不同期限构建的多期夏普比率为:

其中,λj是分辨率为j 下的尺度,R(λj)为λj尺度下投资组合的收益率均值,Rf(λj)表示λj尺度下的无风险收益率,MVaR(λj)表示λj尺度下投资组合的风险程度,SR*表示投资组合基于MVaR 的小波多期夏普比率。

四、夏普比率与投资周期的关系

在探索投资周期与夏普比率的关系时,Lo(2002)[25]忽略复利的影响研究得到,夏普比率会随着投资周期的增长而单调递增。Lin and Chou(2003)[34]借助block bootstrap 探究了考虑复利时收益率序列的时间依赖性和不同投资周期夏普比率的变化趋势,得到投资周期与夏普比率之间更为准确的关系为:夏普比率会随着投资周期的增长先增加后减小,且当收益率序列正相关时增加投资周期会产生高风险低夏普比率的投资组合,在投资组合中要尽量选择不相关的股票分散风险,并选取合适的投资周期以取得更高收益。接下来是计算q 个投资周期夏普比率的具体方法。

第一步:计算q 期收益率。当股票价格pt(t=1,2,…,q)服从几何布朗运动,收益率Rt(t=1,2,…,q)为独立同分布且均值为μ、方差为σ2时,则q 个投资周期后的债券价格为:

五、数值模拟

在数值模拟部分,通过建立AR(1)模型和ARMA(1,1)模型,将根据时间序列分析法提出的使单期超额收益最大化的投资策略和直接利用时间序列分析法计算的夏普比率的结果进行对比,以验证利用时间序列分析法计算夏普比率估计值的有效性。

首先,利用AR(1)模型rt=a1rt-1+εt,选取8 组不同的参数a1、σ,分别产生10 000 个随机数序列;其次,将根据策略模拟估计出的收益率均值μ1、标准差σ1与利用时间序列分析法推导出的公式估计出的单期超额收益μg、单期超额收益的标准差σg进行对比,并进一步将均值和标准差进行比值计算得到夏普比率的估计值,分别记为SR1和SRg;最后,将六种指标的计算结果进行对比,结果如表1 所示。

表1 一阶自回归模型模拟结果

同理,利用ARMA(1,1)模型rt=a1rt-1+εt+b1εt-1,选取不同的参数a1、b1和σ,并采取相同步骤,最后将六种指标的计算结果进行对比,如表2 所示。

表2 自回归移动平均模型模拟结果

比较表1 和表2 的模拟结果可以得出以下结论:(1)根据买入并持有策略得到的结果与利用公式(24)直接计算的结果相近似,因此可以直接利用基于ARMA(p,q)-GARCH(r,s)模型推导出的公式计算夏普比率的值,验证了该方法在实际应用中的可行性;(2)在随机扰动项εt的方差σ2不同的情况下保证其余参数相同,此时计算出的夏普比率值相同,即夏普比率的值与随机扰动项εt的方差σ2无关;(3)在AR(1)模型中a1值越大,夏普比率值也越大;(4)在AR(2)模型中|a1+b1|相同、随机扰动项的方差σ2不同的情况下计算出的夏普比率值相同;(5)在AR(2)模型中|a1+b1|越大,夏普比率值也越大。

六、案例分析

本文选取上证综合指数、美国标准普尔指数和沪深300 指数2006 年1 月4 日—2020 年12 月31日的日收盘价和月收盘价,对其收盘价的分布特征进行分析。由于基金会受到多种因素的影响,导致其价格走势并不稳定,因此可以先采用差分法得到平稳的对数收益率序列,之后通过构建ARMAGARCH 模型建立均值和方差模型,从而计算夏普比率函数。

(一)数据选取

本文从Wind 数据库中选取了同类型的三种指数型基金:上证综合指数、美国标准普尔指数和沪深300 指数。在这三种指数中:上证指数包含了所有在上交所上市的个股,反映了上海证券交易所上市股票价格的变动情况;标普500 指数作为衡量美国大盘股表现的最佳指标,可以反映其行业分布特性;沪深300 指数包含了在沪深交易所上市的、精选出来的300 只优质个股,能代表中国优质企业的发展状况。数据选取时间为2006 年1 月4 日—2020 年12月31 日,期间上证综合指数、美国标准普尔指数和沪深300 指数均有180 个月收盘价,日收盘价个数分别为3 649、3 774 和3 650。

图1 为2006 年1 月—2020 年12 月收盘价时序图。由图1 再结合中国股市中发生的大事件可以看出,上证综合指数和沪深300 指数在2007 年6月—2008 年6 月均呈下降趋势,原因是从2007 年4月起开始显现通胀压力,政府不断调高商业银行的存款准备金利率和存贷款利率,实行从紧的货币政策,打压股市势头过猛上涨,导致了股市“5·30”事件。在2015 年6 月发生了将近一个月的很大程度下跌,此时中国资本市场股价都在下跌,对中国经济市场带来了严重打击,最后在中国政府的强力干预下股价才止跌。2018 年以来,随着融资环境的恶化,中美在科技、金融、外交等领域产生的贸易摩擦打击了中国经济,使得基金价格呈下跌趋势。美国标准普尔

图1 2006 年1 月—2020 年12 月收盘价时序图

(二)数据分布特征

表3 显示三种指数型基金对数收益率的峰度均大于3,说明相对于正态分布存在超额峰度,即是尖峰的。沪深300 指数的对数收益率序列偏度大于0且均值为正,说明该序列的分布是非对称的且呈右偏态,具有长右厚尾的特征。上证综合指数的偏度为-0.641 727,说明上证综合指数的对数收益率序列是左偏的。三种指数型基金对数收益率序列JB 正态检验的p-value<2.2e-16,表明其对数收益率均不满足正态分布。由于三种指数型基金的建模过程与计算夏普比率的方法相同,故选择上证综合指数为例进行建模与计算。

表3 三种指数型基金日对数收益率的描述性统计

从上证综合指数对数收益率的密度直方图(图2)和QQ 图(图3)都可以看出,其对数收益率不满足正态分布,且存在尖峰厚尾现象。

图2 上证综合指数对数收益率密度图

图3 上证综合指数对数收益率QQ 图

(三)构建ARMA 模型

2.白噪声检验,即判断序列是否呈白噪声序列的特性。原假设为序列之间不存在相关关系,因此拒绝原假设则是序列之间存在相关关系,可建立ARMA 模型对序列中的信息进行提取。在对对数收益率的滞后阶数进行白噪声检验后,结果为拒绝原假设,因此可进行时间序列建模过程。

3.模型识别。在通过平稳性、白噪声检验后,根据对数收益率的ACF 图和PACF 图识别模型(如图4)无法初步确定ARMA 模型的阶数,但可以根据AIC 信息准则确定最适合的ARMA 模型阶数,并对系数进行显著性检验,建立均值方程。其中,AR、MA、ARMA 模型的基本性质见表4。

表4 平稳时间序列自相关和偏自相关函数特征

图4 上证综合指数对数收益率的自相关和偏自相关图

根据最小AIC 准则,此处建立的均值方程为ARMA(1,5)模型,具体表示为:

4.模型检验。对模型残差进行白噪声检验,若残差为白噪声,则说明此均值方程对对数收益率序列中的信息提取充分,若残差序列不为白噪声,则需要重新建立合适的均值模型。通过对对数收益率的残差序列进行白噪声检验,结果显示都不拒绝原假设,说明均值方程已充分提取序列中的信息。残差序列的白躁声检验结果如表5 所示。

表5 残差序列的白躁声检验结果

(四)构建ARMA-GARCH 模型

1.ARCH 效应检验。由图5 可得残差序列无显著相关性,但由图6 可以看出残差序列平方有显著相关性,即序列可能存在ARCH 效应,此处采用拉格朗日乘子法对ARCH 效应进行检验。构造思想为,如果残差序列方差非齐,具有集群效应,则残差平方序列有自相关性,那么应使用自回归模型拟合残差平方序列,于是方差齐性检验就可以转化成是否具有显著性成立的检验。

图5 残差序列的自相关图与偏自相关图

图6 残差序列平方的自相关图与偏自相关图

H0:残差平方序列纯随机。

H1:残差平方序列具有自相关性。

当LM(q)检验统计量的p 值小于显著性水平时,拒绝原假设,认为该序列方差非齐,可以用q 阶自回归模型拟合残差平方序列中的自相关关系。

表6 的拉格朗日乘子检验结果显示,残差自回归函数的系数显著,说明序列存在自相关,拒绝原假设,意味着对数收益率序列存在显著的ARCH 效应。因此,进行异方差性检验后根据AIC 信息准则确定最适合的ARMA(p,q)-GARCH(r,s)模型。

表6 拉格朗日乘子检验结果

表7 的模型比较结果显示,利用AIC、BIC、SIC、HQIC 等指标选取的模型均为GARCH(1,1),联合构建均值方程可以得到上证综合指数对数收益率的ARMA(1,5)-GARCH(1,1)模型,为:

表7 模型比较

其中,zt是独立同分布的随机扰动序列,E(zt)=0,Var(zt)=1,zt和εt-1是独立的。

基于上面时间序列的建模步骤,对其余两个指数型基金的时间序列建立ARMA-GARCH 模型。其中,美国标准普尔指数对数收益率的MA(1)-GARCH(1,1)模型为:

(五)计算夏普比率

因GARCH 部分的系数与夏普比率结果无关,因此在建立ARMA-GARCH 模型后只需要利用均值模型部分中ARMA 模型中的参数并保证其显著性,不需要考虑波动率方程中GARCH 部分的参数。在建立ARMA-GARCH 模型后,进一步利用式(24)估计超额单期收益的均值函数和方差函数,进行比值计算进而得到夏普比率函数的估计值。本文通过前文提到的时间序列分析法计算出了上证综合指数、美国标准普尔指数和沪深300 指数的日夏普比率,分别为0.047、0.040 和0.035。

采用三种指数型基金月对数收益率建立的均值模型分别为:

同理,利用三种指数型基金的月对数收益率进行建模并计算出夏普比率,分别为0.162、0.087 和0.109。

对比三种指数的日夏普比率发现,上证综合指数的日夏普比率高于另外两种股指,但在三种股指的月夏普比率排名中沪深300 指数的夏普比率值最大,这反映出夏普比率是不断变动的,排名不具有可持续性。鉴于此,在投资时需要考虑长期的超额收益和波动率的变动情况,因为较长周期内的夏普比率值才有更好的参考性。根据计算结果可以得出,沪深300 指数在单位风险内获得的回报最高,比其他指数股票表现更好,同时也可得出上证综合指数的表现略优于美国标准普尔指数。

若假设对数收益率独立同分布,则由周期与夏普比率的关系即利用日夏普比率计算出的月夏普比率结果分别为0.210、0.179 和0.156,这比利用时间序列分析法计算出的月夏普比率值都偏高,因此忽略单期收益率之间的相关性会导致估计的夏普比率值误差较大。

七、结语

目前来看,学者们主要通过对收益率序列提出不同假设条件来计算夏普比率函数,并使其计算方法在发展中不断得到完善。通过阅读国内外文献,本文总结了现有估计夏普比率函数的方法,主要包括参数法、非参数法、时间序列分析法、小波分析法四种方法,根据前文对模型和方法的介绍现总结这四种方法在使用时的优缺点。

参数法操作简单、计算速度快、使用广泛,但需满足收益率服从正态分布并保持平稳性的假设条件,且在计算时忽略复利的影响会导致参数法估计的夏普比率值有偏差,并随着投资周期的增长而增大。

非参数法利用异方差非参数回归模型经变形后将条件均值函数和方差函数的比值作为整体,相比于先分别估计条件均值函数和方差函数后再进行比值计算得到的夏普比率估计值,根据三次样条法和局部线性核估计法直接估计出的夏普比率函数值更加精确。利用非参数法可以将不易求解的夏普比率函数转化为凸函数,将问题转化为凸优化问题,从而得到全局最优解。模拟后发现,局部线性核估计法比非参数三次样条法在大样本情况下的误差更小。但是,使用非参数法可能会因样本数据过少而遇到维数祸根问题,且该方法在假设误差项满足正态分布的情况下才可使用,对于误差项服从不同分布时的夏普比率计算还需进一步研究。

时间序列分析法中的GARCH 模型不仅可以消除异方差性,还可以同时估计股票收益率的条件均值和条件方差,并因考虑了扰动异方差的滞后期可以更好地衡量股票的波动情况,能更准确地预测收益率的变动情况,是金融风险预测最常用的工具。在模拟实验中发现,夏普比率与随机扰动项的方差无关,时间序列分析法先对股票收益率序列构建最优ARMA-GARCH 模型,在得到模型参数后再将其带入推导出的计算公式,可直接得到单期夏普比率函数的估计值。计算出的日夏普比率和月夏普比率估计值显示,夏普比率排名不具有可持续性。时间序列分析法计算简单,但对数收益率序列要满足平稳性才能建立时间序列模型。该方法虽然具有合理性,但每次对不同时段的日数据或月度数据都要建立时间序列模型,因此需要多次计算才能得到不同时期的夏普比率值。而且,模型在能有效拟合对数收益率序列时才能估计出精确的夏普比率值,这对模型系数的显著性要求较高。

小波分析法适用于测度非平稳时间序列数据,因此不要求收益率序列满足平稳性。用VaR 修正后的MVaR 衡量风险能解决收益率在非正态分布时的风险度量问题。小波分析法通过选取不同尺度计算出多期夏普比率的值,该方法不仅可以对同一时期的不同基金绩效做出评价,还可以对不同持有期的同一基金绩效做出评价,进而找出基金的最佳投资持有期。基于MVaR 和小波分析计算的多期夏普比率虽操作复杂,但在实证分析中应用更加广泛。

猜你喜欢

夏普比率方差
方差怎么算
一类具有时滞及反馈控制的非自治非线性比率依赖食物链模型
概率与统计(2)——离散型随机变量的期望与方差
计算方差用哪个公式
方差生活秀
一种适用于微弱信号的新颖双峰值比率捕获策略
海信收购夏普墨西哥工厂
比率和比例的区别
比率和比例的区别