基于鲁棒二阶随机占优的投资组合优化模型研究
2022-09-13段倩倩李金林
段倩倩, 彭 春, 李金林
(1.北京物资学院 物流学院,北京 101149; 2.北京理工大学 管理与经济学院,北京 100081)
0 引言
投资组合优化问题一直是备受关注的热点研究问题之一,被广泛应用到不同的领域,如项目资源分配、金融产品投资。均值-方差模型描述了资产收益偏离其均值的程度,但并没有定量地刻画资产收益可能的损失,因此,随机占优作为与均值-方差理论优势互补的投资组合的评价工具,近年来越来越受到重视。本文利用随机占优约束来度量和规避风险,且符合投资者的风险偏好,研究基于二阶随机占优的投资组合优化问题,具有十分重要的理论和实际意义。
在不确定决策中,随机占优(Stochastic Dominance)理论,尤其二阶随机占优(Second-Order Stochastic Dominance, SSD),一直都是重要的分析工具之一,它在金融学、经济学、统计学和决策科学的相关研究中扮演了不可替代的角色。直到2003年,Dentcheva和Ruszczyński首次将随机占优作为约束条件放到优化问题中,并假设随机变量的离散概率分布已知,并将二阶随机占优约束优化问题转化为线性规划的等价模型[1],这正式打开了随机占优约束优化问题的研究之窗。同样,假设随机变量的离散概率分布已知,Luedtke[2]进一步得出随机占优约束优化问题的新的等价问题。由于投资收益率高度不确定,在实际中也很难估计它的精确的概率分布。然而,目前绝大多数研究[1~3]均基于有限的投资收益率的历史数据样本(情景)和样本均值估计方法,将问题转化为线性规划求解。但当选取的资产和历史样本的数量较大时,会导致较高的计算成本。
近年来,由于鲁棒优化理论作为处理不确定性决策问题的有效工具不断发展[4],一些学者开始研究基于鲁棒随机占优的投资组合优化问题。然而,无论从理论方法还是实际应用层面,目前鲁棒二阶随机占优相关的研究较少。Dentcheva和Ruszczyński[5]首次提出了鲁棒二阶随机占优的概念,假设不确定参数的概率分布未知,且属于某不确定集合,但没有给出模型的数学等价形式和数值求解方法。Guo等[6]则利用离散近似的方法离散化基于矩信息的不确定集合,来估计分布式鲁棒二阶随机占优问题,但当离散分布的样本规模较大时,求解比较困难。与本文密切相关的是Sehgal和Mehra[7],它研究鲁棒二阶随机占优投资组合优化问题,但假设投资收益率不确定且属于预算(budget)不确定集合,基于不同的实际数据集合进行分析。本文同样研究基于鲁棒二阶占优的投资组合优化问题,考虑三类投资收益率的不确定集合,如箱式(box),椭球(ellipsoid)和多面体(polyhedral)不确定集合,基于实际数据,对模型的最优性、鲁棒性和二阶随机占优约束的可行性进行样本内和样本外的实证分析。尽管本文所采用的三类不确定集合下的鲁棒优化理论的相关成果比较丰富,但将这些理论成果运用到含有鲁棒二阶随机占优约束的优化模型,相关的研究非常少。因此,本文主要从优化建模和实证分析两个角度,研究一类含有二阶随机占优约束的投资组合优化问题。
本文具体结构安排如下:第1章给出随机占优理论和传统二阶随机占优投资组合优化模型。第2章假设投资收益率不确定,且属于不确定集合,提出了鲁棒二阶随机占优优化模型。第3章基于实际股票市场数据,对不同历史数据规模和不确定集合下的模型进行分析。最后第4章总结全文。
1 二阶随机占优投资组合优化模型
假设投资者计划将一笔资金投资于N个不同的资产(如股票)。为了文中更清楚地表述,令i∈[N]表示资产的编号i=1,2,…,N。行向量r=[r1,r2,…,rN]表示股票1,2,…,N的投资收益率,列向量x=[x1,x2,…,xN]T表示投资每一个资产的权重。在这里假设xi≥0,例如对于股票,则卖空是不被允许的。若随机变量X二阶随机占优Z,则可表示为X2Y,可进一步等价为E[(t-X)+]≤E[(t-Y)+],∀t∈R。因此,根据文献[1],基于二阶随机占优的投资组合优化模型可进一步表示为有限的随机规划模型(1):
maxE[rx]
s.t.E[(t-rx)+]≤E[(t-B)+],t=b1,…,bT,
(1)
x∈Z
maxθ
(2)
dtk≥0,x∈Z,∀t∈[T],k∈[T]
2 鲁棒二阶随机占优投资组合优化模型
在实际中,人们往往很难准确地获取或者估计资产的投资收益率的精确概率分布,而且由于资产投资市场的高风险性,则资产的投资收益率也具有高度不确定性,波动往往较剧烈。因此,在第2章的基础上,本章进一步假设投资收益率r不确定,且r属于某一不确定集合R,即r∈R,但该不确定集合并不依赖r的概率分布信息。具体地说,本章将考虑三种经典的不确定集合(箱式、椭球和多面体不确定集合),利用鲁棒优化理论,推导出鲁棒二阶随机占优投资组合优化模型的等价问题,使得可以直接采用目前的数学求解器(如CPLEX, GUROBI)非常有效地求解中小规模的问题。
考虑如下鲁棒二阶随机占优投资组合优化模型(3):
s.t.E[(t-rx)+]≤E[(t-B)+],∀r∈R;t=b1,…,bT
(3)
x∈Z
maxθ
下面的命题1,2和3则分别给出了箱式、椭球和多面体不确定集合下模型(4)的等价问题。
命题1如果给定不确定集合Ub={ξit‖ξit|≤Ψt,∀t∈[T],i∈[N]},其中Ψt为该不确定集合的不确定参数,控制不确定集合的大小,则上述模型(4)等价为如下线性规划问题:
maxθ
dtk≥0,x∈Z,∀t∈[T],k∈[T]
maxθ
dtk≥0,x∈Z,∀∈[T],k∈[T]
maxθ
dtk≥0,x∈Z,∀t∈[T],k∈[T]
根据鲁棒优化理论,很容易得出,当Ψt=Ωt=Γt=0时,所有的三个模型均等价于名义模型(1)(如文献[1~3]中的模型),这个结论可以在后面算例分析中得到进一步验证。另外,值得注意的是,基于本文中采用的三种不确定集合,不确定集合U还可以有多种不同的选择组合,例如Ube=Ub∩Ue,Ubp=Ub∩Up,Upe=Up∩Ue,和Ubep=Ub∩Ue∩Up。这些不确定集合下的模型(4)均可以等价转化为线性规划或者二阶锥规划问题。
3 实证分析
本文采用S&P500股票市场的实际数据来进行分析。3.1节描述了数据选取和算例实验分析的具体设置,3.2节则分析了不确定参数对最优投资组合的权重的影响,3.3节则给出了不确定参数对样本内(in-sample)期望收益的影响分析,3.4节给出了不确定参数对样本外(out-of-sample)期望收益的影响分析。
3.1 数据选取
在该部分中,选取S&P500市场自2004/11到2016/04的总共595周的股票收益率历史数据[8]。数据选取的过程为:首先从442支股票中随机选取5支股票。其次从该5支股票的595周历史数据中随机选择某一个时间点M(例如第M周),然后分别选取该时间点之前的连续12周,52周和104周的投资收益率作为训练样本集合(样本内集合),即T∈{12,52,104}。然后,选取该时间点后的连续52周的投资收益率作为测试样本集合(样本外集合),即T∈{ 52}。最后,重复选取训练样本和测试样本50次。所以,本章节的所有结果,均为基于50次独立重复计算的平均数值。本文选取服从均匀分布的投资组合作为参考。此外,本文假设每一个历史样本发生的概率服从均匀分布。根据本文中所采用的三类不确定集合,考虑不确定参数Ψt,Ωt和Γt的取值来自[0,10],且Ψt=Ψ,Ωt=Ω,Γt=Γ。因此,为了有效的保证二阶随机占优约束的可行性和最优性条件,在随机占有约束右侧添加一个非常小的松弛[3,6]。本文所有计算实验代码采用C编程并调用CPLEX,在128 GB RAM的windows系统的配置环境下求解。
3.2 最优投资组合的权重
本节主要分析不同不确定集合下,不确定参数对五支股票的最优投资组合的权重的影响。图1以T=104为例,分别给出了箱式、椭球和多面体不确定集合下的最优投资组合的平均权重组成的彩虹图,其中每一种颜色所构成的区域的宽度表示一种股票的权重。令从上往下的颜色区域依次代表股票#1(灰色), #2(绿色), #3(红色), #4(黄色)和#5(蓝色)。从图中可以看出,当不确定参数为0时,三个不确定集合下的模型的平均投资组合的权重比例相同,这是因为此时三个模型均等价于名义模型。另外,对于不同不确定集合,整体上说,#2和#4股票在最优投资组合中所占比重较大,#3和#5股票则较小,这是由于#2和#4股票的平均投资收益率较高,#3和#5股票的平均投资收益率较小的缘故。但是,随着不确定参数继续增加,#2和#4股票在最优投资组合中所占比重逐渐降低,而#3和#5股票所占的比重则逐步增加的趋势。当不确定参数的值增加到一定程度,各个股票在最优投资组合中所占的比重趋于均匀分布(均匀分布的投资组合的参考目标收益)。对于三个不确定集合,趋于均匀分布的最优投资组合的速度明显不同。综上,这都在一定程度上说明不确定集合的选择和不确定参数的取值对投资组合的权重有重要的影响。
3.3 不确定参数对样本内期望收益的影响
本节主要讨论在不同样本内(训练样本)规模下期望收益的鲁棒性分析。具体地,图2给出了不同不确定集合和不同训练样本规模下的期望收益与不确定参数之间的变化情况。从图2中可以看出,(i)对于给定的不确定集合和样本规模,当不确定参数较小时,样本内期望收益之间的差距较小,随着不确定参数增加,样本内期望收益之间的差距变大;(ii)随着不确定参数增加,样本内的期望收益逐渐降低,这是因为不确定性逐渐增加,模型越保守,这也在一定程度上说明在距离选择的时间点越近(最近的历史数据,例如T=12周),得出的最优投资策略效果最好,期望收益较高;(iii)另外,对于给定T(如T=52)和不确定参数的取值,多面体、椭球和箱式不确定集合下的期望收益逐渐降低,这也进一步验证了在相同的不确定参数取值下,三种不确定集合下鲁棒模型的保守程度依次为,多面体集合<椭球不确定集合<箱式不确定集合。
3.4 不确定参数对样本外期望收益的影响
本节对其它指标与三种不确定集合、不同样本规模、不确定参数的取值进行分析。样本外期望收益E[Rx]是通过训练样本下的最优投资组合权重xin与测试样本(T′=52周)的投资收益率rout计算出来的,其中Rx=xinrout。因此,图4还计算了样本外夏普比率(Sharp ratio, SR),即SR=E[Rx]/σRx,其中σRx为Rx的标准差。SR来衡量资产收益对投资者所承担风险的补偿程度。此外,引进一个新的指标,随机占优约束的“违反区域”(violation area in SSD, VAS)[9],它定量刻画了样本外二阶随机占优约束被违反的程度。VAS的值越大,二阶随机占优约束的违反程度越大,即样本外测试下随机占优约束不被满足的概率越大。
图3给出了三种不确定集合和三个训练样本规模下的样本外期望收益与不确定参数之间的变化关系。图4则以T=104为例,描述了样本外VAS和SR随不确定参数变化的关系。从图3和图4中可以观察到,(i)无论哪一个不确定集合,样本规模越小,样本外的期望收益越高。因此,与图2样本内鲁棒性分析相比,图3中的曲线并没有呈现有规律的变化趋势。(ii)从整体上说,除了椭球不确定集合下T=104外,其它训练样本规模下的样本外期望收益均高于样本外的参考目标收益,这是由于T=104下的训练样本主要集中在2009~2010年左右,正好处于全球次贷金融海啸的影响中。这在一定程度上说明,鲁棒二阶随机占优模型可以取得较好的样本外期望收益,同时保证了测试样本下鲁棒二阶随机占优约束的可行性。(iii)随着不确定参数增加,样本外SR增加,投资组合的“性价比”逐渐提高。在相同不确定参数取值下,多面体集合下的SR最高,椭球集合次之,箱式集合最小,样本外VAS则正好相反,这是因为三个不确定集合下鲁棒模型的保守程度不同。此外,随着不确定参数取值增加,样本外VAS逐渐减小,这说明在测试样本(样本外)下,鲁棒二阶随机占优约束仍然可行成立的概率越高,这与(ii)一致。
4 结论
本文主要考虑一类经典的含有二阶随机占优约束的投资组合优化问题,其目标为最大化期望收益。与均值-方差模型不同,本文利用二阶随机占优约束来度量风险,满足期望收益二阶随机占优给定的参考目标收益。与传统的二阶随机占优模型不同,本文考虑不确定的投资收益率,且属于某一不确定集合,建立鲁棒二阶随机占优模型。尽管本文所考虑的三个不确定集合下的鲁棒优化理论相关的成果较丰富,但对含有鲁棒二阶随机占优约束的优化问题,相关的研究很少。在优化建模方面,考虑三种不确定集合(箱式、椭球和多面体),利用鲁棒优化理论,将鲁棒二阶随机占优模型转化为线性规划和二阶锥规划;在实证分析方面,基于S&P 500股票市场实际的投资收益率的历史数据,对不同历史样本数据规模下的三个鲁棒二阶随机占优模型进行实证分析,特别是样本内和样本外不确定参数对期望收益的影响分析。本文的结果表明,不确定集合的选择和不确定参数的取值对投资组合的选择有重要的影响。在相同不确定参数下,多面体不确定集合下的模型取得较好的绩效,在保证最优性和鲁棒性的前提下,也保证了样本外测试下二阶随机占优约束成立的可行性。最后,在对三种不确定集下的鲁棒二阶随机占优模型的比较分析过程中,如何尽可能消除不确定参数Ψ,Ω,Γ对模型结果的分析过程中带来的影响,这是未来仍需要进一步研究的课题。