APP下载

基于EEMD与模糊回归的投资组合选择模型及实证

2022-06-11周晓光黄晓霞

运筹与管理 2022年5期
关键词:卖空方差收益率

周晓光, 何 倩, 黄晓霞

(北京科技大学 经济管理学院,北京 100083)

0 引言

马科维茨[1]提出均值-方差模型,用均值和方差分别衡量投资组合的收益与风险,使收益与风险的多目标优化达到最佳平衡效果。将一笔资金在某一时期进行投资,期初投资者需从可能的证券组合中确定一个最优投资组合。此时投资者的决策目标是实现尽可能低的风险和尽可能高的收益,最佳目标是在两者之间寻找平衡点,由此建立投资组合模型。

大部分投资组合模型都是基于随机不确定性而建立,使用确定的数值量化投资组合的收益与风险。然而证券市场中充斥着不确定性因素,且多表现为模糊不确定性,例如投资者对证券收益的预期、对证券价格变化和交易量的判断等。Tanaka[2]于1987年提出了模糊线性回归的基本模型,用于描述自变量与因变量之间的模糊关系,把观测值与实际值之间的误差看作是由系统的不确定性造成的。因此,可通过参数模糊化,利用模糊回归分析来解决证券市场的模糊性问题(Muzzioli等[3];柏林和房勇等[4])。对于证券市场的收益与风险来说,时间尺度是最主要的特征,如何最大程度地提取证券收益风险预测中的有效信息,是构建投资组合的重要问题。基于上述分析,本文在模糊线性回归(fuzzy linear regression,简称为FLR)的基础上,引入一种噪声辅助数据分析方法,即集合经验模态分解,以最大程度地消除投资组合中收益风险时间序列的噪音,提取有效信息。

1 文献综述

基于模糊理论建立的投资组合模型对投资者的投资决策起到了优化效果,成为众多学者研究的焦点,是投资组合模型研究的重要组成部分。大部分学者基于均值-方差理论构建模糊投资组合模型,也有增加了如偏度和熵的指标,对投资组合风险的度量指标也扩展为半方差或绝对偏差。例如,Liu和Zhang[5]用可能均值表示收益和流动性,用可能半方差量化市场风险和流动性风险,建立了具有约束的可能均值-半方差模糊多目标投资组合模型。Bhattacharyya[6]在收益、方差和偏度的基础上,增加了交叉熵指标,提出了使投资组合均值偏度最大化,方差和交叉熵最小的模糊投资组合模型。Deng和Pan[7]、Gupta等[8]都在直觉模糊环境下,构建了均值-方差-偏度-熵的模糊多目标投资组合模型,不同的是前者以接受度和拒绝度为目标函数,而后者将投资者的犹豫度最小化,并建立了可以根据投资者偏好进行定制的投资组合模型。

部分学者将投资者行为作为研究重点,提出了针对不同偏好投资者的模糊投资组合模型。例如,Bermúdez等[9]用风险函数描述投资者对风险的态度,把主观特点包含在投资组合选择中,使用梯形模糊数对投资组合中的不确定性收益进行建模。Tsaur[10]和Zhou等[11]提出了针对投资者不同风险态度的保守-中立-激进风险态度的投资组合模型,不同的是前者用标准差描述风险,后者则使用绝对偏差。刘家和等[12]把证券收益率看作随机模糊变量,构建了针对不同风险态度投资者的随机模糊投资组合模型。Zhou和Xu[13]使用得分-偏差三等分法区分三类投资者,提出了基于最大得分和得分-偏差的投资组合选择模型。此外还有学者基于不同的研究侧重点,建立了新的模糊投资组合模型。Dutta等[14]用模糊数表示不同股票的比率因子,以得出股票未来的模糊价格,在两阶段多目标模糊概率规划模型中纳入交易成本;Liagkouras和Metaxiotis[15]同样考虑了交易成本因素,不同的是其建立了多周期投资组合模型。

近几年,集合经验模态分解算法成为研究金融时间序列比较常用且重要的方法,学者们一般将其与其它方法相结合构建模型,以用于对金融时间序列的预测。例如将EEMD和局部线性预测方法结合,将其用于预测原油、电力和天然气的时间价格序列(Qin等[16])。为克服传统EEMD方法同一时期分解结果可能不完全相同的缺点,邸浩等[17]、Wu等[18]分别将EEMD与长短时记忆网络两种方法结合起来。郭金录[19]将EEMD应用于预测沪深300指数,但他选择与长短时记忆网络和变分模态分解两种方法相结合,证明了基于EEMD方法预测的有效性。

现有模糊投资组合的相关文献主要集中在调整投资组合模型优劣的衡量指标和投资组合约束目标这两个方面,利用模糊回归首先估计证券收益率,再构建投资组合模型的文献较少,而模糊回归通过参数模糊化能够更好地描述证券市场存在的不确定性,因此本文采用模糊线性回归方法对证券收益率进行预测。现有基于EEMD方法的文献,主要应用于预测金融时间序列,还没有将EEMD与模糊回归相结合以进行证券收益率预测的相关文献,而EEMD能够最大程度地提取证券收益率中的有效信息。因此本文将模糊线性回归方法和EEMD相结合,并基于预测收益率构建投资组合模型,不仅可以提高收益率预测的准确性,还提高了投资组合计算的有效性,使投资者能更好地进行资产配置与优化。

本文的创新之处在于:将根据数据自身时间尺度进行信号分解的EEMD方法与模糊线性回归相结合(EEMD-FLR),使用对称三角模糊数表示投资者对证券收益的预测,构建了基于模糊数的投资组合优化模型,通过来自沪深300股票数据的实证,与集合经验模态分解和普通最小二乘结合的方法(EEMD-OLS)、单一模糊线性回归方法的对比,证明了EEMD-FLR方法的有效性,这为建立更优的投资组合选择模型提供了参考。

2 模型构建

2.1 集合经验模态分解

EEMD是基于经验模态分解(empirical mode decomposition,简称为EMD)提出的一种改进算法,其分解原理是当附加的白噪声均匀分布在整个时频空间时,滤波器将该时频空间分割成不同的尺度成分。通过足够的测试,附加噪声被消除,全体的均值被认为是最后的结果即IMFs,其中频率最高的分量也是第一个分量代表原始时间序列的主要特征。与传统的小波分析和EMD方法相比,EEMD方法不依赖于任何基函数,引入白噪声序列可以避免产生模态混叠现象,具有更高的分解效率和时频特性,更适合于非平稳时间序列的应用和处理。Qin等[16]、Wu等[18]分别使用EEMD方法对原油价格进行预测,实证表明经过EEMD分解后的序列趋于平稳,附加噪声被消除,且基于分解后序列所建立的模型预测能力更强。对于某一序列x(t),使用EEMD方法的步骤如下:

(1)在原序列x(t)中添加白噪声序列w(t),其中w(t)~N(0,σ2);

(2)对加入白噪声后的信号x(t)+w(t)进行EMD分解,得到有限个IMFs和一项残差;

(3)加入不同的正态分布白噪声序列,重复步骤(1)和(2)M次;

(4)将M组分解得到的IMF分量和残差进行集成平均处理作为最终结果。

2.2 模糊线性回归模型

模糊回归模型用回归系数的模糊性描述系统的不确定性,即将回归系数看作是某种具有隶属度函数的模糊数,用以描述自变量与因变量之间的模糊关系。

其中(i=0,1,…,n)表示模糊回归系数,一般采用三角模糊数表示,即(l,m,u),其中m表示中心值即可能性最大的值,l和u分别为模糊数的下限和上限,m-l和u-m分别为模糊数的左模糊幅度和右模糊幅度。当m-l=u-m时,该三角模糊数又称为对称三角模糊数。

(1)

上式中,yj(j=1,2,…p)为真实值,λ是设定的模糊回归方程的最低隶属度,表示按置信水平λ可以覆盖所有观测数据,取值范围为(0, 1);S表示因变量的模糊幅度之和;n和p分别表示自变量和因变量的个数,ci表示中心值,wi表示模糊幅度。求解上述规划问题,可得模糊系数最优解,即ci和wi。

2.3 基于EEMD的模糊线性回归模型

分别对各只证券的收益率序列进行EEMD分解,在此基础上建立模糊回归模型:

……

(2)

其中λ值取0.5[4]。求解上述规划问题,可得对称三角模糊系数最优解,即各IMF分量对应的ci和wi。最后将各IMF分量下的预测值加总,即为最优解。

(3)

2.4 构建基于模糊数的投资组合模型

(4)

3 案例分析

3.1 数据描述

以股票收益率为研究对象,随机选取沪深300中的十只股票,分别为中国平安,招商银行,广发证券,农业银行,华能国际,北方稀土,陕西煤业,贵州茅台,五粮液和古井贡酒。为降低2015年股价暴跌异常值对收益率预测的影响,样本期选择为2016年1月4日至2019年12月31日。所有的数据采取日度数据,数据均从Choice数据库获取。收益率计算公式如下:

(5)

其中rt表示第t天的收益率,Pt和Pt-1表示第t天和第t-1天的收盘价。描述性统计如表1所示。

根据表1可知,只有广发证券、华能国际和北方稀土三只股票样本期的平均收益率小于0。十只股票的方差都较低,表示这些股票的收益率波动较小。偏度系数多大于0,其绝对值都在0附近,基本满足正态分布;而峰度系数则围绕正态分布的峰度3上下波动。其中广发证券和农业银行的峰度系数比较高,说明这两只股票收益率序列中的极端值较多,未来发生剧烈波动的概率比较高。总体来看,选择这十只股票组成一个投资组合是可行的,是具有投资价值的。

表1 收益率的描述性统计

3.2 实证结果

图1以中国平安股为例,展示了该股票的收益率时间序列经过EEMD分解之后的9个IMF分量与一项残差。可以看出EEMD将原始序列的各尺度分量依次从高频到低频进行提取,分解得到的本征模函数也是按照频率由高到低排列,IMF1为最高频的分量,最后一项为残差项,也是最平稳的一项,频率接近于0。

图1 中国平安股票EEMD分解结果图

依次将每只股票分解后的分量序列代入式(2)中求解,经过式(3)加总,得到的结果如附表1所示。附表1中,0.0000与0含义不同,前者为保留四位小数后的结果,后者即为0本身。根据附表1,中国平安、广发证券、北方稀土和古井贡酒的收益率时间序列分解之后,得到9个IMF分量和一项残差,因此这四只股票的IMF10分量下无数据,其余序列则得到10个IMF分量和一项残差。

3.3 投资组合有效前沿

将附表1计算结果代入式(4)的投资组合模型中,得到的投资比例及投资组合的收益与风险极值如表2和表3所示。表2展示了无卖空限制下,收益与风险取极值时,投资者在十只股票上的投资比例。如第2列的数据表示EEMD-FLR方法下,收益风险极小时各股对应的投资比例,第3列的数据则表示收益风险极大时各股的投资比例。表4展示了不允许卖空条件下,收益与风险取极值时,投资者在十只股票上的投资比例。同样地,第2列和第3列的数据分别表示EEMD-FLR方法下,收益风险极大和极小时对应的各股投资比例。

由表2可以看出,无卖空限制时,EEMD-FLR,EEMD-OLS和FLR三种方法预测下,该投资组合的收益取值区间分别为[0.0005,0.0237],[0.0003,0.007]和[0,0.0125],标准差即风险取值区间分别为[0.0043,0.0328],[0.0059,0.0457]和[0,0.0344]。投资者可以根据投资偏好,确定收益最大或风险最小时的各股投资权重,以组成无卖空限制下最优的投资组合。由表3可知,存在卖空限制时,EEMD-FLR,EEMD-OLS和FLR三种方法预测下,该投资组合的标准差即风险取值区间分别为[0.0043,0.0114],[0.0059,0.0142],[0, 0.1058×10-15],收益取值区间分别为[0.0007,0.0079],[0.0002,0.0016],[0,0.0062]。同样地,投资者此时依然可以根据自身投资偏好,确定收益最大或风险最小时的各股投资权重,以组成存在卖空限制下的最优的投资组合。

表2 无卖空限制下的投资者在收益与风险极值时的投资比例

为了更直观地比较三种方法下的投资组合收益与风险,计算得出无卖空限制和存在卖空限制时的投资组合有效前沿,如图2和图3所示。横坐标表示投资组合的标准差即风险,纵坐标表示投资组合的均值即收益。图2(a)为无卖空限制时,基于EEMD-FLR和 EEMD-OLS方法下的投资组合有效前沿;图2(b)为无卖空限制时FLR方法下的投资组合有效前沿。图3(a)为存在卖空限制时,EEMD-FLR,EEMD-OLS方法下的有效前沿,图3(b)则为存在卖空限制时FLR方法下的有效前沿。综合表2和表3,以及图2和图3,可以发现无论是否存在卖空限制,基于EEMD-FLR方法的投资组合收益上限都比EEMD-OLS和FLR方法要高,而风险上限要更低。与EEMD-OLS,FLR方法下的投资组合有效前沿相比,相同风险下,基于EEMD-FLR方法的投资组合收益更高;相同收益下,基于EEMD-FLR方法的投资组合风险更低。

表3 存在卖空限制下的投资者在收益与风险极值时的投资比例

图2 无卖空限制下的投资组合有效前沿

图3 存在卖空限制下的投资组合有效前沿

4 结论及展望

本文根据集合经验模态分解和模糊回归结合的预测方法,构建了基于对称三角模糊数的投资组合模型,并与集合经验模态分解和普通最小二乘结合的方法、模糊线性回归方法下的投资组合结果进行比较。通过对比无卖空限制和存在卖空限制的有效前沿,发现基于集合经验模态分解和模糊回归方法构建的投资组合是最优的,不仅提高了投资者对目标证券收益率预测的准确性,也使得投资者可以选择最大化组合收益或最小化组合风险,以确定最终投资策略,合理分配资产,对于投资组合的优化具有参考意义。未来进一步的研究方向如下:

1)本文使用对称三角模糊数表示股票收益率,如果考虑采用非对称三角模糊数,梯形模糊数,直觉模糊数和正态模糊数,对投资组合的优化结果又可能会产生怎样的影响?

2)本文研究的投资组合模型是基于均值和方差两个指标,如果考虑增加用模糊数表示的偏度,峰度等可以衡量目标证券投资稳定性的指标,这对投资组合优化结果又会产生怎样的影响?

猜你喜欢

卖空方差收益率
上市公司卖空交易后财务状况会改善吗?
概率与统计(2)——离散型随机变量的期望与方差
方差越小越好?
计算方差用哪个公式
方差生活秀
2016年10月债券平均久期、凸性及到期收益率
2016年10月底中短期票据与央票收益率点差图
2016年9月底中短期票据与央票收益率点差图
2016年9月债券平均久期、凸性及到期收益率