APP下载

稀疏超越指数追踪的分位数回归模型及其算法

2021-01-20范青竹张成毅罗双华

河南科学 2020年12期
关键词:位数一致性收益率

范青竹, 张成毅, 罗双华

(1.西安工程大学理学院,西安 710048; 2.西安交通大学经济与金融学院,西安 710049)

在金融市场中,指数型基金的管理变得日益重要. 为了更加有效地研究投资组合问题,许多学者越来越关注指数追踪[1]和超越指数追踪[2]. 相比较指数追踪,超越指数追踪能够在保证追踪组合的收益率与标的指数收益率尽量一致的条件下给投资者带来超额收益,即战胜市场.

对于超越指数追踪模型的建立和求解,国内外许多学者已经做了很多有意义的工作. Dose等[3]建立并求解追踪误差与超额收益的加权超越指数模型;Beasley等[4-5]建立一个混合整数规划的超越指数模型,对模型采用两阶段逼近和三阶段逼近求解模型;Lejeune等[6]和Guastaroba等[7]分别建立了一个凸二次锥规划的超越指数模型和混合整数规划的超越指数模型;胡春萍等[8]建立了时间加权SVM的指数优化复制模型,并利用OR-Library 中的5 个市场指数历史数据进行实证检验;在利用元启发智能算法求解模型方面,差分进化算法、免疫算法、混合遗传算法给出了很好的求解思路[9-11];马景义等[12]构建了一个可以调节追踪误差和超额收益的超越指数模型,并给出了广义最小角度回归算法;赵志华等[13]提出了交替二次罚算法的稀疏超越指数追踪模型,该模型用二次罚算法(AQP)求解.

由上可知,超越指数追踪已经取得了长足的进步,这主要得益于稀疏优化[14-16]的发展. 目前对超越指数追踪问题的研究大多是基于均值回归的最小二乘模型,但由于风险资产收益数据的非对称性和尖峰厚尾的非正态分布特征,使得超越指数追踪的投资组合稳定性较差. 为了解决这一问题,引入分位数回归模型,分位数回归由Koenker和Basset[17]提出,基于分位数回归模型的灵活性及能够对响应变量的条件分布作出全面描述而且不会受到异常值的影响,因此更加稳健也更加有效[18-20]. 利用分位数回归模型研究超越指数追踪问题具有重要的理论意义和应用价值.

1 稀疏超越指数追踪的分位数回归模型

1.1 超越指数追踪

超越指数追踪是在金融市场的N 个资产中选取其中的r 个构建成一个投资组合,超越指数的目标函数是最小化跟踪误差(TE)和最大化超额回报(ER),表示为

其中:R ∈ℜM×N和I ∈ℜM分别是N 个资产的收益率矩阵和每一个周期所有资产的收益率组成的向量;ω ∈ℜN是投资组合的权重向量;T 是选取总资产的期数;e 是一个全一向量;eT是e 的转置. 因此,超越指数始终是TE 和ER 之间的权衡. 通过权衡参数给出混合单目标函数

其中:a 是追踪组合与指数之间收益率差异的惩罚参数,a ∈( 0,1) .

1.2 分位数回归模型

设定Xn×m=( x1,…,xm)是包含解释变量的设计矩阵,我们要研究的线性模型是

其中:I 每一个周期所有资产的收益率所得到的中位数组成的向量;β 是回归系数向量;ε 是随机误差项.

分位数回归主要是最小化目标函数

其中:

对于任意的实数s 都成立,其中q 是分位数,q ∈( 0,1) .

考虑模型(1)式构造分位数回归的超越指数追踪模型

其中

1.3 稀疏超越指数追踪的分位数回归模型

稀疏优化模型能够用尽可能少的股票获得尽可能高的超额收益. 用L1/2正则化模型构造分位数回归的超越指数追踪模型是因为L1/2正则化能够产生更稀疏的解,在同等效果下能减少交易费用和交易成本.

因此建立一个稀疏超越指数追踪的分位数回归模型,模型如下:

其中:λ 是正则化系数,λ >0.

2 HSS-Half阈值算法

利用凸优化中拉格朗日方法求解模型(2)为以下目标函数

对于上式,分别对u,β 求导可得

其中:u 是拉格朗日乘子;β 是回归系数向量;a 是惩罚参数;ρq是损失函数;R 是收益率矩阵;I 是每一个周期所有资产的收益率所得到的中位数组成的向量;e 是一个全一向量;λ 是正则化系数;r 表示股票收益率向量.

函数ρq的次微分为

把u,β 求导后写成矩阵的形式:

其中:

不改变A 的大小作如下变换得

所以(4)式可表示为

可推出:

由上述等式可构造HSS迭代格式如下:

其中:k 是迭代次数. 对于迭代(6)式

则有

定义变量

对(9)式做变换有以下迭代格式

因此有以下迭代格式

其中:

是Half阈值算子,

被称为Half阈值函数,

所以,HSS-Half算法的迭代(6)式为

这样就简化了HSS-Half算法中(6)式的迭代格式,并得到新的等价迭代格式

3 实证分析

在本节选择与文献[13]中的稀疏超越指数追踪模型进行对比,把稀疏超越指数追踪模型记为模型A,把稀疏超越指数追踪的分位数回归模型记为模型B. 不比较两种算法的快慢,只比较模型的优越性和样本内外的一致性.

实证分析的数据包括金融数据库OR-Library 中的恒生指数(香港),DAX 100 指数(德国),FTSE 100 指数(英国),S&P 100 指数(美国)1992—1997 年的290 个周收盘价构成数据集. 对于相应的指数和股票的290 周每周收益率,将前145周作为训练数据集也就是样本内数据集,后145周作为测试数据集也就是样本外数据集. 对稀疏超越指数追踪的分位数回归模型进实证分析. 具体计算中,投资规模r 分别取5,10,15,20,25五种情况,惩罚参数a=0.8,分位数q=0.4,将两种模型在样本内外的一致性和优越性上进行比较.

为了度量样本内外性质和样本内外的一致性,引入以下两个标准.

1)一致性. 定义A 产生的投资组合的样本内和样本外追踪误差的一致性为

其中:TEIA和TEOA分别为模型A 的投资组合的样本内和样本外的追踪误差. Cons( A) 的值越小,说明模型A 产生的投资组合样本内和样本外追踪误差的一致性越好.

2)样本外优越性. 我们定义

其中:TEOA和TEOB分别是模型A 和模型B 对组合的样本外追踪误差. 如果SupO( A,B )<0,则TEOB小于TEOA,即模型B 的投资组合在样本外追踪误差方面优于模型A .

表1、2、3中N 是数据集中资产数目,ERI,ERO 分别表示样本内超额收益和样本外超额收益.

表1 两个模型在样本内外误差的对比Tab.1 Comparison of in-sample and out-of-sample errors between the two models

表2 两个模型在样本内外收益的对比Tab.2 Comparison of in-sample and out-of-sample returns between the two models

表3 两个模型在样本内外的一致性和优越性的对比Tab.3 Comparison of consistency and superiority of the two models with in-sample and out-of-sample

表1是两个模型分别在样本外和样本内的追踪误差,可以看出模型B 比模型A 在样本内和样本外的误差更小. 表2是两个模型分别在样本外和样本内的超额收益,可以看出模型B 比模型A 在样本内和样本外的超额收益更大. 从表3可以看出:①模型B 在样本内外误差之间的一致性比模型A 更好,因为90%(18/20)实例的Cons( B )<Cons( A) ;②模型B 的投资组合在样本外追踪误差方面优于模型A,因为85%(17/20)实例的SupO( A,B )<0,这证明了模型B 在测试集上的表现更好.

综上所述,稀疏超越指数追踪的分位数回归模型与稀疏超越指数追踪模型相比,不仅误差风险更小,并且能够获得更好的超额收益.

4 结语

在超越指数追踪模型的基础上进行优化扩展,通过引入分位数回归模型和L1/2正则化理论建立了稀疏超越指数追踪的分位数回归模型,其求解算法HSS-Half阈值算法具有良好求解能力. 稀疏超越指数追踪的分位数回归模型具有较好的稳健性和适应未来风险的能力.

猜你喜欢

位数一致性收益率
注重教、学、评一致性 提高一轮复习效率
对历史课堂教、学、评一体化(一致性)的几点探讨
IOl-master 700和Pentacam测量Kappa角一致性分析
连续自然数及其乘积的位数分析
2016年10月债券平均久期、凸性及到期收益率
2016年10月底中短期票据与央票收益率点差图
2016年9月底中短期票据与央票收益率点差图
2016年9月债券平均久期、凸性及到期收益率
基于事件触发的多智能体输入饱和一致性控制
比大小有窍门