基于L1-中位数边信息的在线投资组合策略
2022-10-18郑丽娜
□文/郑丽娜
(广东工业大学管理学院 广东·广州)
[提要] 在实际投资过程中,投资者往往根据各种信息动态地调整资产头寸。本文利用L1-中位数预测股票市场的涨跌趋势,将其作为反映市场情况的边信息引入到基于线性学习函数的在线投资组合策略中,构造基于L1-中位数边信息的在线投资组合策略。采用上海证券交易所股票构造股票组合,从数值算例中证明策略在真实股票市场的表现,结果表明该策略具有较好的收益。
在线投资组合选择问题是计算金融领域的一个热点问题。不同于传统的均值-方差模型,在线投资组合模型不对资产价格做任何的概率假设,而是只利用过去的市场价格序列构造投资比例。Cover 通过对所有的定常再调整策略(CRP)进行加权平均,提出泛证券投资组合策略(UP),该策略首次将在线竞争的思想引入投资组合问题中。Helmbold 等基于指数梯度类型算法和相对熵,利用乘法更新公式设计指数梯度策略(EG),该策略具有良好的表现,能够追踪上一期表现最佳的股票,同时使当期与上一期投资比例之间的差距尽可能小,进而减少交易费用。张卫国等考虑到UP 策略在股票数量较多时计算难度大,构造基于线性学习函数的在线投资组合策略LFM,该策略具有计算复杂度低的优势。Li 等将上一期相对价格的倒数作为当期相对价格的预测值,并利用在线主动被动学习技术构造策略PAMR。Huang 等考虑到现有的均值回归策略并未仔细处理数据中的噪声和离群值,利用L1-中位数预测下一期的股票价格,设计策略RMR。Cover 和Ordentlich 考虑到投资者往往会参考各种市场信息做出投资决策,提出边信息的概念,并将边信息引入UP 策略。杨兴雨等将边信息引入到EG 策略中,提出EGS 策略,该策略将边信息定义为一个符号引入模型中,但是并没有对边信息进行进一步的研究。
在已有的研究中,考虑边信息的在线投资组合模型仅认为边信息是与未来市场趋势相关的信号因子,而缺乏对边信息内容的研究。本文利用移动窗口历史相对价格数据的L1-中位数预测股票市场的涨跌趋势,将其作为边信息引入基于线性学习函数的在线投资组合策略LFM 中,构造基于L1-中位数边信息的在线投资组合策略。
一、相关概念与记号
Cover 提出的在线投资组合选择模型如下:假设有m 只股票可以进行投资,总共有n 个投资期,即投资者需要在n 个投资期结束后得到最优的最终累积收益。具体符号如下:xt=(xt,1,xt,2,L,xt,m)表示市场中的m 只股票在第t 个交易期的相对价格向量,其中xt,i表示第i 只股票在第t 个交易期的相对价格,相对价格是指当期期末股票价格与上一期期末股票的比值(1≤t≤n,1≤i≤m);整个投资期的相对价格向量序列为{xt}nt=1,简记为x1n;给定移动窗口长度w,离第t 个交易期最近的移动窗口历史相对价格数据为xtt--1w=(xt-w,xt-w+1,L,xt-1);bt=(bt,1,bt,2,L,bt,m)表示投资者在第t 个交易期的投资比例,其中bt,i表示第t 个交易期投资于第 i 只股票的比例;投资比例构成的集合记为△m={b=(b1,b2,L,投资组合策略,简记为b1n。
在第一期期初,一般采用将资金平均地分配于各项资产的方式,即b1=1/m·1,其中1 表示所有分量均为1 的m 维向量。随后每一期期初,通过利用当前持有的信息进行投资决策。若第t 个交易期投资者采初始财富值。不失一般性,取S0=1。
下面介绍一个常用的基准策略,即最优定常再调整策略BCRP。如果投资者在每一期期初都采用相同的b 作为当期的投资决策,则称为定常再调整策略CRP,使用该策略实现的最终累积收益的计算公式为定常再调整策略,记为b*,即:
由式(1)可知,BCRP 策略是一个事后策略,即只有在获得整个投资期的相对价格序列后才能确定。该策略往往被选作基准策略来衡量在线投资组合策略的优劣。如果在线投资组合策略累积收益的平均对数增长率渐近于BCRP 策略累积收益的平均对数增长率,那么称该策略为泛证券投资组合策略。
在实际投资过程中,投资者往往会从市场中获取许多的信息,利用信息辅助投资决策,这些信息称为边信息,能够帮助投资者实现较好的收益。将第t 个交易期的边信息状态记为yt,整个投资期的边信息状态构成的序列为{yt}nt=1,简记为y1n。假设将市场状态分为k 个边信息状态,则集合记为Y={1,2,L,k}。策略决策过程:在第t 个交易期期初,首先得到当期边信息,识别边信息状态yt,再根据边信息状态做出相应投资决策,该期投资比例记为b(tyt),则整个投资期投资比例向量构成
二、策略设计
本节在基于线性学习函数的在线投资组合策略LFM 中引入反映市场情况的边信息,设计基于L1-中位数边信息的在线投资组合策略。首先,对LFM 策略进行简要介绍。LFM 策略是基于线性学习函数bt+1,i=ct,ibt,i构造的在线投资组合策略,ct,i为线性因子,再对投资比例进行归一化得到LFM 投资比例更新公式,即:
其中,ct,i为区间[eσxt,i/bt·xt,1+(eσ/bt·xt-1)xt,i]的中点,σ∈[0,1]为学习率。易知,该区间的右端点大于等于左端点,当σ=0 时左右端点相等。LFM 策略的主要思想是根据股票当前期的表现确定下一期的投资权重,在下一期赋予当期表现较好的股票较大的权重。当前期股票的表现越好,即相应的相对价格xt,i越大,则区间的左右端点均越大,故区间的中点也越大,从而该股票权重越大。该策略可以实现较好的收益且计算复杂度低,为在线投资者提供一种更为简单实用的投资策略。
下面设计基于近期固定长度移动窗口的L1-中位数边信息。首先,考虑到过去较长时间的股票价格信息对当前的投资决策影响较小,甚至可能会对当前的决策造成干扰,本文在设计边信息时只考虑近期数据,设置移动窗口的长度为w。然后,计算移动窗口长度为w 的历史相对价格数据的L1-中位数,将其作为下一期相对价格的预测值,得到市场的预期涨跌趋势,将该趋势作为边信息应用于在线投资组合问题中。移动窗口长度为w 的相对价格数据的L1-中位数是与它们的欧几里得距离之和最小的向量,即:
其中,‖·‖表示欧几里得范数。
本文利用Vardi 和Zhang 提出的改进的Weiszfed 算法求解移动窗口长度为w 的历史相对价格数据的L1-中位数。该算法通过迭代计算求解,迭代的具体过程为:
将每只股票近w 期相对价格中位数构成的向量设置为迭代初始值,即 μ1=median(xt-w+1,xt-w+2,L,xt)。在迭代过程中,迭代 r 次得到 μr+1。设迭代容忍度为v,最大迭代次数为M。当‖μr+1-μr‖≤ν‖μr‖或r=M+1 时,终止迭代,返回 μr+1。取 L1-中位数 μ=μr+1,将该向量的均值作为反映市场情况的边信息,即:
在第t+1 期期初,根据得到的λt+1确定边信息状态,即:
其中,p 为阈值参数,边信息状态集合为Y={1,2}。投资者利用所获得的边信息状态确定第t+1 期的投资比例。过去所有边信息状态与第 t+1 期相同的期数构成的集合为{τ∶τ≤t,yτ=yt+1}。若该集合为空集,取bt+1(yt+1)=1/m·1;若该集合非空,则记s=max{τ∶τ≤t,yτ=yt+1},第t+1 期的投资比例为:
其中,cs,i=(eσxs,i/bs·xs+1+(eσ/bs·xs-1)xs,i)/2,称该策略为基于L1-中位数边信息的在线投资组合策略LFMS。
三、数值分析
本文采用真实股票价格数据对LFMS 策略进行数值分析,检验其在真实股票市场上的表现。
(一)数据来源与参数设置。本文的测试数据来自上海证券交易所(Shanghai Stock Exchange,SSE),具体的测试数据如表 1 所示,其中每只股票包含了从2006 年1 月1 日到2019 年12 月31 日的交易数据,共 3,404 个交易日。(表 1)
表1 股票组合名称一览表
本文构造的LFMS 策略的参数主要有学习率、移动窗口长度和阈值参数等,参数设置如下:学习率σ=0.01,移动窗口长度w=30,阈值参数p=1,最大迭代次数M=200,容忍度ν=10-9。
为了观测策略LFMS 的表现,同时列出了以下策略在相同数据下的表现,包括离线策略 Market、BCRP、在线策略 UP、EG、LFM,上述策略中的参数按照原文献进行取值。
(二)策略表现分析。首先,观察策略在不同股票组合中的最终累积收益表现,实验结果如表2 所示。为了便于观察,表2 中浅色数据在每个股票组合中表现最好的两个策略的最终累积收益。可以看出,在组合1、组合2、组合3 和组合4 中,策略LFMS 最终累积收益优于所有的对比策略,在组合5 和组合6 中,策略的表现仅次于事后策略BCRP,说明LFMS 策略在中国市场中具有较好的表现,且具有稳健性,可以帮助投资者实现较好的收益。(表2)
表2 不同策略在6 个股票组合上的最终累积收益一览表
为了进一步说明策略LFMS 的性能,下面比较其与BCRP、UP 和LFM 策略在不同股票组合上的逐日累积表现。图1 给出它们在股票组合3 和组合6 上的逐日累积对数收益。可以看出,当投资期数较少时,各策略表现接近,随着投资期数的增加,策略LFMS 的优势逐渐显现出来。LFMS 策略在股票组合中能够稳定地优于UP、LFM 策略,且能够追踪BCRP 策略,进一步说明策略的性能好、稳定性强。(图1、图2)
图1 不同策略在组合3 上的逐日累积对数收益图
图2 不同策略在组合6 上的逐日累积对数收益图
综上,本文将移动窗口历史相对价格数据的L1-中位数作为反映市场情况的信号因子引入到基于线性学习函数的投资组合策略中,构造基于L1-中位数边信息的在线投资组合策略。采用实际股票数据对策略进行数值分析,结果表明具有较好的性能。在后续的研究中将尝试设计包含更多信息的信号因子,进一步提高策略的表现。