基于ARIMA模型的余额宝收益率的预测
2017-09-03罗裕凡刘小蓉朱淑雅赵伟帆李敏
罗裕凡,刘小蓉,朱淑雅,赵伟帆,李敏
(山东师范大学数学与统计学院,山东 济南 250014)
基于ARIMA模型的余额宝收益率的预测
罗裕凡,刘小蓉,朱淑雅,赵伟帆,李敏*
(山东师范大学数学与统计学院,山东 济南 250014)
选取2013年5月30日—2016年7月27日期间的余额宝收益率数据,进行数据处理并建立ARIMA模型,从而预测出余额宝在2016年7月28日—2016年8月21日期间的收益率。通过实际结果与预测结果之间的对比,确定了在允许误差范围内该模型的有效性。
余额宝;收益率;ARIMA模型
2013年6月,阿里巴巴集团和天弘基金合作在支付宝平台上正式推出了余额宝,由于其操作的简便性和相对较高的利润而受到很多人的青睐。目前余额宝使用人数已达到2.6亿,并成为我国市场上规模最大的货币基金。余额宝是互联网的快速发展带来的中国利率市场化的产物,因而受到了很多专家学者的广泛关注。通过分析余额宝收益率的变化情况,并做出准确合理的预测,将有利于市场参与方做出自己的决策。王莹[1]对余额宝的流动性、收益性及风险性进行综合分析,并对投资者和余额宝自身提出相应建议。相对于银行的活期存款利息,余额宝的收益率比较高,但是,张大海[2]认为将这两者作比较是不恰当的,并分析说真正和余额宝业务相似的是银行发行的短期货币基金以及开放式无固定期限理财产品。李恒等[3]从监管层面、商业银行、产品自身和客户对余额宝业务的认知等多个方面对余额宝风险性作了研究。以上文献都在定性方面对余额宝作了充分的分析,但是定量方面的研究并未涉及。另一方面,王雪飞等[4-9]基于自四归积分滑动平均模型(auto-regressive integrated moving average model,ARIMA)[10]对中国钢材市场价格、土建专业群人才需求、短期风速、商品住宅销售价格、人口与医疗需求及中国人均粮食等方面做了有效的预测。本文将通过时间序列的方法,建构ARIMA模型,对未来短期内的余额宝收益率走势进行预测。为了避免因余额宝收益率有时变化较大而带来的误差,本文选取每天的余额宝七日年化收益率作为研究对象,给出一个合适的预测模型来进行预测。
1 ARIMA模型相关介绍
ARIMA模型是一种常用的随机时间序列分析模型,这种模型是Box和Jenkins提出的,所以又被称为B-J模型[10]。这是一种精度相对较高的短期的时间序列预测方法,其基本思想表现为,即便构成时间序列t的任意一组随机变量存在具有不确定性的单个序列值,但是纵观整个时间序列,其变化却具有某种规律。根据这种思想,我们可以使用相应的数学模型近似地进行描述,进而建立数学模型,得到最小方差意义下的最优预测。根据原序列是否平稳以及回归中所含部分的不同,可以将ARIMA模型分成自回归模型(auto-regressive model,AR)、移动平均模型(moving average model,MA)和自回归移动平均模型(auto-regressive moving average model,ARMA)。MARIMA(p,d,q)称为差分自回归移动平均模型,其中AR代表自回归,p代表自回归项;MA代表移动平均,q代表移动平均项数;d代表时间序列成为平稳时所做的差分次数。
如果时间序列yt是其前期值和随机项组成的线性函数,即可表示为:
yt=φ1yt-1+φ2yt-2+…+φpyt-p+ut,
(1)
令Bk为k步滞后算子,即Bkyt=yt-k,则(1)式可表示成为:
yt=φ1Byt+φ2B2yt+…+φpBpyt+ut,
令
表示滞后多项式,则上述模型可简化为:
如果时间序列yt是由其当期随机误差项和前期随机误差项组成的线性函数,即可表示为:
yt=ut-ξ1ut-1-ξ2ut-2-…-ξqut-q,
(2)
其中,ξ1,ξ2,…,ξq为实数,称为移动平均系数,则yt是一个移动平均序列,相应的(2)式就是一个q阶的移动平均模型,将其记作MMA(q)。
则(2)式可以简化为:
yt=ξ(B)ut。
为了使AR过程和MA过程能相互转化,即为可逆过程,就必须保证移动平均过程无条件平稳。因此要求滞后多项式ξ(B)的根都在单位圆外。
如果时间序列yt是由其当期随机误差项,前期随机误差项和前期值组成的线性函数,即可表示为:
yt=φ1yt-1+φ2yt-2+…+φpyt-p+ut-ξ1ut-1-ξ2ut-2-…-ξqut-q,
(3)
则该yt是一个自回归序列,相应地,(3)式就是一个(p,q)阶的自回归移动平均模型,将其记作MARMA(p,q)。其中,φ1,φ2,…,φp是自回归系数,ξ1,ξ2,…,ξq是移动平均系数。
引入滞后算子B,(3)式可以简化为:
2 实证与预测
2.1 ARIMA模型预测的主要步骤
(1) 对序列的平稳性加以判别。具体是根据时间序列的散点图、自相关函数以及偏自相关函数图,对序列的方差、趋势进行检验。如果时间序列是平稳的,直接建立ARIMA模型;否则,必须通过适当处理使其满足平稳性要求,具体过程是对于不平稳的数据序列,因其具有一定程度的上升或下降的趋势,那么数据需要进行差分处理,要保证处理之后的数据自相关函数值和偏相关函数值不显著为0。
(2)建立相应的模型并进行参数估计,避免高阶的MA模型或者包含高阶移动平均项的ARMA。
(3) 进行模型检验,检验残差序列是否为白噪声。
(4)进行预测分析[11]。
2.2 数据
本文数据来源于天天基金网中的天弘余额宝货币终端,选取对象是2013年5月30日—2016年7月27日期间的余额宝七日年化收益率。我们使用ARIMA模型给出2016年7月28日—2016年8月21日这25天的余额宝七日年化收益率。
2.3 建模过程
2.3.1 一阶差分单位根检验
对序列进行一阶差分之后,可得到序列图(图1),差分后的结果显示图像在零线上下波动,即模型的拟合值与实际值的变动较小,对此,我们可假定序列已经达到了平稳,接下来,为了探究其是否真的达到平稳,还需要对其进行单位根检验。
图1 一阶差分后序列图Fig.1 The sequence diagram after the first order difference
通过单位根检验,得出结果如表1所示,其中原假设一阶差分有一个单位根,外生变量是常数,并且滞后长度是13,该值自动基于最大滞后长度是22的SIC准则。由表1可得,一阶差分之后的序列t检验的统计量明显小于各个显著性水平提供的临界值,所以可以得出,经过一阶差分之后的时间序列是平稳序列[12]。
表1 一阶差分后序列单位根检验结果
2.3.2 差分序列的相关性检验
因为纯随机序列不具有建模的必要性,所以为了避免一阶差分后的序列呈现纯随机序列的情况,我们需要对差分后的序列做相关性检验,根据差分后的自相关系数来判定其是否为纯随机序列。进行一阶差分之后,得出的自相关函数,偏自相关函数以及相关统计量的情况如表2所示。
表2 自相关函数和偏自相关函数结果图
从表2中我们可以发现,自相关函数和偏自相关函数都是拖尾的。综上所述,该时间序列不是纯随机序列,因此有建模必要。
2.3.3 模型最优判定
表3 模型定阶原则
我们通过对2016年7月27日之前的数据进行一次差分之后序列的自相关函数和偏自相关函数的分析,从一阶差分的偏自相关函数中可以观察到,在k=3以后的值都在置信区间内,偏自相关函数很快趋于0,偏自相关函数呈拖尾状态,因此可以确定p=3;从一阶差分自相关函数可以观察到,在k=5以后的值都在置信区间内,自相关函数也很快趋于0,自相关函数呈拖尾状态,因此可以初步确定q取5。在此基础上我们建立MARIMA(3,1,5)模型,其中关于MARIMA(3,1,5)模型的相关参数和指标分别见表4和表5。
表4 MARIMA(3,1,5)模型的相关参数
表5 MARIMA(3,1,5)模型的指标
2.3.4 模型检验
进行参数估计后,模型的残差序列还需要进行白噪声检验,主要是检验其残差序列是否属于白噪声序列[4]。如果残差序列不属于白噪声序列,则还需对模型进行进一步的改进。我们对MARIMA(3,1,5)模型残差的自相关函数和偏自相关函数进行置信区间检验,LM检验结果如图2所示。
由图2可以看出,残差的自相关和偏自相关函数都处于置信区间内,这说明残差通过了白噪声检验,可以用于预测。
2.3.5 模型预测
通过上述一系列的分析以及文献[14]的理论知识,我们可以确定最佳拟合预测模型就是MARIMA(3,1,5),图3是预测结果与实际结果,即预测和实际收益率的对比图。
图2 残差的LM检验Fig.2 LM test of the residual errors
图3 预测结果与实际结果的对比图 Fig.3 The comparison of the predicted results with the actual results
在表6中,我们给出了2016年7月28日—2016年8月21日期间每天的实际值、预测值以及其相对误差,最大的相对误差为1.146%,因此认为该模型是有效的。
表6 余额宝收益率预测结果与实际结果的对比图
续表6
日期实际值预测值相对误差/%2016⁃08⁃182.3672.3820.6342016⁃08⁃192.3632.3810.7622016⁃08⁃202.3602.3810.8902016⁃08⁃212.3592.3800.890
3 结论
本文使用的ARIMA模型,能近似地描述随时间变化的序列,基本避免了由于其他经济原因带来的误差,因而本文的预测对象,即余额宝的收益率所组成的序列可以被有效地识别出来,从而建立相应的数学模型,通过研究时间序列的现在值和过去值,对未来值进行预测。
本文首先对余额宝收益率的原始序列进行一阶差分,并通过相关函数来分析序列的平稳性。其次,按照序列的不同性质来选用最合适的模型,通过对模型的运用,可以对序列进行短期预测,并将其与实际情况进行误差分析,结果表明,我们使用的模型预测效果可信。本文可为更多新型金融衍生品的风险函数研究提供参考价值。
[1]王莹. 余额宝的流动性、收益性及风险分析[J]. 中国商贸,2013(35):65-66.
[2]张大海. “余额宝”的机会与风险[J]. 创新时代,2013(8):37-37.
[3]李恒,郝国刚. 余额宝的风险及防范研究[J]. 时代金融旬刊,2014(5):60.
[4]王雪飞,刘志伟. 基于ARIMA模型的中国钢材市场价格预测[J]. 中国城市经济,2011,(1):20-23.
[5]肖凯成,蒋春霞,杨波. ARIMA模型在土建专业群人才需求预测中的应用[J]. 科技信息,2013(6):42,44.
[6]陈平,夏敏. 基于ARIMA模型的短期风速预测方法[J]. 华章,2011(15):266-267.
[7]谷秀娟,梁润平. 基于ARIMA模型的郑州市商品住宅销售价格预测研究[J]. 金融理论与实践,2012(1):51-54.
[8]郑红云.ARIMA模型在深圳人口与医疗需求预测的应用[J]. 齐鲁工业大学学报(自然科学版),2012,26(4):44-49.
[9]吴秀芝,刘颖博. 基于ARIMA模型对中国人均粮食的预测[J]. 金融经济,2010(24):109-110.
[10]易丹辉.数据分析与Eviews应用[M].2版.北京:中国人民大学出版社,2014.
[11]高铁梅.计量经济分析方法和建模——Eviews应用及实例[M]. 北京:清华大学出版社,2009:78-80.
[12]王周伟,崔百胜,朱敏. 经济计量研究指导——实证分析与软件实现[M]. 北京:北京大学出版社,2015.
[13]李正宏. 波罗的海运价指数波动规律与预测[J]. 上海海事大学学报,2004,25(4):69-72.
[14]段洪涛,曾繁声,李景春.一种预测频段占用度的时间序列分析方法[J].无线电工程,2011,41(7):17-20.
Prediction of the Yu Ebao yield based on ARIMA model
LUO Yu-fan, LIU Xiao-rong, ZHU Shu-ya, ZHAO Wei-fan, LI Min*
(School of Mathematics and Statistics, Shandong Normal University, Jinan 250014, China)
∶The research object of this paper is the yield of Yu Ebao. By selecting the yield data during May 30, 2013 to July 27, 2016, the ARIMA model was established for data processing, thus predicating the yield of Yu Ebao between July 28, 2016 and August 21, 2016. Finally, by comparing the actual results with the predicted results, the validity of the model within the allowable error range was determined.
∶Yu Ebao; prediction of the Yu Ebao yield ; ARIMA model
10.3976/j.issn.1002-4026.2017.04.016
2016-10-31
教育部留学回国人员科研启动基金资助项目(教外司留[2015]1098)
罗裕凡(1995—),女,研究方向为信息与计算科学。
*通信作者,李敏。E-mail: liminemily@sdnu.edu.cn
O2.3
A
1002-4026(2017)04-0099-07