基于改进ARIMA模型的光伏建筑一体化股票短期预测
2022-07-29林政扬倪肖婕
林政扬,倪肖婕,王 博
(杭州电子科技大学自动化学院,浙江 杭州 310018)
0 引言
作为资本市场的长期信用工具,股票的存在可以在一定程度上反映当前的经济形势。对于投资者来说,预测越精确越能规避股票投资存在的风险。而对于监管机构来说,预测未来走势越准确越能够加强对股票市场的把控。由于股票波动趋势受到多方因素的影响难以完全纳入考虑范围,因此相较于传统方法,时间序列方法通过着重于其本身的概率或者随机性质对未来做出短期预测。Adebiyi 通过ARIMA 模型预测股票价格,结果显示该模型具有短期预测潜力,说明ARIMA 是一类经典且短期预测效果理想的时间序列模型。滑动窗口是一种简单的降噪方法,其作用是限制窗口大小下不断更新时间序列。一般ARIMA模型连续预测下始终保留所有数据,本文结合滑动窗口的方法,选用不断更新的数据序列,并在新的序列下估计ARIMA模型参数。
随着国家《第十四个五年规划和2035年远景目标纲要》的出台,我国北京、上海等31地相继发布光伏建筑一体化(下称BIPV)未来三至五年相关政策,影响我国BIPV 和相关行业股市发展。本文以沪深股市中37家光伏建筑一体化相关企业的股票(见表1)为依据,对BIPV 板块建立模型,并利用2021 年5 月6 日至5 月28 日数据进行误差分析并修正模型,根据修正后的模型对该板块未来发展趋势做出预测。
表1 沪深股市中37家光伏建筑一体化相关企业
1 数据处理与模型建立
1.1 数据处理(数据来源:http://shumo.neepu.edu.cn/)
●在研究37 家光伏建筑一体化相关企业组成的BIPV 板块时,本论文在模型建立过程中选取2019 年4 月1日作为计算BIPV板块指数的基准日。
●在数据清洗过程对于缺失的交易数据,本文默认涨跌、涨跌幅、交易量、交易额为0,开盘价,收盘价保持上一个交易日的数据。
●市值计算中以交易量为权重,且以2019年4月1日的市值等价为1000点。
1.2 板块指数计算
记M()为BIPV 板块以2019 年4 月1 日为基准日第天的加权市值,有
其中P()表示第股对应的当日收盘价,W()表示第股的当日交易量,第天的板块指数为
1.3 ARIMA模型建立
ARIMA模型与ARMA模型的区别在于ARMA模型研究的时间序列是平稳的,ARIMA模型研究非平稳时间序列,对于不平稳的时间序列,可以同通过适当阶数的差分运算后变为平稳序列,从而用于ARMA模型。BIPV板块时间序列的差分时间序列为
其中∇称为阶差分算子,定义为
其中为(自回归序列)模型中定义的滞后算子。
差分运算后的时间序列∇I,要求是平稳时间序列,将差分平稳序列代入ARMA(m,n)模型中即有
其中,…,θ是()模型中的自回归系数,,…,β是MA模型中的移动平均系数,η是MA模型中第期的误差值。当为0 时,模型降为模型,为0 时则降为模型,对应预测的平稳差分序列可以通过式⑶推出原序列的预测值。
1.4 滑动窗口下的ARIMA模型
窗口大小为在第时刻的滑动序列窗口可定义为
如果时间序列确定,通过参数估计可以确定ARIMA 模型。一般ARIMA 模型连续预测下它始终保留所有数据,滑动窗口的作用是限制窗口大小下不断更新时间序列,在新的序列下估计参数。这样就能在保证受历史数据作用的同时减少过旧的数据作用,起到一定降噪。
1.5 评价指标
本文选用均方根误差说明模型预测与实际数据的误差程度:
2 数据分析
对于大部分金融数据而言其时间序列数据是非平稳的,且具有非线性、波动聚集性和异方差性。如图1 所示BIPV 板块指数有一种趋势,且数据偏度(Skewness)大于0,峰度(Kurtosis)大于3 即数据呈现“尖峰尾肥”的状态。本文对数据进行单位根检验(即ADF 检验,实际操作中要分别对不考虑趋势项和滞后项,仅考虑滞后项,考虑趋势项和滞后项三个ADF 检验模型进行检验,但凡有一个模型拒绝原假设,时间序列视为平稳时间序列),检验可得T统计量为-2.8639,P值为0.1754大于0.05,BIPV板块指数具有单位根,另外分析得自相关明显,因此BIPV 板块指数并非平稳时间序列。
图1 BIPV板块指数统计直方图(统计分析软件采用EViews 10)
本文选取2021 年4 月30 号前原I时间序列做一阶差分处理(在股市中指数的一阶差分是具有意义的,表示BIPV 板块指数的对数收益率),确定差分后的时间序列为平稳且非白噪声序列,即ARIMA(,,)中取值为1。确定好值后根据自相关和偏相关图以及AIC、SBIC、HQIC 准则确定AR(p)和MA(q)模型的阶次和参数(见表2),最后再对模型进行残差正态分布检验,经过检验最终的修正模型为ARIMA(1,1,1)。
表2 ARIMA(1,1,1)模型中参数
传统的ARIMA 模型对BIPV 板块进行动态趋势预测可以得出在2021年4月30号后BIPV 板块指数呈现缓慢上升,180 天滑动窗口下的ARIMA 模型预测则是缓慢下降(见图2(a))。利用2021 年5 月6 日至5 月28 日数据进行误差分析可知实际指数总体变化情况基本在180天窗口下ARIMA 的动态预测置信区间内,而传统的ARIMA 模型基本脱离模型预测区间,说明本文提出的新模型对BIPV 板块指数动态预测具有更好的效果。在定量预测BIPV 板块指数的时候,本文采用循环单步预测的方法的同时通过确定移动窗口的大小来预测该窗口约束下下一交易日的BIPV 板块指数,要注意的是每一次新序列的生成均要重复前文的模型确定过程,重新进行新序列下的参数估计。从预测结果上看一般的ARIMA模型预测RMSE为219.5526,本文提出的模型预测RMSE 为206.5721,效果更优(见图2(b))。
图2 ARIMA和基于180天滑动窗口的ARIMA模型对BIPV板块指数预测
3 灵敏度分析
本文提出的基于滑动窗口ARIMA 模型预测精确度受限于滑动窗口的大小,滑动窗口的选择起到了数据降噪的作用,图3 给出了不同滑动窗口下的指数预测,从表3 可知不同窗口选择的预测结果有显著性差异。
表3 不同窗口预测误差
图3 不同滑动窗口下ARIMA模型预测
4 结束语
本文提出一种基于滑动窗口的ARIMA 模型,该模型通过选择窗口大小,对窗口内的时间序列进行ARIMA模型预测,最后得出光伏建筑一体化的相关股票在下半年短期内总体趋势会有下滑,可能处于板块发展的瓶颈期,未来仍然需要相关政策的扶持。本文模型的难点在于选择合适的时间窗口长度,对于一类长期稳定的时间序列而言,可以深究能否优化出一个普适的时间窗口长度来实现用简单的方法进行高精度短期预测。此外读者还可以考虑采用模型组合的方法进行其他改进,从而将模型应用到粮食产量,水文变化,电力运输等方面。