基于GARCH模型和BP神经网络模型的股票价格预测实证分析

2019-10-15崔文喆李宝毅于德胜

天津师范大学学报（自然科学版） 2019年5期

崔文喆，李宝毅，于德胜

（天津师范大学数学科学学院，天津 300387）

在金融投资领域，股票市场占据十分重要的地位.股票价格走势一直是人们关注的焦点.为了更精确地预测股票价格，人们提出了许多股票价格预测模型，如：自回归移动平均模型（ARMA）[1]、差分自回归移动平均模型（ARIMA）[1]、自回归条件异方差模型（ARCH）[2]、广义自回归条件异方差模型（GARCH）[3]、人工神经网络类模型[4]等.为了比较不同模型的预测性能，相关研究做了大量尝试[5-10].文献[5]运用GARCH模型和BP 神经网络模型对清华同方的收盘价进行实证分析，结果表明：对股票价格序列，从非线性系统的角度建模比从非平稳时间序列的角度建模效果要好.文献[6]利用深圳股票市场的实际数据，建立BP算法网络预测模型、ARCH（1）和 GARCH（1，1）预测模型对深成指数每周末收盘价的波动性进行预测，结果表明BP 算法的预测效果最好.文献[7]建立ARMA 模型和含有一个隐层的BP 网络模型，以亚泰集团360 个交易日数据为样本预测未来10 天的收盘价，结果表明相对于BP 网络模型，ARMA 模型对短期股价预测的精度较高.文献[9]选取3 支股票价格作为研究对象，对比分析得出相较于其他阶数的GARCH 模型，GARCH（1，1）预测有效性最好，且BP 神经网络模型在隐层节点数为5 时对工商银行股票收益率数据拟合程度最优，2 种方法均能对股票价格进行短期预测.文献[10]基于广义回归神经网络模型对股票价格进行预测，并与ARIMA 模型对比，结果表明基于广义回归神经网络的预测模型要优于ARIMA 模型.

本研究采用GARCH 模型和BP 神经网络模型，利用上海 A 股 30 支股票（6 类，每类各 5 支）2015年6月29日至 2017年6月30日的日收盘价，分别进行短期、中期和长期预测，并考虑了当日价格波动对预测结果差异的影响.

1 研究对象

选取上海 A 股 30 支股票 2015年6月29日至2017年6月30日连续105 周的每日收盘价格，具体股票为：

金融（600016 民生银行、600030 中信证券、601288农业银行、601318 中国平安和601788 光大证券）；

公用事业（600004 白云机场、600037 歌华有线、600088 中视传媒、601008 连云港和 603000 人民网）；

房地产（600007 中国国贸、600068 葛洲坝、600463空港股份、600708 光明地产和601186 中国铁建）；

综合（600082 海泰发展、600108 亚盛集团、600371万向德农、600783 鲁信创投和600805 悦达投资）；

工业（600010 包钢股份、600028 中国石化、600066宇通客车、600118 中国卫星和600305 恒顺醋业）；

商业（600327 大东方、600628 新世界、600694 大商股份、600993 马应龙和601607 上海医药）.

采用GARCH 模型和BP 神经网络模型对以上30支股票分别进行短期（第1 周：2017年7月3日至7月7日）、中期（第 6 周：2017年8月14日至 8月18日）和长期（第 12 周：2017年9月25日至 9月29日）预测，以比较2 个模型的预测能力，同时考虑了当日价格波动对预测结果差异的影响.

2 研究方法与模型建立

2.1 GARCH模型

GARCH 模型是对ARCH 模型的一些约束条件进行扩展得到的，该模型分为均值方程与方差方程2 部分.均值方程形式为

其中：yt为条件均值，代表被预测的收盘价；yt-i为条件均值的滞后值，代表预测所用的已知收盘价；ut为残差，ut-j为残差的滞后值，c 为常数.方差方程形式为

使用 MATLAB R2012b 对 GARCH 进行建模.由于常见的金融时间序列都可以用GARCH（1，1）模型描述[11]，因此本研究选择建立GARCH（1，1）模型对股价进行分析和预测.

运用price2ret 函数将30 支股票的每日收盘价序列转化为收益率序列.对日收益率序列进行ACF 检验和PACF 检验；对日收益率残差序列进行Ljung-Box Q（LBQ）检验和ARCH 检验；对日收益率平方进行ACF检验.结果表明：日收益率序列的ACF 和PACF 检验结果显示日收益率序列的相关性不具有统计学意义（P ＞0.05）；日收益率平方序列的ACF 检验显示平方序列的相关性具有统计学意义（P ＜0.05）；日收益率残差序列的LBQ 检验中逻辑值H=1（P ＜0.05），表明该序列不是自相关的，ARCH 检验中逻辑值 H=1（P ＜0.05），表明在95%的置信区间下拒绝无异方差的原假设，即该样本数据的残差有异方差的特性，可以采用GARCH 模型.

对30 支股票日收益率建立的GARCH（1，1）模型进行LBQ 检验和ARCH 检验，均有逻辑值H=0 及P ＞0.05，表明模型拟合效果显著，所建模型适合，可以使用其进行预测.

使用garchpred 函数对收益率进行预测，再用ret2price 函数将得到的收益率时间序列转化为价格时间序列即可得到预测的日收盘价.

2.2 BP神经网络模型

BP 神经网络可以设置不同数目的隐层，在不限制隐层节点数的情况下，具有一个隐层的BP 神经网络模型可以实现任意非线性映射[12].因此，本研究采用3 层网络结构的BP 神经网络模型，设置一个隐层，输入结点数设为15，输出结点数设为5.在保持模型中其他参数值不变的情况下，通过对比输出误差来确定最佳的隐层节点数目[13]，通过检验得到当隐层神经元数目为25 时，网络的均方误差最小.因此使用MATLAB R2012b 对BP 神经网络模型进行建模，设计一个隐层神经元数目为25 的3 层网络结构进行股票收盘价预测.

3 结果分析

使用MATLAB R2012b 编程对以上2 个模型进行建模，得到6 类30 支股票预测结果与实际收盘价的相对误差数据（均值±标准差），并运用SPSS 24 软件对30 支股票每日收盘价2 种模型的预测结果进行配对T 检验.

每只股票的相对误差计算公式为

定义统计量：每只股票预测价格波动比例（以下简称波动比例），计算公式为

其中日均价=（日最高价+日最低价）/2.分别计算30支股票的预测价格波动比例（均值±标准差），并运用SPSS 24 软件对其进行配对T 检验，以比较在考虑每日价格波动的情况下2 种模型的预测效果.

在30 只股票中，房地产类股票“600708 光明地产”于 2017年6月30日按“10 转 3 股派 1.5 元”产生了送转，公用事业类股票“600004 白云机场”于2017年7月14日按“10 送 4.5 股派 3.7 元”产生了送转.因此对以上2 只股票送转后的实际日收盘价、日最高价、日最低价进行校正，以校正后的价格进行预测误差和预测价格波动比例比较分析.若某只股票按“10转（送）a 股派 b 元”，则校正公式为

3.1 短期预测（2017年7月3日至7月7日）

2 种模型的短期预测相对误差及预测价格波动比例见表1，短期预测相对误差及预测价格波动比例的配对T 检验结果见表2.

表1 GARCH 模型和BP 模型短期预测相对误差及预测价格波动比例Tab.1 Relative error and price fluctuation ratio of short-term forecast of GARCH model and BP model

表2 GARCH 模型和BP 模型短期预测相对误差及预测价格波动比例的配对T 检验Tab.2 Paired T-test of relative error and price fluctuation ratio of short-term forecast of GARCH model and BP model

由表1 可见：2 个模型30 支股票一周预测总体相对误差平均值均在2.5%左右；GARCH 模型的一周预测总体波动比例平均值在1.4 左右，BP 神经网络模型在 1.6 左右；比较相对误差可以发现，前 2日GARCH 模型的预测效果优于BP 神经网络模型，后3日及一周总体预测BP 神经网络模型的预测效果优于GARCH 模型；考虑当日价格波动对预测结果的影响时，前2日GARCH 模型的预测效果优于BP 神经网络模型，后3日BP 神经网络模型的预测效果优于GARCH 模型，一周总体预测GARCH 模型的预测效果优于BP 神经网络模型.由表2 可见，无论是每日预测还是一周总体预测，2 种模型的预测效果的差异均不具有统计学意义（P ＞0.05），即对于短期预测而言，2 种模型预测效果相当.这是由于股票日收盘价时间序列理论上是非线性的，但在相对较短的时间范围内也可以看作是线性的，因此虽然BP 神经网络模型的智能预测精度较高，但在短期预测中线性预测也具有一定的优势，2 种模型预测效果均较好，差异并不明显.在6 类股票中，房地产类股票预测误差相对较大（一周总体相对误差（%）：GARCH 模型为6.77±10.17，BP 模型为 3.81 ± 3.89；一周总体波动比例：GARCH模型为 4.49 ± 7.84，BP 模型为 2.19 ± 2.31），这是由于房地产类股票易受客观因素的影响，预测难度相对较大.

3.2 中期预测（2017年8月14日至8月18日）

2 种模型的中期预测相对误差及预测价格波动比例见表3，中期预测相对误差及预测价格波动比例的配对T 检验结果见表4.

表3 GARCH 模型和BP 模型中期预测相对误差及预测价格波动比例Tab.3 Relative error and price fluctuation ratio of medium-term forecast of GARCH model and BP model

表4 GARCH 模型和BP 模型中期预测相对误差及预测价格波动比例的配对T 检验Tab.4 Paired T-test of relative error and price fluctuation ratio of medium-term forecast of GARCH model and BP model

由表3 可见：30 支股票一周预测总体相对误差平均值GARCH 模型在8.4%左右，BP 神经网络模型在3.4%左右；一周预测总体波动比例平均值GARCH模型在4.6 左右，BP 神经网络模型在2.2 左右.比较相对误差可以发现，无论是每日预测还是一周总体预测，BP 神经网络模型预测效果均优于GARCH 模型（表3），且2 种模型每日预测效果的差异具有统计学意义（0.01 ＜P ＜0.05），一周总体预测的差异具有高度统计学意义（P ＜0.01）（表4）.比较波动比例可以发现，考虑当日价格波动对预测结果的影响时，无论是每日预测还是一周总体预测，BP 神经网络模型预测效果仍优于 GARCH 模型（表3），且 14日、16日、18日预测效果的差异不具有统计学意义（P ＞0.05），15日、17日预测效果的差异具有统计学意义（0.01 ＜P ＜0.05），一周总体预测的差异具有高度统计学意义（P ＜0.01）（表4）.对于中期预测，股票日收盘价序列仍然是非线性的，对于这样波动频繁的时间序列，从非线性系统的角度建模效果优于从非平稳时间序列的角度建模，即BP 神经网络的预测效果优于GARCH 模型.

3.3 长期预测（2017年9月25日至9月29日）

2 种模型的长期预测相对误差及预测价格波动比例见表5，长期预测相对误差及预测价格波动比例的配对T 检验结果见表6.

表5 GARCH 模型和BP 模型长期预测相对误差及预测价格波动比例Tab.5 Relative error and price fluctuation ratio of long-term forecast of GARCH model and BP model

表6 GARCH 模型和BP 模型长期预测相对误差及预测价格波动比例的配对T 检验Tab.6 Paired T-test of relative error and price fluctuation ratio of long-term forecast of GARCH model and BP model

由表5 可见：30 支股票一周预测总体相对误差平均值GARCH 模型在14.2%左右，BP 神经网络模型在7.8%左右；一周预测总体波动比例平均值GARCH模型在8.8 左右，BP 神经网络模型在5.3 左右.比较相对误差可以发现，BP 神经网络模型预测效果优于GARCH 模型（表5），每日预测效果的差异不具有统计学意义（P ＞0.05），一周总体预测的差异具有高度统计学意义（P ＜ 0.01）（表 6）.比较波动比例可以发现，考虑当日价格波动对预测结果的影响时，BP 神经网络模型预测效果仍优于GARCH 模型（表5），每日预测效果的差异不具有统计学意义（P ＞0.05），一周总体预测的差异具有高度统计学意义（P ＜ 0.01）（表 6）.对于长期预测，股票日收盘价序列是非线性的，因而从非线性系统的角度建模效果更好，即BP 神经网络的预测效果优于GARCH 模型，然而随着预测周期延后，误差逐渐积累，预测难度增大，虽然长期预测中BP 神经网络优于GARCH 模型，但预测精度均不够理想，需进一步对模型进行改进以增强其适用性.

4 结论

采用GARCH 模型和BP 神经网络模型，利用上海A 股30 支股票连续105 周的日收盘价，分别进行短期、中期和长期预测，结果表明：

（1）在短期预测中：无论是否考虑当日价格波动，前2日GARCH 模型的预测效果优于BP 神经网络模型，后3日BP 神经网络模型的预测效果优于GARCH模型；无论是每日预测还是一周总体预测，2 种模型预测效果的差异均不具有统计学意义（P ＞005）.

（2）在中期预测中：不考虑当日价格波动时，无论是每日预测还是一周总体预测，BP 神经网络模型预测效果均优于GARCH 模型，且每日预测效果的差异具有统计学意义（0.01 ＜P ＜0.05），一周总体预测的差异具有高度统计学意义（P ＜0.01）；考虑当日价格波动时，无论是每日预测还是一周总体预测，BP 神经网络模型预测效果仍优于GARCH 模型，每日预测中有3日预测效果的差异不具有统计学意义（P ＞005），有2日预测效果的差异具有统计学意义（0.01 ＜ P ＜ 0.05），一周总体预测的差异具有高度统计学意义（P ＜0.01）.

（3）在长期预测中：无论是否考虑当日价格波动，BP 神经网络模型预测效果优于GARCH 模型，每日预测效果的差异不具有统计学意义（P ＞005），一周总体预测的差异具有高度统计学意义（P ＜0.01）.

（4）总体来看，对于股票收盘价预测，随着时间推移，2 种模型的预测相对误差平均值与预测价格波动比例平均值均在逐渐上升，短期、中期预测效果较好，其中：2 种模型短期预测均可得到较好的效果，BP 神经网络模型的中期预测效果更优，而2 种模型的长期预测效果均不够理想.

虽然GARCH 模型和BP 神经网络模型都是通过对股价序列进行分析从而尽可能地发现规律，但由于方法与思路的不同，其适用领域和预测效果也不尽相同.