APP下载

基于模糊处理和遗传优化的小波神经网络股指区间预测

2016-07-16张明宇梁琪

中国市场 2016年27期

张明宇+梁琪

[摘要]文章基于模糊粒化和遗传算法优化的小波神经网络,建立了一种新型股指区间预测模型。并对上证指数开盘数据进行实证检验,预测结果表明模型预测结果比较准确,模型具有较高的预测精度,误差率较小。文章建立的股指预测模型对探究中国股票市场波动趋势有一定意义,同时也为投资者进行股市投资提供一种投资参考。

[关键词]模糊粒化;小波神经网络;股指区间预测

[DOI]101.3939/jcnkizgsc20162.71.1.3

1引言

随着股票市场的逐渐完善和发展,投资金融理财产品成为越来越多的家庭和个人的选择,股票就是其中重要的一种理财产品。近年来,人工神经网络是人工智能领域兴起的研究热点,并且凭借其优秀的非线性逼近和泛化能力在金融市场得到了广泛的应用。王文波等人进行了基于EMD 与神经网络的中国股票市场预测[1],任崇岭等人进行了基于小波神经网络的短时客流量预测研究[2],以上研究表明神经网络在股票市场上有较好的实际预测效果并获得了广泛的应用。潘晓明等人通过采用遗传算法的神经网络集成建立了一种股票市场预测模型。[3]刘沛汉等基于遗传算法优化进行了神经网络的光伏电站短期功率预测[4]等,上述研究结果表明遗传算法在优化神经网络进行预测,降低误差方面有显著作用。

传统神经网络预测多得到股指点的预测,但是股票市场随机性较大,投资者往往更希望得到股指在未来一段时间的波动区间作为投资参考。因此,文章通过将股指开盘数据模糊粒化,然后在小波神经网络基础上建立一种新型的股指区间预测模型,并使用遗传算法优化模型参数,获得更高的精度,预测未来一段时间内股指波动范围,为股市投资者提供投资参考。

2模型的建立

2.1信息粒化

1979年,LAzadeh教授提出了“信息粒化”(Information Granulation)的概念。信息粒化就是通过一定的划分准则,将原始数据中难以辨别,或者具有特定功能相似的数据聚集成多个集合,构成一个个信息粒,这种信息处理的方式称之为信息粒化。一般形式如下:

2.2基于遗传算法和BP学习的小波神经网络预测

2.2.1遗传算法的使用

遗传算法(Genetic Algorithm)是一种模拟生物进化机制的算法,具有较好的收敛性、极高鲁棒性和广泛适用性,可有效提高模型预测精度。因此,文章采用全局搜索能力较好的遗传算法优化网络参数,步骤如下。

2.2.2小波神经网络的建立

小波神经网络是在BP神经网络基础上,以小波基函数作为隐含层节点传递函数,信号前向传播的同时误差反向传播的神经网络。文章选取Morlet母小波基函数作为隐含层小波基函数:

采用梯度修正算法高模型的预测精度、使预测输出更接近期望输出,修正过程如下:

3实证分析

文章选择我国股票市场中的上证指数作为研究数据。文章选取201.4 年1.2月2.2 日至2016 年3 月16 日的300 个交易日的上证指数开盘数据进行预测,数据源于新浪财经。将300个开盘数据每4 天划分成一个数据粒,划分成75个数据块,隶属函数的参数即对应模糊上界,模糊中值和模糊下界。文章使用模糊下界和模糊上界作为股票指数所在的区间。

以股指分块数据的上界为例,选取前72个数据作为神经网络的训练集,后3个数据作为测试集。文章选取前6个数据作为小波神经网络的输入。隐含层节点的数目可根据经验公式[KF(]m+n[KF)]+α 计算,其中α 是取值0~10之间的常数,经过多次尝试隐含层节点为1.3时效果最好,输出层节点个数为1,文章的小波神经网络结构为6-1.3-1。

用遗传算法计算小波神经网络测初始状态,这里文章基于Matlab的Gatbx遗传算法工具箱进行编写。具体的参数设置为:①个体数目:50;②最大遗传代数:20;③变异概率:005;④交叉概率:08;⑤代沟:09。

采用梯度下降法训练小波神经网络,梯度下降训练具体参数如下:(1)小波神经网络权值学习速率η1=002;(2)小波基函数伸缩、平移因子学习速率η1=001;(3)小波神经网络最大迭代次数为600次。训练结果和训练误差如下。

利用训练好的小波神经网络得到2016年3月1日~3月16日的模糊上界的预测值。类似地,对上证指数模糊中间值以及模糊下界进行相同的处理方式,可以得到具体的股指预测区间为[2.73.6,2.889]、 [2.705,2.877]和[2.74.3,2.960]。2016年3月1日~2016年3月16日股指区间预测结果和实际股指图如下所示。

由上图可以看出,2016年3月1日—2016年3月16日一共1.2个交易日的数据几乎全部属于小波神经网络预测区间,并且模型预测区间波动较小,预测较为精确。模型可以较好地预测股票指数在没有重大政策影响的情况下的波动情况。

对于模型预测误差,本文采取均方根误差(RMSE),平均绝对百分比误差(MAPE),最大绝对误差百分比(MaxAPE)这三项指标来进行衡量。按照如下计算公式计算得到预测结果误差并得到计算结果:

4结语

文章提出了一种基于模糊粒化和遗传算法优化的小波神经网络股票指数区间预测模型。该模型通过对上证指数开盘数据进行模糊粒化,建立一个基于遗传算法优化的小波神经网络,并对未来几日的上证指数进行预测。实际结果表明,这一预测模型可以较好地预测未来4日上证指数的波动区间,并且具有较高的预测精度,可以作为股票投资者的一种投资参考,有效地规避风险,从而获取更大的收益。

参考文献:

[1]王文波,等基于EMD与神经网络的中国股票市场预测[J].系统工程理论与实践,2010,30(6):102.7-103.3.

[2]任崇岭,等基于小波神经网络的短时客流量预测研究[J].科学技术与工程,201.1,1.1(2.1):5099-5.103.

[3]潘晓明,等基于遗传算法神经网络集成股票市场预测研究[J].广西师范学院学报,2007,2.4(1):77-83.

[4]刘沛汉,等基于遗传算法优化神经网络的光伏电站短期功率预测[J].水电能源科学,2016,3.4(1):2.1.1-2.1.4.

[5]姚洪兴,等股市预测中的小波神经网络方法[J].系统工程理论与实践,2002,2.2(6):3.3-38.

[6]Neshat,N:An approach of artificial neural networks modeling based on fuzzy regression for forecasting purposes[J].International Journal of Engineering,Transactions B:Applications,2015(2.8):165.1-165.5.