基于RBF神经网络下的股票价格指数预测分析
2014-04-29胡宝予
【摘要】股票市场是一个极其复杂的非线性动态系统,在金融市场中占据着重要的地位。随着证券市场的不断发展与完善,投资者越来越重视股价指数的变化趋势。因此,利用相关模型预测行业价格指数趋势显得尤为重要。本文以深证信息技术行业指数为例,选用神经网络中比较经典的RBF(径向基)神经网络,使模型具有运算速度和外推能力,更具较强的非线性映射功能,从而较好的预测出该行业的未来一段时间的运行趋势,为投资决策提供依据。
【关键词】股价指数 深证信息技术行业指数 RBF神经网络 投资决策
一、问题的引出
随着中国证券市场的不断发展,以及中国金融体制的不断完善,使人们对高风险与高收益的股票市场愈加关注,机构和投资者试图分析财务数据、利用技术分析、宏观政策、数学模型等预测股票的发展趋势。然而股票市场是一个高度复杂的非线性动态系统,有其本身的规律性、复杂性、动态性,同时还受市场、经济、国家政策、投资者心理等众多因素的影响,简单的以技术分析、财务分析、数理统计的方法预测某一行业板块的整体运行态势效果不是很显著,因此寻找合适的方法来预测产业指数显得尤为重要,这为投资者锁定投资目标、实现稳定收益以及减少市场投机提供了基础。本文将以深证信息技术行业指数为例,利用一种较为新型的模型对该行业指数进行预测与分析,从而为股市的其他方面的预测提供一定的依据与基础。
二、文献综述
长时间以来,对股票价格的预测一直就是学术界和广大投资者最感兴趣的的问题之一,它不仅存在着及其重大的应用价值,也极具理论意义。到目前为止,随着投资理论的不断发展,提出了众多的股票价格、产业(行业)指数的预测方法,主要包括以下几类:
(一)较为传统的预测分析方法
具体为基本面分析方法、传统的技术分析法、指标分析方法(如KDJ、MACD、RSI、VOL等技术指标)。
(二)传统的时间序列分析方法
该类分析方法是把股票价格指数、产业指数看作随时间变化的序列,利用时间序列的变化趋势进行预测分析。
(三)非线性系统的分析方法
该类分析方法是把股票、产业指数看作为一个随机性和秩序性交织在一起的非线性动态系统,依靠其非线性函数进行仿真求解,此类方法有分型统计法、灰色预测法、神经网络法等
在长期的研究中,人们试图找到一个求解股票价格指数的非线性动态方程,这样就可以顺利的预测后期股票的价格指数。但是股票市场的复杂性、随机性、动态性决定仅依靠某一动态方程组来解决是不可能的。所以,我们只有基于现有的市场样本(产业指数),从市场过去运行的规律中来寻找决定系统或市场演化的法则和系统状态变量。这样就无须了解市场内在的运行机制,就可以实现任意的函数关系、学习能力以及通过学习掌握数据之间的依存关系。并且它只需要通过对历史数据的学习,就能够从纷繁复杂的数据中自主寻找出参数之间的规律和特点,并且刻画这些规律和特点。显然这里必须使用到非线性的预测方法来逼近系统内复杂的非线性映射,由此我们引用的非线性分析工具——神经网络。
本文选用神经网络中比较经典的RBF(径向基)神经网络,由于该网络的输出层对中间层的线性加权,使得该网络避免了BP神经网络冗长的计算,使更具运算速度和外推能力更具较强的非线性映射功能。因此可以这么说,径向基神经网络特别适合于非线性的时间序列的预测。接下来模型的建立与求解也是建立在RBF(径向基)神经网络的基础之上。
三、样本选择
深证信息(代码:399620)为反映深市不同行业上市公司的整体表现,提供更丰富的指数化投资标的、分析工具和可交易的指数产品,促进ETF等基金产品进一步发展,深圳证券交易所和深圳证券信息公司参照国际惯例于2011年6月15日,将深市个股按行业分类标准分为10个行业,编制10只深市行业指数(纯价格指数)。因此使样本更具科学性:
(一)产业指数更具指导意义
众所周知,深证产业指数是选择几十只股票进行加权之后进行的计算,因此是这一产业整体走势的代表,是一个整体指标,反应了某一行业的整体趋势,因而不易受极端个股的影响,更加真实具体。
(二)使投机转化为战略投资
中国股市之所以脆弱,原因之一就是股市的投机性过强,导致整个证券市场不够稳定,股票价格波动频繁,散户、机构投资者损失惨重,整个市场处于恶性循环状态。而产业指数注重的是整个行业的整体走势,是一个较为长期的指标,因而在一定程度上不能够很好的指导短线投机,但是对于具有战略投资眼光的机构或个人却极具指导意义。他们可以根据某一产业指数的变化转变投资策略,适应不断变化的证券市场,进而实现稳定收益。
(三)个股的股价预测易受政策、内幕、追捧,短线投机者及庄家的影响,预测往往不够理想
在经历了全球金融危机之后,整个金融市场处于一种波动的状态,众多的投资者、机构放弃了长线的战略投资,转而进行投机性的短线操作。不少庄家财大气粗违规操纵股市(广大证券乌龙指事件等),暗地操纵股票,使个股股价巨幅波动,中小投资者在市场博弈中明显处于劣势地位,所以,个股股价的预测存在着极大的偶然性和不确定性,这也导致即使是很好的股价预测模型也不能准确预测出股价的未来走势。而产业指数可以很大程度上避免这种问题,因为某一产业的价格指数是根据一定的指标筛选的在整个证券市场上比较稳定,运行良好的股票,数量多。选样空间要求严格,而且成分股的选择调整较为合理。所以,要人为控制某一产业的整体价格指数不仅资金量大,而且需要的时间较长,风险集中,不利于操作。基于以上几点的分析,本文将以信息行业指数的预测为例进行详细分析。
四、模型建立与求解
本文把信息技术行业指数可以看作是一个时间序列进行处理,因此这里假设有时间序列x={xi/xi∈R,i=1,2,3…N},然后利用已知的N个值预测后M时刻的数值。这里可以采用序列的前N时刻的数据为滚动窗,并将其映射为M个值,这里M代表在在该窗之后的M个时刻的预测值,如表一所示,列出了数据的划分方法,该方法悲哀把数据划分为K个长度为N+M且有一定重叠的数据段,每一个数据段可以看作一个样本,这样就可以得到个K=L-(M+N)+1样本,这样一来就可以将每一个样本的前N个值作为RBF神经网络的输入,后M个值作为目标输出,通过学习,实现RN到RM的映射,从而达到预测目的。
这里的样本数据来源于中国深证证券交易所和深圳证券信息公司,由于篇幅限制本文并没有以一年甚至更长的时间为样本,而是选取了2014年1月份的信息技术产业指数作为样本数据,并给出网络的设计和训练过程。
这里将每三天作为一个周期,3天的信息产业指数数据作为网络的输入量,输出则为预测日的行业指数。因此,本文中的神经元个数为N=3,输出层的神经元个数M=1,样本个数K=7,为了提高精度,中间层的神经元个数设为50。在利用软件MATLAB2013b计算机仿真前,应对1月2日至1月30日的指数值进行归一化处理,再进行网络训练与测试,最终得到如下运行结果:
从表中,我们不难看出,利用RBF神经网络可以较好地预测深证信息技术产业指数,其误差小于0.01,部分值的误差率接近于0,充分说明该模型中对于股市的预测适应性较高,对于非线性的动态系统拟合度较高,外推能力较强。为了便于观察预测值与实际值的差别及走势,我们利用MATLAB2013b进行编程得到如下图像:
从图1上我们很清晰的看到,利用RBF神经网络进行预测可以较好的模拟出整体趋势(“*”号与“o”),从而为预测提供决策依据。
从上图2我们可以看出训练样本共训练15次,在第9次时运行达到最优结果,由于训练样本数据有限导致误差略大,但在小样本的情况下可以控制到这样的误差,我们认为是大致可以接受的。若要提高预测性能,笔者建议应该采取更大的样本,如一年的深证信息技术产业指数。
以下是利用该模型进行的短期预测:
表2给出了2月7日至15日的深证信息技术行业预测指数值。然后我们就可以根据预测的指数点再结合自己的投资经验,技术分析等综合考虑,进而为一段时间的投资决策提供了依据,从而提高了对股市走势的把握程度,减少误差,为作出合理的投资判断提供了指导基础,也增强了收益的稳定性、可靠性。然而由于股票的长期走势受投资者心理、产业结构调整、宏观政策、国际局势、国内政治等多重因素的影响,所以,本文没有从事长期性的预测而是利用已知的指数点预测未来一周左右的走势,在根据实际走势进行不断的修正模型和参数,用实际值继续往后预测,以此类推,继而不断提高模型的准确性和稳定性。
五、总结
本文通过建立RBF神经网络对深证信息行业指数进行预测,一定程度上避免技术指标模型、历史数据模型所构成的集成网络预测股票价格的缺陷。
采用RBF神经网络,由于该网络的输出层对中间层的线性加权,使得该网络避免了BP神经网络冗长的计算,在对股票价格指数的预测中同各国神经元连接权值的调整,更加准确的逼近市场价格波动中反映出来的非线性映射关系,使更具运算速度和外推能力,从而实现对混沌时间序列的准确预测。并且方法简单实用,误差率较小,准确性较高,使模型更具推广型。从而为投资者迅速锁定某一行业、投资决策提供一定的依据。另外,本文所采用的数据较少一定程度上影响预测误差的大小,因此在实践中建议采用一年甚至更长时间的数据。影响行业指数变化的因素有很多,因此,投资者应该结合国家政策、国际形势、技术指标、基本面等进行综合分析决策。今后我们还需要将更多的因素考虑到估价预测模型中去,在股市规律中加入不可预见的调节因素等。
参考文献
[1]飞思科技产品研发中心.神经网络与MATLABR2007实现.北京:电子工业出版社,2007.
[2]周品.MATLAB神经网络设计与应用.北京:清华大学出版社,2013.3.
[3]吴维,陈维强.用BP神经网络预测股票市场的涨跌[J].大连理工大学学报,2001,41(1):9-15.
[4]陈明.MATLAB神经网络原理与实例精解.北京:清华大学出版社,2013.3.
[5]MATLAB中文论坛.MATLAB神经网络30个案例分析.北京:北京航空航天大学出版社,2010.4.
[6]董长虹.Matlab神经网络与应用(2版).北京:国防工业出版社,2007.9.
[7]施航,马琳达.人工神经网络在股票价格预测中的应用[J].电脑开发与应用,2007,20-35.
[8]李国平,林敬松.一种改进的灰色模型在股票价格预测中的应用.商场现代化,2005,25-49.
作者简介:胡宝予(1991-),女,辽宁鞍山人,湖北经济学院,专业:国际金融,研究方向:产业经济学。