APP下载

基于PCA - BP神经网络综合模型预测股票价格

2020-12-28张如梦张华美

电脑知识与技术 2020年33期
关键词:股票价格主成分分析

张如梦 张华美

摘要:针对股票价格和涨跌趋势预测准确度问题,构建PCA - BP( Principal Component Analysis-Back Propagation)神经网络综合模型。将主成分分析法与BP神经网络模型组合,测试得到在隐层节点为7时误差最小,能100%预测股票的涨跌。构建PCA - BP神经网络综合模型,综合模型预测股票涨跌准确度为95%,股票价格误差相对减少。最后可知,综合模型比单个PCA - BP神经网络模型更有优势,能更好地给投资者切实可行的建议。

关键词:BP神经网络模型;主成分分析;股票价格;长短期预测

中图分类号:TP183 文献标识码:A

文章编号:1009-3044(2020)33-0004-04

开放科学(资源服务)标识码(OSID):

引言

金融市场中的股票价格变换迅速且高度非线性,如何较短时间内准确的预测股票价格和涨跌趋势,是许多学者和投资者共同关心的内容之一。影响股票价格的影响因素众多,文章通过主成分分析降低输入变量的维度,进而缩短预测时间。利用神经网络准确的预测股票价格,与前期价格比较从而判断股票的涨跌情况。运用PCA - BP模型构造综合模型对比分析股票价格与涨跌情况,应用广泛[1]。

1 研究现状

许多学者运用BP神经网络对股票价格进行研究。韩莉运用LM - BP神经网络预测智联招聘股票开盘价,平均相对误差为0.88%,预测精度较高[2];闫冬运用主成分分析和遗传算法优化BP神经网络和综合模型对股票价格预测,主成分分析优化的神经网络模型在股票短期预测上具有良好的改进作用[3];郭盼盼构建GA - BP神经网络预测股票价格,预测收益率,利用模型预测模拟投资,累计收益提高50%以上,模型风险小,收益大实用性强[4];兰太强基于主成分与BP神经网络组合进行股票预测,构建了多样化的量化选股模型。实验表明基于主成分与BP神经网络结合能很好地预测股票下一年同一个季度的涨跌情况[5];刘庆霞基于主成分分析改进的BP神经网络拟合和训练股票数据能得出很好的预测结果[6];梁娜将SOM模型、主成分分析与BP神经网络模型结合,构建股票收盘价的组合模型,证明主成分与BP神经网络模型结合效率与精度均高于其他模型[7];杨小平运用主成分分析减少神经网络的输入维数,将主成分作为BP神经网络的输入变量,最后预测股票价格[8];于卓熙运用主成分分析与GRNN回归模型结合和ARIMA模型三种模型对股票价格进行预测,并得到GRNN模型更优于ARIMA模型[9];孙德山利用主成分分析法与DNN、RNN和BP模型结合,比较三种模型的优劣,结果表明PCA - RNN具有更加良好的效果[10]。

從研究现状可知,股票预测研究多倾向于优化组合神经网络方面,通过优化模型,可以提高收敛速度,节约时间,提高效率。本文采用PCA - BP神经网络结合的方法,通过主成分可以减少输入维数,从而提高效率和减少误差。

2 模型介绍

2.1 主成分分析

主成分分析( Principal Component Analysis)通过几个不相关的变量用线性组合的方式代替原来大量的变量,并尽可能多的反映原来的变量信息,这几个新的不相关变量称为主成分。确定主成分的个数包括选择特征值大于1和累积方差贡献率高于85%两种方法,本文采用第二种方法选择主成分的个数为3个。具体步骤如下:

(1)将原始数据进行标准化变换;

3 实证分析

3.1模型构建

根据股票价格的特点,噪声大且重叠信息多共线性强,这里采用主成分分析法,对输入变量分类,分成几个主成分,再将主成分作为神经网络的输入变量,从而降低变量维数,消除共线性性质,从而提升收敛速度。

3.1.1 PCA - BP模型构建

用SPSS对贵州茅台的股票数据进行探索性因子分析,共有4379个数据,7个输入变量。采用主成分分析法,因子选择的个数采用累计贡献率超过85%,选择3个因子作为输入数据,采用正交旋转方法最大方差法初步进行因子分析。最终结果显示如下:KMO为0.797,表示很适合进行因子分析;巴特利特球形度值为130925.84,显著性为0.000<0.05,相关矩阵不是单位矩阵,可进行因子分析。

第一次主成分分析共选用了3个主成分,累计方差贡献是98.214%。进行因子分析后的因子载荷见表2:进行因子分析,输出成分得分系数矩阵,具体数据见表2。

由表2的每个因子在各个变量上的系数乘对应各个变量的标准化转换数值Z变量,就可以得到该因子的得分函数。

将保存在数据集中FAC1,FAC2,FAC3变量作为BP神经网络的输入层,当日收盘价作为输出层。将样本数据同时分成两个部分,前2585天(从2001年8月27号到2019年12月3日)作为训练数据,后20天(2019年12月4号到2019年12月31号)数据作为检验。

本实验利用Matlab软件,通过设置不同节点数得出拟合优度,并比较平均绝对误差,各个节点绝对误差以及拟合优度如表3所示:

误差越小,方程拟合越好。拟合优度越接近1,方程拟合越好。训练时间越短,效率越高,消耗时间越短。根据表3可以得出隐含层节点数是7、9、10时,误差以及训练时间以及拟合优度都达到非常好的拟合效果。

3.1.2模型涨落趋势预测

神经网络模型的隐层神经元个数为7时,预测最后20天的股票数据,与当前20天的股票数据比较大小,后20天股票数据减去对当前数据,若数据大于0,说明20天后股票价格上涨;若数据小于0,说明20天后股票价格下跌,并比较预测上涨与下跌情况与真实的上涨和下跌情况,从而检测模型的可靠性。

根据表4可知,当隐层节点为7时,预测的股票上涨与下跌情况达到100%正确,与真实的涨落情况完全一致,说明BP神经网络可以非常好的预测股票的涨落情况,为投资者提供更为精准的投资方案。

同理可以得到节点个数为9与10时候的预测与真实的涨跌情况。见表5。

根据表5可知,当隐层神经元个数为9时,预测的涨跌情况与真实值100%一致,说明预测完全正确;当神经个数为10时,预测的涨跌情况与真实值95%一致,预测效果也非常良好。因为在连续下跌情况下,一天的上涨,几乎不影响购买者买进还是卖出的决定,说明两种情况下都可以为投资者提供良好的决策。

3.2 综合模型建模

根据上述分析可知,节点7、节点9、节点10均具有非常良好的预测效果,现为了进一步优化和改进模型,构造综合模型,从而减小股票预测值的误差。综合模型构造采用方差倒数法分别计算节点是7、9、10的权数,计算公式详细见公式(1),计算得到组合模型的权数分别是0.2712、0.5765和0.1523。根据组合模型得到预测结果,股票价格更加接近真实值,并且误差变小,说明组合模型能更好地预测股票的价格,为投资者提供精准投资方案。

根据表6可以看出,利用综合模型所预测的股票价格与PCA - BP模型在隐层神经元节点为7的比较,综合模型更接近真实值,绝对误差也最小,并且预测20天股票的涨跌情况一致率也高达95%以上。一天数据的上涨,在整体是下跌情况下,几乎不影响投资者的决策,说明综合模型能更好地预测股票价格,为投资者规避风险做出巨大贡献。下面给出真实值与单个模型与综合模型的预测值的对比图。

通过图2可以看出,综合模型更加接近真实值,说明BP神经网络综合模型能更好地预测股票的真实价格,并能给投资者提供切实可行的投资建议与方案。

4 总结

文章通过主成分分析方法减少输入变量,提高了预测效率,其次通过比较BP神经网络隐层节点的各项误差数据,得出在隐层节点为7时,更能准确地预测股票价格和股票涨跌情况。并利用方差倒数方法,构造出PCA - BP神经网络综合模型,综合模型与单个模型相比较,预测误差更小,且能准确的预测股票的涨跌情况。

参考文献:

[1]翟静,曹俊.基于时间序列ARIMA与BP神经网络的组合预测模型[J].统计与决策,2016(4):29-32.

[2]韩莉.基于LM-BP神经网络股票预测研究[D].哈尔滨:东北农业大学,2016.

[3]闫冬.神经网络技术在股票价格短期预测中的应用研究[D].重庆:重庆交通大学,2013.

[4]郭盼盼.基于GA-BP神经网络的多日股票价格预测[D].郑州:郑州大学,2019.

[5]兰强太.基于主成分分析和BP神经网络算法的综合选股实证研究[D].广州:暨南大学,2017.

[6]刘庆霞.基于主成分分析和BP神经网络的股价预测[D].苏州:苏州大学,2017.

[7]梁娜.基于神經网络与主成分分析的组合预测研究[D].武汉:武汉理工大学,2007.

[8]杨小平.基于主成分与BP神经网络的股票价格预测分析[J].统计与决策,2004(12):42-43.

[9]于卓熙,秦璐,赵志文,等.基于主成分分析与广义回归神经网络的股票价格预测[J].统计与决策,2018(18):168-171.

[10]孙德山,任靓.基于主成分分析和递归神经网络的短期股票指数预测[J].辽宁师范大学学报(自然科学版),2019,42(3):301-306.

[11]蔡红,陈荣耀.基于PCA-BP神经网络的股票价格预测研究[J].计算机仿真,2011,28(3):365-368.

【通联编辑:唐一东】

作者简介:张如梦(1990-),女,河南周口人,研究生,助教,研究方向:应用统计分析;张华美(1986-),女,河南周口人,研究生,助教,研究方向:金融风险管理。

猜你喜欢

股票价格主成分分析
基于GARCH族模型的重庆啤酒股票价格波动研究
基于NAR模型的上海市房产税规模预测
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
论股票价格准确性的社会效益
我国股票价格指数与“克强指数”的关系研究
基于多元回归与技术分析的组合股票价格预测