基于支持向量机的上证指数回归预测
2018-02-07鲁孝平
摘 要:针对股市当中证券指数的不确定性随机性和波动性等特点,提出一种基于支持向量机的预测模型对上证指数进行预测,利用SVM建立的回归模型对上证指数每日的开盘数进行拟合。其结果表明,支持向量机的预测模型具有较高的拟合和预测精度,且支持向量机预测方法计算速度快,准确率高,具有很好的推广应用价值。
关键词:支持向量机;上证指数;回归预测
1 引言
股票起源于西方,到今天已经有300多年的历史了。如今股市已经成为国民经济的“晴雨表”。[1]股票的价格具有很大的不确定性,受政治、经济、投资者心理等诸多因素的影响。因而股市的走势成为许多人关注的焦点。
近年来在股市预测方面运用的最广的是神经网络,BP神经网络由于它自身的优点如结构相对简单和很强的解决问题能力而成为流行和成功的方法。然而由于神经网络自身存在的易于陷入局部极小值,隐含层难以确定,训练速度慢,过学习等问题所以也需要进一步改进。支持向量机是Cortes和Vapnik在1995年首先提出的[2],建立在统计学习理论和VC维理论和结构风险最小的基础上的,它在解决小样本、非线性和高维模式识别中具有独特的优势,还能够有效的克服维数灾难、过学习等问题,并且能够推广应用到函数拟合、实践序列预测等其他机器学习问题中,比起神经网络具有更大的优越性,如能够取得全局最优解,具有更好的泛化能力,结构容易确定等等。[3][4]
2 模型建立
利用SVM建立的回归模型对上证指数每日的开盘数进行回归拟合。假设上证指数每日的开盘数与前一日对的开盘指数、指数最高值、指数最低值、收盘指数、交易量、交易额相关,即把前一日的开盘指数、指数最高值、指数最低值、收盘指数、交易量、交易额作为当日开盘指数的自变量,当日的开盘指数为因变量。
3 MATLAB实现
选取上证公司在1990-2009年间的交易数据,数据是一个4579*6的double型矩阵,记录的是从1990年开始到2009年期间内4579个交易日每日上证综合指数的各种指标,4579行表示每一天的上证指数的各种指标,6列分别表示当天上证指数的开盘数、指数最高值、指数最低值、收盘指数、当日交易量、当日交易额。
选取第1-4578个交易日内每日的开盘指数、指数最高值、指数最低值,收盘指数,交易量、交易额作为自变量,选取第2-4579个交易日内每日的开盘数作为因变量。Matlab 代码如下:
5 仿真结果
图中红色的线为实际的输出,绿色的预测的结果,经过结果的分析预测成交额的预测率为95.7%,成交量的预测结果为99.9%,预测精度相当的高,基于支持向量机的结果预测可以作为有效信息的参考,是可靠的。
6 结束语
股票指数走势一直是人们关注的热点。针对股票指数走势的不易确定性,本文提出支持向量机的股票指数预测模型,并且以上证指数为例进行预测。预测结果表明支持向量机的预测精度相当的高。
参考文献
[1]胡杉杉,等.中国证券市场的可预测性研究[J].财经科学,2001,3:35-39.
[2]周广旭.一种新的时间序列分析算法及其在股票预测中的应用[J].计算机,2005,25(9):2179-2184.
[3]余敏,岑咏霆,王清科,王世明.上證指数、深圳指数预测的马尔柯夫链预测模糊模型[J].数学的实践与认识,2003,33(9):30-34.
[4]陈可,张琴舜,陈培培,蔡日基.BP神经网络在证券分析预测中应用[J].计算机工程,2001,27(11):95-97.
[5]全林,姜秀珍,赵俊和,汪东.基于SVM分类算法的选股研究[J].上海交通大学学报,2009,43(9):1412-1416.
[6]段虎、沈菲,《证券市场的混沌研究及相空间预测》,《数量经济技术经济研究》,2002,第7期,第111-114页
[7] Ince H,Trafalis T. Short term forecasting with support vectormachines and application to stock price prediction[J]. Inter-national Journal of General Systems.2008;37(6):677- 687
[8] Atsalakis G,Valavanis K. Surveying stock market forecast-ing techniques- Part II: Soft computing methods [J]. ExpertSystems with Application. 2009,36:5632- 5941
作者简介
鲁孝平(1991-),女,现就读于安徽淮南市安徽理工大学山南校区电气与信息工程学院。endprint