APP下载

利用上证综指大盘数据预测新疆板块股价走势

2017-01-07张竑魁

现代商贸工业 2016年8期
关键词:上证综指

张竑魁

摘 要:股票价格的走势会影响到上市公司未来的发展以及投资者决策。基于二元Logit回归模型,利用上证综指大盘数据预测新疆板块股票价格走势。实证结果表明:上证综指收盘价和交易金额对新疆板块股票价格的影响是显著的,并且利用所建立的Logit模型对新疆板块股票价格走势的预测较为准确。

关键词:新疆股市;上证综指;Logit回归模型

中图分类号:F83

文献标识码:A

doi:10.19311/j.cnki.1672-3198.2016.08.051

1 引言

随着援疆政策的实施以及“丝绸之路经济带”战略构想的提出,新疆经济的发展取得了巨大进步。自1994年2月新疆首家公司新宏信(今宏源证券)在深圳证券交易所挂牌交易以来,经过20多年的发展,新疆上市公司已达43家,总市值已超过7000多亿。新疆板块股市的表现可以从侧面反映新疆经济的发展状况,因此了解新疆板块股票价格走势情况,具有重要的现实意义。

在股票价格预测方面,有两种方法较为常用。一种是神经网络预测法,另一种是支持向量机。在神经网络预测方面,李响(2008年)利用神经网络对单个股票价格走势进行了预测。林倩瑜、冯少荣、张东站(2010年)把神经网络和模式识别两种方法相结合。刘海玥、白艳萍(2011年)把AR模型和神经网络相结合。薛佳佳(2012年)把灰色GM(1,1)模型和神经网络模型相结合。

在支持向量机预测方面,杨新斌、黄晓娟(2010年)利用支持向量机对股价预测进行仿真实验,实证结果表明支持向量机在预测精度上要优于神经网络。王晴(2010年)把自回归模型与支持向量机相结合。杨震(2012年)把统计学与支持向量机结合。龙真真、张正文(2014年)把SVM模型和支持向量机结合。李坤、谭梦羽(2014)将小波分解与支持向量机方法相结合。

Logit模型在社会学中应用较多,但也有学者开始把Logit模型应用到股市中。程海波(2009年)利用Logit模型对上市公司财务指标和超额收益率进行了研究,结果表明,以上市公司财务指标为变量,预测股票是否存在超额收益率具有良好的效果。易宁明、周文强、何鸣(2011年)运用Loigt模型检验了技术交易规则在中国股票市场上的有效性。

本文借鉴学者们的理论成果和方法,在构建二元Logit模型的基础上,利用上证综指大盘数据对新疆板块股票价格走势进行预测。以期为新疆上市公司以及投资者们在关注新疆股市时提供科学依据。

2 数据、变量及方法

2.1 样本概况

本研究所用数据来源于同花顺数据库,所用数据主要是上证综合指数收盘价、交易金额、交易总手、新疆板块43只股票收盘价,数据时间跨度是从2015年1月5号到5月29号,数据形式为每天每五分钟交易数据。

新疆总共有43家上市公司,第一产业有13家,占总行业的30.23%,第二产业有24家,占55.18%,第三产业6家,占13.95%,综合类一家,占2.33%。由此可知,新疆作为我国欠发达地区,经济的发展主要还是依靠第二产业和第一产业。

中国股市从2015年1月5号到5月29号,这段期间处于大牛市。其中上证综指收盘价从1月5号的3258.63一路飙升到5月29号的4607.93点。交易金额和交易总手也是大幅上涨。

2.2 变量选取及设定

本研究主要利用大盘数据预测新疆板块股票价格整体走势,为了衡量新疆板块股票价格的整体增降,我们选取了新疆43只股票每五分钟的最高价和最低价求其平均值,然后对43只股票每五分钟股价的平均值求其上四分位点,利用下一期上四分位点除以上一期上四分位点得到的值代表新疆板块整体股价的增与降,大于1代表新疆板块整体股价在增,小于等于1代表新疆板块整体股价在降,把增的记为1,降的记为0,使其成为二元变量,作为因变量,用Y表示。上证综指交易总手、交易交额、收盘价三个方面的数据分别滞后一阶、二阶和三阶,构造了9个自变量。其中交易总手滞后一阶、二阶和三阶用变量X11、X12、X13表示,交易金额滞后一阶、二阶和三阶用变量X21、X22、X23表示,收盘价滞后一阶、二阶和三阶用变量X31、X32、X33表示。每个自变量的取值小于下四分位点记为1,大于下四分位点小于上四分位点记为2,大于上四分位点记为3。

2.3 模型选择

Logit模型根据因变量的取值情况,可以大致分为两类,一类是二元Logit模型,另一类是多元Logit模型。本研究分析的是新疆板块股票的整体走势,升取值为1,降取值为0,满足了二元Logit回归模型的要求。二元Logit模型核心思想是要判断一种现象是否发生的概率大小。因变量可以取0或1,当取1时,就是对象发生的概率,取0时,也就是对象不发生的概率。

Logit模型的一般表达式为:

ln(Pi1-pi)=yi=α+βxi(1)

由上式可知回归方程的因变量是某个具体选择概率比的对数。Logit函数具有以下两个重要特点:第一个是当Xi的取值较小且逐步减小时,Pi趋近0的速度会越来越慢;反过来随着Xi的取值较大且逐步增大时,Pi接近1的速度也越来越慢。而当Xi取值中等且增加较快时,Pi的变化会比较快。Pi与Xi之间应呈非线性关系。第二个是Pi的变化始终在0和1之间。

3 实证分析

本文基于R软件,利用逐步回归法建立Logit回归模型,在模型中,不显著的自变量直接去除。最终模型回归结果如公式2所示:

Y=0.658-0.034X21+0.034X22+0.17X31-0.18X32(2)

其中模型的LR chi2统计量为86.67,模型的Psendo R2 统计量为0.345,这说明本研究建立的模型统计是显著的。

(1)通过公式2可知,表示上证指数交易金额滞后一阶和滞后二阶的变量X21和X22对因变量Y的发生概率的影响是显著的,但回归系数符号相反,分别为-0.034和0.034。从数值来看,这说明交易金额滞后一阶和二阶对因变量Y的发生概率影响不大。表示上证综指收盘价滞后一阶和滞后二阶的变量X31和X32对因变量Y的发生概率的影响是显著的,但回归系数符号相反,分别为0.17和-0.18。从数值上看,上证综指收盘价对新疆股票价格的影响要大于交易金额。

(2)为了利用此模型对新疆板块股票价格进行预测,首先检验此模型预测的准确性。对训练样本进行准确率测度。训练样本数总共4974个,代表新疆整体股票上升的有4889,占总样本的98.27%,代表新疆整体股票下降的有185个,占样本总量的3.72%。最终预测结果显示,股票上升被误判为下降的有1089个,下降的被误判为上升的有93个,总误判率为23.76%。但是在股票投资中,以风险较小化的投资思想。投资者主要规避的看涨的股票反而降。通过以上可知,把股价降的判断为增的有93个,占总样本的1.86%,这说明此模型犯错几率较小。

(3)在测试样本中选取一个时间点,以此时间点为基准,往后每五分钟一个测试点,总共选取10个测试点。统计结果显示,处了第一个测试点被完全误判,其余测试点被误判的概率都小于50%。其中对第四个测试点(基准点下20分钟)预测的准确率最高,准确率为75%。

4 结束语

通过模型预测结果可知,本文所建立的二元Logit模型对新疆板块股票价格走势的预测精度达到了预期目的。

参考文献

[1]李响.基于BP神经网络的股价预测[J].大连海事大学学报,2008,(S1):114-116.

[2]林倩瑜,冯少荣,张东站.基于神经网络和模式匹配的股票预测研究[J].计算机技术与发展,2010,(05):17-20+25.

[3]刘海玥,白艳萍.时间序列模型和神经网络模型在股票预测中的分析[J].数学的实践与认识,2011,(04):14-19.

[4]薛佳佳.基于差值灰色RBF网络模型股票指数预测[J].统计与决策,2012,(22):77-79.

[5]杨新斌,黄晓娟.基于支持向量机的股票价格预测研究[J].计算机仿真,2010,(09):302-305.

[6]王晴.组合模型在股票价格预测中应用研究[J].计算机仿真,2010,(12):361-364.

[7]杨震.基于后效时间长度的股票价格预测[J].计算机仿真,2012,(02):378-381.

[8]龙真真,张正文.基于模糊核超球的快速分类算法在股票预测中的应用[J].计算机系统应用,2014,(01):197-201+148.

[9]李坤,谭梦羽.基于小波支持向量机回归的股票预测[J].统计与决策,2014,(06):32-36.

[10]程海波.股票投资价值的logit模型研究——对沪市A股制造行业的实证分析. [C].中国会计学会,2009:8.

[11]尹宇明,周文强,何鸣.中国股市技术交易规则有效性的计量分析——以长期横盘形态为例[J].现代财经(天津财经大学学报),2011,(06):81-86.

猜你喜欢

上证综指
投资者情绪与上证综指的互动关系研究
基于GARCH类模型的上证股市波动性研究