APP下载

双层DE—ELM预测模型及股指中短期预测

2016-05-04张卫国李家铭

关键词:隐层学习机双层

张卫国++李家铭

摘 要:

针对极限学习机易陷入过度学习和隐层节点数目难确定的问题,提出基于双层差分进化算法的极限学习机(双层DE-ELM)预测模型,把极限学习机(ELM)的隐层节点数目和节点参数作为差分进化(DE)算法的外层和内层进化个体,利用DE算法通过自然选择淘汰机制对其进行学习和完善。将该模型应用于上证综合指数和标准普尔500指数的短、中期预测,并与DE-ELM等模型的预测结果进行对比分析。实证结果表明:双层DE-ELM预测模型能够有效地选择隐层节点数目和参数,具有较强的预测能力和较高的稳定性。

关键词:

双层DE-ELM预测模型;隐层节点;股票指数;时间序列

中图分类号: F831 文献标志码:A 文章编号:1009-055X(2016)02-0018-09

引 言

股票指数的预测问题一直以来都是学界和业界十分关注的话题,指数平滑预测法[1]、ARMA(自回归移动平均模型)[2]和ARCH(自回归条件异方差模型)[3]等传统的时间序列分析法被学者广泛研究。然而,这些模型具有较强的使用限制,只有满足特定的条件时才能使用。为了克服这一问题,以时间序列驱动的各类人工智能预测模型,特别是人工神经网络模型逐步成为研究的热点。

1988年,White首次利用神经网络来预测股票每日报酬率,然而预测效果并不理想。White认为神经网络陷入局部极小值而无法跳出,影响了预测效果。[4]Kimoto等利用神经网络对东京证交所股价加权平均指数进行预测,指出神经网络模型对报酬率的预测效果优于TOPIX加权平均指数方法。[5]为了进一步提高神经网络模型的预测能力,许多学者又对人工智能技术进行了改进,比如说,Hassan等把HMM、ANN和GA进行结合对金融市场的行为进行预测,他们认为,改进后的模型对金融市场的预测与传统人工智能技术相比更加精确。[6]Wang等提出WDBP神经网络来预测上证综合指数,其结果表明WDBP神经网络与传统的BP神经网络相比具有更强的预测能力。[7]常松等利用小波包理论将价格波动序列最优地分解为一系列子波动并运用神经网络对子波动进行预测,实证结果表明小波包与神经网络结合起来对股票价格的预测效果比单独的神经网络更好。[8]徐少华等提出一种基于混沌遗传与带有动态惯性因子的粒子群优化相结合的学习方法来优化神经网络的训练问题,以提高神经网络的训练精度。实证结果表明该改进算法提供了PNN网络的训练精度。[9]杨一等提出一种基于输出敏感度方差重要性的结构优化算法来解决RBF神经网络的结构设计问题。结果表明该算法可根据研究对象自适应地调整RBF的网络结构,提高其泛化能力。[10]

由于传统人工神经网络存在结构上的缺陷,比如说,学习速度慢、学习率难以确定、易过度训练等,学者们对人工神经网络的有效性产生质疑。为了克服神经网络模型的结构缺陷,Huang等人提出极限学习机(Extreme Learning Machine,ELM)的概念。[11]ELM算法是一种十分简单快速的单隐层神经网络训练算法,在网络参数的确定过程中隐层节点参数(内权和偏置值)随机设置,且其在网络学习过程中不再改变,而网络外权通过最小化误差的原理计算得出。ELM的学习机制使其只需进行一次运算即可输出权值,与需要进行多次迭代的前馈型神经网络相比大幅度地减少了学习时间、提高了学习效率,近年受到了广泛的关注。

ELM算法的运算机制使该算法同样存在结构上的不足,比如说:隐层输出矩阵易发生奇异,部分隐层节点不起作用。为了进一步改善ELM算法的不足,学者提出了一系列改进方案,比如说:Lan等提出了CS-ELM算法,该算法对ELM算法的隐层节点参数进行筛选,去除显著性较弱的隐层节点来实现网络结构的优化。[12]Wang等提出EELM算法,运用对角占优的方法来优化隐层节点参数,进而保证了隐层输出矩阵的非奇异性,提高了极限学习机的稳定性。[13]Toh等通过添加正则项的方式避免了隐层矩阵奇异和接近奇异情况的发生,有效地提高了ELM算法的学习能力。[14]Huang等提出EI-ELM算法来优化隐层节点参数,简化了ELM算法的复杂度,提高了其优化效率。[15]高光勇等提出CC-ELM算法,运用复合混沌和混沌变尺度算法对极限学习机的参数进行搜索和优化,提高了ELM算法的泛化性能。同时,通过算例指出CC-ELM算法与同类型算法相比更加有效。[16]

然而,上述改进算法均未同时考虑隐层节点数目和参数两方面。为了克服这一问题,本文提出双层DE-ELM预测模型。该模型使用双层差分进化算法(DE)与极限学习机(ELM)结合,利用差分进化(DE)算法对极限学习机(ELM)的网络隐层节点数目、隐层内权和偏置值进行优化。最后,本文利用双层DE-ELM预测模型对上证综合指数和标准普尔500指数的日度数据和月度数据进行预测,以讨论双层DE-ELM预测模型的应用价值。

一、模型介绍

股票市场具有复杂性、非线性、多变性等特点,随着ETF和股指期货等金融工具的出现,股指对股票市场的重要性越发重要,投资者可以利用股指的衍生品进行套利或套保,对股指走势进行预测就显得越发重要。但股指同样具有走势难预测、方向难确定、影响因素多等方面的特点,导致对其进行预测具有很多的困难。

本文利用时间序列的方法,以股指过去n天/月的历史收盘价作为模型的输入,以第n+1天/月的收盘价作为输出函数进行一步预测。股票价格走势与近期的历史信息有关,本文着重考虑单个因素(股价)对自身短中期预测的影响,不考虑其他因素。

[BT4](一)极限学习机(ELM)

Huang等依据摩尔-彭罗斯(MP)广义逆矩阵理论[17]提出了极限学习机(ELM)算法。[11]该算法的特点是在网络参数的确定过程中,内权和偏置值随机选取且无需进行二次调节,而网络外权通过最小化损失函数得到。这种机制使得ELM算法在网络参数确定过程中无需进行任何迭代步骤,只需一次计算即可得出最优网络参数。这样的处理机制大大降低了运算时间,与需要多次迭代的前馈型神经网络相比具有巨大的优势。

猜你喜欢

隐层学习机双层
墨尔本Fitzroy双层住宅
基于RDPSO结构优化的三隐层BP神经网络水质预测模型及应用
极限学习机综述
基于极限学习机参数迁移的域适应算法
分层极限学习机在滚动轴承故障诊断中的应用
次级通道在线辨识的双层隔振系统振动主动控制
传统Halbach列和双层Halbach列的比较
基于近似结构风险的ELM隐层节点数优化
最优隐层BP神经网络的滚动轴承故障诊断
一种双层宽频微带天线的设计