APP下载

基于经验模态分解和深度学习模型的高新区经济增长预测

2019-05-12刘杰

市场周刊 2019年3期
关键词:深度学习

摘要:目前中国经济发展进入了“新常态”,以创新促发展成为我国发展的重要手段。高新技术园区作为中国创新发展的领头羊,其发展状况关系重大,对其经济增长情况进行预测具有重大的现实意义。本文提出了一种经验模态分解(EMD)与长短时记忆神经网络(LSTM)相结合的模型:ELSTM,对中关村示范区总收入增速进行预测。实证实验表明,ELSTM模型相较于其他模型具有更高的精度。

关键词:经济预测;经验模态分解;深度学习

中图分类号:F014.7文献标识码:A文章编号:1008-4428(2019)03-0109-03

一、 背景

近年来,我国经济发展进入了“新常态”,经济发展呈现出了一些新特点。2014年11月,习近平在APEC峰会上系统阐述了中国经济新常态的特点,即经济从高速增长转为中高速增长、经济结构不断优化,从要素驱动以及投资驱动转向创新驱动。从此可以看出,创新的驱动力在未来发展中将会扮演越来越重要的角色。高新技术示范区是我国科技进步和创新发展的重要枢纽,其发展状况具有中国创新发展的晴雨表作用,对其经济增长预测有利于快速统筹协调配置资源、及时调整发展结构、促进经济稳定发展。因此对我国高新区经济增长进行预测具有重大的现实意义。

对经济增长进行预测一直是学术界研究的热点问题,大量的学者都试图创造不同的理论和模型,以期获得更高的预测精度和泛化能力。但绝大部分的模型仍旧停留在传统的统计学方法上,如线性回归模型、灰色模型、滑动平均模型等。这些模型虽然在特定情境下能取得一定效果,但由于现实世界中大部分主体经济增长呈高度非线性以及不平稳性,传统统计模型预测效果有限。近年来,学者开始将目光转向机器学习领域,利用机器学习模型强大的非线性拟合能力来提高预测效果,如广泛使用的BP神经网络模型、支持向量机(SVM)模型等。引入机器学习模型虽然获得了不错的效果,但传统机器学习难以有效利用时间序列数据的时序特征,因此也存在着一定的局限性。

近期,得益于计算机能力的不断增强,机器学习的新领域——深度学习领域异军突起,在人工智能、计算机视觉、自然语言处理、医疗健康等领域取得了不俗的成就。深度学习较普通机器学习模型具有更强大的特征提取能力和拟合能力,其中的循环神经网络(RNN)具有处理序列数据的天然优势,因此本文主要利用RNN神经网络的变体——LSTM,作为预测模型的主体,并辅以经验模态分解对原始序列进行处理来进行预测建模。

二、 模型及原理介绍

(一)经验模态分解

经验模态分解(EMD)是1998 年Huang等提出。EMD可以对一个信号同时将不同尺度(频率)的波动或趋势逐级分解开来,产生一系列具有不同特征尺度的数据序列称为本征模函数(IMF)。IMF波动分量具有显著的缓变波包的特性,不同IMF分量是平稳信号,具有非线性特征,其缓变波包特征意味着不同特征尺度波动的波幅随时间变化,因而也具有时域上的局域化特征。趋势分量则是单调函数或者均值函数,可以代表其长期变化趋势或平均态。

經验模态分解(EMD)方法将时间X(t)分解成一系列本征模态函数IMF,每个IMF分量具有如下特征:①从全局特性上看,极值点数必须和过零点数一致或者最多相差一个;②在某一个局部点,极大值包络和极小值包络在该点的值的算术平均和是零。

经验模态分解提取IMF的过程实质上是将原始特征序列分解为不同振动周期波动的叠加,最后得到的每个IMF分量既可是线性的也可是非线性的。令h0=f(t),Emazx(h0)和Emin(h0)分别是三次样条插值得到的极大值和极小值点的包络,如果h0不满足IMF条件,令

h1=h0-Emax(h0)+Emin(h0)2

不断重复此过程,即可得到该时间序列的所有IMF分量。

(二)长短时记忆神经网络

循环神经网络(RNN)由Elman在1990年提出,其各种变体在自然语言处理领域应用最为广泛。RNN在不同的时间步上重复应用同种结构的神经网络结构,前一步的隐含层输出通过权重连接至当前时间步的神经网络,当前时间步的隐含层输出可表示为:

ht=f(xt,ht-1)

其中,ht为当前时间步输出,ht-1为前一时间步输出,xt为当前时间步输入数据,f(*)为前馈神经网络(BPNN),训练算法主要为BPTT算法,误差由时间步传递。RNN虽然能够解决时间序列的依赖性问题,但随着时间步的增长,整体网络容易发生梯度消失和梯度爆炸问题,网络从而难以收敛,故实践中并不直接应用该模型,一般使用其各种变种来避免这些问题发生。

长短时记忆神经网络(LSTM)由Hochreiter and Schmidhuber在1977年提出,是循环结构网络的一种重要变体,与RNN相比,LSTM隐含层神经单元结构更为复杂,主要由三个门限网络构成,即输入门、输出门、遗忘门。其中还含有一个重要单元,即记忆单元,该单元蕴含历史信息特征,是解决循环网络长期依赖的关键,LSTM结构可定义为:

it=σ(Wixt+Uiht-1+Vict-1+bi)

ft=σ(Wfxt+Ufht-1+Vfct-1+bf)

ct=ft×ht-1+it×tanh(Wixt+Uiht-1+bc)

ot=σ(Woxt+Uoht-1+Voct+bo)

ht=ot⊙tanh(ct)

其中xt为当前时间步(t时刻)的输入数据,it为输入门;ft为遗忘门,决定输入数据的保留程度;ct为记忆单元,保存历史信息;ot为当前时间步输出;ht为当前时间步隐层输出状态,σ为sigmoid函数,tanh为tanh函数,W、U、V为需要学习的权重参数。

(三)ELSTM模型

ELSTM模型为经验模态分解和长短时记忆神经网络的组合模型,预测方法为单步预测,即用前k个历史数据预测第k+1个数据。

首先利用EMD将含n个观测值的原始时间序列T(t1,t2,t3,…,tn)分解为m个IMF分量(imf1,imf2,…,imfm),每个imfs分量均为含n个数据的序列(imf1i,imf2i,…,imfni),然后合并原始数据和各IMF分量,形成新的数据集TN,然后采用滑窗法将新数据集转化为最终所使用的数据集TO,假设窗口大小为w:

三、 实证分析

(一)數据来源说明

本文数据为中关村示范区2010年2月至2017年02月的总收入可比增速(当前总收入/上年同期总收入)月度数据,由于统计原因,不含每年的一月份数据,共78个月的数据,数据详情如表1及图2:

从表3和图4来看模型的预测能力相当不错,对下个月的预测误差控制在1%左右,在实际应用当中,已经具有相当大的参考意义。图4模型在训练集和测试集上的拟合效果:其中前51个月份为训练集预测值与真实值,后25个月为测试集的真实值与预测值的比较,其中虚线为预测值,实线为真实值

四、 结论

本文提出了一种经济预测的新模型,即EMD+LSTM模型的组合模型。通过EMD分解将高度复杂的非平稳时间序列分解为较为平稳的一系列分量,降低了数据的复杂度,然后建立了深度神经网络LSTM,利用分解后的数据训练模型。实验结果表明,本文提出的模型具有良好的预测能力,误差小,准确度高,较传统的模型如ARIMA等有着明显的优势,对机器学习传统模型如BP神经网络等也存在着相当的优势。

随着人工智能、大数据领域发展越来越快,一系列新的算法、理论层出不穷,这对一些传统领域形成越来越大的冲击力,经济预测及计量等强数据驱动的领域必将受益于此。因此我们应加强研究人工智能及大数据领域的新成果,改进经济预测的方法,以获得更好的预测实践。

参考文献:

[1]金碚.中国经济发展新常态研究[J].中国工业经济,2015(1).

[2]Neural network and traditional time series methods: a synergistic combination in state economic forecasts. Hansen J V, Nelson R D. IEEE Transactions on Neural Networks,1997.

[3]曲文龙,樊广佺,杨炳儒.基于支持向量机的复杂时间序列预测研究[J].计算机工程,2005(23).

[4]管卫华,林振山,顾朝林.中国区域经济发展差异及其原因的多尺度分析[J].经济研究,2006(7).

[5]Elman, J. L. Finding structure in time. COGNITIVE SCIENCE,1990,14(2).

[6]Hochreiter, S., and Schmidhuber, J. Long short-term memory. Neural Comput,1997,9(8).

作者简介:

刘杰,男,河南南阳人,北京信息科技大学在读硕士研究生,绿色发展大数据决策北京市重点实验室(Laboratory of Big Data Decision making for Green Development)主要成员,研究方向:园区经济预测。

猜你喜欢

深度学习
从合坐走向合学:浅议新学习模式的构建
面向大数据远程开放实验平台构建研究
基于自动智能分类器的图书馆乱架图书检测
搭建深度学习的三级阶梯
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
利用网络技术促进学生深度学习的几大策略
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究