APP下载

基于BP神经网络的景气预测模型

2015-01-15李静文

统计与决策 2015年23期
关键词:期数总收入景气

李静文,刘 刚

(北京信息科技大学 经济管理学院,北京100192)

0 引言

景气用于衡量总体经济的活跃程度,是总体经济的一种综合性描述。整体经济形势呈上升趋势表示经济景气,整体经济形势呈下降趋势意味着经济不景气。景气预测不仅能够反映当前经济的走势,而且可以应用于经济预警。景气是通过景气指数来反映经济的状况,景气指数是通过景气指标的划分构建。景气指标划分为先行指标、同步指标和滞后指标,通过划分的指标分别编制扩散指数和合成指数,并根据计算结果分析当前经济的状况,预测未来的经济波动,此外还可以通过先行指标预测未来经济状况。景气预测模型的优势在于通过构建景气指数分析和预测总体经济的波动,同时在景气指标的划分上考虑了指标的先行性、同步性及滞后性,缺点在于该模型最终构成合成指数和扩散指数,通过对计算结果的分析了解当前经济状况,但是没有对具体的单个指标进行预测。

BP神经网络是一种能自行修正误差的多层映射网络,由于这种特性使得BP神经网络模型在经济预测中得到了广泛的应用。本文使用基于BP神经网络模型的景气预测法预测高新技术行业的总收入,对于景气预测模型而言,本文构建的模型考虑了景气指标时间上的特性,构建的模型可以预测单个指标,同时具有了BP神经网络的自学性、稳定性和预测准确性的优势。对于BP神经网络而言,该模型考虑了各个指标在时间上的先行性、同步性以及滞后性。不仅结合了景气预测模型以及BP神经网络模型的优点,而且还可以确定预测指标的最大预测期数。该模型在实际应用中的难点在于先行指标及其期数的确定,在模型应用中最为基础的是先行指标及其期数的确定,先行指标在实际计算中往往受限于数据的准确度和长度,准确的先行期数能够提高预测精度。本文通过使用时差相关分析以及峰谷对比法综合确定了先行指标及其期数,在计算过程中还考虑季节因素的影响。计算中使用的数据为剔除季节性和不规则因素的同比增长率以考虑数据的非平稳性,同时预测了季节因子在未来月份的变化。

1 基于BP神经网络的景气预测模型

1.1 BP神经网络的述评

BP神经网络是一种按信息正向传播和误差反向传播算法训练的多层前馈网络,1986年由Rumelhart和McCelland首次提出。BP神经网络模型由输入层、隐含层和输出层组成,如图1所示:

图1 BP神经网络的结构

图1展示的为一个3层的神经网络,输入层和输出层的个数可以根据输入向量和研究目标而定,可以是1个也可是多个。但是隐含层个数的确定和输入层之间有着很大的关系,若输入层有m个神经元,隐含层神经元个数n和输入层神经元m之间可以按照n=2m+1的关系来选取[1]。然而,在实际计算中要不断调整各种参数,根据学习训练的效果,确定出使预测效果最优的隐含层神经元个数。

信息的正向传播和误差的反向传播组成BP神经网络模型。信息的正向传播:输入层接受模型的输入信息,并将信息传递给隐含层;隐含层各神经元处理接收到的信息,并将处理结果传递给输出层,即完成了一次信息的正向传播,由输出层向外界输出信息处理结果。当实际输出与预期输出不符时,进入误差的反向传播阶段。误差反向传播:误差通过输出层,将误差以某种形式通过隐含层向输入层逐层反传,这是一个误差分摊个神经元的过程,分摊后的误差作为修正各个神经元的权值的依据。信息正向传播和误差反向传播作为一个周期,这个周期不断循环直至网络输出的误差降低到可以接受的区间,或者达到预先设定的学习次数为止。

BP神经网络模型自学性和误差反向传播的特点,使得该模型广泛的应用到仿真和预测的领域中。BP神经网络在实际应用中,可以发现该模型比较适用于短期预测,中长期预测的精度较低。同时隐含层的个数难以确定,隐含层的个数确定对预测结果的影响很大,固定的学习率或学习过程中出现的瘫痪现象会导致训练时间较长。

1.2 景气预测指标的确定

1.2.1 景气指标体系的划分

景气指标划分的关键是确定基准指标,基准指标是景气指标划分的参照系。基准指标的确定主要有以下3种方法:(1)选择一组波动与总体周期波动大体上一致并且能从侧面反映总体经济波动的重要的经济指标。(2)参考景气循环年表中记录的经济现象和经济政策等。(3)根据专家意见及专家打分等综合判断最终确定基准指标。

根据指标的特性,把指标划分为同步、先行和滞后三大类指标,然而在实际预测中经常使用的是先行指标,因为该类指标先行于总体经济的变化,能够预测未来经济的变化情况。

1.2.2 景气指标选择方法

根据上述基准指标的选取方法可以确定景气指标体系中的基准指标。景气指标选择的方法主要有:时差相关分析法、K-L信息量法、峰谷对比法和聚类分析法等[2],本文使用时差相关分析以及峰谷对比法对景气指标进行划分。

时差相关分析是确定指标时间序列先行关系、一致关系或滞后关系的常用方法,主要是利用指标之间的相关系数进行计算。计算方法是在选定基准指标的条件下,计算被选择指标与基准指标的相关系数,继而通过相关系数判断指标的先行性或者滞后性。

设 y={y1,y2,…,yn}为基准指标,x={x1,x2,…,xn}为被选择指标,r为时差相关系数,则

上式中,l成为时差数,表示先行、滞后期数,取负数表示先行,取正数表示滞后;L为最大延迟数;nl是数据取齐后的数据个数。

在选择景气指标时,要确定若干个不同时差数的时差相关系数中的最大值,最大的时差相关系数

被认为反映了被选指标与基准指标的时差相关关系,相应的时差数l'表示先行或滞后期。

峰谷对比法能够对各个指标的状态进行直观具体的描述,通过利用画图的方法可看出每个候选指标与景气循环中峰、谷的对应状态,进而确定各个指标的先行性或滞后性。确定基准指标滞后,把基准指标与被选指标画在同一坐标系中,这样峰、谷的对应状况就一目了然了[3]。峰谷对比法可以和其他景气指标划分的方法一起使用,作为校验和调整景气指标及其期数的依据。

1.3 模型结构

本文构建的基于BP神经网络的景气预测模型以景气指标中的先行指标作为基础,以BP神经网络模型为核心进行预测。

根据景气指标选择的方法确定先行指标及先行期数,在该过程中先对数据进行预处理,剔除季节因素和不规则因素的干扰。首先根据时差相关分析法确定被选择指标的先行性、同步性和滞后性,再根据峰谷对比法确定最终的先行指标及先行期数。

以确定的先行指标作为BP神经网络模型的输入层,基准指标作为输出层。根据上述确定的先行指标及期数构建BP神经网络的学习样本,输入层指标中最小的先行期数是输出层指标的最大预测期数。例如,假设输入层的先 行 期 数 为 l={l1,l2,…ln},n为输入层指标个数,则l'=min{l1,l2,…ln}为输出层指标的最大预测期数。

2 实证分析

2.1 先行指标及其期数的确定

本文以预测中关村国家自主创新示范区(简称中关村)的总收入为例,从投入产出的角度分析,总收入作为产出类指标,产出类指标必然影响着总收入的变化,而且在指标上具有先行性。本文从文献[4~7]中发现先行指标主要分为:固定资产投资类、贷款类、研究对象相关投入类指标等。本文主要是预测中关村的总收入,同时根据基准指标的确定方法,总收入也符合基准指标的要求,因而确定总收入为基准指标。

根据文献梳理的分类以及中关村的高新技术园区的定位,粗略确定以下指标作为中关村园区的候选先行指标范围,分为资产类、贷款类、科技投入类、进出口类指标和北京市相关指标。资产类指标包括中关村自身的固定资产投资以及北京市固定资产投资,即本年完成固定资产投资总额、资产总计以及北京市相关指标;贷款类指标包括银行贷款和负债合计;科技投入类指标包括科技经费的投入、科技人员的投入、科技成果,即企业用于科研活动的经费支出、引进国外技术经费支出、科技活动人员合计、期末从业人员数和发明专利授权数;进出口类指标:由于中关村有很多进出口贸易的企业,因而本文考虑了出口总额、技术合同成交总额。本文的研究对象属于中观性,因而会受北京市总体经济变化的影响,在先行指标中加入了北京市相关指标。先行指标的被选择指标集如表1所示。

表1 先行指标的被选择指标集

根据表1中指标,中关村各指标体系中,本年完成固定资产投资和负债合计的数据有缺失,在实际及计算中不考虑上述两个指标。本文先计算中关村园区内部的先行指标及其期数,再找出北京市相关指标的先行指标。根据时差相关分析法,使用Matlab软件计算可得到中关村被选择指标的先行指标及其期数,如表2所示。

表2 被选择指标的计算结果

从表2可知引进国外技术经费支出、出口总额和技术合同成交总额均为滞后指标,由时差相关分析确定的先行期数还需根据峰谷对比法进行校验。本文使用的为月度数据,因而北京市相关指标也应为月度数据,本文从北京市统计局网站上查找了相关指标:规模以上工业增加值、工业销售产值、全社会固定资产投资、社会消费品零售总额、城镇居民人均可支配收入、城镇居民人均消费性支出、出口总额、进口总额,其中出口总额、进口总额数据来源于北京市商务委。

对上述指标和中关村的总收入进行相关性分析以及格兰杰因果检验,只有社会消费品零售总额、全社会固定资产投资总额、进口总额、出口总额满足要求,根据时差相关分析计算结果如表3所示。

表3 北京市被选择指标的计算结果

根据表3可知,社会消费品零售总额和全社会固定资产投资总额是先行指标。因而相对于基准指标总收入而言,先行指标共有8个,其中中关村自身指标有6个,北京市指标2个,具体指标如表4所示。

表4 先行指标及其先行期数

表4为构建模型的先行指标及其期数,则表4中先行指标剔除季节因素和不规则因素后的同比增长率(限于篇幅,相关数据从略),以表4中的先行指标作为BP神经网络模型的输入层,总收入作为输出层,建立的如图2所示的神经网络模型。

图2 神经模型网络结构

根据模型的特性,可知总收入的最大预测期数为5个月,即可以预测5个月以后的总收入。在计算前要对数据进行季节调整,以INCOME表示总收入,INCOME_TC表示剔除季节因子和不规则因子的序列,INCOME_SF表示总收入的季节因子,INCOME_IR表示总收入的不规则因素。

INCOME=INCOME_TC×INCOME_SF×INCOME_IR

实际中的总收入含有季节因子,因而同时对总收入在不同月份的季节因子进行了预测,本文采用了二次指数平滑模型预测了对不同月份未来一期的季节因子,由于INCOME_IR表示不规则因素,在实际预测中忽略该因素的影响。

2.2 模型过程的处理

本文搜集数据时间段为2009年1月到2013年11月,实际计算中使用的是指标的同比增长率,因而数据同比增长率的长度2010年1月到2013年11月,其中2010年1月到2013年6月数据作为模型的仿真数据,用于构建模型,作为模型的拟合区间。2013年7月到2013年11月作为检验性数据,用于验证模型的精度和模型的对比分析。

根据图2中的模型结构,使用Matlab软件计算得到INCOME_TC的同比增长率预测值,从而可以计算出INCOME_TC的预测值,根据季节调整的原理,由INCOME_SF和INCOME_IR可以计算出INCOME的预测值,具体数据见表5所示。

表5 总收入相关指标数据 (单位:亿元)

表5中INCOME_TC同比增长率预测值可由模型直接计算,根据该值和2009年INCOME_TC的实际值可以计算出INCOME_TC在拟合区间的预测值,根据数据中的总收入的季节因子可以得到INCOME的预测值,即表5中的最后一列。

2.3 预测结果的分析

由表5中的数据,可以画出INCOME_TC和INCOME_TC的拟合图,如图3所示,同时画出INCOME和INCOME预测值的拟合图,如图4所示。

图3 INCOME_TC同比增长率的拟合图

图4 总收入的拟合图

由模型计算过程可知,INCOME_TC同比增长率预测值是通过基于BP神经网络的景气预测模型直接计算得出,从图3可知INCOME_TC同比增长率预测值和实际值是非常接近的,两者的拟合度很高。总收入的预测值是通过INCOME_TC同比增长率的预测值计算得到,同样,从图4可知总收入的预测值和实际值是非常接近。总收入在拟合区间的相对误差如表6所示。

表6 总收入各月份的相对误差

从表6可知,相对误差最大值为1.82%,最小为0.15%,即各时期的相对误差均是控制在2%以内。由图3、图4和表6可知,基于BP神经网络的景气预测模型在拟合区间的拟合精度非常高,因而该模型在未来区间的预测精度也很高。同时本文还对比了二次指数平滑模型和BP神经网络模型在2013年7月到2013年11月的总收入预测值,并计算了不同模型的相对误差,计算结果如表7所示。

表7 不同方法总收入预测误差表

从表7可知,上述三个模型在各个时间点的相对误差都比较低,且基于BP神经网络的景气预测模型的预测误差在后三期的预测误差低于1%。为了更好反映基于BP神经网络的景气预测模型的有效性,按照预测效果评价原则,通常选择下列指标作为评价指标体系:

其中 xi为i时刻的实际值,为i时刻的预测值,根据上述公式,可以计算出不同模型的指标评价体系的值,如表8所示。

表8 预测效果评价指标体系

从表7和表8中可知,基于BP神经网络的景气预测模型的预测能力要优于其他两种模型,其预测精度相对于二次指数平滑模型和BP神经网络模型分别提高1.12%和1.79%。使用基于BP神经网络的景气预测模型预测未来5个月的中关村高新技术园区的总收入,如表9所示。

表9 总收入的预测值

从图4和表9可以看出,中关村高新技术园区的总收入呈现出周期性上涨的趋势,这与先行指标中投入类指标的增加、北京市的良好的经济环境以及固定资产投资的增加是密不可分的。

根据上述模型处理过程,可知模型的计算过程有以下8步:(1)获取所需数据,补全缺失的数据。(2)对被选择指标进行季节调整,找出每个指标的趋势-循环因素。(3)计算出每个指标趋势-循环因素的同比增长率。(4)确定先行指标及先行期数。(5)以先行指标的趋势-循环因素同比增长率作为BP神经网络模型的输入层,预测总收入趋势-循环因素的同比增长率。(6)根据预测的总收入趋势-循环因素同比增长率,反推计算出总收入趋势-循环的预测值,此时的总收入缺少季节因子。(7)预测总收入的季节因子。(8)最终的总收入=步骤6中的总收入×步骤7中相应月份的季节因子。

3 结论

本文构建的基于BP神经网络的景气预测模型结合了景气预测模型和BP神经网络的优势,以景气指标中的先行指标作为BP神经网络模型输出层作为模型的结合点。以中关村国家自主创新示范区的总收入作为实证研究,通过分析模型的拟合度,以及该模型同二次指数平滑模型、BP神经网络模型在拟合度和预测评价指标上的差别,结果表明构建的基于BP神经网络模型的预测精度明显提高,同时该模型还能确定预测指标的最大预测期数。

在实际应用中,根据研究对象的需要以及预测的精度要求,可对应用的模型进一步改进,如在数据补全的方法、确定先行指标及其期数的方法和季节因子的预测模型等,同时,也可以使用多隐含层的BP神经网络或者改进后的BP神经网络对BP神经网络模型进行修正。

[1]杨德平,刘喜华,孙海涛.经济预测方法及MATLAB实现[M].北京:机械工业出版社,2012.

[2]董文泉,高铁梅,姜诗章.经济周期波动的分析与预测方法[M].长春:吉林大学出版社,1998.

[3]张永军.经济景气计量分析方法与应用研究[M].北京:中国经济出版社,2007.

[4]姜向荣,司亚清,张少锋.景气指标的筛选方法及运用[J].统计与决策,2007,(4).

[5]谢佳斌,王斌会.中国宏观经济景气监测的预警体系[J].统计与决策,2007,(4).

[6]孔宪丽,张同斌,高铁梅.基于景气指数的我国工业经济周期性波动特征及本轮波动特点研究[J].数学的实践与认识,2012,(7).

[7]郭国峰,郑召锋.中国宏观经济先行指数和一致指数应用效果检验与改进[J].数量经济技术经济研究,2010,(10).

猜你喜欢

期数总收入景气
下半年黄羽鸡或迎景气周期
碧桂园:2019年总收入4859.1亿 同比增长28.2%
2019年《证券市场导报》论文索引
跟踪导练(一)6
2018年2月中轻景气指数为88.38
2018年3月中轻景气指数为87.82
2018年2月中轻景气指数为88.38
旅游业:半年总收入2.25万亿元
旅游业:半年总收入2.25万亿元
谁有“洪荒之力”里约奥运会收入最高的参赛选手