APP下载

基于BP神经网络的唐山房价预测

2015-12-03高平刘志坚袁立梅

关键词:隐层训练样本权值

高平,刘志坚,袁立梅

(河北联合大学,河北 唐山 063009)

随着国民经济的发展,以住宅为主的房地产业渐渐成为我国的支柱产业之一。众所周知,房价是受很多因素影响的,比如房屋的自身因素、房屋所在的环境因素、国家调控政策、房屋供求、GDP、地价、人民币汇率、人口比例、家庭平均收入、房屋平均造价、房屋销售面积、房屋竣工面积等等[1]。由于需要考虑的因素过多,对未来房价的预测是非常困难的。在计量经济学基础上建立的各种经济模型,大部分都是线性模型,而房价的走势复杂多变,传统的预测模型误差较大。BP 神经网络具有极强的非线性逼近能力,不用明确输入输出之间的函数关系,通过调整其连接权值和阈值即可对新的数据做出预测,而且所考虑的函数关系越复杂,神经网络这种特性的作用就越明显。

一、影响房价的主要因素

国内生产总值(Gross Domestic Product,简称GDP)指的是在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的市场价值,常常被认为是衡量国家或地区经济状况和发展水平的重要指标。一般来说,本地生产总值是消费、投资、政府支出和净出口额的总和[2]。其中,消费反映了当地家庭的收入水平,投资包含了房地产业的资金,政府支出包含了政府对房价的政策及影响。因此,GDP包含了许多影响房价因素。另一方面,中国房地产已经成为我们国家的一个投资市场,整个房地产业也影响着我国的经济增长。对于地方政府而言,房价的变动也会在很大程度上直接影响着当地的GDP变化。

地价和房价的关系一直是受很多人关注的。地价作为房地产开发的一个重要组成部分,也是影响房价的一个重要的因素,这也是由于地价作为成品房的组成成分所决定的。在某些城市,土地价格甚至占到房价的一半,可见地价对房价影响力是相当重要的[3]。一般情况下,要想使房价有所下降的话,短期内应该利用增加土地供给控制房价和地价过快上涨,而长期内则主要是通过抑制地价的过快上涨。

影响房价的因素还有很多,比如国家的调控政策,房屋的硬件、环境,房屋的需求量等等。但在建立BP神经网络预测模型的时候,这些因素不容易被量化,无法纳入模型的训练样本中,因此只能当作参考。

二、BP神经网络

BP神经网络即误差反向传播神经网络(Back Propagation Neural Network),是由大量、简单的处理单元广泛连接而成的复杂的网络系统,是当前应用最广泛的一种人工神经网络,特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题[4]。BP网络学习算法的具体步骤如下:

从训练本集中取某一样本,把它的输入信息输入到网络中;

由网络正向计算出各层节点的输出;

计算网络的实际输出与期望输出的误差;

从输入层起始反向计算到隐层,按一定原则向减小误差方向调整网络的各个联接权值;

对训练样本集中的每一个样本重复以上步骤,直到对整个训练样本集的误差达到要求为止。其最大特点是仅凭样本数据就能实现由输入层输出层的高度非线性映射,且映射结果可由足够的训练样本来保证。BP神经网络的训练过程由数据的正向传播和误差的反向传播两个过程组成。正向传播时,模式作用于输入层,经隐层处理后,传向输出层。若输出层未能得到期望的输出,则转入误差的逆向传播阶段,将误差传递到隐层,通过隐层向输入层逐层返回,并分摊给各层的所有单元,从而获得各层单元的参考误差或误差信号,以作为修改各单元权值的依据。这种信号正向传播与误差逆向传播的各层权矩阵的修改过程是周而复始地进行的。权值不断修改的过程,也就是网络的训练(或称学习)过程。此过程一直进行到网络输出的误差逐渐减少到可接受的程度或达到设定的训练次数为止。BP 神经网络的信息以连接权值的形式分布于整个网络,与人脑利用神经突触的变化存储信息类似,这使得神经网络非常稳定;网络可以并行处理信息,大大提高了网络运行速度;网络内部高度连接,少量误差或部分神经元的损伤不破坏整体,它可以自动修正误差[5]。

三、房价预测模型

可以分为神经网络的训练和预测两部分,具体步骤如下:

(1)选取训练样本数据来构造训练样本,房价不但受到很多经济因素的影响,而且还有人为的作用、政府的调控等都影响房价的未来走势。所以需要选择合适的房价样本数据,如果选取不合适的数据会降低网络的预测能力。本文选择对房价影响最大的两个因素GDP和地价为训练样本。

(2)对房价样本数据进行预处理。在进行网络预测之前,为避免原始数据过大造成神经网络麻痹,我们将对房价样本数据进行归一化处理,对于预测值,由于变化幅度较大,也不宜作为网络的输出,也对其进行归一化处理。将数据归于[0,1]内,这样可以尽可能地平滑数据,从而消除预测结果的噪声。

(3)建立并训练预测模型。建立一个含2个输入层,3个隐层,1个输出层的神经网络,将2008-2013年的GDP、地价数据归一化后作为输入样本导入网络,将2008-2013年的房价作为输出样本导入,训练方式为通过调整隐层的权值阈值建立每一季度的GDP、地价与房价的关系,同时用前两年的房价预测后一年的房价,即用2008年、2009年的房价预测2010年的房价,对比2010年的实际房价,神经网络的各参数朝着可以减小误差的方向修改,以此类推以达到训练的目的[6]。

(4)做出预测。运行训练好的网络,利用2012年、2013年的房价对2014年的房价做出预测。

表1 训练样本

将上述数据进行标准归一化处理后如表2:

表2 预测样本

在MATLAB 软件中建立BP 神经网络,输入为经过归一化后的GDP 和地价水平值,输出为房价,隐层个数为3,隐层神经元传递函数为tansig,输出层神经元传递函数为logsig,最大训练次数定为200,目标误差设为0.0001。

网络的训练情况如图1:

图1 网络训练情况

由上图可以看出,网络在经过7次训练之后,误差低于0.0 001,达到预期的目的,网络停止训练。网络的输出为0.0 036,0.1 499,0.3 236,0.6 768,0.8 748,0.9 890。对比实际的房价,误差都控制在1%以内,可以用来预测。

利用编好的程序,最终得到2014年的房价为6 362元/平方米。

四、结论

1)本文首先分析了影响房价的因素,从中选出影响力最大且可以量化的两个因素,作为BP 神经网络的输入,将历年的房价作为输出,在MATLAB中编程,建立输入输出之间的关系,训练网络并运行。从仿真结果可以看出,利用BP 神经网络,以GDP和地价作为输入,是可以预测房价的,且预测的准确率可以达到1%以内。这说明用神经网络预测房价是可行且有相当说服力的。

2)本文最终得到2014年唐山房价均价为6362元/平方米,与2014年上半年唐山房价均价6235元/平方米相比高出127 元/平方米。所以,按BP神经网络的预测结果,唐山2014下半年的房价会小幅上涨。

[1]王斌.房地产价格影响因素分析[D].北京:北京交通大学,2007.

[2]杜家龙.国内生产总值回归预测新探[J].统计与决策.2013(9).

[3]林先成.城市地价动态监测体系及其系统研究[D].成都理工大学.2008.

[4]韩立群.人工神经网络理论、设计及应用[M].北京:化学工业出版社,2002:1-16.

[5]郑君里,杨行峻.人工神经网络[M].北京:高等教育出版社,1992:15-30.

[6]楼顺天.基于Matlab的系统分析与设计—神经网络[M].西安:西安电子科技大学出版社,2000:23-40.

猜你喜欢

隐层训练样本权值
基于RTD可编程逻辑门的n变量函数实现算法
一种融合时间权值和用户行为序列的电影推荐模型
CONTENTS
基于BP神经网络学习算法的图像压缩技术研究
人工智能
基于RDPSO结构优化的三隐层BP神经网络水质预测模型及应用
代价敏感正则化有限记忆多隐层在线序列极限学习机及图像识别应用
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究
宽带光谱成像系统最优训练样本选择方法研究