APP下载

基于BP神经网络的南京市房价预测

2019-05-11吴姗姗

市场周刊 2019年2期
关键词:BP神经网络

摘 要:一直以来,房价呈持续上涨的态势,整个房地产市场形势错综复杂。本文以南京市房地产价格为参考,根据2001年至2016年南京市房地产数据,建立BP神经网络模型,选取房地产开发投资额、居民人均可支配收入、人均消费性支出、总人口数、人均地区生产总值等变量,将2001年至2013年的数据作为训练集,2014年至2016年的数据作为验证集,利用2001年至2013年建立的模型预测2014年到2016年的房价与2014年至2016年真实的数据相比较,来验证该模型在房价预测中是否有效,结果发现,模型预测下一年的房价误差较小,而预测接下来的两年或三年的房价误差较大。

关键词:BP神经网络;南京房价;房价预测

中图分类号:F293.3 文献标识码:A 文章编号:1008-4428(2019)02-0058-03

一、 引言

近年来,全国各大小城市的房价一直在上涨,以南京为例,2001年南京市房价均价为2907元/平方米,到2010年达到12061元/平方米,10年间房价上涨超过4倍,而人均可支配收入上涨幅度为3倍左右,为何人均可支配收入的涨幅不如房价上涨幅度?原因是多方面的。房地产供需不平衡、购房者的投机性需求、人口上涨以及住房的改善性需求、GDP增长的需求等均为房价上涨的原因。综合考虑,影响房地产价格上涨的因素有很多并且也比较复杂,各个因素之间相互影响,相互作用,如何对房价走势有效地进行预测,控制房价过快增长成为当今社会人们关心并且迫切想知道的热点问题。

通过翻阅相关资料获知,影响房价的因素较多且复杂,比如政府设定的地价,房屋所处的地理位置,住房供需关系,国家出台的关于房地产的政策,人口状态,投资额,家庭平均收入,建房建筑面积、公摊面积以及使用面积等。由于影响因素较多,以及众影响因素之间的相互关系,考虑的方面比较多,因此对于房价的预测是比较困难的,再加上很多影响因素的数据难以获得,只能将其作为影响因素的参考,而不便于放入模型中,所以对于房价的预测只能尽可能地去做多次模拟以提高预测的精度。

传统的计量经济模型,大多数模型根据设定的变量可以很好地解释模型运行的结果,比如线性模型。而房价的影响因素错综复杂,走势多变,使用传统的模型去预测房价走势,其模型效果检验可能不会太好,误差较大。而BP神经网络模型不用明确输入输出之间的函数关系,虽然对于输出结果不太好解释,但对房价的预测却比较合适。因为使用BP神经网络模型所考虑的函数关系越复杂,其非线性逼近能力就越强。综合考虑影响房价的众多因素以及其复杂性,本文在《南京市统计年鉴》发布的历年数据的基础上,利用BP神经网络模型,对南京市2014、2015、2016年的房价进行预测并验证其准确性。结果发现,该模型在预测临近的下一年的房价时数据准确性较高,但在预测接下来的第二年、第三年房价数据时误差较大。

二、 国内外研究综述

从古至今,“吃穿住行”构成人们生活的主要部分,而住与人们的生活休戚相关,住是提供人们一个休憩之所,住房是人们口口相传的家的象征。而现如今,房价波动上升的趋势以及人们对房价的关心,使得房价成为一大热点问题。广大学者对住宅房价问题进行了诸多研究。在城市商品住宅价格影响方面,高霞、蒋立红和厉文平通过因子分析将影响因素划分为城市基础设施与环境因子、城市规模因子、城市经济因子和城市区位因子。之后通过主成分回归法分析了以上因子与房价的关联度,分析发现:城市经济因子、城市规模因子、城市基础设施和环境因子、城市区位因子这四类因子对房价的影响重要性逐渐减弱。杨贵中通过成都1997—2005年的房价诸多影响因素的相关数据对房价进行预测,通过多元回归建立单方程模型,研究发现:成都市非农人口的增长是影响成都商品住宅价格最重要的因素之一。乔林、孔淑红利用2000—2009年4个一线城市以及14个二三线城市的房地产数据分别对两类城市房价因素做出分析,研究发现:一线城市与二三线城市的影响因素存在较大差异。一线城市房价受居民收入的影响较为显著,二三线城市房价受人口因素的影响较为显著。该研究结果与杨贵中的“成都市房价最重要的影响因素为非农人口的增长”也是比较吻合的。

随着社会经济的发展,影响房价的因素越来越复杂,根据传统计量模型对房价进行预测局限性越来越大。李东月对房价预测模型进行了比较,发现5次多项式模型比灰色-马尔可夫预测模型的预测精度高。Limsombunchai和Gan等根据夏威夷Christchurch市200个交易数据分别建立人工神经网络模型和Hedonic模型,并对这两个模型进行比较分析,发现人工神经网络模型的预测效果比Hedonic模型好。周学君和陈文秀根据BP神经网络模型对黄冈市房价进行預测,结果发现,预测结果符合预期误差。

从学术研究现状来看,预测房价的方法较多,在计量经济学的基础上建立起来的模型大多数都是线性模型,现如今,房价走势复杂多变,房价影响因素错综复杂,房价的变化呈现一种非线性的态势,仅通过线性模型预测房价存在较大的误差,无法给出较好的预测结果。传统的计量模型已不适用于房价的预测。根据参考众多文献发现,BP神经网络无须事先确定输入与输出之间映射关系的数学方程,仅通过自身的训练,学习某种规则,在给出输出结果的情况下,最大限度地逼近输出结果,由此根据输入和输出逼近一个函数使得预测结果精度最大化。这是一种智能信息处理系统,是技术发展的新产品。因此本文对南京市房价预测使用BP神经网络模型,之后对南京市房价进行验证,评估其预测结果的准确性。

三、 BP神经网络模型

BP神经网络(Back-ProPagation Network)是一种按照误差逆向传播算法训练的多层前馈神经网络,在1986年由以Rumelhart和McClelland为首的科学家提出,BP神经网络是目前应用最广泛的神经网络。BP神经网络是在输入层与输出层之间增加若干层(一层或多层)神经元,这些神经元称为隐单元,增加的若干层也叫做隐层,隐层不直接与外界(输入层与输出层)联系,但却是由输入层与输出层决定的,隐层其实是神经网络不断自我学习训练的过程。通过这种不断的自我学习,自我训练,提高网络输出的准确性,当误差达到之前设定的误差范围时,即停止训练,然后用训练好的神经网络进行结果的预测。图1是m×n×r的三层BP网络模型。

四、 南京市房价预测模型

(一)变量的选取

南京市属于二线城市,现居于新一线城市范围,根据参考大量文献,参考与南京市经济发展水平相似的城市,参考其对城市房价预测所选取的变量,比如:房地产开发投资额、人均可支配收入、人均消费性支出以及总人口数等,将其作为影响因素纳入模型中进行房价的预测。此外,通过阅读文献、新闻发现,政府所出示的土地价格直接影响到房地产开发商建房的成本高低;房地产行业对GDP的提高有一定的促进作用,人均GDP一定程度上可以显示经济发展水平,并预示房价的涨跌。因此,在房价预测过程中除了要参考通过阅读文献所得到的影响因素,还要将人均GDP和土地价格纳入模型之内,但在数据收集的过程中,历年来的地价数据收集难度较大,因此,仅将其作为参考因素。

(二)数据的预处理

在建立神经网络模型之前,需要将原始数据进行归一化处理,如果不进行归一化处理,数据在模型中训练学习收敛速度会比较慢,很可能找不到最优的函数模型,也就是说很可能无法逼近输出值。另外,进行归一化处理除了能够提高训练速度之外,还可能提高计算的精度。归一化处理将数据范围控制在[-1,1]之间,将有量纲的数据转化为无量纲的数据,成为标量,消除外界因素对预测结果可能造成的影响。

(三)训练样本和预测样本的构造

本文将2001—2013年的数据作为训练样本,将2014—2016年的数据作为测试样本,建立一个含5个输入层、5个隐层、1个输出层的神经网络,将归一化的输入样本导入网络,再将输出样本导入,通过不断调整隐层的权值、阈值建立每一年影响房价的各个因素与房价的关系,同时采用滚动预测的方法对房价进行预测,即用2001—2013年的房价预测2014年的房价,对比2014年的实际房价,神经网络的各参数朝着可以减小误差的方向修改,以此类推以达到训练的目的。当误差达到目标时,即可用训练好的网络进行预测;若测试结果没有达到目标,则返回训练,直到测试成功为止。

(四)神经网络模型的建立

本文所使用的软件为MATLAB,将原始数据进行归一化处理所采用的方法是运用MATLAB中的premnmx()函数。选用Sigmoid函数作为隐层节点的激活函数,tansig为隐层神经元的传递函数,选用对数S型sigmoid函数作为输出节点的激活函数,purelin为输出层神经元的传递函数。创建BP神经网络采用newff。最大训练次数为5000次,学习率为 0.15,目标误差为0.0000001。

(五)神经网络的训练和结果

经过原始数据归一化之后对BP神经网络进行训练学习。经过多次学习和训练,模型所显示的误差达到目标精度以下,训练的最佳网络性能如图2所示。从图2中看出,网络经过253次训练之后的误差低于0.0000001,之后停止训练学习。

在神经网络模型达到最佳学习效果后,需要保存当前网络模型,保存的目的是固定初始权值和阈值,如果初始权值和阈值发生变化,那么便无法保证预测结果的准确性。完成对神经网络的训练后,用训练集里面的数据即2001—2013年数据对训练好的BP神经网络进行测试,并将预测的房价与实际房价(2014—2016年)进行比较,对比结果如表2所示。

从测试的结果来看,训练完后的BP神经网络对临近的下一年房价预测效果较好,而对随后的第二年、第三年的預测效果越来越差。所以借助BP神经网络模型可以在一定条件下、一定程度上有效地进行下一年房价的预测以及房价走势的判断。

五、 结论

本文通过分析房地产行业现状、地区经济发展情况及有关房价影响因素的相关学术研究,选取了对房价影响较大并且可以量化的5个因素建立了BP神经网络模型,通过将预测结果与实际数据作比较发现,BP神经网络对房价的预测具有一定的有效性,就南京市房价预测来说,该模型对临近的下一年房价预测效果较好,但随着年限的增长预测效果越来越差,该模型对房价的预测在政府宏观调控方面具有一定的参考价值。

另外,本文也存在着不足之处。住房销售价格影响因素多而复杂,除了本文模型纳入的因素之外,还有很多无法量化的因素,比如国家对房地产市场的调控政策、经济环境等,这些因素均在一定程度上对房价产生影响,不能将其考虑进模型之内,是本文的缺陷之一。

参考文献:

[1]李云平.房地产业对中国经济的影响[J].科技与企业,2014(6):56.

[2]王彬.房地产价格影响因素分析[D].北京:北京交通大学,2007.

[3]高霞,蒋立红,厉文平.城市商品住宅价格影响因素分析[J].价格月刊,2008(1):24-27.

[4]杨贵中.成都商品住宅价格影响因素分析与房价预测[D].成都:西华大学,2007.

[5]乔林,孔淑红.我国不同发展层次城市房价影响因素的差异分析及对策研究[J].特区经济,2012(5):210-212.

[6]李东月.房价预测模型的比较研究[J].工业技术经济,2006,25(9):65-67.

[7]Limsombunchai V, Gan C, Lee M. House price prediction: Hedonic price model vs. artificial neural network[J]. American Journal of Applied Sciences,2004,1(3).

[8]周学君,陈文秀.基于人工神经网络BP算法的黄冈市房价预测[J].黄冈师范学院学报,2014(3):13-15.

作者简介:

吴姗姗,女,江苏盐城人,南京财经大学硕士,研究方向:区域经济、产业经济和国民经济统计。

猜你喜欢

BP神经网络
基于神经网络的北京市房价预测研究
一种基于OpenCV的车牌识别方法
基于遗传算法—BP神经网络的乳腺肿瘤辅助诊断模型
一种基于改进BP神经网络预测T/R组件温度的方法
基于BP神经网络的光通信系统故障诊断
提高BP神经网络学习速率的算法研究
就bp神经网络银行选址模型的相关研究
基于DEA—GA—BP的建设工程评标方法研究
复杂背景下的手势识别方法
BP神经网络在软件质量评价中的应用研究 