基于BP神经网络的上海市二手房价格验证与预测
2018-10-26何飞
何 飞
(上海理工大学 管理学院,上海 200093)
引言
二手房是已经在房地产交易中心备过案、完成初始登记和总登记的、再次上市进行交易的房产。二手房市场作为房地产市场的一个重要组成部分,在缓解城市土地市场和住房压力方面有着不可或缺的作用。二手房市场的发展,不仅有利于住宅一级市场的繁荣、缩短新建商品住宅的销售周期,而且可以满足居民住宅升级和提升住房消费层次的需求,补充和保障中低收入家庭的住房需求。
1999年国家停止实物分房,并出台《已购公有住宅和经济适用住宅上市出售管理暂行管理办法》《已购公有住宅和经济适用住宅上市出售土地出让金和受益分配管理的若干规定》两个文件,指明了二手房市场的发展方向。上海市政府也积极推行各项政策,如简化二手房贷款事宜办理流程,提高二手房贷款比例以及提高二手房贷款期限等措施,使得海市二手房平均价格步步攀升,于2015年突破五万大关。二手房市场量价齐升,交易越发火爆,已成为市场交易的主力,中低收入家庭的住房问题得到进一步解决。
随着国家和上海市政府政策的引导,二手房价格过快增长的态势得到有效遏制,上海市二手房市场得到进一步的发展。如国家贷款利率上调、二手房交易营业税由“满五免征”调整至“满二免征”、降低二套房首付比例等。上海市政府着力构建信息畅通的房地产交易平台,消除政策壁垒,通过税收杠杆,间接为低收入住房消费者提供补贴等措施成功实现房地产二、三级市场联动,扩大了住房消费主体,使得二手房市场平均价格逐年稳步升高,良性发展,上海市二手房市场得到进一步发展。
这样的背景下,上海市政府、开发商、学者以及上海市都对未来上海市二手房价格趋势和走向非常关注,普遍集中讨论房价是否合理、房价涨幅是否过快。随着房地产业的、房地产管理要求的提高、房地产市场的发育,房价预测必将日趋重要和活跃发展。目前上海市二手房价格的影响因素有很多,诸如区域因素、市场因素和房屋自身因素等。利用传统的分析方法,在预测二手房价格时遇到了很大的挑战,科学地对上海市二手房价格进行预测已经成为一个十分紧迫的课题。
一、文献综述
在研究房地产市场方面Eugenio Cerutti等以50个国家的住宅金融政策和房价为样本,分析了家庭信贷和房价热潮之间的动态关系。
在研究二手房价格方面,刘斌等借鉴美国Csae-Shiller房价指数的编制方法,构建了上海Csae-Shiller二手房价格指数,一定程度上克服了国家统计局70个大中城市房屋销售价格指数存在的缺陷,分析发现,房价指数与宏观经济指标有较高的联系。缪格在对二手房价格的研究中,以地铁、楼龄、配套设施等为特征价格变量,通过构建特征价格模型,利用多元回归法探索了二者之间有一定的内在联系。张红以实际二手房交易的特点为基础,通过经济学实验,模拟在预期房价上涨条件下,二手房的交易过程,研究发现二手房市场经常出现的逆向选择现象是由信息不对称造成的。曾昭法在评估二手房价格中,根据模糊数学理论,利用建筑特征、邻里特征和区位特征等综合评估因素,建立了二手房价格模糊综合评估模型,并结合实例,验证了模型的可靠性。阮连法在衡量二手房价格中,利用特征价格理论和支持向量机理论,建立特征价格模型对二手房价格进行预测,根据模型验证结果显示,在训练样本和测试集样本具有相似特征时SVM拟合效果良好。祁神军通过对Hedonic模型的研究,建立厦门市二手房特征价格模型,并应用到厦门市二手房价格指数中,较为准确地反映了市场的供求关系。潘志安利用武汉市2010—2012年各季度商品房价格建立BP神经网络模型,对模型进行训练与测试,证明该模型在房地产价格预测方面具有较好的效果,具有误差小、效率高等优点。
在以往对二手房价格的文献研究中,大多以微观因素为考察对象,分析微观变量的不同及对价格的影响,诸如住宅面积、朝向、交通和配套设施等。但在实际中,诸如央行基准利率和地区GDP等宏观因素的变动同样会引起二手房价格的波动。神经网络能在短期预测中取得良好的结果,但以往文献大多以年平均价格为研究对象,虽然取得良好的拟合效果,但预测效果不可避免地会大打折扣。因此,本文以上海市二手房季度平均成交价格为研究对象,通过建立BP神经网络模型,从宏观角度考察宏观因素对二手房价格的影响。
二、BP神经网络的建立
人工神经网络是对生物神经网络的抽象、简化和模拟,作为一种非线性统计性数据建模工具,人工神经网络的应用范围相当广泛,模型种类也很多。BP神经网络(Back Propagation Network)是应用最为广泛的一种人工神经网络。网络结构图(如图1所示)。
模型共三层,输入样本信号从输入层输入,通过逐层计算,传到隐层,再传到输出层,最后得到输出层的实际输出值。若输出层实际输出值与期望输出值误差符合要求,则学习结束。否则将进行误差的反向传播,反向通过网络误差来调整网络权值和阈值,使误差信号趋于最小。两个过程反复交替,直到算法达到收敛为止。
图1 三层BP神经网络模型结构图
(一)变量选取
输入变量的选取原则为,选取对输出变量影响大且数据易搜集的变量,同时各输入变量之间相关性较小。考虑到上海市具体情况与数据的易收集性,本文分别从供需关系角度、金融货币角度和政策影响三个角度对影响因素进行了选择和分析。
反映房地产市场供需关系的因素包括上海市固定资产投资额、上海市房地产开发投资额、上海市房屋施工面积、上海市房屋新开工面积、上海市房屋竣工面积、上海市新建商品住宅销售面积、上海市新建商品住宅销售额、上海市房屋出租面积、上海市常住人口数和上海市户籍人口迁移各项数据指标等。为避免神经网络模型中各输入变量冗余重复,以上海市房地产开发投资额代表各项投资额数据变量,以上海市新建商品住宅销售面积代表上海市各项房屋面积指标,以上海市常住人口数作为上海市各项人口指标的代表。因此,从供需关系角度共选取了上海市房地产开发投资额、上海市新建商品住宅销售面积和上海市常住人口数3个数据变量。
反映房地产市场金融货币类影响因素包括上海市地区生产总值、五年以上中长期贷款的央行基准利率、上海市居民消费价格指数、固定资产投资价格指数和居民人均可支配收入及消费支出等。其中,上海市居民消费价格指数、固定资产投资价格指数和居民人均可支配收入及消费支出三项指标都是对上海市价格水平的反映,选择上海市居民消费价格指数作为三项指标的代表。因此,从金融货币角度选择了上海市地区生产总值、五年以上中长期贷款的央行基准利率和上海市居民消费价格指数3个对房地产市场产生较大影响的数据变量。
二手房市场经常受相关政策影响,所以从政策影响角度选取了1个变量,即经济政策不确定性指数。
(二)数据收集与预处理
通过对上海统计局、上海统计年鉴和EPU指数等各数据源进行搜集罗列,汇总出各项数据(见下页表1)。
表1 上海市二手房季度平均价格及影响因素
将收集的变量数据进行尺度归一化处理,由于选取的变量数据分别表示不同的意义和量纲,通过归一化处理,可以将数据转换成在[-1,1]之间变化,使输入变量地位同等。另外,也可以避免由于数据过大导致输出饱和。
(三)隐层节点数的确定
适当的节点数可以提高网络逼近能力。确定最佳节点数有以下两个经验公式:
式中,m为隐层节点数,n为输入层节点数,l为输出层节点数,α为1—10间的常数。本文通过试验确定最佳隐层节点数为5。
(四)建立模型
BP神经网络包括输入层,隐层和输出层,本文输入层七个节点,隐层只有一层且5个节点,输出层1个节点。本文网络结构图(如图2所示)。
图2 网络模型结构图
用xi表示神经网络的输入,本文共有7个输入变量,分别为上海市房地产开发投资额、上海市新建商品住宅销售面积、上海市常住人口数、上海市地区生产总值、五年以上中长期贷款的央行基准利率、上海市居民消费价格指数和经济政策不确定性指数;yk表示神经网络的输出,即上海市二手房季度平均价格;dk表示神经网络的期望输出;Wijk表示第i层第j个神经元到第i+1层第k个神经元间的权值;Oij表示第i层第j个神经元的输出;θij表示第i层第j个神经元的阈值;用netij表示第i层第j个神经元的输入;Ni表示第i层神经元节点数。
在信息的正向传播过程中需计算各神经元的输入与输出,主要计算公式如下:
如果网络的实际输出与期望输出间的误差在允许的范围内,则网络训练完成,否则将进行误差的反向传播,修改各权值与阈值,主要计算公式如下:
误差定义:ek=dk-yk
其中,ek为误差。
网络的权值沿E函数梯度下降的方向调整,即ΔWijk=为学习效率),经推导得出权值与阈值调整公式如下:
其中,对于第i层神经元:
三、上海市二手房价格验证与预测
(一)Matlab建立模型
利用Matlab中的newff函数创建1个三层BP网络,其中输出层7个节点,隐层5个节点,输出层1个节点。隐层节点激活函数使用双曲正切S型sigmoid函数,输出节点激活函数使用双曲正切S型sigmoid函数,训练函数为trainglm。最大训练次数100次,误差设定值为0.01。
(二)神经网络训练和预测
为提高BP神经网络模型训练及预测效果,将收集的2011—2018年共29组季度数据打乱并分成两部分,分别是测试集与训练集。测试集样本占20%,随机抽取其中5组作为测试集。其余80%的样本,共24组数据作为训练集。利用Matlab对设定好的BP网络进行训练,从网络性能图可以发现,在经过4次训练后,网络误差达到目标要求,停止训练。
图3 网络性能图
保存网络,利用预先准备好的测试集对训练好的BP网络进行验证,通过预测结果与实际结果的对比发现网络预测效果较好,误差较小,训练好的BP网络在一定程度上可以对未来房价走势做出大体判断。
图4 预测结果与实际结果对比
表2 预测结果与实际结果对比
利用指数平滑法预测出下一季度的输入值,即房地产投资额、地区生产总值、央行基准利率、住宅销售面积、居民消费价格指数、地区人口数和经济政策不确定性指数。再运用已建立的BP神经网络模型进行预测,得到下一季度上海市二手房的预测价格为50 447.8万元/平方米。
结语
本文通过分析选取了七个对上海市二手房价有较大影响的宏观因素,建立了三层BP神经网络模型,通过对测试集的实际输出与期望输出间的误差进行对比分析,验证了模型的有效性,并预测出下一季度的上海市二手房价格,具有一定可信度。本文研究填补了上海市二手房价格研究方面的空白,为政府制定宏观调控政策提供一定的参考,同时也为房地产开发企业制定公司发展战略提供一定借鉴。
由于房价的影响因素诸多,除了上述七个宏观因素外还有其他的宏观微观因素都会对房价产生影响,这些因素对BP神经网络二手房价的预测结果或多或少会产生一定程度的影响。BP神经网络在短期预测中能取得较好的结果,不适用与长期预测,在现实运用中应结合实际考虑到其他因素的影响。