APP下载

基于神经网络模型的房价预测研究

2022-05-30李然章政缪华昌

中国集体经济 2022年27期
关键词:神经网络

李然 章政 缪华昌

摘要:房产在我国国民经济中占据重要地位。随着深度学习算法发展,关于房价预测问题算法也有深入的研究。文章将调试Logistic、ReLu各隐含层函数来预测结果,并将结果综合后判斷本模型的预测精度完成房价预测。

关键词:房价预测;神经网络;Logistic;ReLu

中国经济实验研究城市生活质量中心2019年报告显示,整体上来看房地产市场仍然还是以谨慎的态度为主,且近几年来国家住房政策的调整使得房地产行业将迎来新一轮的“洗牌”。房地产作为我国国民重要的资产项目,微观层面在转让、售卖、租赁的时候有可靠的参考标准对消费者与产权拥有者意义重大。从中观角度企业可基于房价预测判断用多大的成本建设可获得最高收益,能够帮助企业做出精准的市场战略,防止资金浪费在低投资回报率项目上导致资金链断裂。宏观角度可靠的房价预测在精准调整政策、提高政策在基层可实施性、防范系统性金融风险等方面有积极作用。

基于现状,本文以如何构建一个新行业背景下不动产定价预测这个问题进行建模,最终辅助国民涉及房产方面的决策。数据源于kaggle官网“House Prices-Advanced Regression Techniques”。

一、神经网络构建

Logistic函数又称sigmoid函数源自逻辑斯蒂方程。原用以描述自然界物种无天敌的理想状态下,物种最快增长函数。其式:

求解得到以上,式中Wij是指连接权重,xj是指输入的特征变量,δi指神经元阈值,yi指在Logistic的激活函数下的加工后的数值。

相比sigmoid函数ReLu只需要一个阈值就可以得到激活值不必进行大量臃余计算。

式中yi指经过ReLu加工后的数据,Wij是指连接权重,xj是指输入的特征变量,δ指神经元阈值。

Logistic和ReLu情形下神经网络模型的构建各有特点,因此对两结果取均值对预测精度的好处如表1所示。

二、神经网络运行结果

用“蓝鲸”软件建模。数据累计53个提供信息的特征列参与建模,其中10列为名义型变量其余为数值型和序列型变量。名义型变量的处理方式是转换为编码,序列型变量的处理方式是转换为评分形式的数值型变量。预测结果与实测结果存在误差的原因可能是由于数据记录时本身就存在错误,导致记录数与真值存在误差。或是由于模型本身特性导致的。因此本文利用两个不同隐藏层函数跑出的结果进行加权平均。其原理为两个模型自身的精度较好,但是存在一些异常的数值。两组数据如果差距不大则很有可能这个结果本身是对的。如果两组数据的差距比较大,则取其均值以平抑其错误的大小。结果如表2所示。

本文以对应真实房价为比较对象。并绘制了图2横轴为本模型结果纵轴为真实结果的平面图。房价预测时应当存在一个区间,在该区间以内可视为有效合理定价。如果超出该区间过多将视其为噪点。图2中的两条箭头线代表的是可接受合理区间上下沿分别是一个均方根误差。RMSE=25752.16,R2=0.897648,表明预测结果与真实情况接近。

鉴于房价定价除了客观因素影响还有个体喜好差异的因素。因此图2中两个双箭头线是个体差异导致的可接受的误差,误差值为一个均方误差。

导致误差的原因包含标准化后的数值转回预测目标数值时较大的量纲使误差被放大,也包含数据集本身就有错误数据的可能。但是从大体上来看,除去少数极端异常点多数的点落在合理区间的。其余在合理范围边缘的点可能是数据除噪精度低导致的。约97%的点在区间内,总体的精度较优。

三、模型仿真

为进一步验证模型效果,参考了《中国房地产统计年鉴2006》至《中国房地产统计年鉴2020》南京市商品房平均销售价格以及南京市统计局对应年份的统计年鉴。其中a为地区生产总值(亿元);b为地区人口总数(人);c为城市居民人均可支配收入(元);d为城市居民人均消费支出(元);e为农村居民人均可支配收入(元);f为农村居民人均生活消费支出(元);g为商品房销售面积(万平米);h为本年完成投资额(万元);i为商品房平均销售价格(元/平米),数据如表3所示。

为平抑量纲对模型的影响,将数据标准化。并使用2005~2018年的数据为训练集,2019年舍去i的数据为预测集。

最终利用以上的方法得到两种激活函数综合之后2019年预测结果为19472.25元/平米,误差仅2.45%。因此本模型可用于研究近几年我国房地产房价问题。

四、结语

本文基于神经网络算法解决了如何在新时代背景下对房价的合理区域的预测,并结合了本模型的均方误差给出了相应合理的区间,达到了便于消费者合理评估不动产价值、辅助房地产企业判读是否购买某块地区的土地建设、有利于国家对居民端房地产交易环节实施精准的宏观调控的研究目标,为房价预测问题提供了一种新解决方式。

参考文献:

[1]张连城,郎丽华,赵家章,王银,郝宇彪,张自然,王钰.城市居民生活质量“总体稳定、稳中有忧”——2019年中国35个城市生活质量报告[J].经济学动态,2019(09):3-17.

[2]张樨樨.房价泡沫抑制了生育率复苏吗?——论生育率与房价的动态因果关系[J].华东师范大学学报(哲学社会科学版),2021,53(02):164-175+180.

[3]Nellis J G,Longbottom J A.An empirical analysis of the determination of house prices in the United Kingdom[J].Urban Studies,1981,18(01):9-21.

[4]Baffoe-BonnieJ.The dynamic impact of macroeconomic aggregateson housing price and stock of houses:A national and regional analysis.Dordrecht:111e Journal of Real Estate Finance and Economics,1998,17(02):179-197.

(作者单位:苏州大学应用技术学院。章政为通信作者)

猜你喜欢

神经网络
基于递归模糊神经网络的风电平滑控制策略
BP神经网络在路标识别上的应用研究
神经网络抑制无线通信干扰探究
基于Alexnet神经网络的物体识别研究
基于BP神经网络的旋转血泵生理控制
基于神经网络MRAS的速度辨识仿真研究
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定
基于神经网络分数阶控制的逆变电源