APP下载

上海市二手房价格影响因素研究

2022-04-02胡夷蔡近近张敬鸿袁鹏程

经济研究导刊 2022年4期
关键词:上海市

胡夷 蔡近近 张敬鸿 袁鹏程

摘 要:收集上海市14个区的11 195条有效二手房成交数据作为样本,首先对样本进行相关性检验并选择9个变量,分别用线性模型和半对数模型对样本进行初步分析,通过比较模型的拟合优度等最终选取半对数模型对样本进行回归分析建模,由此得到模型的常数值和各变量相关系数。根据此模型分析得到各自变量对上海市14个区的单位面积房价的影响程度,其中房源所处的行政区对单位面积房价的影响较大。此外,运用该半对数模型可对指定特征信息的房源进行房价预测。

关键词:上海市;二手房价格;单位面积房价;虚拟变量

中图分类号:F299.23        文献标志码:A      文章编号:1673-291X(2022)04-0070-03

引言

据报告统计,2020年,上海二手房市场量价走势与新房市场基本一致。全年二手住宅成交约30.2万套,同比增长27%,达近4年来新高。其中,2020年12月上海二手房的成交量刷新了近几年来的新高,二手住宅月度成交套数约为3.9万套,环比增长20.3%,同比增长96.2%。由此可见,二手房交易在上海市房地产市场逐渐占据重要地位。

在此前提下,对于二手房价格影响因素的研究越来越多。如戴瑗、郑传行通过Python对南京市二手房数据进行了收集和分析,经过可视化分析从中提炼出能帮助人们做出购房决策的信息[1];黄明宇、夏典收集了合肥市二手房交易数据并进行分析,建立了多元线性回归模型,为合肥市二手房交易提供了一个有实用价值的房价参考定价工具[2];傅行行利用ArcGIS分析了上海市二手房价格空间分布特征,探索影响二手房价格的可能因素[3]。

本文以上海市的14个区(除金山区和崇明区外)为研究对象,对其进行数据收集和处理,并建立了多元线性回归模型和半对数模型,通过比较得出各因素对二手房单位面积房价的影响程度,最终选择了半对数模型进行房价的预测。

一、数据收集和变量选择

本文通过数据收集工具“Gooseeker”从链家网站上爬取了上海市14个区的二手房成交数据,共采集了12 316条2020年上海市成交的二手房数据,经过初步相关性检验,剔除了房屋结构和厨房数等无关变量,最终选取了9个变量,其中单位面积房价为因变量,其余为自变量,具体变量如表1所示。

二、变量处理和描述性分析

对采集的数据进行预处理:一是删除数据异常和存在无关信息的数据条;二是对于数值型缺失值,采用平均数代替;对于虚拟变量型缺失值,采用众数代替。通过异常值筛选和缺失值填充处理后,有效数据共11 195条。

所有样本数据中,单位面积房价最高为100 977元/平方米,对应于黄浦区士林华苑的一套住房,此住房2室2厅,面积90.12平方米;单位面积房价最低为20 842元/平方米,对应于奉贤区金水苑的一套住房,此住房3室1厅,面积103.4平方米。面积最大为586.15平方米,对应为青浦区的圣安德鲁斯庄园,成交总价为1 940万元;面积最小为19.6平方米,对应为黄埔区尊德里的住房,此住房为1室0厅。

上海市14个区的平均房价为54 358.72元/平方米。平均单位面积房价最高的行政区为黄浦区,高达96 675.5元/平方米。黄浦区为上海市中心城区,拥有南京东路,人民广场和外滩等比较繁华的地段。平均单位面积房价最低的行政区为奉贤区,低至23 305元/平方米。奉贤区位于上海南部,距离上海市中心较为遥远,且经济发展较为缓慢。

部分变量样本分布情况如表2所示,可以看出,配备电梯的二手房样本相对较少,且低楼层和中楼层占比较高,经查阅资料可知其主要原因是上海市大部分老旧小区楼层较低,没有配备电梯设施。

三、模型建立

(一)创建虚拟变量

本文将单位面积房价作为因变量,面积,卧室数等作为自变量,其中是否有电梯,装修情况,楼层,地区为定性变量,对于是否有电梯引入0—1虚拟变量来处理;对于装修情况和楼层这两个3种取值的变量,分别以毛坯和高楼层为基准,各引入两个0—1虚拟变量;同样对于行政区这一定性变量,该变量有14个取值,以奉贤区为基准,引入13个0—1虚拟变量进行处理。其中,1均表示是,0均表示否。

(二)模型选择和拟合结果比较

本文选择多元线性回归模型和半对数模型这两种模型对上海市的二手房单位面积房价进行分析建模,表现形式分别为:

其中,P为单位面积房价,a为常数项,bi为各影响因素的特征系数,?着为误差项。

将因变量和所有自变量导入SPSS 26.0,分别建立线性模型和半对数模型,分析结果如表3所示。

通过比较可知,線性模型和半对数模型的调整后R2分别为0.967和0.976,拟合优度均较好,其中半对数模型更接近于1,且半对数模型的估计标准误差为0.05871,远远小于线性模型的估计标准误差,因此半对数模型对该二手房房价样本解释能力更好。

(三)模型建立和显著性检验

经过上述分析,本文选择半对数模型对样本进行回归分析,其中因变量为单位面积房价,其余为自变量,各变量回归系数和显著性如下页表4所示。

模型F值为18 779.693,对应的P值为 0.000<0.05,说明引入的22个自变量在a=0.05的显著水平下总体上对因变量单位面积房价有显著性影响,且每个自变量对应的P值均小于0.05,说明每个自变量在a=0.05的显著水平下均对因变量有显著性影响。同时由共线性检验可知,各自变量的方差膨胀因子(VIF)均远小于10,说明此半对数回归分析模型不存在多重共线性的问题。

综上分析可得本文建立的回归模型如下:

LnP=11.437-0.009x1-0.002x2+0.007x3+0.008x4+0.011x5+0.006x6+0.016x7+0.005x8+0.006x9+0.326x10+0.417x11+0.801x12+0.629x13+0.694x14+0.253x15+0.566x16+0.685x17+0.757x18+0.539x19+0.207x20+0.737x21+0.931x22

由模型可知,面積和房龄与单位面积房价为负相关,其余特征变量均为正相关。

(四)结论和预测

通过控制变量可以得到以下结论:一是面积每增加1平方米,单位面积房价下降约0.9%;房龄每增加1年,单位面积房价下降约0.2%。二是卧室数每增加1个,单位面积房价增加约0.7%;客厅数每增加1个,单位面积房价增加约0.8%。三是单位面积房价中,有电梯比无电梯增加约1.1%。四是单位面积房价精装比毛坯增加约1.6%,单位面积房价简装比毛坯增加约0.6%。五是单位面积房价低楼层比高楼层增加约0.5%,单位面积房价中楼层比高楼层增加为0.6%。

由于模型拟合度较好,且变量总体和个体均通过显著性检验,因此可以利用此模型来进行预测。假设杨浦区有一套3室2厅的120平方米的精装修房,房龄10年,楼层处于中楼层,有电梯,根据此模型预测的单位面积房价为66 237元/平方米,总价约795万元。

结语

本文以上海市11 195条有效二手房数据为样本,经过相关性检验确定了8个自变量,并通过对比分析选择了半对数模型对样本进行回归分析,可以得出8个特征变量对单位面积房价的影响程度,其中行政区对单位面积房价影响较大,房龄对单位面积房价影响较小,最后,根据此模型对假设房源进行了房价预测并验证。由于房价影响因素较多,未来可以引入是否临近地铁、月收入水平等因素进一步完善模型,使模型更加精准。

参考文献:

[1]  戴瑗,郑传行.基于Python的南京二手房数据爬取及分析[J].计算机时代,2021,(1):37-40+45.

[2]  黄明宇,夏典.合肥市二手房价多元线性回归预测模型[J].合作经济与科技,2019,(9):80-82.

[3]  傅行行.上海市二手房价格空间分布及其影响因素研究[J].上海房地,2020,(7):11-15.

猜你喜欢

上海市
上海市能源经济相关信息
——2022年1-6月
上海市能源经济相关信息
——2022年1-5月
上海市能源经济相关信息
——2022年1-4月
上海市能源经济相关信息
——2022年1-3月
上海市能源经济相关信息
——2022年1-2月
上海市能源经济相关信息
——2021年1-12月
上海市能源经济相关信息
——2021年1-11月
上海市房地产学校
下期见