APP下载

基于多元线性回归的城市商品房价格预测

2018-07-12陈林锋杨伟杰徐晓伦郝秀兰

电脑知识与技术 2018年14期

陈林锋 杨伟杰 徐晓伦 郝秀兰

摘要:根据 2008~2016 连续 9 年的历史数据对浙江省10个主要城市的商品房价格与居民消费水平、固定投资额、城市基础建设投资、人均总值等7个因素建立多元线性回归模型,通过在 95 %置信水平下的 F检验与 t 检验,分别确定了总体线性相关的显著性和各个变量影响的显著性,为识别影响房价走势的关键因素以及总体把握房地产市场的变化、完善房地产宏观调控具有重要的意义。

关键词:多元线性回归;显著性检验;房地产调控;影响因素;商品房房价

中图分类号:F293.3 文献标志码: A 文章编号:1009-3044(2018)14-0266-03

Abstract: After historical data in nine consecutive years (from 2008 to 2016) witnessed the relevance between the price of commodity houses of 10 major cities (Zhejiang Province) and other 7 factors like consumption level, fixed investment, investment of citys infrastructure construction and per capita, a multiple linear regression model was modelled. F-test and T-test under 95% confidence level respectively determined the significance of overall linear correlation and of each variables influence. All these are meaningful for recognizing the key factors that influence real estate tend and for mastering overall changes in real estate so as to improve macro-control on real property.

Key words: multiple linear regression; overall linearity; significant test; real estate regulation; influence factors; housing price

1 商品房价格和影响因素

中国房地产行业自2017年“3·17”政策变天开始,各种限制性手段无所不用其极,并将防范房地产泡沫列为中国经济的五大风险。这意味着,房地产作为最好投资的历史基本宣告结束。房地产市场的不稳定促使需要从定性分析转变为定量分析。比起定性分析,定量分析更接近于事实,更能直观的体现影响商品房价格变动的因素。因此,本文探讨了影响房地产需求的各个因素,并对各个因素对房地产价格的影响程度进行了分析。

影响商品房价格的因素复杂多样,本文选取商品房的平均销售价格(y)、居民消费水平(x1)、固定投资额(x2)、城市基础建设投资(x3)、人均总值(x4)、商品房销售面积(x5)、房地产开发投资额(x6)、财政收入(x7)作为主要因素,作为回归模型的解释变量。假设决策变量 Y 与解释变量 x1,x2,x3,x4,x5,x6,x7之间呈线性关系,则有七元线性回归模型:

其中,β0,β1,β2,β3,β4,β5,β6,β7为待估参数,ε 为随机干扰项。以我省杭州、寧波、温州、绍兴、台州、嘉兴、金华、湖州、衢州、丽水、舟山等10个城市2010~2016 年连续6年的数据。以杭州为例,建立以为样本,数据分别对应商品房当年的价格,居民消费水平、固定投资额、城市基础建设投资、人均总值、商品房销售面积、房地产开发投资额、财政收入。

2 模型的基本原理

研究在线性关系相关性条件下,两个或者两个以上自变量对一个因变量,为多元线性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型。多元线性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似,只是在计算上很复杂需借助计算机来完成。

1)计算公式如下:

设随机y与一般变量x1,x2,……xk的线性回归模型为:

其中β0~βk为k+1个未知参数,β0为回归常数,β1~βk称为回归系数;y称为被解释变量;x1~xk是k个精确可控制的一般变量,称为解释变量。当k≥2时,上式就称为多元线性回归模型。ε是随机误差,通常假设E(ε)=0,var(ε)=[σ2]。

2)多元线性回归模型的检验

由样本数据所建立的回归方程需要通过方程的拟合度、检验回归方程、方程系数的显著性等的检验后,才可用于实际解释解决实际问题。

在判定一个线性回归直线的拟合优度的好坏时,相关系数([R2])的平方是一个重要的判定指标。本项目使用Conway的著作《机器学习使用案例解析》中利用2个RMSE(RMSE是预测值与真实值的误差平方根的均值)的比值来计算[R2]的方法。具体见如下python函数:

其中y_test为实际测试集合,y_true为模型预测集合,y_mean为y_true集合取均值的结果。

当[R2]越接近1时,说明回归直线的拟合优度越好。

3)RMSE

F检验主要是检验因变量同多个自变量的整体线性关系是否显著。当检验被解释变量yt与一组解释变量x1, x2 , ... , xk -1是否存在回归关系时,给出的零假设:

设检验水平为a,检验规则是若用样本计算的F?Fa(k-1,T-k),则接受H0;若用样本计算F>Fa(k-1,T-k),则拒绝H0。

拒绝H0意味着肯定有解释变量与yt存在回归关系。若F检验的结论是接受H0,则说明k– 1个解释变量都不与yt存在回归关系。

通过python计算的F统计量与查F分布表所得的[Fα]=[F(k,n-k-1)]值比较即可。若F>[Fα]则可说明线性关系显著。

4)t检验(回归系数显著性检验)

当上述F检验结论是推翻H0时,并不见得每个解释变量都对yt有显著的解释作用,所以还应对每个解释变量的系数进行显著性检验,给出零假设

差。通过spss工具给出的t值的绝对值与查t分布表所得的[tα2](n-k-1)值比较,若t>[tα2]则可说明该回归系数影响显著。

5)多元线性回归的优缺点

优点:

(1)回归分析法在分析多因素模型时,更加简单和方便;

(2)运用回归模型,只要采用的模型和数据相同,通过标准的统计方法可以计算出唯一的结果,但在图和表的形式中,数据之间关系的解释往往因人而异,不同分析者画出的拟合曲线很可能也是不一样的;

(3)回归分析可以准确地计量各个因素之间的相关程度与回归拟合程度的高低,提高预测方程式的效果;在回归分析法时,由于实际一个变量仅受单个因素的影响的情况极少,要注意模式的适合范围,所以一元回归分析法适用确实存在一个对因变量影响作用明显高于其他因素的变量是使用。多元回归分析法比较适用于实际经济问题,受多因素综合影响时使用。

缺点:

有时候在回归分析中,选用何种因子和该因子采用何种表达 式只是一种推测,这影响了用电因子的多样性和某些因子的不可测性,使得回归分析在某些情况下受到限制。

3 模型建立及分析检验

根据分析得到可能影响到房价的几个因素,从网上得到了湖州市近几年的数据如表 1,首先根据表 1建立最初的多元回归模型Y=β0+β1X1+β2X2+…+β6X6,再利用spss软件,根据逐步回归的方法,可得到以下输出结果:(见表2~4)

由表可得最终预测模型为y=-16802.816-0.201x1-150.406x2-16.329x3+1.36x4+4.691x5-14.219x6。

(1)分析与检验

由表 2中得到的相关系数以及调整的多重判定系数很接近1,所以模型的拟合优度较好。

(2)显著性检验

再取显著性水平α=0.05,查F分布表可得[F0.05(6,2)]=19.33远小于表 3中统计量F值,说明该模型线性关系比较显著。根据表 4查t分布表可得[t0.025(2)]=4.303,只有人均生产总值这一个影响因素的t值小于[t0.025(2)],可见人均生产总值是主要影响湖州房地产商品房价格的因素。最后得到图 1的各预测值与实际值的对比可见该模型比较合理,可用于房价预测。

4 结语

本文根据最近连续9年的历史数据对浙江省主要的10个城市商品房价格与居民消费水平、固定投资额、城市基础建设投资、人均总值、商品房销售面积、房地产开发投资额、财政收入等 7 个因素建立多元线性回归模型,并分别对总体线性相关的显著性和各个变量影响的显著性进行了F检验法检验,识别出制约影响商品房价格的关键因素,可为有关部门在制定房地产调控政策、选择主攻方向时提供参考依据。房地产市场是关系到国计民生的复杂系统,受政治、经济、技术、环境等多个方面因素的综合影响。本文运用多元回归模型来分析影响城市商品房价格的主要因素,只是提供了一种可以借鉴的思路框架,数学里还有其他方法也可以做类似的分析,如果能够并行处理、综合考虑,结论可以更加精准。

参考文献:

[1] 陆红.房价大数据分析模型构建方法[J].数字技术与应用,2017(03):137-138

[2] 朱毓旻,邱扶东,吴文智.长三角旅游房地产价格影响因素研究[J].旅游论坛,2015,8(03):101-107.

[3] 鲁君四. 中国房地产业发展对经济增长的影响研究[D].吉林大学,2017.

[4] 唐鹤隽. 多元回归和神经网络在武汉市房地产预测中的应用比较[D].华中科技大学,2013.

[5] 董春游,丁立秋.我国房地产价格影响因素的实证分析[J].价值工程,2017,36(02):40-43.

[6] 周易. 中國房产价格的影响因素[D].浙江大学,2017.