基于Logistic回归房地产预警研究
2017-01-18吕思奇秦喜文赵春阳董小刚李巧玲
吕思奇, 秦喜文,2*, 赵春阳, 董小刚, 李巧玲
(1.长春工业大学 基础科学学院, 吉林 长春 130012;2.长春工业大学 研究生院, 吉林 长春 130012)
基于Logistic回归房地产预警研究
吕思奇1, 秦喜文1,2*, 赵春阳1, 董小刚1, 李巧玲1
(1.长春工业大学 基础科学学院, 吉林 长春 130012;2.长春工业大学 研究生院, 吉林 长春 130012)
通过主成分分析对房地产市场预警模型的影响因素进行分析,运用线性回归模型和Logistic回归模型对长春市房地产市场进行预测,并得出Logistic回归模型对房地产市场进行预警的结果优于线性回归模型。针对长春市房地产运行现状,提出土地、经济、行政等方面的建议。
房地产预警; 主成分分析; Logistic回归
0 引 言
我国房地产开始于20世纪80年代,至今仍是“十三五”期间我国经济社会发展的支柱产业。房地产市场预警系统具有预测功能、监测功能和调控与指导功能,对于我国房地产业的健康发展有重要意义。
1903年,英国学者利用“国家波动图”描述出英国宏观经济的波动;20世纪70年代,预警方法逐步成熟,主要成果有Frankel的单位概率模型、JPMorgan的单位对数模型、Hedonic价格指数、RS指数等[1];20世纪90年代以后,在房地产预警理论和研究方法方面主要以房地产经济周期波动理论为基础,Yoon Dokko等[2]提出了房地产价值周期模型、Sim G A[3]利用住宅数据对美国房地产市场周期模型做了综合检验。
对比国内外房地产的发展历程,均从宏观经济预警研究到房地产预警。模型预警法的实质是通过建立滞后模型进行回归分析。由于计算机的应用领域不断扩大,模型方法的运用范围越来越广,预警模型也逐渐成熟起来。目前,在房地产市场预警过程中出现不少新方法,如序贯判别法、马尔可夫链等预警方法[1]。
1 房地产预警的影响因素分析
房地产预警系统的设计应坚持定量化、系统化、明确化原则,主要从定性处理和定量处理两方面研究。根据房地产市场预警系统的基本理论与预警指标体系研究评述,文中将房地产预警指标划分为警情指标、警兆指标和警界区间三部分。
1.1 警情指标
房地产预警系统警情指标直接反映了当前房地产业发展的状况和当前供需的平衡状态。
1.2 警兆指标
对影响房地产业指标进行筛选,找出与销售率相关且先行的指标作为警兆指标。房地产业在中国处于发展初期,波动性大,因此,我们采用定性分析与定量分析相结合的方法,选择具有代表性的警兆指标。
1.3 警界区间
在预警区间判断时,需要对警兆指标值进行处理。警界区间的选取直接决定了预警结果的准确性。警界区间划分的方法主要有:u-σ法、正态归一化法、系统化方法和经验数据法。由于我国房地产市场波动比较大,所以警界区间的确定仍需要参考专家经验。
2 Logistic回归模型
一般的Logistic函数形式为:
在Logistic回归中,用pi=P(yi=1|xi)作为因变量,得到Logistic基本回归模型:
(1)
式中:pi----第i个案例发生事件的概率,它是由一个解释变量xi构成的非线性函数[3]。
Logit(pi)=α+βxi
Logistic回归主要步骤[4]如下:
1)选择自变量和因变量,通常因变量为二项反应变量;
2)将所有数据分成分析样本和检验样本;
3)检查模型的假设条件,Logistic回归模型中自变量是否相关,因变量的发生概率是否符合Logistic模型;
4)用回归估计的方法对回归参数估计,检验回归参数的显著性,并检验模型的拟合度;
5)解释估计结果;
6)利用检验样本进行检验。
3 实证分析----长春市房地产预警
3.1 数据来源
通过国家统计局和吉林省统计年鉴搜集整理了长春市房地产相关数据,根据2002-2014年的指标数据及对房地产运行情况的分析,选取12个警兆指标[5]。X1:地区生产总值;X2:固定资产投资额;X3:城镇居民人均可支配收入增长率;X4:房地产投资额;X5:竣工房屋价值;X6:房屋销售额;X7:商品房销售额;X8:新购置土地面积;X9:房屋施工面积;X10:房屋竣工面积;X11:房屋销售面积;X12:房屋空置面积。
由于搜集到的数据数值差异较大,需要将数据进行优化处理,即正向化处理和无量纲化处理[6]。
通过SAS软件对所有警兆指标进行相关分析,可以看出各警兆指标间存在强相关性,表示各警兆指标信息严重重合,需要降维处理来去除多余的重合信息。对数据进行主成分分析,得到前3个主成分的累计贡献率分别为82.25%、90.95%和94.77%,故调整原变量为3个自变量,计算出3个主成分的具体数值。
根据前3个主成分的特征根,可以得到反映长春市房地产市场景气情况的综合预警指数:
(2)
代入3个主成分的数值,即可以得到综合预警指数z的具体数值、均值及标准差。
根据这13年间长春市房地产市场的综合预警,通过3σ方法将预警系统划分为五大警界区间:过冷状态(-∞,-62.029),偏冷状态(-62.029,-31.015),正常状态(-31.015,31.015),偏热状态(31.015,62.029),过热状态(62.029,+∞)。
3.2 模型建立
选取长春市2002-2014年的指标数据,选择前3个主成分代表12个警兆指标作为自变量,通过SAS软件进行线性回归处理。
回归系数的估计值见表1。
表1 回归系数的估计值
根据表1可以得到线性回归模型:
(3)
与线性回归模型一样,Logistic回归模型的自变量为前3个主成分。由于因变量必须为定性变量,所以用数字1~5来表示过冷、偏冷、正常、偏热、过热等房地产市场运行状态,将其作为因变量,通过SAS软件进行多元Logistic回归分析[7-9]。
表2 最大似然估计
(4)
(5)
偏热:
正常:
偏冷:
综上,在其它因素不变的情况下,主成分z1、z2、z3的值越大,长春市房地产市场的运行状态属于偏热的概率越大,属于偏冷的概率越小,且z1对结果的影响比z2、z3对结果的影响要大。
3.3 回归模型检验
通过SAS软件进行多元Logistic回归分析,采用AIC检验法、SC检验法、似然比检验法对模型进行拟合优度检验,总体检验见表3。
表3 总体检验
由表3可见,模型显著性明显。从统计学角度来看,此次的参数估计是比较有效的。
3.4 结果分析
因此,模型得到2015年长春市房地产市场运行状况为偏热状态,与实际2015年长春市房地产市场情况相同,并存在房地产投资增速过快、房地产市场供需关系不平衡及房价上涨的幅度越来越大等问题。
对比线性回归模型与Logistic回归模型得到2015年长春市房地产市场情况的预测,线性回归模型得到的预测结果为过热状态,Logistic回归模型得到的预测结果为偏热状态,两者存在差异较小。根据长春市2015年实际的房地产市场状况,文中认为Logistic回归模型得到的结果更为准确。
4 结 语
选取长春市2002-2014年房地产数据,对比使用线性回归模型和Logistic回归模型进行预测,线性回归模型得到长春市2015年房地产处于过热状态,Logistic回归模型得到长春市2015年房地产处于偏热状态,两者存在差异较小。根据长春市2015年实际的房地产市场状况,认为Logistic回归模型得到的结果更为准确。
针对长春市目前房地产运行状况提出以下建议:
1)长春市房地产管理部门可根据现有的房地产状况,对土地的开发、改造、规划及价格评估做出改变,只有合理地规范土地,才能保证房地产处于健康的发展状态;
2)调节房地产的投资方向、物业价格、税收措施等方面的关系,合理安排房地产相关的所有经济内容;
3)政府慎重考虑城市规划、发展战略等政策,促进房地产业健康、良好、有序的发展。
[1] 郭峰.房地产预警系统研究综述[J].贵州大学学报:自然科学版,2005,22(4):380-383.
[2] Dokko Y, Edelstein R H, Lacayo A J, et al. Real estate income and value cycles: A model of market dynamics[M]. A Global Perspective on Real Estate Cycles. Springer US,2001:69-96.
[3] Sim G A, Sutton L E, Cameron A F. The mortgage meltdown, the economy, and public policy[J]. B E Journal of Economic Analysis & Policy,2009,9(3):145-151.
[4] 何晓群.多元统计分析[M].北京:中国人民大学出版社,2012.
[5] Huang F, Wang F. A system for early-warning and forecasting of real estate development[J]. Automation in Construction,2005,14(3):333-342.
[6] 叶宗裕.关于多指标综合评价中指标正向化和无量纲化方法的选择[J].统计科学与实践,2003(4):24-25.
[7] Zhao J, Zhao Y L, Duan Q Q. Modeling of regional real estate early warning based on logistic regression[J]. China Population Resources & Environment,2013,398:80-87.
[8] 黄兴柱.基于多元logistic回归模型的房地产预警研究[D].济南:济南大学,2012.
[9] 张家进,张卓勇,相玉红,等.Logistic回归算法结合近红外光谱对子宫内膜癌组织切片分类的研究[J].光谱学与光谱分析,2013,33(2):344-348.
Real estate early warning study based on Logistic regression
LYU Siqi1, QIN Xiwen1,2*, ZHAO Chunyang1,DONG Xiaogang1, LI Qiaoling1
(1.School of Basic Sciences, Changchun University of Technology, Changchun 130012, China;2.Graduate School, Changchun University of Technology, Changchun 130012, China)
We analyze the influential factors to the real estate market early warning model with Principal Component Analysis, and predict the real estate market in Changchun with both the linear regression model and Logistic regression model. It is suggested that the Logistic regression model is better than the linear regression model to give the real estate early warning. Our research can offer some references for the land, economic and administrative management based on real estate operation in Changchun.
warning of real estate; principal component analysis; Logistic regression.
2016-05-25
国家自然科学基金项目(11301036,11226335); 吉林省教育厅科研项目(2014第127号; 2013第142号)
吕思奇(1994-),女,回族,辽宁沈阳人,长春工业大学硕士研究生,主要从事统计计算方向研究,E-mail:864575427@qq.com. *通讯作者:秦喜文(1979-),男,汉族,吉林梅河口人,长春工业大学教授,博士,主要从事HHT理论与应用研究,E-mail:qinxiwen@ccut.edu.cn.
10.15923/j.cnki.cn22-1382/t.2016.6.17
O 29
A
1674-1374(2016)06-0603-04