APP下载

基于领先指标和ARDL模型的城市住宅价格预测——以北京市为例

2015-01-22刘广友

产业与科技论坛 2015年12期
关键词:协整领先房价

□ 刘广友

一、引言

2014年以来,我国房地产市场开始呈现明显的分化趋势。不同于以往各城市房价全盘持续上涨的态势,大部分城市房价增长乏力,甚至一些城市已有明显降价现象,对此政策指出要分城施策调节房地产市场。面临市场的新形势,对于作为市场主体之一的开发商而言,判断一个城市未来房价是走高还是走低或是保持平稳是其需要考虑的一个重要问题。因此,对城市未来房价趋势的前瞻性预测成为企业决策者制定投资和营销等决策的重要参考依据。

回顾近年来国内学者对城市房地产价格的预测研究,基于数据模型的量化方法占据主流并且可分为两大类:第一类是回归模型、时间序列模型等传统预测方法,如洪增林等[1]基于主成分回归模型的研究;曾五一等[2]、欧廷皓等[3]、黄鹂[4]、侯普光等[5]应用 AR、ARMA、ARIMA、VAR 等时间序列模型的研究;第二类是神经网络、灰色系统模型、支持向量机等现代预测方法,如章伟[6]、许芳等[7]、申瑞娜等[8]的研究。范晓[9]对比了两类方法的优缺点:传统预测方法简便,对价格短期预测效果良好;缺点是具有严格的假设条件,不能很好地刻画现实数据的复杂性特征。现代预测方法优点是对数据复杂性特征刻画能力较强、对价格长期预测表现较好,但存在方法复杂的缺点。本研究拟基于时效性高的月度数据作出向前三个月到一年时间的短期房价预测,对此传统预测方法较为适用。自回归分布滞后(ARDL)模型是一种近期应用较多的传统分析方法,俞姗[10]基于ARDL模型实证检验了我国消费物价指数的影响因素;刘园等[11]应用ARDL模型研究了我国房地产价格与银行信贷、经济增长和利率的关系。

基于ARDL构建房价预测模型的一个优点是可以用自回归项之外的其他变量引入房价领先指标来增强预测能力。从国内研究文献来看,目前尚无领先指标与ARDL模型相结合的城市房价预测研究。本文拟在所述理论基础之上,探索建立适用于城市房价短期预测的方法,并以北京市为例实证检验预测效果。主要研究步骤(图1)为:首先,完成领先指标的筛选和处理;其次,用ARDL检验方法检验所选领先指标对住宅价格的领先关系;最后,建立住宅价格的ARDL预测模型并评价预测结果。

图1 研究步骤图示(双线框表示研究步骤、单线框表示输入与输出)

二、理论基础

(一)房价领先指标。经济系统始终处于动态变化中,波动性是经济运行的重要特征。经济波动通常可以从统计指标数据的变动上反映出来,利用指标之间波动变化的时差关系可将指标分为先行指标、同步指标、滞后指标三类。其中领先指标的趋势变动在时间上有先导性,可以基于其提前变动对未来经济趋势作出前瞻性预测[12]。

房地产价格是房地产业的一个重要经济统计指标,其未来变动趋势与待投资项目未来投资收益水平或者销售项目所获利润高低紧密相关。房地产价格变动一方面受房地产销售量、供应量、开发成本等房地产市场和行业内部因素变动的影响。另一方面,因为房地产业与整体经济系统联系紧密,价格变动也受到宏观与国际经济、政策因素、人口与收入水平、财税金融、突发事件等多种外部因素的影响。可以从房价影响因素相关的统计指标中寻找房价领先指标,用以提前预测未来价格的变动趋势。曲线图法可用于识别领先指标,即用曲线图对比一系列统计指标曲线上波峰波谷等轨迹变动特征在时间轴上的相对关系,与选定的基准指标轨迹基本一致的指标称为同步指标,在时间轴上向前平移的指标称为领先指标,在时间轴上向后平移的指标称为滞后指标。根据曾五一等[2]、闫妍等[13]的研究,房企贷款融资、房企自有资金、房地产投资额、商品房施工面积、商品房销售面积、货币与准货币量、居民人均可支配收入、居民消费价格指数、工业品出厂价格指数、建筑材料工业品出厂价格指数、社会消费品零售总额等指标一般可作为房价的领先指标。

(二)协整理论与ARDL模型。时间序列平稳性是经典回归分析的基本假设,其含义是假设样本时间序列中随机变量的历史和现状具有可延续性并且能延续到未来,因此只有基于平稳时间序列的预测才是有效的。但是经济时间序列普遍都是非平稳的,如果直接对非平稳变量进行回归分析,即使方程整体及系数的统计值显著,所得出的也可能是完全虚假的结论,即存在“伪回归”问题[14]。常用方法是对非平稳变量进行差分或对数变换后变为平稳的变量建立模型。但是由于经济理论通常是建立在水平变量而不是差分或对数变换后的变量上,会导致含有新变量的分析结果不易用经济理论解释。

Granger的协整理论为非平稳时间序列提供了新的分析方法,他发现把两个以上非平稳的时间序列进行特殊组合后可能出现平稳性,即“协整”现象,存在协整关系的变量建立回归模型可避免伪回归。随后EG(Engle-Granger)和JJ(Johansen-Juselius)等协整检验方法在涉及非平稳序列的研究中得到了广泛应用,但是这些协整检验方法存在两个缺点:一是参与检验的所有变量必须同为I(1);二是小样本条件下检验不稳健。Pesaran等[15]提出的ARDL边限检验法可克服这两个缺点,以下为ARDL建模过程简述[10]:

在时间序列自回归模型中引入一个或多个预测变量及其滞后值即成为一般的自回归分布滞后(ARDL)模型。以两变量X与Y为例,设Y为因变量,X为自变量,一般ARDL模型如式(1):

其中p和q分别为变量Y和X的最大滞后期数,ε为误差项且满足E(ε)=0。

Pesaran是在式(1)导出如式(2)的ARDL-ECM模型基础上,检验变量之间是否存在协整关系:

检验的原假设是变量X与Y之间不存协整关系,即H0:θ1=θ2=0;备择假设是 H1:θ1≠0 或者 θ2≠0。通过 Wald 统计方法给出的F统计量检验θ1和θ2的联合显著性。Pesaran等[15]给出了各种模型形式的上下限临界值,当所有变量最高阶数为I(0)时比较下限值,为I(1)时比较上限值,如果F统计量大于对应的下限或上限,则拒绝原假设说明变量之间存在协整关系。不同滞后期变量之间存在的协整关系称为滞后协整[16],式(3)表示变量序列Y与X从滞后j0期起始的多个滞后期变量序列之间存在协整关系:

若存在长期协整关系,即可利用AIC或SC信息准则并结合其他模型诊断标准确定ARDL模型中各变量的滞后阶数。承式(3),Y与X的长期均衡关系可表达为如式(4)的一般ARDL模型:

承式(4),表示短期动态关系的ARDL-ECM模型如式(5):

其中,ecmt-1为短期失衡向长期均衡调整的误差修正项,γ为误差修正系数,表示短期失衡向长期均衡调整的速度。

三、实证分析

(一)领先指标初步筛选。从北京市统计信息网、中国人民银行网站等信息来源收集了2008年1月至2015年3月期间多项与房价影响因素相关的月度经济统计指标,包括住宅销售均价、住宅销售面积、二手房均价、房企到位资金、房企银行贷款、全国货币供应量、城镇居民可支配收入、居民消费价格指数等作为待选指标。由于同比数据是与上年同期的比较,可排除季节性因素从而更好地反映出经济指标的变化趋势[17],所以可以绘制同比曲线图来初步筛选房价领先指标。

图2 住宅价格、销售面积、到位资金同比曲线图

从图2所示的同比曲线图发现,销售面积领先房价约10个月左右;到位资金领先房价约4个月左右。其他指标由于领先关系不明显或者无领先关系,图上未绘出。其中:银行贷款领先期过长、波动幅度大,且到位资金中已包含银行贷款,所以被排除;全国货币供应量、城镇居民可支配收入与住宅价格之间未发现明显领先关系;二手住宅价格、居民消费价格指数滞后于住宅价格。

图3 北京市新建住宅平均价格

(二)指标数据来源与处理。同比数据虽然可以很好体现领先关系,但是存在较长滞后性而不能灵敏地反映近期变化。所以在之后的协整检验和预测模型中,以各指标月度水平值来分析建模。综合可获得的各项指标样本数据的时间范围,全样本期定为2010年1月至2015年3月。北京市新建住宅均价数据(图3)来源于中国房地产指数研究院按月发布的百城房价指数报告。收集到的最早报告日期为2010年6月,为了适当扩大样本量,利用报告中同比数据推算出2010年1月到5月的平均价格。

图4 北京市住宅销售面积

图5 北京市房地产企业到位资金

住宅销售面积(图4)和房地产企业到位资金(图5)数据来源于北京市统计信息网。由于原始数据为当年逐月累计数据,首先通过累计倒减方法计算出每月新增数据,1月和2月的数据都按前2个月累计数据的1/2计算。对原始数据作图发现,每年11~12月数值明显偏高,这既包含企业临近年末的业绩冲刺或集中结算导致数据偏高等合理因素,也包含一部分由于统计数据上报中存在的问题导致的数据偏差。由于原始数据存在季节性因素,用X-13-SEATS方法对其作季节调整。在随后的协整检验和预测模型中,使用能够更好地反映数据变化趋势的数据季节调整所得趋势分量。

(三)ARDL边限检验。ARDL边限检验方法要求待检验的变量序列的单整阶数不能超过I(1),否则检验结果是无效地。表1是ADF和PP两种单位根检验方法的结果,经检验变量序列S为I(0),变量序列P和M都为I(1),符合ARDL边限检验的要求。

对变量P、S、M构建式(3)所对应的ARDL-ECM模型:

ΔPt=+θ2St-j0+θ3Mt-k0+εt(6)来检验P与S、M之间是否存在统计上的滞后协整关系。由于变量P的自相关图拖尾、偏自相关图1阶截尾,故之后协整检验和预测模型中只需考虑P的1期滞后项。根据图2判断,可对S和M按各自可能的最大滞后期12和6开始降阶进行滞后协整检验,由于小于3个月的预测实际意义较小,故检验中考虑的最小滞后期为3。由于要对比领先指标在不同滞后期的显著性,所以每次检验中只考虑S和M各自最多只有一个滞后值参与的情况,即(6)式中j0=p2和k0=p3。在P与S、M组合的共46个ARDLECM模型中,有表2所示共15个模型的F统计值通过检验,说明15个模型中变量S、M或者变量组合与变量P之间存在滞后协整关系。

从检验结果可知:销售面积S对住宅均价P存在统计意义上滞后5~10期不同显著程度的协整关系,即经济意义上领先5~10个月的关系;到位资金M对住宅均价P存在滞后3期的协整关系,即经济意义上领先3个月的关系。从同时考虑销售面积S、到位资金M对住宅均价P的检验中,发现前两者最显著的滞后期数都有后移的现象,比如销售面积S的滞后5期显著度降低、滞后8期和9期的显著度增加,同时到位资金M的滞后4期也变得显著。

(四)ARDL预测模型及其误差评价。由于滞后期较长的变量S在滞后6~8期时协整关系比较显著,所以将全样本期最后8个月即2014年8月至2015年3月作为预测期,2010年1月至2014年7月作为估计期,分别用来对比预测误差和估计预测模型。为模拟真实预测情况,估计期数据按上文所述方法由原始数据重新处理得到。

住宅均价P与销售面积S和到位资金M存在滞后协整关系,即可构建(4)式对应的一般ARDL模型:

在现实中当期住宅价格可能受到之前多个不同领先期数的销售面积和到位资金的滞后影响,则预测模型中领先指标变量的多个滞后期可以同时进入模型。随后在按照不同滞后期变量组合估计出的多个整体及变量系数都显著的模型中,依据AIC和SC准则选出如表3所示4个较优的预测模型:

表1 变量单位根检验结果

表2 变量的ARDL边限检验结果

表3 北京市住宅价格预测模型(估计期)

在以上4个模型中,模型1和2中变量M的最小滞后期为3,所以只能作出向前3期预测;而模型3和4中变量S的滞后期分别为8和9,可以作出向前8~9期预测。4个模型的预测值和实际值见表4。

表4 2014年8月至2015年3月北京市住宅价格预测结果

对比MAPE值发现:模型1和2预测期数较短,但同期预测误差较小;模型3和4预测期数较长,但预测误差较大。在实际应用中可以按模型1或2预测最近3个月住宅价格,然后按模型3或4预测向前4至8或9个月的住宅价格。用全样本期数据重新估计4个预测模型的参数,对2015年4月至12月北京市住宅均价预测结果如表5,数据表明未来住宅价格会有小幅上升。预测准确性需要未来实际数据的检验。

表5 2015年4月至12月北京市住宅价格预测结果

四、结语

第一,从预测误差来看本方法具有较高的预测准确度。这得益于三点:一是ARDL边限检验方法可以较好地检验变量之间的滞后协整关系,滞后期的识别较为显著;二是领先指标有助于提高预测精度,4个预测模型前3个月的同期比较发现,同时用销售面积和到位资金比单独使用销售面积预测精度更高;三是模型使用数据季节调整后的趋势分量,避免了因原始数据的较大波动而导致的预测价格的大幅偏离。第二,实证结果与北京市实际情况相符。本文以2010年1月至2014年7月作为估计期构建预测模型对2014年8月至2015年3月房价进行模拟预测,预测值和真实值偏差较小,而且与此期间北京市房价基本平稳的实际情况符合。以2010年1月至2015年3月全样本期数据构建模型预测出2015年4月至12月北京市房价将会小幅上涨。第三,本研究的几点不足:一是由于缺乏城市范围和月度频度的统计数据导致一些领先指标数据不可得,模型所考虑的领先指标不全面;二是预测值受上期房价的影响偏大,受领先指标影响偏小,可能是由于缺少必要的领先指标;三是对式(5)表示的短期失衡向长期均衡调整的误差修正模型未作实证讨论。

[1]洪增林,马卫鹏,余永林.基于主成分回归分析的西安房地产价格走势[J].陕西广播电视大学学报,2013,15(1):72~77

[2]曾五一,孙蕾.中国房地产价格指数的模拟和预测[J].统计研究,2006,9:27 ~30

[3]欧廷皓.基于ARMA模型的房地产价格指数预测[J].统计与决策(理论版),2007,7:92~93

[4]黄鹂.我国房屋销售价格指数 AR模型的预测分析[J].统计与决策,2013,7:75 ~78

[5]侯普光,乔泽群.基于小波分析和ARMA模型的房价预测研究[J].统计与决策,2014,15:20 ~23

[6]章伟.粗糙集BP神经网络在房地产价格预测中的应用[J].计算机仿真,2011,28(7):365 ~368

[7]许芳,邹婧.GM(1,N)模型在重庆市房地产价格预测中的实例分析[J].广东技术师范学院学报(自然科学),2012,1:49 ~53

[8]申瑞娜,曹昶,樊重俊.基于主成分分析的支持向量机模型对上海房价的预测研究[J].数学的实践与认识,2013,43(23):11 ~16

[9]范晓.我国价格预测方法文献研究[J].开发研究,2014,5:105 ~109

[10]俞姗.我国物价波动影响因素的实证研究——基于ARDL-ECM的预测检验[J].福建师范大学学报(哲学社会科学版),2011,6:19 ~25

[11]刘园,韩斌.我国银行信贷与房地产价格关系的实证研究[J].统计与决策,2012,17:154 ~157

[12]蒋润祥,姚敏,孟秋敏,芦国荣,何彩虹.经济先行指标体系实证研究——基于甘肃省的时间序列数据[J].甘肃金融,2012,4:31 ~36

[13]闫妍,许伟,部慧,宋洋,张文,袁宏,汪寿阳.基于TEI@I方法论的房价预测方法[J].系统工程理论与实践,2007,7:1 ~9

[14]田立法.关于非平稳数据“伪回归”的解析[J].统计与决策,2014,3:17 ~21

[15]M.Hashem Pesaran,Yongcheol Shin and Richard J.Smith.Bounds Testing Approaches to The Analysis of Level Relations[J].Journal of Applied Econometrics,2001,16:289~326

[16]郭淑会.多元时间序列的滞后协整分析[D].武汉理工大学,2007

[17]谢安.浅析我国消费价格指数中的“环比”与“同比”[J].数量经济技术经济研究,1998,8:19~22

猜你喜欢

协整领先房价
两大手段!深圳土地“扩权”定了,房价还会再涨?
我国铁钌接力催化氨合成技术国际领先
防范未然 “稳房价”更要“稳房租”
外商直接投资对我国进出口贸易影响的协整分析
外商直接投资对我国进出口贸易影响的协整分析
潍柴:从领先到引领
河南金融发展和城乡居民收入差距的协整分析
河南金融发展和城乡居民收入差距的协整分析
去库存的根本途径还在于降房价
2016房价“涨”声响起