基于ARIMA模型的衡阳市房价预测分析*
2021-11-09付淇伟易艳春张诗佳汤敏岚
付淇伟,易艳春,张诗佳,丁 嘉,汤敏岚
(衡阳师范学院 数学与统计学院,湖南 衡阳421001)
近年来,我国房地产市场存在着投资规模过大,城市房价泡沫化,供给结构不合理,市场秩序混乱等现象,针对这一系列现象,2015年政府推行了“限购限贷,限售限价”的调控政策;2020年国务院总理李克强发表了“坚持房子是用来住的,不是用来炒的定位,因城施策,促进房地产市场平稳健康发展”的观点[1]。在一项关于居民家庭资产的考察中显示:不动产类资产占比高达72%,其中住房贡献了59.1%,由此可见,住房在人们消费资产中占比之高。因此,不论是在个人层面还是国家层面,房价的预测都显得尤为重要。
在大数据背景下,针对如何准确预测房价走势及建立影响要素模型一直受到国内外学者的热切关注。而ARIMA模型是随机时间序列模型中的一种,排除了复杂的影响因素,仅是通过寻找历史数据之间的自相关性来预测未来,比较适用于房价的预测。吴承业等[2]基于ARMA模型,根据数据自身特性并运用对数变换和差分变换对杭州市房价进行预测及分析;郑永坤等[3]采用滚动预测的方法,基于ARIMA模型更加客观真实地对广州和深圳的二手房房价进行持续性预测;章晨等[4]采用自回归移动平均建立计量经济学模型,排除外部因素的影响并利用ARIMA模型对我国房地产价格预测。衡阳市作为省内副中心城市,房地产发展前景好,本文收集了衡阳市2016年到2021年上半年的房价数据,借助ARIMA模型对衡阳市房价进行分析预测。
1 ARIMA模型的基本思想
ARIMA模型的基本思想是将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列,这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。
根据时序图、ADF检验和QLB检验统计量判断序列的平稳性和纯随机性,若观察值序列不满足平稳性条件,可通过预处理将其转化为平稳非白噪声序列,其具体建模步骤如下:
(1)平稳:通过对数化,差分化等手段,对非平稳时间序列数据进行平稳操作;
(2)定阶:根据自相关系数图和偏自相关系数图确定ARIMA模型的阶数p,q;
(3)估计:估计未知参数,检验是否具有统计意义;
(4)检验:进行假设检验,借助Eviews软件检验残差是否是白噪声序列;
(5)预测:利用已通过检验的模型进行预测分析。2 ARIMA模型分析
2.1 数据分析
本文数据来源于安居客网站的衡阳市历史房价。由于国家对房价的严厉调控,一二线城市房价出现下跌行情,而衡阳市作为三线城市房价出现上涨,主要有两点原因,其一是目前行情已经触底,人口和政策促进衡阳经济继续腾飞,人们可支配收入增加,购买能力也变强,开始追求更舒适的居住环境,对新房屋的需求开始增加;其二是衡阳市新入市的土地价格已经框定,房价平稳上涨很正常。虽然房地产市场受到需求、供给、政策等诸多因素的影响,但通过整个的样本数据分析可以猜测房地产数据自身必然存在着一定的规律性,且各个数据之间存在着一定的相依性,这就意味着过去的行为对将来的行为有着一定程度的影响[4]。
2.2 平稳性检验
生活中绝大多数的时间序列所呈现出的都是非平稳的序列,进行随机性检验是为了确定没有随机趋势或确定趋势,否则将会产生“伪回归”问题。伪回归是说,有时数据的高度相关仅仅是因为二者同时随时间有向上或向下的变动趋势,并没有真正联系。这样数据中的趋势项和季节项等无法消除,从而在残差分析中无法准确进行分析。生活中绝大多数时间序列是非平稳的,因此对该序列进行平稳性检验是很有必要的。通过收集到的衡阳市2016到2021年上半年的房价数据绘制原序列时序图可知,衡阳市的房价具有很明显的上升趋势,不具备平稳性。但是由于图检验有一定的主观性,因此决定对原序列进行ADF(单位根)检验。
检验得到的三种模型下的P值分别为0.4162(常数项)、0.9653(带有常数线性趋势)、0.9583(无漂移项),在只有常数项的情况下,AIC、SC、HQ的值均最小,故根据这一情况下的检验可以得出序列不具有平稳性(均大于0.05,拒绝原假设)。
2.3 序列平稳化
由于ARIMA模型适用于平稳时间序列的分析,当时间序列存在上升或下降趋势时,模型的分析效果会大打折扣,为了使序列平稳化,可先对数据进行对数化处理,接着对取对数化的数据进行差分运算,得到趋于平稳的对数化二阶差分时序图,选取带有常数线性趋势的情况可以得出差分后的序列是平稳的(P值等于0.0000,远小于0.05)。
2.4 纯随机性检验
若一个序列彼此之间没有任何的相关性,是一个没有记忆的序列,过去的行为对将来的发展没有丝毫影响,这种序列称为纯随机序列。从数据分析角度来说这种序列没有任何分析的价值,而基于数据间蕴含的关联性进行研究才是有意义的,可以从这种关联性之间挖掘出有效的信息或者规律,可通过Eviews软件进行纯随机性检验,由图1的输出结果可知,延迟1-8期的p值均小于0.05,可证明该序列在短期内具有相关性,是一个非白噪声序列,在短期预测中能取到较好的结果。
图1 白噪声序列样本自相关图
2.5 模型的确定
2.5.1 模型识别
利用SPSS对处理后的平稳非白噪声序列进行自相关分析和偏自相关分析,由输出结果可尝试建立三种模型:(1)自相关系数呈现拖尾的特征,偏自相关系数呈现一阶截尾的特征,建立ARIMA(1,2,0);(2)自相关系数呈现拖尾的特征,偏自相关系数也呈现拖尾的特征,建立ARIMA(0,2,0)模型;(3)自相关系数呈现一阶截尾的特征,偏自相关系数呈现二阶截尾的特征,建立ARIMA(1,2,2)模型。
由于AIC准则和SBC准则可以改善对于自相关图和偏自相关图的主观判断性在有限接收范围内寻找相对最优拟合模型,故借助AIC函数以及SBC函数(该函数是对在AIC函数的基础上将未知参数个数的惩罚权重由常数2变成了样本容量的对数函数)的计算结果可知ARIMA(1,2,0)模型的AIC和SBC值达到最小,因此选择的ARIMA(1,2,0)模型拟合效果相对最优。
2.5.2 建立方程
求和自回归移动平均模型ARIMA(p,d,q)的模型结构为:
φ1=-0.358,显著性水平为0.006(<0.05),因此拒绝“系数显著为0”的原假设,故该系数对应的解释变量对被解释变量起显著作用。
将参数数据代入方程并简化得到本文建立的ARIMA(1,2,0)模型方程:Xt=1.642Xt-1-0.284Xt-2-0.358Xt-3+εt。
2.6 模型检验
2.6.1 判定系数
判定系数是回归平方和与总离差平方和的比值,它是对估计的回归方程拟合优度的度量,在统计学中用于度量因变量的变异中可由自变量解释部分所占的比例,以此来判断统计模型的解释能力[7]。如表1所示接近于1,达到了很好的拟合效果。
表1 模型统计资料
2.6.2 残差检验
并不是所有平稳性序列都值得建模,只有那些序列值之间具有较强的相关关系,且历史数据对未来预测有一定影响的序列才能挖掘出有效信息用来对事件的未来情况进行预测。故为了判断模型提取信息是否充分,需对拟合模型的残差序列进行白噪声检验,由ACF图和PACF图可看到其数值几乎趋近于0,但不等于0,序列数值间几乎不具有相关性,因此该残差序列通过白噪声检验,处理后的序列具有实际的预测意义。
2.6.3 模型拟合图
图2 给出了衡阳市房产价格观察值曲线与模型拟合值曲线的对比图,可以看到两条曲线基本吻合,拟合效果较好。
图2 模型拟合图
从模型统计量检验结果、残差检验图、模型拟合图三方面来看,均可判断模型是有效的,故模型用于实际生活中衡阳市房价预测是合理的。
2.7 模型预测
依据建立的模型对衡阳市2021年7-12月和2022年1-6月的房价进行预测,从预测结果来看,2020年受新冠肺炎疫情影响,衡阳市的房价有所变化,但也只是小幅度的波动,预测房价将呈现稳定增长,前期由于外部因素造成的震荡无法改变房价上涨的大趋势。根据最新公布的第七次全国人口普查的结果,衡阳市15-59周岁的人口数量在湖南省内稳居第二位;0-14周岁的学生数量稳居湖南省前三位。彰显着衡阳市未来发展的蓬勃动力和强劲势头,随着物价的上涨且伴随着三孩政策的开放,住房刚性需求增加,人口的增多等众多因素促进着衡阳市未来的房价会进一步的增长,见表2所示。
表2 衡阳市2021年7-12月和2022年1-6月房价预测结果
3 结论
3.1 房价走势
本文以衡阳市2016-2021年上半年的房价作为纵向研究数据,运用取对数法和差分法处理原本不平稳的序列,将数据最后变成非白噪声序列,采用ARIMA建立多个模型,经检验筛选出ARIMA(1,2,0)模型,达到了很好的拟合效果。由模型及分析预测结果看,衡阳市2021年7-12月和2022年1-6月的房价呈上涨趋势,可为有购房需求的市民提供一定的参考。
3.2 现存不足
文章还存在着些许不足的地方,ARIMA模型是基于房价数据本身的方法论,是从数据本身出发的,没有考虑到外在因素可能对房价造成的影响,比如政府宏观调控、居民收入水平、突发事件影响等;ARIMA模型只适用于短期预测,虽然根据表达式外推可以预测长期的数据,但是随着时间的推移,预测方差会越来越大,越往后数据越不可靠,在这点上还需进一步加强。在数据上,要求时序数列必须是稳定的或者是差分后的数据要稳定,而生活中绝大多数原始时间序列都需要经过一定手段方法才可达到平稳,在对数据进行平稳化的过程中过差分可能会导致原始数据的信息流失,预测精度降低。
综上所述,利用本文所建立的衡阳市房价预测模型去模拟衡阳市往年的房价数据,都达到了很高的拟合程度,但在具体的细节上还需加强把握,后续可以运用多种方法一起预测,对比结果看哪个更好,进一步加强预测精度。
3.3 建议
衡阳市未来短期房价仍然呈现缓慢增长的趋势,但是衡阳目前作为全国地级市前100强,均价却没有达到全国县级市房价100强的均价,说明了衡阳商品房市场仍然处于低谷状态,针对这一现状需要提出如下建议:
(1)吸引人口来衡居住,衡阳市虽然人口居于湖南省第二,但是人口流失大,需要政府出台人口来衡激励政策,加强公共设施建设,增加城市宜居度,吸引外来优秀大学生和工作人员来衡工作,促进衡阳市房地产的发展。
(2)严厉打击“炒房”行为,银行不应该对借机投资的贷款,对大额贷款拥有一定的敏感度或者一定程度上调整贷款的首付款比例和利率。
(3)购房者应树立理性的购房观念。端正购买的心态,正确衡量购买的利弊,不要随意投资购房。理性消费,促进衡阳房地产行业健康可持续发展。