空间计量模型在城市二手房批量评估中的应用
2021-09-18刘英
刘 英
(兰州财经大学,兰州 730000)
0 引言
在房地产经济活动增加的背景下,房地产估价行业在房屋征收补偿、房屋定价与租金定价等方面有着较大的需求,房地产批量评估技术有着较大的发展潜力。相对于评估中传统的三大方法,批量评估是一种新兴方法。本文认为批量评估是在传统的评估方法和资产价值的基础上形成的理论,是应用互联网及计算机技术、数理统计的方法、地理信息系统等工具,在一定的时间内对房地产价值测算的一种方法。
目前关于房地产批量评估的研究大多使用的是传统的特征价格模型,但是利用该模型的评估结果只体现出异质性,忽略了空间依赖性。近年来,随着地理信息系统的发展,空间特征模型成为处理空间数据的主要方法。与传统特征价格相比,空间计量模型认为数据是存在联系的,具有空间相关性和异质性。基于此,本文引入了空间计量模型,详细介绍如何利用该模型分析城市二手房的空间差异和影响因素,为今后房地产批量评估提供参考。
1 空间计量模型
1.1 空间权重矩阵
在空间计量模型建立之前,需要定义空间权重矩阵,其中的元素表示房地产之间的关系强度,其一般形式为:
其中,wij为空间权重矩阵中的每一个元素,用来表示不同区域之间的距离。在主对角线上,各个元素都为0,这表示样本和本身没有空间关联。如果研究样本之间有边界,则为“相邻”,此时wij=1,反之则为0。空间权重的定义还有一种方式是以样本间的地理位置为基础,只要样本单元i≠j,就认为存在空间相关性,样本之间距离越远,空间相关性越弱。
1.2 空间自相关检验
空间计量方法在使用之前应当对数据进行空间自相关检验,判断能不能用该方法。莫兰指数I 是最常用的检验方法。
1.2.1 全局空间自相关检验
I 的取值一般在-1~1 之间,I>0 的情况下区域观测值之间是正相关;I>0 表示负相关。
1.2.2 局部空间自相关检验
局部空间自相关检验可以观测局部地区样本的集聚分布情况,它也可以用散点图来检验。
1.3 空间计量模型的建立
1.3.1 空间滞后模型
空间滞后模型主要分析的是观察数据对临近的数据有无溢出的作用,引入了变量的空间滞后项,其表达式为:
公式中,Wy表示空间滞后的被解释变量;ρ 为空间滞后系数;X 为n×k 解释变量矩阵;β 是X 的相关参数;ε 为随机误差向量。在空间滞后模型中,一般用MLE 的方法估计。
1.3.2 空间误差模型
空间误差模型的一般表达式为:
其中误差项ε 存在空间依赖性,ε=λWε+μ,μ~N(0,δ2In)。W是空间权重矩阵;λ 为空间误差系数。在空间误差模型中,一般也用MLE 的方法估计。
2 基于空间计量模型的城市二手房批量评估程序
2.1 确定评估区域和对象
在评估对象确立之前首先要对评估区域展开科学的划分,批量评估时,同一区域内尽可能是同一类型的房地产,保证结论能体现出该分区的情况。在本研究中,可以选择某城市、某地区二手房为评估对象,选取时应注意二手房的种类。
2.2 数据的来源与处理
在数据的来源上,可以通过安居客、链家、房天下等房地产行业网站采集二手房的成交数据。在信息的采集方法上可以先从一个网站上收集,然后利用整理和删减数据,最后与其他二手房网站对比得到最终的数据。此外,可以根据具体案例利用百度、高德地图等软件及GIS 技术等为辅助工具对样本的数据进行采集处理。在数据的处理上,为减少模型在应用上的误差,可以处理其异常和缺失的数值,具体处理方法应结合案例选择。此外,也可在数据的时间维度上进行处理,数据的处理方式应根据所选数据的特点来判断。
2.3 特征变量的选择与量化
因变量应为二手房价格,具体选择可以根据案例来选,例如可以选取为某一小区的二手房的挂牌均价。关于自变量主要从建筑、区位和邻里三个方面的特征选取,同时考虑了学位这一因素。变量的选取主要是结合了城市二手房价格的影响因素,分为实际变量和虚拟变量两类。
2.3.1 建筑特征
(1)建筑面积:以房屋建筑实际面积量化,预测对房价有正向影响;(2)居室数量:以实际的居室数量量化,预测对房价有正向影响;(3)房龄:以建成年份到2021 年年数量化,预测对房价有负向影响;(4)容积率:以小区的容积率量化,预测对房价有负向影响;(5)物业费:以小区的物业费量化,预测对房价有正向影响;(6)绿化率:以小区的绿化率量化,预测对房价有正向影响;(7)朝向:为虚拟变量,按照均不朝南、一面朝南、南北通透的顺序分别赋值为0、1、2,预测对房价有正向影响;(8)装修情况:为虚拟变量,以毛坯、简装、精装、豪华装修的顺序分别赋值为0、1、2、3,预测对房价有正向影响。
2.3.2 区位特征
本文选取了小区到CBD 的距离,以小区到最近CBD 的距离来量化,预测对房价有负向影响。
2.3.3 邻里特征
有关邻里特征,本文从交通、学校、医院等周边因素进行分析。在交通方面,主要选取了小区到公交站、地铁站的距离,以小区到最近的公交站、地铁站的距离量化;在其他因素上,分别以小区到中小学、公园、医院、购物中心的最近距离来量化,以上因素预测对房价均有负面影响。
2.3.4 学区特征
以是否为重点学区为变量,以虚拟变量赋值法量化,非学区为0、普通学区为1、重点学区为2,预测该因素对房价有正面影响。
本研究中关于特征变量的选取和量化仅供参考,具体变量的选择还应根据研究对象的实际情况进行选择。量化变量之后可对样本数据进行处理,剔除缺失数据的样本,然后对样本的数据做一个描述性统计,得到小区均价,二手房的最高值和最低值。
2.4 空间计量模型的应用
2.4.1 构建空间权重矩阵
该步骤可利用GIS 技术得到估价对象的地理坐标数据,以此为基础,建立空间权重矩阵。
2.4.2 基于莫兰指数I 的自相关检验
相邻区域的样本观测值的线性关系如果为正,为高-高集聚或者低-低集聚;如果是斜率为负的线性关系,则为高值和低值的集聚,样本变量存在着空间负相关关系。如果是随机分布的特征,此时没有空间自相关关系,要选择传统的计量模型。此外,在局部检验时,通过散点图可以清楚地把握度量区域与相邻区域的相关关系。
2.4.3 模型估计
在空间相关性分析后,如果具有空间相关性,那么接下来需要利用空间计量模型对数据进行拟合。同时为了进一步研究空间计量模型在二手房批量评估的适用性,可以结合已知数据和特征变量,先用传统的价格模型对其交易价格的影响因素进行分析,然后与空间计量模型中的滞后和误差模型进行对比,得到各个模型的研究结果,分析判断空间计量模型的适用性和合理性。
3 结语
本文的研究不仅为城市二手房批量评估提供了新的思路,也为消费者在购房时如何进行区位和价格等方面的选择提供了参考价值。但是该研究还有一些不足之处:在特征变量的选取上,现实中影响城市二手房的价格因素较多,而本文只是选取了有代表性特征变量;在技术上,本文的研究主要是从房地产评估的视角出发的,但是研究对象涉及了很多方面,有复杂的学科知识。在数据的选取上,房屋真实的销售数据的获取较困难,数据可能有一定的缺失,导致模型出现一定的误差。
本文只是对模型的一个初步的认识,要想更好地研究城市二手房的价格,还需做出以下研究:首先,在特征变量的选取上,应根据具体案例的特点,结合其实际情况,对特征变量进行选取和量化。其次,在空间权重矩阵的构建上,由于其形式的多样性,不同类型的矩阵对模型估计的结果会有影响,因此在具体研究中应结合案例的实际情况构建,并且在未来研究中可以采用一些构建更接近真实状态的空间权重矩阵。最后在技术的应用上,应结合具体案例从多个方面出发,并结合互联网技术进行分析,提升其准确性。