APP下载

哈尔滨市二手房价格评估研究

2020-05-06杨凯博

合作经济与科技 2020年9期
关键词:权函数二手房权重

□文/杨凯博

(东北林业大学 黑龙江·哈尔滨)

[提要] 在房产税税基评估新要求下,房地产评估行业对于二手房价格评估有了更高的要求。本文基于特征价格理论,选取哈尔滨市主城区六区的13,694条二手房成交数据建立地理加权回归模型。结果显示:拟合优度R2为0.595,模型拟合良好,在保证评估精确度的同时,为二手房税基评估提供新思路。

一、引言

房地产批量评估一直以来都广泛受到资产评估界的关注。与传统针对个案使用成本法、收益法、市场法相比,批量评估能够快速、高效地确定房地产价值,在确定房产税税基等领域有着广泛地用途。

目前,国外学者将统计学与计算机技术相结合,研究出CAMA(Computer Assisted Mass Appraisal)、地理信息系统 GIS(Geography Information System)、人工神经网络ANN(Artificial Neural Network)等技术作为批量评估方法应用于房地产价格评估之中。我国仍处于使用传统特征价格模型阶段,一般采用基于特征价格理论的多元线性回归模型,然而使用传统OLS进行批量估价会忽略各个影响因素在空间上的变化。因此,从空间统计学出发应用地理加权回归模型,探索更加准确、公平的评估方法,有利于提高房地产估价的科学性和创新性。

二、数据处理与模型构建

(一)研究区域与研究数据。哈尔滨市共辖18个县级行政区,因其二手房成交量主要存在于主城区,其余行政区的二手房成交量较小,故选取包括南岗区、道里区、香坊区、道外区、松北区、呼兰区这六个主城区作为研究区域。哈尔滨主城区2019年二手房均价在第1至第44周上涨较为平稳,从45周开始有较大幅度上涨。为避免极端值对二手房价格评估模型的影响,选取2019年前三季度主城区六区的二手房成交数据,共获得成交记录13,694条,涵盖825个小区。

(二)变量选取。特征价格理论认为,房地产的价格可以分解为不同的特征变量进行反映,本文借鉴国内外对房地产价格批量评估的研究文献,结合哈尔滨市的实际情况,按照特征价格理论中的建筑特征、区位特征和邻里特征选取容积率、绿化率、物业费、建筑年龄、与最近小学距离、与最近公园距离、与最近三甲医院距离、与最近大型超市距离、最近地铁站距离、与最近公交站距离等10个特征变量作为影响哈尔滨市二手房成交价的空间分异因素。

(三)地理加权回归模型的构建。地理加权回归模型(GWR)是局部模型,主要思想是认为回归系数根据地理位置的变化而变化,考虑了数据在空间上的非平稳性,对每个样本点都设定了一系列的局部变量回归系数,样本点与拟合点间的地理位置间隔越小,权重越大,能够探测参数在区间内的非平稳变化,因此优于普通的线性回归模型。

构建完整的地理加权回归模型分为三步:

首先是确定地理加权回归模型的基本公式:

式中,(ui,vi)为第i个样本点的坐标,xik是第i个样本点的第k个解释变量,回归系数βk(ui,vi)是地理坐标(ui,vi)的函数。残差 εi~N(0,σ2),不同样本点 i和点 j的随机误差相互独立,协方差为0。

其次是空间权函数的选择。空间权重矩阵定量反映了地理要素之间的空间关系,是构造地理加权回归模型最关键的一步,不恰当的选择空间权函数将无法对参数进行有效估计。常用的空间权函数有以下四种:(1)距离阈值法:选取合适的距离阈值,然后将数据点与回归点之间的距离与阈值进行比较,如果二者之间的距离大于该域值,则赋予权重为0,否则为1。距离阈值法的实质其实就是划定一个判断范围,超出范围的距离点将不被赋予权重。距离阈值法虽然简单,但其缺点为分段函数,因此无法对参数进行估计。(2)距离反比法:在空间地理位置上距离回归点相近的数据点比相远的数据点对回归点的影响更强,因此在估计回归点的参数时,应对距离相近的数据点赋予更高的权重。距离反比法采用数据点与回归点距离倒数的一次方或二次方作为权重,但是当出现回归点与数据点重合时,二者距离为0,回归点观测值权重将变得无限大,而删除数据点将降低参数估计的精度,因此无法直接用于地理加权回归进行参数估计。(3)高斯核函数法:构建一个单调递减函数反映所赋予的权重与回归点和数据点之间距离两个变量之间的关系。用带宽描述权重与距离之间单调递减关系的快慢,带宽越大,权重随距离衰减得越慢,带宽越小,权重随距离衰减得越快。因此,高斯核函数可以克服上述空间权函数为分段函数的缺点,适合作为地理加权回归模型的空间权函数。(4)截尾型函数法:实际估计中,截去对回归参数没有影响的数据点,使其不参与回归模型的计算,并使用有限高斯函数代替高斯函数,最常用的截尾型函数为bi-square函数。bi-square函数可以视为距离阈值法和高斯核函数法的结合,在距离阈值即带宽范围以内的回归点,通过有限高斯函数计算并赋予数据点权重,在距离阈值即带宽范围以外的数据点,赋予的权重为0。通常地理加权回归模型选取高斯核函数法或bi-square函数法作为空间权函数进行参数估计。

最后是带宽的确定与优化。地理加权回归模型对选取高斯核函数法还是bi-square函数法作为空间权函数并不是非常敏感,但对其带宽的确定却非常敏感。因此,确定并计算合理的带宽是保证地理加权回归模型参数估计无偏性、有效性的关键,常用的方法有两种:(1)交叉验证法:应用于带宽确定时,表示对于回归参数进行估计时,将排除回归点本身,只根据回归点附近的数据进行参数估计,然后把不同的带宽和不同交叉验证到的CV值绘制成趋势线,当CV值为最小时,对应带宽为最佳带宽。(2)AIC最小信息准则:又称为赤池信息量准则,建立在信息熵的基础上,衡量所建立的模型的复杂程度和模型拟合数据能力的优良性。当模型有大量可供选择的参数时,应选取AIC值最小的。因为AIC值的大小与模型独立参数的个数呈反比,模型参数个数越少,AIC值越小;AIC值的大小与模型的极大似然函数呈正比,模型极大似然函数越大,AIC值越小。当模型参数较少时,模型较为简洁,当模型极大似然函数较大时,模型较为精确。因此,AIC值和评价模型拟合优度的调整R2类似,在评价模型对数据的拟合能力时兼顾了简洁性和精确性。当两个模型之间存在较大差异时,体现为两个模型的极大似然函数差别较大;当两个模型之间不存在显著差异时,参数越少的模型拟合能力越好,因此这个准则被称为最小信息准则。当利用AIC准则确定带宽时,有利于评价地理加权回归模型是否比多元线性回归模更好地拟合数据。

(四)结果分析。地理加权回归模型是对传统多元线性回归模型的拓展,因样本数据没有过于离散的点,故选取混合高斯函数作为空间权函数,拟合优度较好的交叉验证(cross-validation,CV)方法作为验证最优带宽方法。利用GWR4.0软件对样本点进行回归分析,模型评价采用拟合优度R2和比率检验指标进行评估。

根据回归模型计算结果OLS模型拟合优度R2和调整的R2为0.574和0.568,GWR模型拟合优度R2和调整的R2为0.595和0.587,说明地理加权回归模型的总体拟合效果较好,解释变量对被解释变量具有一定的解释能力。

为进一步分析二手房价格评估的精确性,引入国际评估协会(IAAO)对于房地产价格评估模型准确性与公平性判定的三项指标:比率中位数、离散系数、相关价格差异系数。比率中位数是将预测值与真实值相除得到的一组比率按升序或降序排列后取其中值的方法;离散系数是衡量回归结果离散程度的相对统计量;相关价格差异系数是评估结果累进性或累退性的统计指标。如表1所示,地理加权回归模型的三项评价指标均符合国际评估协会制定的标准,相较于传统的多元线性回归模型,地理加权回归模型在评估的精确性上更优。(表1)

表1 OLS模型与GWR模型比率检验指标对比一览表

三、总结

本文结合特征价格理论和地理加权回归模型对哈尔滨市二手房价格进行评估,一方面GWR模型克服了传统OLS模型无法解决的空间非平稳性问题;另一方面为批量评估房产税税基提供了一种可行的思路。对于大数据下的二手房价格批量评估研究,不仅要提高模型的精度,更要提高模型的运算效率。

猜你喜欢

权函数二手房权重
基于改进权函数的探地雷达和无网格模拟检测混凝土结构空洞缺陷工程中的数学问题
一类广义的十次Freud-型权函数
权重常思“浮名轻”
异径电磁流量传感器权函数分布规律研究*
为党督政勤履职 代民行权重担当
基于公约式权重的截短线性分组码盲识别方法
二手房买卖之卖方违约纠纷解析
下半年北京二手房或将迎来降温盘整
本市二手房成交量及价格走势图
抓住客户需求 促进交易达成——以二手房交易为例