APP下载

特征价格模型对房地产税税基评估的适用性

2015-11-05杨杉邓科

商业研究 2015年6期
关键词:房地产税主成分分析

杨杉 邓科

摘要:以房地产的评估值作为税基是房地产税立法征收的必由之路,也是国际通行作法。如何更好地求取城市房地产的价值是房地产税制改革必须面临的重要课题。国际上,不动产税基评估主要依靠“计算机辅助批量评估系统(CAMA)”实现,而CAMA系统的核心是建立估价模型。本文以成都市当前存量住宅数据为例,基于主成分分析和对数回归分析,建立特征价格模型,就房地产税税基的批量估价进行实证分析,并利用比率分析对模型估计值的可靠性进行评估。研究结果表明各项评估指标均理想,通过模型求取的估值可靠性很高,模型可以被应用和推广。

关键词:房地产税;特征价格;估价建模;多元对数回归;主成分分析

中图分类号:F2933文献标识码:A

一、引言

税基是一个税种最基本的税制要素。房地产保有性质税种的税基有原值、净值、评估值等,在加拿大、美国、澳大利亚、德国等国家和地区主要以评估值作税基。在我国,房产税(1986年)在设立之初,考虑到房地产市场还不发达、物权不清晰、评估力量薄弱等国情,并没有以评估值作税基,而是以计税余值或租金替代;土地方面则是以分等级的土地面积作为土地税的税基。房地分离是我国房地产保有税收的基本现状[1]。如今,房地产业已成为我国最重要的支柱性产业,房地产已高度商品化,《物权法》的出台使得产权制度更加清晰,房地产登记正趋于完善。在这种新的现实背景下,老的房地产保有税收呈现出税制设计不合理、税负不公、征管不便等诸多问题,为此,党的十八届三中全会明确提出要“加快房地产税立法并适时推进改革”[2]。

如何确定房地产税的税基?国际通行做法是按评估值计征[3-4]。如何公平合理地确定大量房地产的评估值?房地产评估分为个案评估(case appraisal)和批量评估(Mass appraisal)。简单地说,个案评估就是对某一宗房地产进行估价,批量评估就是对大量的房地产一次性估价。批量评估技术由于其效率高、成本低、一致性强等优越性更加适宜房地产课税性质的估价。

国际估价协会(International Association of Assessing office,IAAO)对批量评估的定义为:在给定时间,使用标准方法,采用共同的数据,考虑统计检验,对一系列房地产进行评估的过程。一般情况下,批量评估需要应用计算机辅助批量评估系统(Computer Assisted Mass Appraisal,CAMA)。这是一个以大量房地产特征数据为基础,以自动评估模型(Automated Valuation Model,AVM)为核心的计算机软件系统,其核心是建立估价模型[5]。因此,本文提出基于主成分分析和对数回归分析的特征价格模型,就房地产税税基的批量估价进行实证分析。

二、特征价格模型

(一)特征价格模型理论概述

房地产和一般商品不同之处在于其具有很强的异质性,价格形成因素复杂。一般商品在考察偏好和效用时主要从个体行为出发,而房地产还要考察产品本身的差异。消费者理论认为消费者并非从消费品本身得到效用,真正的效用来自于商品的特征[6]。房地产总价可以用这些特征进行组合并解释,而特征的数量以及特征价格可通过回归分析得到。常见的房地产特征属性包括交通、配套、景观、朝向、位置等区位特征;建筑结构、建筑外观、装饰装修、设施设备、面积、空间布局等实物特征;土地属性、土地使用期限、规划条件等权益特征[7]。

因此,特征价格模型可以理解为:一种处理异质产品差异特征与产品价格间关系的模型。房地产交易情况和市场供需、货币购买力等虽然也是影响房地产价格的因素,但是这些因素都不是来自于产品本身,所以特征价格模型一般不予考虑。

特征价格模型并没有脱离个案的房地产估价基本理论,不同的是估计方法[8]。区别主要在于:一是个案估价主要依靠估价师职业判断特征变量的数量和特征变量系数,批量估价中的特征价格模型则是依靠参数估计确定特征变量的数量和特征变量参数;二是个案估价是在可比实例的总价上乘以百分率体现特征变量对价格的影响力,批量估价则是将估值 “拆分”开来,通过回归系数体现特征变量对价格的影响力;三是个案估价除了房地产特征变量,还要考虑市场和交易对价格的影响,特征价格模型则相反[9]。

(二)特征价格变量分析

1.发现特征变量

若要用特征变量模型对房地产进行批量估价,面临的第一个问题往往就是如何发现影响房地产价格的特征变量,这一般是由经验丰富的估价师来解答。由于批量估价的对象众多且往往集中在某个区域,估价师需要首先把影响这个区域房价的因素统统罗列出来。有时,通过访问房地产的业主或商户能够获得意外收获。如果有大量关于特征变量的规范化描述与成交案例,就能通过统计分析确定最终可以用于估价的特征变量及其系数。

2.特征变量与价格的关系

一般情况下,特征变量与价格之间都呈线性关系,即特征变量越是良好,房地产价格就越高,反之越低。多数时候,当特征变量良好到一定程度,对价格上涨的贡献就呈边际效应递减效应。比如,从郊区外至市中心,假设其它因素不变,生活配套这一特征变量越接近市中心越完善,但房价上涨的势头却在接近市中心的某个区域起越来越弱。当然,一些特殊的特征变量与房价的关系并非线性关系,常见的有楼层这个特征变量:一些高层电梯公寓密集的区域,低层的房屋视野差房价低,中间段楼层适中视野开阔房价高,越接近顶楼房价反而越低。不过,这种案例的样本往往并不普遍,基本不会影响我们对大范围的房地产建立估价模型。

当较多特征变量放在一个模型中时,还会面临这些特征变量对房地产价格影响力边界不同的问题,比如1个垃圾站对周边10个铺面产生影响,1个停车场对周边30个铺面产生影响,1个地铁口对周边50个铺面产生影响。而特征变量模型对一个较大区域建立模型时,影响力弱的垃圾站可能因不显著而被排除出特征变量行列。

3.特征变量之间的关系

特征变量之间的自相关常常会导致我们过多地估计某几个特征变量对于房价的贡献,或者无法满足一些模型的建模条件。比如,如果银行网点、行政中心、餐娱集中度三个特征变量对房价的解释力可能相同,有效的做法是把这三个特征变量整合为商业配套一个特征变量。

(三)模型及校准

住宅的特征价格基本模型是:

p=f(x1,x2,x3…xn)

其中,p为房地产价格,x1,2,…,n为特征价格变量。

模型校准是通过统计学参数估计确定变量的个数及其贡献。常用的模型校准方法有多元回归(MRA)、人工神经网络(ANN)、自适应回归(AEP)等估计方法。其中多元回归(MRA)是目前应用最广泛,也是受国际估价协会(IAAO)认可的方法。由于在房地产估价中,特征变量一般情况下与房价都是呈线性关系,满足用多元线性回归建模的前提条件。

多元线性回归的基本原理是通过对变量、误差的假定,用最小二乘法来拟合因变量与自变量的线性关系,从而建立数学模型。最小二乘法的涵义简单地讲就是使样本与曲线误差最小的一种估计方法。多元线性回归具有估计方法成熟、容易理解、容易代入软件等优点,但需满足必要的假设条件,如自变量与因变量呈线性关系、误差正态分布、自变量独立分布等假设前提。多元线性回归的函数公式分为一般线性、对数、半对数形式。

线性模型:p=β0+∑ni=1βiΧi+ε

此函数β0是常数项,Χi代表特征变量,βi为特征变量的偏回归系数。标准化的βi代表自变量与因变量的关系,说明该特征变量对房地产价格的“贡献”。ε代表估值与样本的误差。线性模型的优点是容易理解,缺点是无法解释特征变量对房地产价格的边际效应。

半对数模型:lnp=β0+∑ni=1βiΧi+ε

此函数特征变量采用线性形式,因变量采用对数形式,偏回归系数代表特征变量每变动一个单位时,特征价格随之变动的比率。

对数模型:lnp=β0+∑ni=1βilnΧi+ε

此函数特征变量和因变量均以对数形式进入模型,偏回归系数代表特征价格的弹性,即在其它特征变量不变的情况下,某特征变量每变动一个百分点,特征价格将随之变动的百分点。此函数的优点是可以解释特征变量对房地产价格的边际效应。

在房地产估价中,因房价走势更符合对数形式,因此用对数模型或半对数模型对房价进行批量评估是更适合的模型选择。

(四)特征价格模型技术路线

运用特征价格模型对一个城市房地产进行批量评估,需要制定一套技术路线。一般情况下,用特征价格模型进行CAMA系统建设,遵循如图1所示的技术路线。

(1)评估分类是将城市的房地产按照一定原则进行分类,如住宅、写字楼、综合体、临街商铺、工业厂房、酒店、加油站等。评估分类的目的是使得影响房价的因素能够在模型中更加“明显”而富有规律。(2)确定估价方法是根据房地产类型确定使用什么样的估价方法。一般情况下住宅更适宜用市场比较法,收益性房地产适宜用收益法,其它类型房地产可以使用成本法评估。(3)评税分区是将分类后的房地产按照样本价格、规划或其它容易识别的边界进行细分,其原则是更加有利于模型的显著性。(4)制定数据采集方案工作需要熟悉本地并有丰富评估经验的估价师参与,重点在于挖掘影响房价的各种特征变量。(5)数据采集工作是CAMA建设中工作量最大,涉及人员最多且不可逆的工作,决定建模成败。随着科学技术特别是空间地理信息(GIS)普遍应用,数据采集工作变得不像以前那样艰巨。(6)数据量化就是评估人员将采集来的描述性信息量化为可以进行模型分析的表格,如对建筑结构为钢混的赋值为1、砖混赋值为2、砖木赋值为3。(7)建模及检验是根据量化后的数据利用SPSS等统计软件进行建模分析和检验,最终得到估价模型。(8)比率分析是将通过估价模型求取的估值与样本进行比较,确定样本数据质量和模型的可靠性。(9)最后一步是将模型导入设计好的CAMA系统中,完成整个CAMA系统建设。自此,就可以对区域内的任一房地产进行自动估价了。

三、特征价格模型构建——基于成都市住宅样本

实现税基评估有两个最重要的环节:一是数据采集;二是模型构建。其中,数据采集是基础,模型构建是核心。

(一)样本分析

构建特征价格模型离不开特征价格样本数据。根据建模需要,我们选择成都市住宅作为样本进行分析研究。由于构建特征价格模型是在评税分区的基础上进行的,因此我们在成都市住宅总体数据上选择整层抽样方式,确定一个评税分区作为样本进行建模,并对这些样本进行二次随机抽样,留存48个样本用于比率分析。评税分区的范围属于成都市成华区,西起二环路,东至三环路,南起双桂路、迎晖路,北达成华大道。该区域属于成都历史上老工业基地较为集中的城东片区,职工安置房、房改房较多,和成都市城南、城西片区相比,配套建设起步较晚,分布不太均匀。样本区域内,主要的生活配套有沙河湿地公园、塔子山公园、东郊记忆音乐主题公园等。近年,随着城东老工业区搬迁改造工程,新建了一批较为高档的住宅小区和配套设施,如华润二十四城、花样年·花郡、优品·尚东等小区和万润·万象城等大型城市综合体。

我们在评税分区内共采集样本量429个。特征价格指标有标准房、建筑结构、建成年代、朝向、建筑类型、文娱、市政、生活、交通便捷度、污染状况、绿化、公共配套等共30个,具体见表1。其中,多层房屋楼层主要集中在2楼,电梯公寓主要集中在8-12楼。由于成交案例不易采集,我们用标准房代替,即个案评估值。标准房价格的价值日期统一为2012年3月。其它特征价格变量由估价机构现场采集完成。

(二)模型构建与分析

1.模型选择和数据处理

由于考虑到特征价格变量对房地产价格的边际递减效应,我们选择半对数模型进行分析研究,将因变量标准房价格转换为对数形式。为方便建模,我们对采集的样本进行标准统一的变量赋值。同时,为后续相关性分析方便,我们将度量标准统一为数值型变量,如表2所示。

其中,每一个指标的状况都分成若干档次进行评估。如污染状况分为四个档次:(1)无污染(远离污染源、无污染、环境清幽、利于居住);(2)无明显污染(周边无有害异味、无明显噪声,距污染源有一定距离,不影响居住);(3)污染较严重(接近污染源,偶尔能嗅到有害异味,周边环境长期较脏乱、临近噪声、粉尘污染的工矿企业、交通主干道、喧闹的市场、公厕、垃圾中转站等影响居住环境的不利因素);(4)污染严重(位于污染源,能嗅到明显的有害异味或环境长期脏臭无人治理;飞机噪声、工业噪声90分贝以上;邻早5时前或晚10时后喧闹的市场;邻变压器、高压线、大功率无线发射站等)。

2.相关性分析

相关性分析的主要目的是分析特征价格变量与房地产价格之间是否有显著的线性关系。由于在变量赋值时,我们将所有变量都设为数值型变量,因此可以使用pearson相关系数进行判定。通过SPSS求出的相关性分析结果显示,房屋朝向、交通限制、电梯、安全通道四个变量与房地产价格的相关性水平较低,于是将这4个变量从模型中排除,剩余26个特征价格变量。

3.多重共线性诊断

进行多重共线性诊断的目的是看特征价格变量之间是否具有线性关系,即某个特征价格变量是否能够近似地用其它特征价格变量的线性组合来描述。具有多重共线性的后果是回归方程偏回归系数既无统计学意义也无经济意义,同时导致R2趋向1,给出虚假的回归效果好的结论,特征价格变量与房价的关系难以被准确解释。

通过SPSS多重共线性诊断,观察共线性统计量VIF值发现:文娱、市政、开发商信誉三个变量VIF值大于10,具有严重的多重共线性,建筑结构、是否学区房、周边治安、物业管理具有较强的多重共线性。这是因为样本的特征价格变量是由估价师根据经验选定的,只要估价师认为对房屋价格有影响的指标都被纳入,并没有考虑特征价格变量显著性和共线性问题。此外,在样本个数只有429个情况下,特征价格变量达到30个,也容易导致出现多重共线性。

4.主成分分析

解决多重共线性问题最主要的方法是进行主成分分析。主成分分析是利用降维的思想,把多个变量转化为少数几个互相无关的综合变量的多元统计分析方法,即将部分变量进行合并。主成分分析结果如表3所示。

通过SPSS进行降维,观察“解释的总方差”表,虽然代入的前7个主成因提取平方和载入的“合计”数大于1,但“累计百分比”只有7652,说明主成因只能解释7652%的变量。经过权衡,当主成分为9个时,初始特征值“合计”为0807,“累计百分比”为82829,最为理想。

5.回归分析——主成分因子建模

(1)显著性检验和方差分析。通过SPSS分析,利用9个主成分可以得到3个对数线性回归模型。三个模型复相关系数R=0991,调整R2=0982,说明自变量与因变量之间的线性关系很好,模型拟合度很好,解释力强。不过,为什么经过主成因分析处理后的变量R2会“过于理想”呢?从数据来源上分析,我们认为这是因为样本并不是真实的成交案例,而是评估值,而评估值是假设交易双方在信息非常透明、交易双方高度理智的情况下的成交价格,所以模型拟合度很高。同时,通过方差分析可以看出,回归方程是显著的,即进入方程的特征价格变量与房地产价格之间存在的线性关系能够成立。

(2)异方差分析。如果回归分析中误差项的方差是一常数这一条件不能满足,我们就说回归分析发生异方差性问题。在特征价格模型批量估价中,异方差主要解决评估值误差集中度问题。若残差呈正态分布,且大多分布在2个标准差以内,说明不存在异方差现象,模型可以很好地解释变量。由于样本属截面数据,异方差分析显得非常重要。观察直方图,残差成正态分布,且绝大多数都处于2个标准差以内;P-P图显示残差集中度非常理想(见图2);散点图分布较为离散,没有明显的规律可循(见图3),说明不存在异方差,模型解释力很强。

(3)变量还原。主成分因子分析的目的是为了消除共线性,模型表达式并没有经济意义,也不利于理解,因此必须将主成分因子分析模型还原为原来特征价格变量下的模型。

经过转换,模型表达式为:

分析对数模型表达式,发现建筑类型与房价呈负相关,与经济意义不符。查看量化标准,建筑类型独栋别墅赋值标准150、联排双拼130、叠拼120、花园洋房110、多层106、电梯公寓100。根据常识,赋值越高房价应该越贵,可模型却恰恰相反。观察样本后发现:样本中只有多层和电梯公寓两种,而多层大多建筑年代久远,小区配套设施不健全,且很多为安置房和房改房,房屋品质较差,而电梯公寓多数为近几年东区改造后新修的房屋,各种配套齐全,小区品质较高。因此模型中建筑类型出现负值实际上是符合经济意义和估价常理的。

(三)比率分析

比率分析的目的是检验估值和案例的比率关系,用以说明估值的可靠性。国际估价协会(IAAO)规范的比率分析指标主要有三个,分别是:集中系数、离散系数(COD)、价格相关差(PRD),如表4所示。

集中系数主要反映估值与案例比率的集中水平;离散系数主要反映估值与案例的离散程度;价格相关差是比率平均数与加权比率平均数的比值,用于判断房价被高估和低估的可能性。通过对比“成都市评估案例的比率统计量”表(如表5所示)与“IAAO比率分析指导标准表”,我们发现各项指标均理想,说明通过模型求取的估值可靠度很高,模型可以被应用。

四、结论与启示

(一)变量合并可以让建模更加轻松

在制定数据采集方案时,估价师会将自己认为影响房价的所有因素都予以考虑,且会让特征变量更加具体,这样才能方便现场采集人员能够准确地描述特征变量。但是过多的变量会导致建模时为消除多重共线性而大费周折。因此,在建模前,如果估价师能够将变量依据一定的标准进行合并,会让建模工作变得更加轻松。虽然评估经验能够为合并变量带来便利,但如果能够通过数据相关性分析来合并变量将会使得这步工作更加可靠。

(二)房地产价格指数和个案修正需要在特征价格模型外予以考虑

特征价格模型一般不考虑房地产市场状况对房地产价格的影响,即房地产价格指数的影响。然而当时间序列性的成交案例难以取得,样本为截面数据时,持续准确的房地产评估值必须通过房地产价格指数来进行调整。此外,有一些特征价格变量仅对极小范围的房地产产生影响,这种变量常常是建模被排除的对象,但针对受影响的个案来说,这些变量又十分重要。因此,就像房地产价格指数一样,在特征价格模型外部,需要建立一套个案修正模型,便于对那些特别的房地产进行估值。

(三)如何对模型进行更新维护是房地产税税基评估的难点

房地产税税基评估是一项持续性工作,大多数国家每年都会对存量房地产进行一次评估。房地产价格总是在不断变化,一些房地产因为区位因素改善而价格攀升,另一些房地产因供需变化而降价。如何针对具体情况对现成的模型进行修正是房地产税税基评估的难点。要解决这一问题需要具备至少两个条件:一是先进的数据更新工具。目前公共网络上面有大量关于房地产特征价格变量的大数据可以被挖掘,而地理信息系统(GIS)和数据挖掘和分析软件已经在很多行业广泛应用,若能将其应用在CAMA系统将会使得数据更新变得轻松。二是专业的评估队伍。数据采集、模型构建、数据更新、数据挖掘等工作专业性强、工作量大,只有凭借专业的评估队伍才能满足未来庞大的房地产税税基评估需求。

参考文献:

[1]王春雷.基于区制转移模型的房价泡沫实证研究[J].商业研究,2012(6).

[2]司继文,韩莹莹,罗希.Hedonic住宅特征价格模型的BP神经网络方法[J].管理学报,2012(7).

[3]贾生华,温海珍.房地产特征价格模型的理论发展及其应用[J].外国经济与管理,2004(5).

[4]陈安明.基于主成分分析的住宅项目特征定价模型[J].重庆大学学报:自然科学版,2006(6).

[5]刘畅.城市景观对房地产价值的影响初探——以苏州为例的享乐价格模型分析[J].学术探索,2012(9).

[6]张立新,姜吉坤,温海珍.基于特征价格模型的商品住宅价格评估方法应用[J].统计与决策,2010(21).

[7]张海洋,袁小丽,陈卓.投资性需求对我国房价影响程度的实证分析[J].软科学,2011(3).

[8]周丽萍,李慧民,樊胜军.基于主成分分析的住宅特征价格模型的实证应用[J].西安电子科技大学学报:社会科学版,2008(4).

[9]ZHANG Hong, WENG Shaoqun, ZHOU Xuan.Housing Price Fluctuations Across China: An Equilibrium Mechanism Perspective[J]. Tsinghua Science and Technology, 2007,12(3):302-308.

Abstract:To assess the value of real estate as a tax base is the necessary way of the real estate tax levy legislation, as well as international practice. How to strike a better urban real estate value is an important issue to be faced with real estate tax reform. Internationally, the real estate tax base assessment relies mainly on “Computer Aided Mass Appraisal System (CAMA)” to achieve, while the core of CAMA system is the valuation models. Taking the current stock of housing data of Chengdu for example, this paper proposes a hedonic price model based on principal component analysis and logistic regression analysis and makes an empirical study of hedonic price model in the real estate tax base batch assessment and then uses ratio analysis to evaluate the reliability of the model. The results indicate that the assessment index is ideal and the estimation value is reliable, and the model can be further applied and promotion.

Key words:real estate tax; hedonic price; estimate and model; multivariate logistic regression; principal component analysis

(责任编辑:张曦)

猜你喜欢

房地产税主成分分析
我国房地产税制改革探究
从国际经验看土地产权制度与房地产税
基于NAR模型的上海市房产税规模预测
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
服务贸易结构优化路径研究
浅谈我国房地产税制改革
房地产税、供需与房价问题研究
批量估价法在房地产税税基评估中的应用研究