大数据和GIS的房地产信息体系构建
2015-10-30李妍肖良生
李妍+肖良生
摘要:在当今大数据时代,各种数据和新技术纷至沓来,使人目不睱接,如何应用好各种数据,这无疑给房地产市场研究带来新的机遇与挑战。简要分析房地产市场参与方的信息需求,探讨大数据的加工技术,针对房地产的参与方的需求提出了可能的产品系列。
关键词:房地产,市场监测,价格指数,信息技术,批量评估
中图分类号:F293.33 文献标识码:A
文章编号:1001-9138-(2015)10-0018-26 收稿日期:2015-09-05
房地产市场的变动与国民经济、市民生活均息息相关,市场现状、市场健康程度、市场涨跌、市场未来趋势等无一不是政府、学者和市民关注的焦点。
随着大数据时代的来临,房地产这一关系着国计民生的重要领域也在经历一场新的变革,各类房地产信息与数据充斥着人们的工作与生活。人们对房地产信息准确度的要求亦逐步提高。无论是房屋买卖的微观个体行为,还是政府的宏观调控行为,都需要权威、准确、精细度高的房地产信息,但实际上,目前房地产信息纷繁冗杂,其准确性及可信度均难以令人满意。比如就价格来说,存在着诸如交易价格、挂牌价格、不同估价目的的评估价格等各种类型的价格。而就价格标准来说,也存在着普通住房优惠价格标准、征地拆迁补偿价格标准、存量房交易计税参考价格等诸多标准。房地产信息如此庞大,却很难满足各个群体的真实诉求,其权威性、公正性与准确性也常常受到怀疑,因此构建全新的城市房地产信息体系的要求也日益迫切。
1 房地产信息体系构成
在房地产市场的运行过程中,主要包括以下参与方:政府、开发商、银行、中介服务机构和购房者。其中,政府既是土地的供应方,也是市场的管理者,他们需要了解房地产市场供求情况、价格走势、市场走势及风险等信息;开发商则是土地的需求方,房产的供应方,他们需要了解土地供应和土地价格、房地产市场供求情况、价格走势、拟供应区域市场情况和结构特征、同类产品供应情况及价格、购房者心理预期等信息;银行贷前需要了解市场走势与风险、微观价格指导,贷后则需要对抵押房地产的市场价值加以评价,因此需要不同时点的房地产价格信息;对于中介服务机构,他们需要为开发商、售房者、购房者、银行及政府提供房地产交易,评估及咨询等服务,因此他们既是房地产信息的生产者,也是使用者,他们需要全面的房地产微观信息;对于购房者,他们需要了解价格走势、房地产价格信息和房地产特征信息等。
基于以上分析可以看出,市场参与方所关注的信息既有宏观层面的统计信息、风险评估、市场走势分析,也有微观层面每套房屋的价格、物理特征、配套情况及房地产区域特点等。因此,可以从宏观层面和微观层面分别建立房地产信息指标体系。房地产市场宏观信息及其来源可归纳如表1所示。
房地产微观信息及其来源可归纳如表2所示。
2 房地产信息体系建立关键技术
在上文所述的房地产宏观信息和微观信息中,一部分可根据基础数据统计得出,一部分需经过计算和分析得出,如房地产价格指数、市场风险评价、每套房屋价格、市场走势判断等,而这些信息往往是市场参与者最为关心的部分,本节则主要研究获得这些信息的关键技术。
2.1 房地产全样本价格指数
早在20世纪60-70年代,国外就开始了对房地产价格指数(REPI,Real Estate Price Index)的研究,并相继引入了Repeat-Sales模型和Hedonic模型。Hedonic模型又称为“特征值模型”或“可变参数模型”,该模型较好地消除了两个时段之间非市场因素对房地产价格带来的差异,故受到国内外广大学者及专家的关注。尽管Hedonic模型在房地产领域应用较广,但是该模型最大的困难就是需要大量的房地产特征状态值,如何有效地确定这些状态值是十分重要的。另外,在小样本的情况下,容易产生共线性及空间自相关等问题,同时也存在估计误差。针对Hedonic模型的这些缺陷,一些学者做了进一步研究,从某些方面对Hedonic模型进行了改进,但是应用效果并不明显且比较复杂,因此没有得到广泛应用。
Repeat-Sales模型由Bailey于1963年提出,并结合回归模型构造了房地产价格指数。但是,直到80年代中期,Repeat-Sales模型才受到业界重视。Repeat-Sales模型不需要大量的房地产特征状态值,但是其对房地产交易的重复性要求较高,通常情况下很难保证一幢房产在两次交易时的同质性。另外,所选择的重复交易的房产不一定具有较好的代表性。这些都大大制约了该模型的应用。在实际操作中,考虑到具体的数据与上述模型的不匹配性,一些学者建立了Hybrid模型。但是,由于综合了多种方法,使得应用复杂化,同时相关方法还不够成熟,故目前实际应用较少。
目前,广泛应用的特征价格模型和重复交易模型都存在着因交易有限性而不可避免的属性修正或者价格修正难题,无论采用何种算法或者模型加以改进,这一误差均无法避免。为了解决这一同质性难题,深圳采用全样本评估价格进行房地产价格指数的计算,取得了很好的效果。
所谓全样本价格指数,就是针对研究区域内的所有商品住宅,通过自动估价模型,评估得出每期的单个房产价格,再对其加权平均得出不同区片、不同类型的房地产均价,并基于此建立的价格指数。
全样本房地产价格统计以所有小区为计算基础,楼栋基准价和小区基准价的计算采用多级多重加权计算方法,分别计算出基于面积加权和基于金额加权的价格水平后,然后再取两者的简单平均值作为小区价格水平。片区基准价的计算采用特定加权方式计算,最后通过固定权重的片区加权平均计算得出整个城市全样本房价水平。
2.2 数据库技术及主要模型
2.2.1 “地-楼-房”模型
该模型主要用来构建房地产基础数据库,即描述房地产的基本状况和实物状况的数据仓库。无论在全样本房地产价格指数的计算过程中,房地产自动估价过程中,还是在其他的管理应用中,房地产基础数据都是整个体系中最基础的部分,它明确了研究对象的基本信息,同时也是其他数据(如价格数据、评估参数数据等)得以发挥作用的主体。
从数据内容来看,房地产基础数据库主要包括两类数据,一类是描述房地产名称、坐落、用途、面积、楼层、装修、楼龄、周边配套设施及权属等方面信息的基础特征数据,另一类是描述房地产空间位置、形状、大小、分布状况及拓扑关系等信息的空间数据。从数据对象来看,房地产基础数据库应包含土地信息、建筑物信息和房产信息,而土地、建筑物、房屋这三个主体之间存在着相互依存的关系,因此通过建立“地-楼-房”模型来实现现实世界中的房地产表现形式在信息世界的映射,即根据数据对象间的相互关系来组织数据内容。其概念模型具体见图1所示。
2.2.2 价格生命周期模型
全样本价格指数要求每期对所有研究房地产评估,获得其当期市场价值。要评估如此大量的房地产价格,就需要有大量的房地产价格信息数据库。在房地产从产生到灭失的全生命周期内伴随着各种资产交换行为,因此有不同的房地产价格数据产生。基于此即可构建“价格全生命周期模型”。
房地产从产生到最后使用权结束这一个时间段内,一般经历了新房销售阶段、存量房使用阶段及拆迁补偿阶段,各个阶段均会产生相应的价格信息,在新房销售阶段,会产生新房销售价格;在存量房使用阶段,会产生交易价格信息,如挂牌价格、交易价格、交易计税参考价格、产权登记价格等;会产生抵押价格信息,如抵押评估价格、抵押贷款价格等;还会产生租赁价格信息,如租金等。在拆迁补偿阶段,会产生拆迁评估价格、拆迁补偿价格等信息。如图2所示。
在房地产存在的不同阶段,产生了不同的价格数据,其共同特点就是围绕的实体都是“地-楼-房”,因此我们可以将这些价格数据与其对应的实体建立起联系,在这里我们将价格也抽象为一个实体。这就是以“地-楼-房”为基础的房地产价格生命周期模型的雏形,如图3所示。
从图3可以看出,在房地产全生命周期内,按照类型来分,涉及的价格主要有以下几类:交易价格、租赁价格、挂牌价格、评估价格和抵押价格等。
通过建立房地产价格生命周期模型,将这些不同阶段产生的不同类型的价格数据组织起来,可以实现房地产全生命周期价格跟踪管理和分析,不仅有利于掌握房地产价格的时间变化,有利于为发现房地产价格变化的内在机制提供依据,还为全样本房价的测算提供了丰富的价格参考依据。房地产价格生命周期的概念模型具体见图4所示。
2.3 GIS技术
房地产基础属性信息中涉及到的社区、物业、水电、学校、超市、银行配套、公交、道路及城市规划等大量数据,均是与地理位置有着密切关系的信息,也是房地产邻里信息和区位信息的重要来源。而地理信息系统(GIS)正是对各种空间信息进行收集、存储、分析和可视化表达的信息处理与管理系统。如何充分利用GIS技术在海量空间数据处理和分析中的优势,来提取、挖掘和表达房地产信息已成为一项研究热点。
采用GIS技术,既可以获取房地产的空间、配套、交通等基础信息,还可以利用三维GIS进行景观分析、日照分析、污染分析等,获得全方位的房地产物理特征数据。同时,GIS还可以很有效的集成各类数据,以直观可视化的方式加以分析与展示。如图5、图6、图7所示。
3 产品系列
在完成数据库建设、整体估价及GIS集成后,可形成一系列产品,如房价查询、选房比较、区位分析、同类产品分析等微观产品,及价格指数、供求情况分析、押品风险评估、房地产政策仿真等宏观产品。
3.1 房地产市场监测报告
可按日、周、月、季度分别设计报告形式,提供即时的市场信息。日、周报告主要体现时效性,可包括新房销售情况、存量房销售情况、新开盘项目情况、均价变化等;月度、季度报告除了市场基本情况外,还可包括房地产开发、房地产贷款、房地产税收、土地市场、市场走势分析等内容。
3.2 房地产属性与价格查询
在房地产属性查询方面,使用者可获得全面的房地产位置、外观、周边配套、内部配套等信息。
在价格查询方面,可提供房屋价、楼栋均价、小区均价、片区分类型均价、同片区类似房产、不同区域类似房产等多种维度的查询功能,以满足置业者了解房价,比较选择房产的需求。查询可实现表格、二维地图、三维地图的自由切换,给查询者更好的使用体验。
针对开发商的需要,可提供定价参考、目标客户分析等衍生功能。
3.3 风险评价与预警
对于政府和银行来说,市场风险评价及预警至关重要,如能提前发现问题,便可采取相应措施避免损失或降低损失。
对于银行,往往需要对抵押贷款的押品进行定期贷后重估,因此可为其按月(或季度)提供押品的市场估价,对价格有下降趋势的房产提出预警,避免金融风险。
对于政府,可通过设定预警指标体系,分析市场所处区间,适时出台相应调控政策。
3.4 全样本房地产价格指数
基于整体估价技术和全样本房地产价格指数技术定期测算房价指数,可提供不同时间维度(周指数、月指数、季度指数及年度指数)、不同区域范围、不同建筑结构(多层、高层、低层)、不同面积范围、不同楼龄范围的指数。为市民、政府、专业人士提供更为科学、准确的房价走势指标。
3.5 房地产政策仿真
基于房地产大数据和GIS技术,结合系统仿真技术(如系统动力学、多Agent技术等)建立房地产政策仿真实验室。在政策实施前进行政策仿真实验,研判政策实施后的市场反应和效果,提高政策制定的科学性和有效性。
4 小结
本文首先从宏观层面和微观层面分别分析了房地产市场参与主体的房地产信息需求,在考虑数据可得性的前提下初步建立了房地产信息指标体系;然后提出了实现房地产信息体系所需的关键技术,包括反映市场真实情况的全样本价格指数,房地产信息数据库建立的主要模型,建立“一房一价”系统所需的整体估价模型,以及加强数据挖掘和直观展示的GIS技术等内容;最后,初步分析了基于房地产大数据及GIS技术可能形成的产品系列,如针对政府和专业人士的房地产市场监测报告、全样本价格指数、风险评价及预警及房地产政策仿真,针对市民、地产咨询公司及开发商的房地产属性与价格查询产品,针对银行的风险评价及全样本价格指数等产品,以期为市场参与方提供全方位、多尺度的房地产信息服务。
参考文献:
1.纪益成 傅传锐.批量评估:从价税的税基评估方法.中国资产评估.2005.11
2.孙凤仪 韩晓露.房产税税基批量评估文献综述.地方财政研究.2013.3
3.任作风 廖俊平.计算机辅助批量评估法(CAMA)在物业税估价中的应用.中国房地产估价师.2005.1
4.耿继进 何素芳.房地产计税价格批量评估实证研究.地理空间信息.2011.6
5.耿继进 汪友结 张晖.基准房价理论与实践.人民出版社.2014
6.McCluskey,W.J.An Evaluation of MRA,Comparable Sales Analysis,and ANNs for the Mass Appraisal of Residential Properties in Northern lreland.Assessment Journal.1997.4
7.International Valuation Standards Committee.International Valuation Standards[R].In:IVSC[A].2007
作者简介:
李妍,博士,副研究员,供职于清华大学,曾于国内外知名期刊发表多篇学术论文,荣获华夏建设科学进步奖、中国地理信息科技进步奖等。
肖良生,博士后,副研究员,供职于哈尔滨工业大学深圳研究生院城市规划与管理学院、深圳市房地产评估发展中心,曾荣获中国地理信息产业优秀工程金奖等。
Abstract:In todays era of big data,all data and new technology to pour in,people wont take ploughing the field,how to make good use of all kinds of data,no doubt to the study of the real estate market to bring new opportunities and challenges.This article briefly analyzes the information needs of the real estate market participants,and discusses the processing technology of large data,and puts forward the possible product series for the real estate.
Keywords:Real estate,Market monitoring,Price index,Information technology,Batch evaluation
李求军/责任编辑