房地产咨询公司数据标准探索
2020-09-11黄海
文/黄海
一、引言
企业信息化是提升企业核心竞争力的重要途径。随着云计算、大数据、移动互联网等技术的蓬勃发展,企业信息化进入转型升级的阶段,逐渐由流程驱动转向数字驱动。2020年初的新冠肺炎疫情对企业的复工造成了不小的影响,远程协同办公的需求在客观上倒逼企业加速完善信息化系统。
对房地产咨询公司而言,开展房地产估价、房地产经纪、信息咨询等业务有着广泛的数据需求;同时,各个业务部门在长期发展中积累了大量的数据,有效整合与利用公司内外部业务相关数据,挖掘更多的潜在价值,是房地产咨询公司推进信息化的重点。企业要实现数据价值与核心业务的深度融合,首要任务是建立一套完善的数据标准体系。
目前,在房地产及相关领域,政府有关部门建立了各种数据标准,如《房地产市场信息系统技术规范》《房地产市场基础信息数据标准》《不动产登记数据库标准(试行)》《土地利用规划数据库标准》等。各个行业组织也在积极推进行业数据标准建设,如房地产经纪行业自律发展组织“中房经联”发布了《房地产房源数据库标准行业建议版1.0版》,部分从业人员对房地产行业整体或细分业务领域的数据标准建设进行了有益的探索。
然而,企业数据标准建设的出发点与政府、行业组织不同,其数据标准的范围应该主要集中在业务的核心数据部分,而不是将房地产领域所有数据悉数纳入考虑范围。本文以笔者的从业经历为例,对构建数据标准的思路与逻辑进行论述,以期为同行开展数据标准建设工作提供参考。
二、房地产咨询公司数据特征
设定“标准”的意义是为了在一定范围内获得最佳秩序,而在企业范围内构建数据秩序,首先需要研究其产生与使用数据的特征。
(一)数据在细分领域上有所侧重
不同于政府与行业组织,公司的数据围绕业务产生。房地产咨询公司市场定位各异,如一些偏重商办物业、一些偏重居住物业,因而产生的数据也不尽相同,会集中在个别细分领域。所以,在数据标准构建初期,企业需要聚焦当前或近期开展的业务领域,没有必要将房地产行业内大量的数据对象都纳入研究范围。
(二)数据内涵存在差异且多变
公司开展的业务种类繁多,数据需求也不尽相同,这往往导致数据的内涵会有较大差异。例如,同样是搜集某写字楼的数据,抵押评估业务更关注产权单元信息,而市场定位咨询业务更关注现状信息。此外,随着政策制度调整、市场环境变化以及公司的不断发展,业务类型也在更新迭代,这使同步产生的数据内涵不断变化。因此,企业在构建数据标准时,应考虑标准对多类型业务的适应性,避免因为业务类型调整而导致数据与标准脱节。
(三)数据在执业空间范围内零散分布
单个业务项目的对象多数为单一对象,如评估业务多数为某套房屋,规划业务多数为某个村镇。公司在承接业务时,空间上也存在随机性,这使业务产生的数据在执业空间范围内零散分布。如何使零散分布的数据在广大的空间范围产生有序、易识别的联系,也应是构建数据标准的重点关注内容。
三、数据标准构建思路
(一)整体思路
考虑到上述的数据特征,数据标准可以按照以下思路构建:
根据涉及业务与数据生产实际情况设定较为通用的数据基础对象。将业务数据与基础对象匹配,不匹配的数据再基于基础对象生成次级对象。为所有对象分级构建属性,具体包括界定属性、通用描述属性、业务主题属性。特别强调地理空间属性的建设。
数据标准的构建也应参照数据库三范式,对数据标准进行规范化处理,使结构更加合理,并消除数据内部异常,尽量减少数据冗余,以便于数据维护过程中进行新增、删除与更新操作。
第一范式:数据表中的每一列(属性),必须是不可拆分的最小单元。
第二范式:在满足第一范式的基础上,表中的所有列都必需依赖于主键。
第三范式:在满足第一范式、第二范式的基础上,任何非主属性不依赖于其他非主属性。
(二)数据标准构建实践
1. 设定通用的数据基础对象。在房地产咨询公司开展的业务中,房地产是核心,它既有具象的实体,也有抽象的产权。考虑到企业虽然无法全面、持续地了解房地产权属与实体的对应关系,但实体对象是长期客观存在的,企业可以直接进行探知与了解,笔者选择从实体开始设定。首先设定两个基础对象,即土地与自然栋。土地指地球表面的特定区域,自然栋指土地上独立的、有固定界限的建筑物与构筑物。
对于建筑物,业务往往关注它的实物特征,而房屋的建筑实物特征在自然栋内表现得并不均匀,这种现象在办公楼、商场等物业类型中尤其普遍。为了更好地描述实物特征差异,笔者对自然栋进行逻辑拆分,在只考虑实物特征差异的前提下,将自然栋划分为连续、内部匀质的自然子栋。
随着项目的推进,通常会获得一些房地产的产权数据,对于这些可以明确实体与产权对应关系的自然子栋,便可对其继续进行逻辑拆分。根据最小产权划分在自然子栋内对原则进行拆分,同时保证实体的连续性,由此形成产权子栋。同样,对于可以明确产权的土地,便可以形成产权宗地(图1)。
图1 逻辑图
2. 将业务数据与基础对象匹配。完成基础对象设定后,将业务中产生的各项数据与基础对象进行匹配。对于不能直接匹配的对象,可以通过基础对象组合成次级对象,再进行匹配。如此,则可保证所有数据在一个逻辑体系下运作,使各个数据项形成有序的逻辑联系。例如,自然栋可以组合成住宅小区,产权子栋可以组合成逻辑栋(图2)。
图2 关系图
3. 为各对象分级构建属性。为各个数据对象分级构建属性,可将属性分为三类:界定属性、通用描述属性、业务主题属性。首先,构建界定属性。界定属性描述的是数据对象最基础的特征,通过这些属性的组合来区分对象内的每一条记录。其次是构建通用描述属性,此类属性是对各项业务的数据需求进行归纳,用于描述比较常用的对象特征。最后是构建业务主题属性,这类属性由各个项目团队根据业务需求加以补充,自行构建。
表1 自然栋数据标准
以自然栋的属性表为例(表1),首先通过底面投影、实际总楼层、建筑物状态区分唯一的自然栋。随后,通过归纳各类涉及自然栋的数据需求,罗列涵盖名称、地址、主体结构、建筑总面积等通用描述属性,并在实际业务中自行补充业务主题属性。
4.强调建设地理空间属性。房地产有两项显著特征:其一是其位置相对固定,不可移动;其二是客观排他,在同样的空间、时间上不可能出现其他的房地产。因此,笔者在构建各对象的属性时,特别强调地理空间属性的建设,将其作为各对象的核心差异特征。例如,自然栋关注建筑的底面投影、商办综合体关注管理范围边界等。如此,则可借助地图引擎对数据对象中每条记录的空间位置加以直观显示(图3)。
图3 空间图
四、结语
数据标准构建的成功与否取决于其能否落地实施,本文提供了一种以业务价值为导向的数据标准构建思路。在该思路中,首要任务是设定基础对象,其他所有对象都在其上进行构建。在完成数据与对象对匹配后,所有数据即可形成逻辑联系(图4)。在此基础上,根据业务实际需求可以对次级对象、业务主题属性等进行动态调整与扩展,确保数据标准能够满足当前业务需要,甚至满足未来业务发展的需要。
图4 逻辑关系
此外,笔者在数据标准中强调使用地理空间属性。地理空间属性可以使数据在地图上具象化,实现通过地图直观地查询数据,了解数据与数据之间的空间关系(见图5)。量化的地理空间属性也可直接用来进行区位条件的运算。
图5 具象图
围绕业务需求进行数据标准构建,可以使公司进行数据整合与数据共享,进而有效减少数据重复建设的工作,提高工作效率,从而为公司业务创新提供有力支撑。