APP下载

不动产数据整合规范性研究

2018-02-07宁波市国土资源局奉化分局陈月琴

浙江国土资源 2018年6期
关键词:数据源整理规范化

□ 宁波市国土资源局奉化分局 陈月琴

不动产登记数据是支撑统一不动产登记信息系统运行的核心,是完成业务办理的基础和重要依据。统一不动产登记,提高不动产登记业务办理效率的重要前提是不动产登记数据的规范、准确、完整和统一。因此,我们需要制定完善的不动产登记数据整合机制。不动产登记数据整合是将格式不同、介质不同的分散存储的不动产登记信息进行搜集、梳理、规范化与整合,建成符合统一不动产登记系统数据库规范的不动产登记数据,为不动产登记系统的正常运行提供依据和支撑。由于历史原因,在统一不动产登记前,不动产相关业务采用分散登记管理制度,造成不动产登记资料分散存储于相关的不同部门,数据的使用与存储各自独立;另外,由于行业之间或行业内不同地区的实际情况,导致采用的数据标准和数据格式也不一致,各类数据甚至存在矛盾冲突的情况,电子信息化程度也有较大的差距;最后,不同部门间分别单独承建系统采用的技术架构以及相关的数据库、开发平台等也不尽相同,因此跨地区和跨部门的数据共享非常困难,相关数据也难以有效衔接起来,造成海量不动产登记数据得不到充分有效的利用。这些都是推行统一不动产登记工作的重点和难点。因此统一不动产登记工作的首要任务是完成不动产登记数据的整合。下面将对不动产登记数据存在的主要问题进行阐述,针对这些问题提出一些数据规范化整合的建议。

一、不动产登记数据存在的主要问题

由于整合前期分散登记制度下不动产登记数据的分散登记存储,导致不动产登记数据的数据标准不同、数据格式不同,数据存量巨大、历史关系错综复杂、数据多源异构和矛盾冲突,导致不动产登记数据不能充分利用。通过对基础数据进行调研,现归纳不动产登记数据的主要问题有以下两点。

1.数据标准不一,格式不一,数据量大,分散存储

不动产登记业务覆盖了国土资源、住建、农业、林业等多个不同的职能部门,由于登记机关职能相对分散,相关权利人查询相关数据也比较麻烦,并且会产生一定的安全隐患。另外,各部门信息化系统大多数采用自建的形式,数据标准是各部门自行定制,加上不同部门的侧重点也各不相同,数据采集方式、数据精度,数据准确性等方面存在很大的差别。

2.数据关联衔接性差,可追溯性差

由于海量数据存放方式不同,数据不完整,相同数据间属性字段描述存在相互矛盾的情况、结构化和非结构化数据共存等数据本身的原因,并且资料年代久远,数据可追溯性差,无法有效关联衔接。

二、不动产数据规范化的几点想法

针对上述问题,需对现有和存量房地数据基础情况进行细致分析,以数据质量为重点,进行规范化预清理和整理,为数据挂接,跨部门数据综合查询和数据共享奠定基础。

1.源数据预清理和数据调查分析

规范、准确、完整、一致的不动产数据是整个不动产数据整合的根基。而数据预清理和规范化整理的前提在于对存量房地的各类数据的整体质量现状有充分的了解,因此在数据规范化整理前,对存量房地数据进行全面的数据调查分析,并基于调查分析结果生成存量数据情况分析报告,保障不动产登记于清理和规范化整理的高效有序开展。

数据分析常用的方法有抽样调查方法、统计调查方法和综合分析方法。采用数据抽样的方式,通过分别抽取区域典型的宗地数据和房屋数据及对应的相关的权利数据、图形数据、抵押、查封限制等数据,进行数据完整性、一致性、规范性权利和历史上下手关联关系完整进行抽样调查分析。同时通过对街道存量屋、土地数据,房地历史数据进行数据量、必填字段数据完整性、数据准确性无效数据量等进行统计分析。最后在广泛利用现有的统计资料的基础上,对房与土地、不动产单元与权利、图形与属性、房地历史上下手之间的关联关系,采用文字、图解等多种方式进行全面的调查分析。数据分析的范围包括存量房地相关的图形、属性、档案数据等。

2.数据规范化整理的意义

数据规范化整理是将不动产登记数据空间数据、登记数据以及档案数据按照不动产登记数据库标准和不动产登记技术规范,实现比例尺相同的情况下,相同地理范围内的空间参考一致。如不一致,则根据相应的空间坐标转换参数进行统一转换。然后利用宗地代码、自然幢号、业务号、证书号、档案编号等建立图形、属性、档案等数据的内在逻辑关联关系。通过数据规范化整理能够极大地提升数据的准确率和数据的共享,从而达到不同部门信息数据最大化共享。

数据规范化整理根据数据类型的不同,将整理好的数据分成房产数据、土地数据、档案数据、登记薄数据4个大类,分别按照不动产登记数据库建库标准中规定的格式分门别类进行存储。这样形成的数据条理清晰、结构完整,并且数据精度相对较高。在接下来的数据整合挂接工作中,由于数据条目清晰、检索方便,数据关联关系也相对容易整理,极大简化了图、属、档的串联、一体化工作。数据清理整合挂接的工作效率能够得到极大的提高。通过数据规范化整理,对缺失的实体属性数据的全面补充修订、空间数据的拓扑处理、数据接边、镶嵌、拼接处理,数据的准确性、一致性和完整性有了极大的提高,数据质量提升显著,有很强的数据共享价值,在接下来的数据整合挂接过程中也有了更充分的整合挂接依据,清理整合的可行性更高。最后,能够对各类数据进行全面的分类统计,利用大数据技术进行数据挖掘分析,对全面了解不动产登记数据现状和未来的发展趋势有很大的好处。

3.数据规范化的主要原则

数据调查分析完成后,即可依据数据调查分析结果来开展数据规范化整理工作。经过不断的探索、研究和实践,归纳总结数据规范化整理的原则如下。

数据类型规范:确定数据源的存储形式和数据格式,选择数据采集整合方法。

现势性规范:确定数据源的现势性,分析其是否符合当前现状实际,与实际不一致的需剔除,并开展权籍调查或变更调查。

完整性规范:判断数据源的空间覆盖范围、登记信息内容和档案数据是否完整,不完整的需找出原因并后期补充完善。

一致性规范:判断数据源的面积单位、小数点位数等是否与《不动产登记数据库标准》一致,不一致的确定换算方法。

逻辑性规范:用房产、地籍现行的技术标准对照不动产登记簿和《不动产登记数据库标准》(试行)进行分析,找出源数据与不动产登记簿之间的差异,确定同名异质、同质异名的转换规则。

空间参考规范:确定是否需要投影转换,以及转换方式方法。

合法性规范:不动产权籍要求是经过验收(或审查)合格的资料(或数据),必须对数据源进行合法性分析。

4.数据规范化关键技术点

在遵循数据规范化整理的原则的基础上,可以适当引入不同的技术处理手段,提升数据规范化整理的效率和准确性。

通过实践经验总结,建议将数据规范化整理具体处理过程包含数据预处理和数据匹配两部分。数据预处理和数据匹配主要有以下相关的处理技术点。

数据预处理是按照预先定制好的清理转换数据标准,对采集到的数据中重复、非法、遗漏、不一致的数据进行去重、补漏、规范化、一致化等预处理,对档案数据本身的完整性和准确性进行验证。保证每宗土地和每套房在数据库中的唯一性和真实性。同时,可根据需要,对宗地图形数据进行坐标转换和格式转换,对空间要素采用分层的方法进行组织管理,对矢量数据进行图幅接边和几何接边处理。根据拓扑规则,对点、面状要素进行拓扑错误检查和处理。

数据匹配是数据整合的关键环节,利用宗地、房屋等物理数据范围确定容易、表达精度高、格式转换简单、空间计算可信度高的优点。构建基于空间数据与属性数据结合的房地登记数据匹配方法体系,提高匹配准确度和速度。数据匹配包括无空间图形的房产登记数据与土地登记数据匹配和有空间图形的房产登记数据土地登记数据匹配两部分。有空间图形的房产登记数据与土地登记数据通过空间计算,以宗地为单位提取出落入同一宗地范围内的土地和房产登记数据,极大减少数据关联的计算量,通过土地登记的坐落信息与房产登记的楼盘表进行关联匹配,实现土地登记数据与房产登记数据的匹配,并根据分类结果生成成果数据。土地登记数据与无空间图形的房产登记数据通过语义匹配进行关联,以宗地为匹配单元,定义匹配标准,依据分类结果生成成果数据。

不动产登记数据整合是一项庞大和复杂的工程,涉及到多个不同的职能部门和登记机关,需要充分利用现有资源,以科学的管理制度和先进的整合技术作为支撑,充分发挥数据规范化整理的优势,加强各部门之间的有效衔接与合作,完善工作机制,为全面清理和整理不动产登记历史资料打好基础,由点扩面,向全市范围推广,将不动产登记数据清理整合挂接工作推上新的台阶。

猜你喜欢

数据源整理规范化
Web 大数据系统数据源选择*
价格认定的规范化之路
基于不同网络数据源的期刊评价研究
高一零碎知识整理
整理归纳中渐次坚实
基于真值发现的冲突数据源质量评价算法
狂犬病Ⅲ级暴露规范化预防处置实践
高血压病中医规范化管理模式思考
满足全科化和规范化的新要求
分布式异构数据源标准化查询设计与实现