不动产登记平台升级数据迁移方法研究与实践
2020-02-14车德伦
车德伦
(贵州省不动产登记中心 贵州贵阳 550003)
0 引言
贵州省于2016年开展了不动产统一登记云平台的建设并逐渐在全省推广使用,经过三年的运行维护,现有平台功能不能满足国家政策要求及业务需求。根据国务院和贵州省人民政府的相关要求,以推进政府治理体系和治理能力现代化为目标,压缩办理时间,实现贵州省到2019年底全面压缩不动产登记办理时限至5个工作日的要求。
1 数据现状分析
1.1 数据现状及存在问题
贵州省不动产登记云平台经过3年多的运行,积累了大量的数据,由于前期系统对数据内容要求不严格,导致在运行过程中产生大量不完善数据。从原住建部门和原国土部门拿到的房产交易、登记,土地登记的数据,也有很多的缺陷,导致系统数据内容缺失,房地不关联,权利人信息不完整等问题。对贵州全省的不动产数据进行完整性、正确性、关键字段唯一性、合理性和逻辑性分析,在结合试点区的实际情况,对数据进行的详细分析。
1.1.1 现状数据分析
(1)完整性分析:主要是在考虑贵州省实际现状的前提下,开展要素和登记业务是否齐全,空间数据是否全覆盖等数据分析。
(2)正确性分析:主要是按照国家不动产数据库结构(试行)的要求,对数据进行必填字段分析和合理性检查。其中合理性分析包括唯一性分析和值域分析。
(3)关键字段唯一性分析:主要指对数据结构的关联字段的不能重复,如不动产单元号、宗地代码等。
(4)合理性分析:主要是指按照国家不动产登记数据库标准(试行)的要求,对数据的填写是否规范进行分析等。
(5)逻辑性分析:主要对表与表之间的关系进行关联分析。如登记业务数据与不动产单元是否关联,户是否与自然幢关联,自然幢能否与宗地关联等分析。
1.1.2 数据存在问题
依据现行的相关标准,对全省不动产登记数据进行分析,主要存在如下问题:
(1)数据完整性差
业务数据、客体数据的内容残缺不全,存在大量必填字段为空的情况。如面积为空的约43.4万,坐落为空的约37.8万,权利人为空的约7万。楼盘表的单元、户号等信息缺失最为严重。
(2)数据填写错误多
存在较多的数据填写错误,如不动产单元号编码错误的约1.2万,权利类型填写错误的约0.8万,划拨土地填写土地使用时间的约6.6万。
(3)数据关联关系不健全
全省有5147865条登记业务记录与不动产单元未建立关联关系,其中现势的抵押/查封业务未与不动产单元关联的有233127条。如抵押或查封业务未与不动产单元关联,则该单元在办理转移登记时系统将无法提供不能转移的限制,存在较大的登记风险。全省有约34万个不动产单元存在两个以上有效的权利人信息不一致的数据。全省大概约有1113万户房屋,已实现落宗的房屋有683万户,落宗率61.36%。
1.2 数据迁移难点
1.2.1 数据量大且复杂
全省业务总量2900万,涉及土地产权、土地抵押等多种业务。
1.2.2 数据多源异构问题明显
空间数据和登记数据的来源多源,登记数据主要涉及原国土、房产、林业和农业部门。
1.2.3 数据质量参差不齐
数据存在面积、坐落、业务号、权利人为空,土地使用权结束时间或土地使用权起始时间为空等字段为空。
2 数据迁移思路
2.1 试点先行
使用统一技术规范,结合贵州省数据现状,选择具有代表性的、小范围区域进行试点,覆盖数据分析-数据迁移-数据质检入库各个环节,验证技术方案可行性。
2.2 实行分批迁移
本次项目工作内容多、技术难度高、工期紧张,云平台的切换不能停办业务,因此需要制订分批次迁移的方案。
3 数据迁移过程
3.1 准备工作
3.1.1 数据备份还原
主要包括2步:①省厅信息中心将权籍属性成果、权籍空间数据成果和登记成果和登记业务数据进行还原;②由开发单位将信息中心还原的数据库成果包还原至新系统的云资源数据库中。
3.1.2 提取试点区的数据
根据区县分区代码提取试点区的登记数据,并创建相应的新表。完成迁移后,需对提取的户和审批申请表进行分析,以供楼盘表更新和增量档案提取。
3.2 数据清洗
按照各区县提供的数据问题修改确认意见进行问题数据修复。具体处理事项如下:
根据试点区处理意见,对不动产单元号为空的数据进行虚拟编码。同时更新客体与权利的关联关系更新相应的权利表中的不动产单元号。对楼盘表进行数据更新。将提取处理好的楼盘表数据更新在“提取试点区的数据”步骤中的户非增量数据。对增量数据进行人工按每幢进行楼盘表处理。
根据试点区对不动产多产权问题的处理意见,对不动产单元存在多产权的数据进行处理。
将权利表中登记类型(DJLX)为注销登记的现势权利数据的权属状态更新为历史。
更新权利表中权利人、权利人类型、证件号以及证件种类等数据的分割符,将不同类型分隔符统一更新为“/”。
3.3 数据迁移
通过FME工具将权籍属性成果、权籍空间成果、登记成果和审批表进行数据迁移入库。
3.4 楼盘表构建
楼盘表数据是业务登记的基础,由于原始数据缺失逻辑幢、单元和户号的信息,首先需要根据原住建部门的房屋数据建立逻辑幢信息,在根据房屋坐落提取房屋的单元信息和户信息。
3.5 数据质检
质检方式分为计算机自动检查和人工检查两种:计算机检查包括整体性、规范完整性、逻辑一致性、拓扑关系等检查规则,通过定制不动产数据质检软件,保证整合成果数据结构完整、要素分层清晰、内容准确齐全以及图形精度与空间逻辑关系正确等;人工检查分为全面检查、专项检查、随机抽检三种方式。质量控制严格采用“两检一验”制度:作业组按要求进行全面检查,逐条核实;质检组对作业组提交的整合成果按不低于40%比例进行随机抽检,保证数据质量。
4 数据成果
全省登记业务总量27025457条,不动产单元全省总量为12469828条。空间矢量数据983275条。
此次数据迁移分8次迁移,先已贵阳市本级和六盘水市本级为试点区,试点整个平台切换是否可行。其次再将剩余7个市本级分2次迁移。最后88个区县分4次数据迁移。同时,针对迁移后的数据开展了质检工作,对全省限制类的业务进行全部检查和楼盘表检查。通过检查,发现了面积存在迁移前后位数不一致问题,还发现整个贵州约34%的楼盘表存在缺失;同时,在保证迁移不走样的基础上,完善了部分数据。
5 结语
本文结合了贵州省不动产登记数据的实际情况,建立以不动产数据迁移时间最短、所耗资源最少,迁移前后不重不漏为目标,实现全省不停办业务的前提下顺利实现贵州省不动产统一登记云平台升级的数据迁移。数据迁移基于FME软件开发,设计了从数据预处理到数据迁移入库的整个迁移模型。模型简单易懂,数据迁移模型的建立和使用具有较大的实际意义和应用价值,为贵州省的不动产统一云平台升级奠定了数据基础。