基于内外业“正”“反”向调绘一体化技术的房产存量数据整理
2019-07-05朱贵方
朱贵方
(沈阳市勘察测绘研究院,辽宁 沈阳 110000)
1 引 言
《物权法》中明确规定了“国家对不动产实行统一登记制度”。为此,沈阳市于2016年开始对沈阳市本级及市内九区的不动产登记数据进行整理,以确保最终建立沈阳市不动产统一登记成果数据库。面对数据量庞大的房产存量数据,如何快速准确地完成整理工作是建立沈阳市不动产统一登记成果数据库的关键环节。
沈阳房产存量数据根据测绘的加入分为两个阶段,前一阶段没有测绘信息,房产数据缺少相应的空间位置,房落地相对较难;后一阶段,随着测绘的加入和发展,房产测绘数据越来越准确,基本上做到了房落地,整理过程中只要进一步核实房屋位置和房形即可。针对两个阶段数据的不同情况,本文提出了利用“正”“反”两个方向进行房产存量数据整理。根据整理出的部分成果可见,此整理方式在保证准确性的基础上大大提高了效率。
2 整理技术路线及方法
2.1 技术路线
沈阳市不动产登记房屋数据整理是以房产提供的房屋楼盘表数据和房产登记数据为基础任务数据,房屋楼盘表分为测绘楼盘表和逻辑楼盘表,总数约26万幢,对应房产登记数据(户数)约574万户。其中测绘楼盘表是具有测绘资料的房屋数据,数据量约有4.4万幢,对应300余万户,该部分数据存在形状不准确、位置精度差、坐标系统不一致等问题,需要进行坐标转换、空间位置调整、逐幢核实等整理工作;逻辑楼盘表是无测绘资料的房屋数据,房产部门日常业务中整理出空间位置房屋图形约1万幢,对应20余万户,剩余约20.6万幢无空间位置数据,对应约254万余户。
通过对各相关数据收集、分析、整理、抽取、转换等技术手段进行房产数据提取和空间化处理,将数据分为测绘数据和逻辑数据两大类房产存量数据,利用内外业“正”“反”向调绘一体化技术,确定与房屋相对应的逻辑幢[2]、自然幢[2]的空间位置和房形[1],并对逻辑幢赋予相应的属性信息[2],利用图属关联进行质量检查、拓扑检查,无误后提交成果数据并编码入库。其总体技术路线如图1所示。
图1 房屋数据整理技术路线图
2.2 整理流程及技术方法
根据房屋数据整理技术路线,本文通过ETL数据提取、数据空间化处理[3]、内外业“正”“反”向调绘一体化、房地图属关联等方法,将沈阳市房产存量数据准确无误地整理到沈阳市不动产统一登记成果数据库[4]。
(1)ETL数据提取
ETL(Extract-Transform-Load)是用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程[5]。本文采取了ETL的思想[6],通过制定提取规则从房产数据库中(包括楼表、户表、开发商表、小区表等)提取有效房屋数据,利用房产已有测绘数据、地名地址数据和地形图数据等参考数据对所提取数据进行清洗、转换,最后加载到过程数据库(自然幢、逻辑幢数据库)中,整个数据提取流程中除了清洗转换过程需要一定的人工干预,其他均可制订相应的规则实现全自动化处理。其数据处理流程如图2所示。
图2 ETL数据提取流程图
(2)数据空间化处理
根据前期对房产数据状况评估,房产存量数据逻辑数据较多。对于缺失房屋图形的逻辑数据,利用地名地址数据和逻辑数据中的房屋地址对逻辑数据进行数据空间化处理[7]。将已有空间位置的地名地址数据与无空间位置的房屋地址进行地址匹配,匹配成功后得到房屋地址对应的空间位置,利用此位置地形图房屋图形加工制作房产房屋图形。地址匹配分为精确匹配和模糊匹配两个过程。
①精确匹配
精确匹配的算法是以逻辑数据的地址(FWDZ)与地名地址数据完全一致为判断条件,形成具有准确空间位置信息的房产数据,即“房产地址点”图层。
利用具有空间位置的“房产地址点”和地形图房屋数据,自动提取包含“房产地址点”的房屋数据并赋予相应的地址属性信息,获得具有大致位置的空间化的房产数据,并将其归入测绘数据,待内外业“正”向调绘时核实房屋准确地址和房形。通过精确匹配共整理出约5.4万幢房屋数据。
②模糊匹配
模糊匹配是将逻辑数据的地址(FWDZ)与地名地址数据利用地址的语义相似度制定地址匹配算法[10],形成准确性较差的具有大致空间位置信息的“房产地名地址”图层。由于相似度越大,匹配上的数量越少,但相似度过大又会影响匹配的有效性,所以需要根据地址的不同情况,设置适当相似度值,同时在空间化处理过程中需要加入一定的人工干预。利用模糊匹配算法得到的结果准确度会相应下降,在整理房屋数据时将此类数据作标识码后归入测绘数据,待内外业“正”向调绘时核实房屋准确地址和房形。通过模糊匹配共整理出约1.8万幢房屋数据。
(3)内外业“正”“反”向调绘技术
根据对沈阳市房产数据的了解,其存量房屋数据分为有测绘资料的测绘数据和无测绘资料的逻辑数据,前者加入了房产测绘的测绘资料整理较为容易,而后者无测绘数据整理较为困难。针对这两大类数据,本文提出了内外业“正”“反”向调绘一体化技术,其流程如图3所示。此方法可以在保证整理质量的前提下,大幅度地缩短整理时间。
图3 内外业“正”“反”向调绘流程图
内外业“正”向调绘一体化主要用于调绘有测绘数据的存量房屋,内业利用已有的参考数据和房产测绘数据进行数据分析提取,将提取有效数据展绘至调绘底图上,外业作业员实地核实调绘底图上房屋的地址和房形,其外业调绘图如图4所示。利用内外业“正”向调绘便可方便快捷地整理出大量测绘楼盘表数据和资料相对较全的逻辑楼盘表数据,其整理结果如图5所示红色标注房屋。
图4 外业调绘图
图5 整理成果细节图
内外业“反”向调绘一体化用于调绘经过外业“正”向调绘未整理出的所有房产存量数据,通过对数据的分析可知,其主要包括两大类:一是老旧地址房屋数据,二是资料不完整的房屋数据。此类数据只有逻辑属性,无法定位到相应的房屋。内业利用房产档案查找房屋权利人,外业通过相应房产权利人的配合,对房屋进行定位调绘,确定房屋地址位置和主体房形;对于查档也无法确定位置的房屋,大部分位于实地存在而未整理的房屋上,将此类房屋整理到“备用图层”方便外业调绘,如图5中黑色字体标注房屋为外业调绘的非整理房屋地址。利用内外业“反”向调绘主要是弥补房产资料不足造成的整理困难,调绘过程中需相应的房屋权利人的配合,相比外业“正”向调绘较慢,但可保证整理房屋数据的准确性。为了避免重复调绘,此过程应与日常权籍调绘建立互通机制。
(4)房地图属关联
关联是指利用唯一标识的属性或空间位置将两个或多个数据连接到一起,得到更全面更准确的属性和空间信息,如属性关联、空间关联。房地图属关联是利用逻辑幢、自然幢和宗地的相应属性,将房屋数据、宗地数据进行图形和属性的关联,既包括房屋数据的图形与属性关联,又包括房屋数据与宗地数据的空间关联和属性关联。使其既可以通过图形查询属性,又可以通过属性定位图形。
此次属性关联是利用具有唯一标识的房屋ID对整理完的房屋数据与房产Oracle数据库中的属性数据进行关联,统计和添加所整理房屋的权利人、户数、层数、面积等必要属性信息。
利用空间关联,将房屋与宗地进行属性对接,通过统计宗地内房屋数量、分析宗地权利人与房屋权利人是否一致、房屋与宗地空间位置关系是否正确等进一步确定房屋和宗地空间位置的准确性。
3 整理难点及不足
面对错综复杂、形态各异的房产存量数据,根据整理过程中遇到的难点制订了相应的解决方法,但内外业“正”“反”向一体化技术仍有不足之处,主要难点及不足如下。
(1)测绘数据准确度较差
具有测绘数据的房屋,由于在不同时期所利用测绘手段、坐标系等不同,在进行整理过程中造成此类房屋在位置上的准确性相对较弱。
内业利用现势性较好的地形图和影像数据与其进行对比分析,大致确定房屋位置,加上外业“正”向调绘,最终整理出准确的房屋数据。如图6所示红色字体标注的为整理数据,蓝色字体标注的为房产测绘数据。
图6 测绘数据与整理数据对比图
(2)房产档案资料不完整
无测绘数据的房屋,由于存档时间较长房产档案资料相对不完整,单凭房产档案和参考数据无法确认,此类房屋在外业进行调绘过程中加入房屋权利人的配合,在整理房屋数据的准确性上取得了较好效果,但由于是被动联系房屋权利人,在调绘过程中碰到许多不配合情况,导致整理效率下降。此类房屋整理最好加入房产权籍调查,既可保证准确性又可保证日常登记业务。
档案中的房屋资料不全主要包括无空间位置无房形、无空间位置有房形、有空间位置不能确定房形三种。无空间位置无房形的逻辑幢楼盘表状态多样,但大多为未取得预售许可、抵押和在建工程抵押状态。无空间位置有房形分为两种情况:一种为电子档案中有分幅平面图,但也只是单独房屋;一种为电子档案中无平面图,但分层分户可以确定房形。有空间位置不能确定房形的情况主要是扫描的平面图只有一部分房子或分幅平面图有折叠,此部分需查询原始纸质档案来进行确定。
(3)房产数据动态变化
房屋存量数据整理的对象为房产系统内的所有房屋,而整理过程中房产业务同时也在实时办理,导致房屋档案存在变化的情况。为了解决此类问题,会同房产部门,制订了相应的整理更新流程,保证已整理数据的有效性和准确性。
(4)内外业“正”“反”向一体化技术不足之处
利用内外业“反”向调绘过程中仍有部分房屋无法准确整理。尤其是实地已拆迁的老旧房屋,但由于各种原因房屋权利人未进行房屋注销登记,造成房产系统中的部分档案信息与现状不符,同时权利人配合较难,此类情况利用内外业“正”“反”向调绘一体化技术无法解决。由于日常登记业务较少,暂作为待整理房屋,等到相应房屋权利人办理业务时,进行日常权籍调查解决。
4 结 语
房产存量数据整理是一个非常复杂的问题,暂时没有可供参考的完美方案。本文在查阅各相关文献资料和对沈阳市房产存量数据分析的基础上,针对沈阳市不动产房产存量数据的特点,提出了基于内外业“正”“反”向调绘一体化技术的整理方案,介绍了整个不动产房产数据整理的技术路线和其他关键技术,总结了整理过程中的工作难点和不足,并根据整理中遇到的各种难点提出相应的解决方法。在沈阳市不动产房屋数据的整理工作中,利用内外业“正”“反”向调绘一体化技术提高了房产存量数据整理的速度和准确度,在实际生产中具有一定的参考价值。