APP下载

不动产登记热点及空间差异性分析

2022-04-02辉朱军王

测绘地理信息 2022年2期
关键词:聚类总量热点

刘 辉朱 军王 恒

1武汉市自然资源和规划信息中心,湖北 武汉,430014

自2015年3月起,全国实行不动产统一登记,各级不动产登记局建立不动产登记信息管理基础平台,实现了个人信息与房、地、林等不动产登记信息的整合[1]。不动产登记信息记录了不动产权利人、不动产位置、状态等详细信息,是一种高价值的国土资源数据,深入挖掘不动产登记信息,可解释人和不动产信息之间的复杂关系,为政府部门的土地供应、房产管理等工作提供决策支持[2]。徐财江等[3]针对不动产登记数据量大、复杂等特点,依托不动产单元的不动产登记数据整合技术路线,对不动产数据整合具有指导意义;程丽丽[4]在参照不动产登记数据库标准和数据整合规范基础上,从技术和应用层面提出了基于SuperMap的不动产登记数据整合的优化思路。耿冯康[5]针对不动产登记信息分散共享难等问题,建立了一种数据集成、整合、管理、交易和查询框架,为数据整合提供了可行的实施方案。张潆文等[6]从不动产登记数据价值方面,综述了不动产大数据分析的应用方向和重点领域。本文开展不动产数据的分析评价工作,来反映城市空集聚特征和间差异性。通过空间自相关分析,探索不动产登记热点,利用空间聚类分析,寻找不动产登记空间集聚特征区域,探索登记业务在城市空间的差异性特征。

1 研究方法

首先,采用探索性空间分析方法从全局范围探索不动产数据的空间自相关性,确定其空间分布模式;其次,通过采用高低聚类分析方法识别统计显著性的地籍子区的空间热点;最后,使用聚类方法发现空间差异性特征。具体方法流程如图1所示。

图1 方法流程图Fig.1 Flow Chart of the Method

1.1 不动产登记数据的空间分布模式

给定地籍子区内各类登记数据,利用Global Moran’sI指数评估不动产登记数据在空间的分布模 式,并 用I指 数 进 行 显 著 性 评 估[7]。I的 取 值 为[-1,1],I大于0表示不动产登记类型数据在空间具有正相关性,I小于0表明在空间上不具备相关性。

由ArcGIS空间自相关方法得到I指数和z得分,I指数值为0.243 585大于0,z得分为18.348大于2.58,表明不动产登记数据分布仅有1%可能是随机分布的,在空间上表现为聚集特征具有统计显著性,具有空间正相关模式。这表明不动产登记数据在空间分布模式的全局自相关性符合统计显著性的集聚聚类模式特征。

1.2 基于不动产数据的局部空间自相关聚类

全局空间自相关能够反映单一特征在全局空间上的分布特征,难以发现单一特征在空间局部区域的分布及关联模式[7]。而局部空间自相关分析方法能够识别出空间集聚形式、非典型的局部区域和异常值等分布模式。在地籍子区划分的基础上,以空间邻接性度量地籍子区之间的权重关系,采用局部自相关方法对地籍子区分析结果进行分类标识[8]。

以武汉市中心城区为例,采用该方法发现中心城区具有显著特征的高值聚集或低值聚集区域,以及异常点等区域的分布模式。图2是局部自相关聚类结果,可以发现红色区域是显著高值聚集的区域,呈现为显著的空间集聚模式。由图2可知,高值区域集中在江岸区、洪山区、东湖高新区和汉阳区,并且集中在区域中心,与城市实际情况相符。

图2 不动产登记总量数据局部自相关聚类结果Fig.2 The Total Real Estate Registration Result of Local Auto-correlation Clustering

1.3 k-means聚类算法

1)k-means算法原理。k-means聚类方法是一种无监督学习方法,对没有标签的数据依照数据多维属性特征,实现对数据划分的方法[9,10]。k-means算法思想是先初始化给定k个类簇中心,将待分类的样本按照某一相似原则分配到各个类中;并按照一定原则重新计算各个类簇的质心,来确定新的聚类中心;然后通过不停的循环计算,各个类簇的质心变化小于某一给定值[10]。

采用k-means聚类方法对武汉中心城区的地籍子区不动产登记业务类型的数量按照k值进行聚类,形成k类。本文将聚类划分数选定为6,聚类结果如图3所示,其中第0类表示没有登记数量的区域,没有作为聚类结果的样本数据。

图3 划分数为6的聚类结果图Fig.3Clustering Result with Partition Number of 6

2)聚类数确定方法。k-means聚类方法中聚类数的确定很大程度影响着聚类结果的好坏[11]。轮廓系数(silhouette coefficient)是度量样本与其所属类别和其他类别之间的相似度,其值越大,聚类效果越好[11,12]。CH(Canlinski-Harabasz)指数是度量聚类后所属类内协方差与类间协方差的差异,该值越大,聚类模型效果越好[13]。然而,轮廓系数和CH指数都受到聚类数的影响,并且二者呈现出相反的变化趋势[14]。因此,为了综合评价聚类效果,本文构建了一种新的聚类评价指标度量聚类效果,该指标为综合 指 标(comprehensive score,CScore),计 算 方法为:

式 中,silhouette为轮廓 系 数;CH为Canlinski-Harabasz指数。

由图4可知,当聚类数k=3时,轮廓系数最大;k<9时,基本保持平稳,当k>9时,随着k值增加轮廓系数变小。当k=6或7时,CH指数最大。当聚类数为6时,Cscore值最大;当k>9时,随着聚类数增加,综合指数集聚减小。因此,根据Cscore的变化,将聚类数设定为6类,此时聚类效果相对最佳。

图4 综合指标随k值变化图Fig.4 Comprehensive index Changing Diagram with k Value

2 试验与分析

2.1 试验数据

武汉市共有215个地籍区,3 598个地籍子区。研究区域为中心城区,包括139个地籍区,1 237个地籍子区;研究数据是自武汉不动产登记工作开展以来至2018年5月的数据,约281.9万条;其中不含登记业务的共277个地籍子区。不动产登记数据包含自然幢、登记业务类型等信息。不动产登记业务类型主要包括首次登记、转移登记、变更登记、注销登记和其他登记5种类型,本文采用不动产登记业务类型衡量地籍子区的空间分布特征。

2.2 登记业务热点区域识别与分析

根据不动产登记业务的数据量,采用热点分析方法识别不动产首次登记、转移登记和变更登记在空间上的热点或冷点区域。数据显示,截止2018年5月不动产登记数据主要业务是首次登记、转移登记和变更登记,其中首次登记量约占研究区域总登记业务数量的62.42%,因此,选择这3类数据作为登记业务热点区域的重点研究对象,如图5所示。

图5(a)中,中心城区地籍子区在东湖高技术开发区、洪山区、武昌区、江岸区塔子湖、汉阳和武汉经济技术开发区呈现显著性的高值聚集模式,东湖风景区、青山区和硚口区等呈现显著的低值聚集的模式;图5(b)表示首次登记的热点分析图,与登记总量结果总体保持一致。图5(c)表明不动产转移登记业务热点区域、冷点区域和不动产登记业务总量分布情况大体一致,在汉阳区和武汉经济技术开发区体现的差异性非常明显,依照不动产地籍子区划分情况系,转移登记数量在局部区域不具备统计显著性。图5(d)是变更登记热点分析结果,热点区域主要集中在武汉经济技术开发区和江夏区庙山地带。这表明了基于地籍子区的登记业务总量热点区域探测不动产登记的业务特征的空间分布具有合理性。

图5 中心城区不动产登记业务热点分析结果图Fig.5 Hot Spot Analysis Result of Real Estate Registration Data in Central Urban Area

2.3 不动产登记业务空间差异性特征

本文采用k-means聚类方法,按照业务类型数据进行聚类,发现了登记业务空间差异性分布特征。

1)聚类后每类的比例分布情况。如图6所示,每一类中平均登记总量依次递减,其中class1类平均登记总量是最少的、class3的平均登记总量最多,并且数量级呈现巨大差异。如图7所示,class1、class2、class5和class3这4类具有类似的特征,在每一类中,首次登记和转移登记比例占比很大,其他登记类型占比过小;在class6和class4中变更登记比重都超过30%,与其他类差异巨大。因此,结合图6和图7,将class1划分为低频度登记区(平均登记总量最小)、class5划分为中频度登记区(平均登记总量与class1有显著量级差异)、class2为次高频度登记区、class3划分为高频度登记区(平均登记总量最大),class6划分为低频度变更登记区域,class4为高频度变更登记区(变更登记总量显著的区域)。

图7 聚类后各类中业务类型数量占比图Fig.7 The Proportion of Business Types After Clustering in Each Category

2)聚类结果的空间分布情况。由图6知,class1主要分布在江岸区、江汉、硚口、武昌区中心、洪山区离三环较近处和东湖高新开发强度不大的区域;class5主要集中在江汉区、江岸区、洪山区的白沙洲、和东湖新技术开发区的城区,这些区域具有居住密度高、人口集中的特点;class3是黄陂盘龙城的高密集居住区,不动产登记业务总量巨大。对于class6的区域主要分布在洪山区南湖社区和白沙洲附近等区域,这些地区都是高密度住宅区域。对于class4其主要在江岸区的后湖区和江夏的庙山,是城市比较早的重点居住开发区。

图6 聚类后各类登记总数均值图Fig.6 Mean Value of Total Number of Registrations After Clustering

3 结束语

不动产登记数据伴随不动产登记的开展,为空间数据挖掘和城市空间分布研究提供了新的思路。①结合空间自相关分析方法,利用空间自相关方法发现城市空间模式,结果表明武汉市中心城区的不动产登记业务在空间具有显著的聚类模式;②采用局部自相关方法探测各类不动产业务在空间上的冷点热点区域,发现转移登记在武汉经济技术开发区和汉南区没有热点特征,其他登记类型在空间上具有相似的冷点、热点特征;③通过空间聚类分析发现内在聚类模式,发现按登记业务数量和类型,中心城区不动产地籍子区可以划分为6类聚类特征。

本文虽然探索了不动产登记业务类型的空间结构特征,但是由于对不动产业务划分不够详细、其他综合信息利用不够,因此在未来工作中需要综合考虑权利人信息、交易信息以及业务指标等,构建不动产综合业务考核及不动产评价的模型,为不动产工作提供合理参考。

猜你喜欢

聚类总量热点
基于数据降维与聚类的车联网数据分析应用
中国高碳行业上市公司碳排放总量榜
基于模糊聚类和支持向量回归的成绩预测
电信业务总量保持高位增长
4月高考热点关注
基于密度的自适应搜索增量聚类法
环保部:今年上半年全国主要污染物排放量均大幅下降