APP下载

基于关系链映射的“四实”数据空间化研究

2022-07-14张珊珊何正国

地理信息世界 2022年3期
关键词:表单关联实体

张珊珊,何正国

1. 广州市城市规划勘测设计研究院,广东 广州 510640;

2. 广州市城市规划自动化中心,广东 广州 510030

0 引 言

城市实有数据自1997年公安部苏州会议[1]提出后,已有上海、湖南、广州等城市实施落地。“四实”数据是实有数据的一种,包括实有人口、实有房屋、实有单位与实有设施,是一种表达城市人口、建筑及设施等要素的新型数据类型。实有数据与传统的城市人口及建筑以行政区划做总量统计,以及测绘体系下类型化要素表达不同,“四实”数据针对人口、建筑、就业单位及服务设施的采集尺度与对象聚焦到独立地理实体目标上,是一种以最小空间粒度划分、全息采集的新型地理空间数据采集方式,具有以地理实体为典型数据特征的新型基础测绘数据的特点。

当前,有关“四实”数据的研究较为有限,姜玉[2]、李菁[3]等针对北京和上海实有人口数据的类型及规范性等质量问题进行了研究,何华贵等[4]研究了智慧广州时空云平台实现“四实”数据的地址化标准化方法。在地理实体的新型基础测绘研究方面,李景文[5]、龚健雅[6]等学者研究了地理实体基本理论,闾国年[7]、彭清山[8]等学者研究了地理实体的类型化,从空间形态、应用方向等角度进行分类。阮于洲[9]、顾婷[10]研究了地理实体的采集与质量控制。这些研究着重于数据采集质量及标准化,对“四实”数据属性及空间粒度精细至个体人、房屋地理实体特征,以及表单化数据如何实现空间化缺乏系统性的范式研究。

本文依据新型基础测绘体系下地理实体相互关联理论,针对“四实”数据的特点提出地理关联实体概念,研究“四实”表单数据在关系链映射下的数据规则化与空间化的技术与方法,并以广州市人民南社区为例进行了验证。

1 基于关系链映射的“四实”数据空间化方法

1.1 数据内容

“四实”数据在不同城市数据类型及数据内容上有差别。广州市“四实”数据中,实有设施数据已采集了空间坐标,因此需要空间化的地理实体对象为人、房(栋、套)、建筑与单位数据,以人口信息表、流动人口信息表、境外人口信息表、房屋栋信息表、房屋套信息表、单位信息表、从业人员信息表、人房关系表、单位房屋关系表9张表单形式存储(表1)。

表1 “四实”数据表单内容Tab.1 Contents of the “Four Reals” data sheet

“四实”数据表单为需要处理的原始数据,数据空间化处理流程总体包括数据质量标准建立、数据清洗规则设计、数据清洗、关系链映射、地理关联实体构建与空间化等步骤。其中,基于关系链映射的地理关联实体构建与空间化,是实现建筑单体与人口个体数据关联及空间落地的关键环节。

1.2 地理关联实体构建

新型基础测绘是测绘空间地理信息在数据采集方法与应用需求发生巨大变化之后的发展方向[11],而地理实体是这一发展方向中在数据要素方面最核心的类型和表达[12-13]。地理实体能够实现空间表达粒度和信息的精细化与全息化[14]。对于地理实体的类型化划分,彭清山等提出以空间形态划分的地理单实体、地理组合实体、地理聚合实体3类地理实体[8]。其中地理组合实体要求类型一致,而地理聚合实体则由若干具有空间关联性的实体聚合而成,指向了一定封闭空间单元中具有逻辑关系的独立地理实体组合。

“四实”数据表达的人、房(栋、套)、建筑与单位等实体要素关系,并不符合上述组合与聚合类型的地理实体特征,而是在城市尺度这一广域范围内以特定要素相互关联的地理实体集合,本文称之为地理关联实体。具体而言,地理关联实体指向以下两个方面。

1)在人、房(栋、套)与单位的关系中,人与房(栋、套)、人与单位、单位与房(栋、套)分别存在着居住、就业、进驻的关系,且这些关系同时与作为空间单元的建筑实体存在关联关系,这一多重关系是“四实”地理关联实体的逻辑关联。

2)以建筑实体的地址信息作为人、房(栋、套)、单位等多重逻辑关联实体的纽带,可以实现“四实”地理关联实体的空间关联。“四实”地理关联实体的关系如图1所示。

图1 地理关联实体构建过程Fig.1 The process of constructing geographically associated entity

1.3 关系链映射

为实现“四实”数据空间化,需要梳理多表单数据的内在关系规则,通过对9个数据表单的分析,首先明确空间落点表单对象分别为个体人口信息、房屋建筑、单位信息,其次确定从业人员信息表CY、人房关系表GX1、单位房屋关系表GX2是具备关联功能的关系型表单。3个关系型表单及各落点对象信息表单关键属性字段的匹配关系表明,人口、房(栋、套)、单位信息之间存在一对一、一对多、多对多的关系规则,人口信息、单位信息、房(栋、套)信息之间存在承载关系。将承载关系划分为职住两条,个体居住在具体房(栋、套)内,房(栋、套)位于具体单体建筑内;个体在具体单位就业,单位进驻在房(栋、套)内,房(栋、套)同样位于具体单体建筑内。

关系链是对多级关联传递的一种相对直观的可视化模式,基于指定的关系规则,实现属性信息传递至相应载体上[15]。本文以“四实”数据表达的人、房(栋、套)、单位之间存在的一对一、一对多、多对多的关系,建立“四实”数据关系链映射(图2)。

图2 “四实”数据关系链映射Fig.2 “Four Reals” data relationship chain mapping

实现“四实”数据关系链映射主要有两个过程,一个过程基于人口信息完成居住角度与就业角度两组地理关联实体的构建,另外一个过程基于地址信息的属性项关联匹配,实现对居住和就业两条关系链的拓展与地理关联实体的空间化。

结合图 2,上述 4式中RK1、RK2、RK3、FWT、FWD、DW为各属性信息集合表;GX1、GX2、CY为上述6个属性信息集合表的关联关系;rkid、Tid、Did、DWid为存在于关联关系表中的属性集合关联匹配项,分别关联匹配人口信息、房屋套信息、房屋栋(单体建筑信息)、单位信息。

通过人房关系表,式(1)将3类人口信息表关联至房屋上,式(2)将三维立体角度的房屋套信息关联至二维平面角度的单体建筑上;通过从业人员信息表,式(3)将3类人口信息关系关联至具体工作单位上;通过单位房(栋、套)关系表,式(4)将单位关联至房(栋、套)上。依据关系传递的特性,将3种类型的人口信息进行聚合,分别构建个体职、住关系链。下面的式(5)表示的关系链分别从个人居住角度和工作角度出发,将人口信息传递关联至个人居住的具体建筑、房(栋、套)、工作单位上。

通过建立以上关系链,完成居住角度与就业角度两组地理关联实体的构建,为后续利用空间相关属性将非空间属性进行关系链映射提供基础。在此基础上,选取地址信息作为指向空间位置的基本属性。门牌地址空间数据的地址信息属性项能与房(栋、套)信息表的地址信息属性项关联匹配,实现对职住两条关系链的拓展。以下面的式(6)居住关系链为例,在单体建筑地理关联实体上,利用地址信息属性项,可将关系链与门牌地址空间数据相关联,实现“四实”数据关系链到外部数据的拓展延伸,使其具备空间属性(x,y),实现人口数据及房(栋、套)数据的空间坐标关联,完成关系链的空间化过程。

2 广州市人民南社区“四实”数据空间化

本文选取广州市越秀区人民南社区进行“四实”数据关系链映射、关联实体构建以及空间化研究。人民南社区位于广州市越秀老城区的中心商业枢纽地带,总面积为86 hm2。实验以“四实”数据中实有人口为数据样本,实有房(栋、套)为人口数据载体,通过单体建筑地理关联实体实现数据关联与落点,形成空间数据成果。由于原始数据采集的完整性,以及研究场地范围较小等原因,本文地理关联实体构建与空间化中未处理从业人员-单位这一关联实体数据。

以截至2020年的“四实”数据,统计人民南社区人口结构(表2)。结果显示,人民南社区实有人口总数约5.72万,从性别结构看:男性人口29065人,女性人口28219人,总人口性别比为103.00(以女性为100);从年龄构成看:60周岁及以上的老年人口为15686人,约占社区总人口的27.38%。

表2 人民南社区现状人口信息统计Tab.2 Current demographic information of Renminnan Community

基于关系链映射和地理关联实体空间化方法生成人民南社区人口分布图(图3)与社区建筑人口分布图(图4),获得以实有人口和实有房屋组成的关联实体数据。显然,以关系链映射建立各地理实体之间的关联关系,建立地理关联实体并实现空间化,能够实现有别于传统测绘的新型基础测绘的数据表达。特别之处在于,“四实”当中的实有人口数据,能够超越传统上基于统计年鉴的行政区划空间粒度的人口分析,将数据分析落实于任何空间单元、任何年龄结构,实现多空间尺度与多空间粒度的人口分析。

图3 人民南社区人口分布图Fig.3 Distribution of the population in Renminnan Community

图4 人民南社区建筑中人口分布Fig.4 Distribution of the population in Renminnan Community building

3 结 论

本文以广州市“四实”数据处理、分析与研究为例,创新性地提出面向“四实”数据关联特征的地理关联实体概念,利用基于关系链映射的数据处理策略,实现了“四实”数据空间化,在最小粒度、无尺度全息采集及对社会经济属性关注的数据特征上,新增了空间化数据特征,实现了“四实”数据从记录型数据向地理实体数据的转换。后续工作中要深入研究数据更新与数据应用模式,进一步推动“四实”数据应用的深度与广度。

猜你喜欢

表单关联实体
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
移动App表单组件体验设计
电子表单系统应用分析
前海自贸区:金融服务实体
“一带一路”递进,关联民生更紧
实体书店步入复兴期?
浅谈网页制作中表单的教学
奇趣搭配
两会进行时:紧扣实体经济“钉钉子”
振兴实体经济地方如何“钉钉子”