APP下载

基于“实有人口、实有房屋”数据的精细化人口空间化处理方法及应用研究

2018-09-21李建松蒋子龙

关键词:主城格网武汉市

朱 瑾,李建松,蒋子龙,程 琦

(1.武汉大学遥感信息工程学院,湖北 武汉 430072;2.武汉市测绘研究院,湖北 武汉 430022)

0 引言

人口数据是描述人类各种活动最直接的指标之一,应用领域十分广泛[1].人口统计数据通常以行政区为单元逐级统计和汇总得来.因为行政区划的人为分割,导致人口统计数据往往与其所属空间特征相脱节,在进行人地关系研究时,存在着严重制约[2].解决这个问题的方法即是对人口统计数据进行空间化.人口数据空间化,是采用一定的计算方法,对基于行政区划的人口统计数据进行处理的过程.其目的是将其中隐含的空间信息发掘并展现出来,方便结合其他自然生态、社会经济等数据进行空间分析或跨学科研究[3].

现有的人口空间化方法可以大致归纳为城市地理学中的人口密度模型方法[4]、空间插值方法[5]、基于遥感和GIS的统计建模方法[6-8].人口密度模型强调的是对城镇人口分布规律进行宏观描述,对城区内人口详细分布刻画不足.空间插值方法具体可细分为面插值法[5]、点插值法[9]和地统计学方法[10],其中,面插值法和点插值法的分辨率一般较大,多为数十千米,且误差难以量化,刻画真实人口分布的能力较弱;地统计学方法易于与高分辨率遥感影像结合,但其模型较为复杂,实现比较困难.基于遥感和GIS的空间化方法在近20年来成为主要的空间化方法,可以细分为土地利用类型法[11]、多源信息融合法[12]和基于像元特征的空间化方法[13].其中,土地利用类型法原理简单、精度较高,但不能反映人口分布的某些随机特征;多源信息融合法模拟结果精度较高,能比较真实地反映人口数据空间分布情况,但所选因子的权重确定过程复杂,不易于推广;基于像元特征的空间化方法近年来逐渐成为高分辨率空间化研究的重要手段,但采用的模型多属于经验型统计模型,普适性较差.

现有的人口数据空间化的研究主要关注于大尺度[14-15]的人口模拟,这类研究得到的空间化人口数据,其分辨率在多数情况下大于1 km,无法表现城市内人口分布的细节特征.而精细化的、高分辨率[16]的人口数据空间化研究,其研究区域往往较小,多数仅包含一个区或者少数街区,部分研究甚至仅仅涵盖一个社区的范围,不足以保证对城市整体的研究需求.为此,有必要研究一种兼顾研究范围和高分辨率的人口数据空间化方法.

“两实人口”是指辖区内全部房屋及其全部房屋内居住的所有人员的统称.2012年,公安部提出对各辖区内“实有人口、实有房屋”进行调查,通过逐人逐户地调查走访,掌握辖区内的实有人口、实有房屋信息,以期提升政府服务管理的水平.“两实人口”数据以其权威性和精度高的特点为精细化人口数据空间化提供了基础支撑.

因此,基于公安部门“两实人口”数据以及地理国情普查和房屋调查数据,本文提出了一种精细化人口数据空间化方法,在武汉市中心主城范围内,以居住建筑内的人口数据为空间化目标单元,实现了较大范围的高精细度人口数据空间化,以为各领域对人口的研究提供支持.

1 研究区概况及数据特点

1.1 研究区概况

本文选取武汉市中心主城作为研究区域(见图1).据2015年底武汉市房屋调查数据和公安部门“实有人口、实有房屋”的社区人口数据,中心主城共计包含社区1 114个,占武汉市全部3 493个社区的31.89%;面积808.99 km2,占武汉市总面积8 569.15 km2的9.44%;拥有常住人口6 443 488人,占全市常住人口10 821 004人的59.55%,人口密度见图2.

图1 研究区域

1.2 数据来源及特点

本文所用数据主要包括2015年底武汉市公安部门社区实有人口调查数据、2015年房屋调查专项数据,并使用2015年武汉市地理国情普查和监测数据作为补充.

实有人口,是指某一行政管辖区域内实际存在的人口,包括该辖区内的常住人口、暂住人口、寄住人口、未落常住户口人员、辖区境外人员,数据由各级公安部门每年更新.实有人口调查数据的尺度单元为社区,具有统计单元小、人口数据详细全面、时效性较高等特点.

图2 武汉市中心主城人口密度图

2015年房屋调查专项数据由武汉市测绘研究院主持采集制作.该数据收集了武汉市中心主城范围内绝大部分建筑的相关信息.该数据按照建筑用途将房屋建筑分为大类、中类和小类等三类.本研究的房屋数据主要来源于房屋调查专项数据中的大类信息,根据该数据集的建筑物命名规则,对建筑物进行了筛选,最终得到居住用房信息.此外,由于该数据集中存在的极少数地区房屋调查数据缺漏的状况,需要结合地理国情普查数据对缺漏的部分进行补充.主要用到地理国情普查和监测数据的城镇综合功能单元(面)和地表覆盖分类数据(简称BUCA和LCA).

2 研究方法

本文首先对实验数据进行预处理,然后对房屋数据进行编辑以得到居住用房,随后进行实有人口数据与房屋数据的空间关联,并对缺失数据进行补充.完成上述步骤后,进行居住面积量算以及居民分配,在此基础上实现人口数据的空间化.最后引入中心主城范围的标准栅格网实现人口数据的栅格化.技术路线如图3所示:

图3 技术路线图

2.1 数据预处理

本文选用的数据中,2015年武汉市房屋调查专项数据以及武汉市地理国情普查和检测数据使用的坐标系为“CGCS2000_3_Degree_GK_CM_114E”.该坐标系属于2000国家大地坐标系,是我国当前最新的国家大地坐标系,是全球地心坐标系在我国的具体体现.而来自武汉市公安部门的社区实有人口调查数据则未分配坐标系.为了提高数据处理精度,将实有人口数据重投影至坐标系“CGCS2000_3_Degree_GK_CM_114E”,实现坐标系的统一.根据中心主城的范围,对地理国情普查数据以及实有人口数据进行裁剪,得到中心主城范围内的BUCA、LCA图层数据,以及实有人口数据.

2.2 房屋调查数据编辑

在房屋调查数据的一级分类基础上,对房屋调查数据进行人工筛选,提取出居住建筑以用于人口数据空间化的处理.房屋调查数据编辑过程如下:

(1) 居住建筑筛选.利用ArcGIS软件,筛选出字段“建筑用途”或“竣工用途”为“JR”的房屋.然后根据建筑命名规则,筛选并删除非居住用房,得到中心主城居民居住用房数据.

(2) 空间关联.利用ArcGIS基于空间位置的数据关联功能,对中心主城实有人口数据和房屋调查数据进行关联,赋予房屋调查数据所属社区属性.由于存在房屋跨越两个社区的情况,导致所属社区属性无法分配,需单独进行人工分配.

(3) 缺失数据补充.结合中心主城实有人口数据,针对房屋调查数据中存在的缺失或缺漏情况,从BUCA、LCA图层中对应的位置提取地物对象予以补充.在BUCA图层中,“TYPE”字段属性为“一类”“二类”“三类”“四类”的地块为居住用地;LCA图层中,“一级类”字段属性为“05”的地物为建筑.

房屋调查数据编辑结果如图4所示.处理完成后的房屋调查数据,房屋对象由原有的277 561减少至183 614个,基底面积和建筑面积分别由原来的95.81和428.87 km2减少为47.29和290.74 km2.

图4 房屋调查数据处理结果图

2.3 人口数据计算及空间化

(1) 计算居住面积.以社区为单元,使用如下公式统计居住建筑总的建筑面积:

(1)

式中:Si为第i个社区的建筑面积之和,Sij为该社区中第j个建筑的建筑面积.

(2) 分配居民.由于研究区域内社区数量较大(共计1 114个),单个社区面积小且房屋类型单一,可以假设每个社区内居民的人均居住面积相同.基于这个假设前提下,使用如下公式可将人口由社区重新分配到居住建筑:

(2)

式中:Si为第i个社区的建筑面积之和,Sij为该社区中第j个建筑的建筑面积,Pi为第i个社区的人口总数,Pij为该社区中第j个建筑容纳的居民数.

2.4 人口数据栅格化

为了使人口数据能更方便进行空间分析,以及进行跨学科研究时能更好地与其他数据进行结合,需要对2.3得到的空间化人口数据进行格网化处理.本研究在计算机硬件性能允许的前提下,综合考虑格网大小对精度的影响,选取50 m×50 m的格网作为实验单元.

(1) 生成标准格网.根据武汉市中心主城的范围,使用ArcGIS软件的Fishnet工具生成50 m×50 m的标准格网,并将其转化为格网面.

(2) 空间叠加.使用ArcGIS叠加工具Intersect,对标准格网面和2.3中所得带有人口信息的房屋数据进行处理,得到经格网切割过的房屋数据,并计算切割后房屋对象的面积.

(3) 人口计算.由于部分房屋跨越多个格网,在切割后被分配到不同的格网中.本文假设同一栋建筑内,居民的人均居住面积是均匀的,从而可用如下公式计算切割后的房屋所容纳的人口数:

(3)

式中:Pm为第m个房屋所容纳人口数,Pmn为该房屋被切割后的第n个部分所容纳的人口数,Sm为该房屋的基底面积,Sn为切割后的第n个部分的占地面积.随后,统计每个标准格网内容纳的人口数量,完成人口数据格网化处理.

3 实验结果及分析

3.1 居民住房空间分布分析

根据编辑后的房屋建筑数据,中心主城范围内,居民居住房屋建筑数量为183 612间,占地面积47.20 km2,占中心主城总面积808.99 km2的5.83%,建筑面积总计290.7 km2.由图4可以看出,在中心主城范围内,武汉市房屋建筑分布呈现明显的中心—边缘式空间分异格局.中心区域由于社会经济发展较为成熟,土地开发程度高,房屋建筑较为密集.边缘地区由于大部分开发建设尚处于起步阶段,土地开发程度还比较低,房屋建筑较为稀疏.以位于中心主城北部的长江江心洲——天兴洲为例,该地区房屋建筑数量为115个,仅占中心主城的0.062 6%,这是由于该地区为武汉市的瓜果生产基地,主要从事农业生产,城市开发建设较为滞后.另外,值得一提的是汉阳区中南部,其所处并非边缘区,然而该地区的房屋建筑数量仅为1 448个,远低于中心区域的平均水平.其原因在于,作为武汉市老工业区,该地区在数年前开始的旧城区改造行动中,大量老旧工厂被拆除,新的建设尚未完成,从而导致房屋建筑数量偏少.

图5 地块分类图

对于居民居住建筑和其他建筑的分布细节方面,大致可以根据房屋用途分为三类地块.其中,第一类地块(如图5a所示)为武汉市武昌区洪山广场,是湖北省政府所在地,居住用房中夹杂部分其他建筑,这类地块主要为商业金融用地,且这类地块的其他用房较多数沿街分布;第二类地块(如图5b所示)位于青山区钢花村街道,是原武汉钢铁集团公司的职工家属区,居住用房占绝大多数,其所在地块在土地规划用地方面主要为居民用地,其代表主要为集中建设的居住小区以及城中村地区;第三类地块(如图5c所示)位于武汉市青山区中部,区域中其他建筑占绝大多数,这类地块主要为工业用地,其典型代表位于青山区原武汉钢铁集团公司厂区以及武汉市经济开发区所在地.住房和其他建筑的分布规律,是武汉市中心主城用地规划的外在体现,居住用地、商业用地、工业用地和绿地的规划导致了房屋分布细节的差异.

3.2 人口数据空间化及栅格化结果分析

根据人口数据计算和空间化方法,将武汉中心主城实有人口数据划分到房屋建筑中去,形成人口数据的空间化成果图.图6为中心主城的人口空间化成果图,并以青山区钢花村街道附近区域为例进行了细节展示.由图6可见,武汉市中心主城人口分布主要集中在硚口区、江汉区、江岸区、汉阳区北部、青山区西部、武昌区、洪山区北部以及东湖新技术开发区西部.与图2的中心主城社区人口密度图相比,在体现了人口分布总体概况的前提下,描绘出了更多细节.研究者能通过房屋的形状、排列模式、所容纳人口数量等信息,判断不同地区人口的居住环境.在图6右方的细节图中,房屋形状及排列规整,容纳人口数量较多的房屋为居住小区,如图6右侧实线方框区域;而房屋排列密集,容纳人口数量较少的房屋,为城中村地区,如图6右侧虚线方框区域.此外,图2中人口密度较低的社区,其人口分布的具体细节在图6中也得到了很好的体现.

图6 人口数据空间化成果图

在人口数据空间化的基础上,进一步生成栅格化人口数据(见图7),结果同样以青山区钢花村街道附近区域为例进行了详细展示.该成果在一定程度上放大了空间化人口数据的粒度,在描绘武汉市中心主城这个较大尺度的人口分布时,表现得更为直观、明显.同时由于标准格网的选取,人口分布的细节相比图2也得到了很好的保留,研究者可通过栅格化的人口数据,更直观地观察到某个社区内人口的精细化分布.

与以往传统的社区行政单元为统计单元的人口数据相比,本文所得到的空间化成果对人口分布的描绘体现了更多的细节,同时最大限度地保留了整体信息.经栅格化处理后,保留了大部分细节信息,提高了对人口空间分布的表现力;且栅格化的人口数据将更易于与其他自然环境、社会经济等数据结合,为跨学科研究提供了便利.

3.3 人口数据空间化误差检验

本文根据空间化和栅格化处理后得到的人口总数,量算总体误差.误差量算公式如下:

(4)

式中:EG(general error)为总体误差,Pa为统计人口数,Ps为人口数据空间化后的总计人口数.

图7 人口数据栅格化成果图

研究区所有社区包含的人口总数为6 443 488人,人口数据空间化后,所有房屋容纳的人口总数为6 437 104人,栅格化后所有栅格容纳的人口总数则为6 436 588人.本文所用方法总体误差分别为0.10%和0.11%.

4 结论与讨论

本文提出了一种新的人口数据空间化方法,实现了较大尺度下的精细化的人口分配,并得到了较好的效果.相较同类研究具有以下特色:

(1) 拓展了数据来源.公安部门“实有房屋,实有人口”是我国2012年后才逐步展开的调查行动.调查得到的人口数据比传统的街道人口数据更加详细.此外,地理国情普查和监测数据以及房屋专项调查得到的建筑类别、建筑基底面积、建筑面积是传统影像提取手段很难甚至无法得到的信息,在剔除了非住宅建筑后,用于人口分布的空间化能得到极好的模拟效果.也为近年来在全国范围广泛开展的地理国情普查和监测产生的数据,找到了一个拥有很大潜力的应用领域.

(2) 提高了处理范围和空间分辨率.人口分布的模拟结果精确到真实的单个居住建筑,空间分辨率高、模拟范围广.将人口模拟到单个居住建筑在当前人口数据空间化研究中还不多见;且现有的模拟单个建筑人口分布的研究往往选用少数社区,甚至仅选用一个社区进行讨论.本文对武汉市中心主城808.99 km2的范围进行了人口模拟,让精细化的人口数据空间化更适合城市人口研究的需求.

(3) 应用范围较为广泛.人口栅格化处理可以进一步更好地进行相应的计量地理学处理.在分配到格网的过程中,标准格网的大小可以很方便地定制,适用于分析不同格网尺度下人口分布的特征分析,且格网化的数据能更加方便地进行地统计运算.

(4) 易于推广.在目前全国各地相关部门广泛开展地理国情普查和监测,以及 “两实全覆盖”调查的背景下,本文所用方法的数据来源稳定、覆盖面广.此外,本文所用方法自动化程度较高,在对数据进行少数步骤的处理后,即可由商业软件得到所需成果,便于相关领域的使用和推广.

猜你喜欢

主城格网武汉市
武汉市勘察设计有限公司
重庆主城都市区工业遗产分布图(部分)
武汉市中小学优秀自制教具评选活动成功举办
遥感数据即得即用(Ready To Use,RTU)地理格网产品规范
实时电离层格网数据精度评估
武汉市勘察设计有限公司
“十三五”时期重庆主城拟打通170条“断头路”
基于改进引力模型的公租房空间布局适宜性评价——以重庆主城9区为例
平均Helmert空间重力异常格网构制方法
基于位置服务的地理格网编码设计