基于作息空间思想的人口统计数据空间化方法
2012-09-12康敏捷赵冰茹
康敏捷,曹 可,王 辉,赵冰茹,张 旭
(大连海事大学交通运输管理学院,辽宁大连116026)
基于作息空间思想的人口统计数据空间化方法
康敏捷,曹 可,王 辉,赵冰茹,张 旭
(大连海事大学交通运输管理学院,辽宁大连116026)
探讨了基于作息空间思想的人口统计数据空间化方法。定义居住和工作的活动空间范围为作息空间,并结合土地利用类型数据和泰森多边形构建了作息空间,以作息空间人口密度作为人口空间分布的表达方式。对辽宁省2005年人口统计数据进行了实例分析,精度优于传统的面积权重内插法,结果的地图渲染能够表现受自然因素和社会经济因素影响的人口分布特征。该方法不涉及复杂的权重计算过程,也可以避免主观因素的干扰,简单易行,有较强的实用性。
辽宁省;作息空间;人口空间分布;统计数据空间化
0 引言
人口数据是以行政单元为基础,通过普查、统计、逐级汇总得到的典型的统计型数据[1,2],通常可以满足人口、资源环境与社会经济发展宏观分析的需求;而当进行中小尺度的空间分析或跨学科研究时,存在分区界线不一致和精度不足的问题[1]。首先,承载人口数据的行政单元与其它自然地理环境要素(如流域)的界线不一致,无法实现多源数据融合和综合分析;其次,人口数据在行政单元内只能当做均匀分布来处理,显然与实际不符,并且很多情况下无法满足分析精度要求。人口统计数据空间化通过定性描述与定量分析相结合的方法,表达人口在一定时间和一定地理空间中的分布状态[3],是实现人口数据与土地利用、生态环境和气候等数据进行多源数据融合与综合分析的重要基础,对于跨学科研究具有重要价值[1,3,4]。
现有研究主要采用多源数据融合的思想,围绕影响人口分布的多个自然和人文要素建立人口统计数据空间化计算模型[2,5-9],需要多个影响因素的空间数据作支撑,对研究区域的数据完整性要求较高,模型构建过程较复杂,需统计分析软件支持,不能单独在GIS环境下完成,且构建的模型只适用于特定的研究区域。本文提出作息空间的思想,以辽宁省为例,探讨一种基于作息空间实现人口统计数据空间化的方法,该方法只用到土地利用数据,整个分析过程在GIS软件中实现,空间化结果可以表现出自然因素和社会经济因素综合影响的人口分布特征。
1 方法概述
1.1 基本思想
人口有很强的流动性,不同时刻其空间分布不同。日出而作、日落而息是人类主要生活规律,大多数人类活动会稳定的分布在居所和工作地。本文只关注相对稳定的人口分布,忽略人口流动的瞬时状态。定义居住和工作的活动空间范围为作息空间,作息空间范围内单位面积上的人口数为作息空间人口密度,以作息空间人口密度作为人口空间分布的表现形式。
影响人口分布的主要因素包括:土地利用类型、城乡居民点、地形、交通、河流、气候等自然和社会经济因素[2,5-9],土地利用类型是这些影响因素综合作用的结果,如耕地一定分布在气候和水文条件适宜的地方;居民地分布与地形密切相关(图1),随着海拔的升高,居民地面积递减,200 m以上城镇消失,400 m以上农村居民地已经很稀少。以土地利用数据作为计算作息空间人口密度的基础,简化了人口数据空间化模型,避免重复考虑一些存在相关性的影响因素,同时也实现了人口数据与自然地理要素的融合。
图1 辽宁省各高程带居民地面积统计Fig.1 Statistics of settlement place area based on altitude bands in Liaoning Province
1.2 计算方法
根据作息空间的定义及人口分布与土地利用类型的关系,将人口空间化过程分为两步:首先,根据居住地不同将城镇人口和农村人口区分开。然后,根据工作地不同进一步划分,城镇人口的工作地主要集中于城镇建设用地,作息空间即城镇建设用地,不做进一步划分;农村人口主要从事农业以及在附近的厂矿工作,其作息空间包含了农村居民地、附近的耕地和其它建设用地。
人口居住地的空间化以城镇居民地人口密度和农村居民地人口密度进行表达。通过条件查询从土地利用类型数据提取城镇居民地和农村居民地,并将其与行政单元数据进行叠加分析,计算各地区的城镇居民地和农村居民地面积;用各行政单元的城镇人口和农村人口分别除以对应的城镇居民地和农村居民地面积,即计算出各地区城镇居民地人口密度和农村居民地人口密度。
农村人口作息空间的空间化以农村作息空间人口密度表达。根据工作地邻近居住地的原则,用泰森多边形确定作息空间范围。根据泰森多边形的特点:每个泰森多边形内仅含有一个离散点数据,可以保证居民地与其作息空间范围一一对应;泰森多边形内的点到相应离散点的距离最近,保证了作息空间是每个居民地距离最近的空间范围。通过条件查询从土地利用类型数据提取农村居民地、耕地和其它建设用地作为作息空间范围内农村人口主要分布的用地类型;将作息空间范围与用地类型进行叠加分析,确定各农村居民点的作息空间,即各泰森多边形内的农村居民地、耕地和其它建设用地(图2,见封3)。农村作息空间人口密度是单位作息空间面积内农村居民地人口数,等于农村居民地人口密度与作息空间范围内农村居民地面积的乘积,可表示为:
最终通过城镇居民地人口密度、农村作息空间人口密度实现人口的空间化表达。
2 实例分析
2.1 研究区域
本文以辽宁省为研究区域进行省级人口统计数据空间化试验。辽宁省位于中国东北地区的南部,东经118°53′~125°46′,北纬38°43′~43°26′。陆地面积14.8万km2,约占全国陆地总面积1.5%[10]。地势大致为自北向南、自东西两侧向中部倾斜。东部山地丘陵区为辽宁省主要林区;西部山地丘陵区东缘的临海狭长平原,习惯上称为“辽西走廊”,是中国东北地区沟通华北地区的主要陆上通道;中部辽河平原是东北平原的一部分,由辽河及其支流冲积而成,是辽宁省主要农业区和商品粮基地;南部濒临渤海与黄海,大陆海岸线全长2 178 km,占中国大陆海岸线总长的12%[10]。2005年末全省总人口4 189.2万人,约占中国内地人口总数的3.4%[11]。本文所需数据包括辽宁省2005年土地利用类型图,从2006年辽宁统计年鉴获得2005年辽宁省各地级市的人口统计数据,从辽宁省1∶25万地形图获得行政单元、交通线及地形数据,从1∶400万地形图获得主要河流数据,从沈阳市2006年统计年鉴获得2005年沈阳市各县区的人口统计数据。
2.2 数据处理与分析方法
数据处理与分析在ArcGIS中进行,空间分析工具包括Identity叠加分析、Summary Statistics统计分析和Create Thiessen Polygons创建泰森多边形,分析内容包括行政单元内各土地利用类型面积计算以及农村作息空间人口密度计算。
行政单元内各土地利用类型面积计算如下:1)通过Identity叠加分析确定各行政单元的用地类型;2)通过条件查询创建各种用地类型的图层;3)对各种用地类型图层中行政单元字段进行Summarize汇总,得到各行政单元内该用地类型总面积;4)用各行政单元统计的城镇人口数和农村人口数分别除以对应的城镇建设用地面积和农村居民地面积,可得各自的城镇人口密度和农村居民地人口密度,完成了人口数据空间化的第一步。
农村作息空间人口密度计算如下:1)将农村居民地的多边形数据转换为点状农村居民点;2)通过Create Thiessen Polygons分析工具使用农村居民点创建泰森多边形;3)通过条件查询提取农村居民地、耕地和其它建设用地作为农村作息空间用地图层;4)将泰森多边形与农村作息空间用地图层进行Identity叠加分析,得到各农村居民点的作息空间;5)通过Summary Statistics分析工具,以农村居民点作息空间图层的农村居民点Id字段和土地利用类型为分类字段,对各农村居民点作息空间内各种土地利用类型面积进行统计分析,然后计算作息空间内农村居民地占作息空间用地面积的比例,再乘以农村居民地人口密度即得农村作息空间人口密度。
2.3 结果分析
以面积权重内插法[12]为对照,以市级统计资料的统计值作为实际值,分别计算县区级行政单元人口数的估计值,比较两种方法的误差百分比(表1)。因为市级统计资料只有沈阳市统计年鉴对县级行政单元的城市人口和农村人口做了统计,所以只能以沈阳市为验证范围进行比较。但沈阳市统计年鉴对城市人口和农村人口的统计值与本文通过辽宁省统计年鉴估算的城市人口与农村人口(第一产业从业人口为农村人口,其它为城镇人口)的统计值有偏差,为了比较,计算误差时分别乘以一个比例系数。结果显示,在估计城镇人口数时,面积权重插值法的误差在65.54%~398.64%之间,平均误差为225.58%,标准差为127.39,说明其平均误差都超过真实值的2倍多,误差的变幅很大,是真实值的1倍多;本文方法计算的误差在0.5%~56.74%之间,平均误差为31.32%,标准差只有18.34%,相比面积权重插值法精度有很大的提高,且误差的变化比较平稳。在估计农村人口数时,面积权重插值法的误差在1.33%~28.38%之间,平均误差为14.25%,标准差为8.78%;本文方法计算的误差在3.03%~20.7%之间,平均误差为13.08%,标准差为6.03%,结果也优于面积权重法。综合比较可以看出,本文方法的估计结果较好。
表1 本文方法与面积权重插值法的误差比较Table 1 The error comparison of the method in this paper and area weighting interpolation method
从结果的地图渲染看,面积权重内插法的结果通过行政单元进行地图渲染,人口在整个行政单元范围内均匀分布,无法显示人口分布的特征。本文方法地图渲染结果(图3,见封3)显示:辽宁省西部和东部地势高的山区人口密度低,中部地势平缓的地区人口密度高;沿海岸带地区的人口密度整体较高;河流沿线、铁路/国道沿线人口密度较高。本文人口统计数据空间化结果与辽宁省人口分布实际情况相符,而且在人口空间化过程中并没有考虑距海岸线、河流、交通线距离及地形等因素,但结果仍能够体现这些自然因素和社会经济因素所影响的人口分布特征。可见,基于本文方法简化的人口空间化模型是可行的。
3 结语
本文探讨了一种简单可行的人口统计数据空间化方法,提出了“作息空间人口密度”作为表现人口空间分布的表现形式,围绕作息空间的基本思想,实现了城市与农村人口的空间分布表达;方法不涉及复杂的权重计算或参数计算过程,也避免了主观因素的干扰,简单易行,有较强的实用性。
通过辽宁省人口统计数据空间化结果可以看出,本文方法在精度上优于面积权重内插法,在表现形式上,实现了作息空间范围内人口的不均匀分布表达,能够体现出自然因素和社会经济因素综合影响的人口分布特征。以土地利用数据为空间基础,提高了人口数据的空间分辨率,并且可以方便地实现与各种自然要素分区下的统计分析。
[1] 林丽洁,林广发,颜小霞,等.人口统计数据空间化模型综述[J].亚热带资源与环境学报,2010,5(4):10-16.
[2] 廖顺宝,李泽辉.基于人口分布与土地利用关系的人口数据空间化研究——以西藏自治区为例[J].自然资源学报,2003,18(6):659-665.
[3] 吕安民,李成名,林宗坚,等.基于遥感影像的城市人口密度模型[J].地理学报,2004,59(6):283-292.
[4] 叶宇,刘高焕,冯险峰.人口数据空间化表达与应用[J].地理科学进展,2006,8(2):59-65.
[5] 廖顺宝,孙九林.青藏高原人口分布与环境关系的定量研究[J].中国人口·资源与环境,2003,13(3):62-67.
[6] 廖顺宝,孙九林.基于GIS的青藏高原人口统计数据空间化[J].地理学报,2003,58(1):25-33.
[7] 刘纪远,岳天祥,史培军,等.中国人口密度数字模拟[J].地理学报,2003,58(1):266-276.
[8] 田永中,陈述彭,岳天祥,等.基于土地利用的中国人口密度模拟[J].地理学报,2004,59(2):283-292.
[9] 江东,杨小唤,王乃斌,等.基于RS、GIS的人口空间分布研究[J].地理科学进展,2002,17(5):734-738.
[10] 辽宁省统计局.辉煌的岁月——辽宁60年回眸[M].北京:中国统计出版社,2009.
[11] 辽宁省统计局.辽宁统计年鉴(2006)[M].北京:中国统计出版社,2006.
[12] GOODCHILD M F,LAM N S N.Areal Interpolation:A Variant of Traditional Spatial Problem[M].Geoprocessing,1980.297-331.
Abstract:The spatialization method of demographic data based on work and residence space conception is discussed in this paper.Work and residence space is defined by the extent of work and residence places,and it is created by land use data and Thiessen polygons,then population space distribution can be expressed by the population density in work and residence space.The empirical analysis is done using demographic data of Liaoning Province in 2005,result accuracy is better then area weighting interpolation method,and the result map can present the demographic characteristics affected by natural factors and socio-economic factors.This method does not include complex weights calculation procedure,it is not interfered by subjective factors,and it is simple and practicable.
Key words:Liaoning Province;work and residence space;population space distribution;spatialization of statistical data
Spatialization Method of Demographic Data Based on Work and Residence Space Conception
KANG Min-jie,CAO Ke,WANG Hui,ZHAO Bing-ru,ZHANG Xu
(Transportation Management School of Dalian Maritime University,Dalian 116026,China)
K901.3
A
1672-0504(2012)04-0060-03
2012-02-17;
2012-04-12
国家自然科学基金项目(41071079);国家海洋公益性行业科研专项(201005008)
康敏捷(1982-),男,博士研究生,主要研究方向为经济系统分析。E-mail:kangminjie@sina.com