协同遥感信息与统计信息的人口空间格局分析
2017-06-19董珍珍仇阿根
董珍珍,王 亮,仇阿根
(中国测绘科学研究院,北京 100830)
协同遥感信息与统计信息的人口空间格局分析
董珍珍,王 亮,仇阿根
(中国测绘科学研究院,北京 100830)
针对人口空间格局分布分析不足的问题,借助遥感信息与基本统计信息,引入人口地理集中度、探索性空间数据分析和地理加权回归模型,定量地分析了特征因子在市域范围上的空间异质性。人口集中指数与Moran指数能有效地反映空间事物之间的密切作用关系,在产业空间分布中能较好地评价集聚效应,反映空间分布状态。以长江经济带为研究区域,对人口空间分布进行了研究,得出了“圈层集中—东西对立—南北差异—四周分散”的分布特征,并从经济、社会、环境、土地利用方面分析原因,为人口合理增长和资源分配提供了参考。
人口;空间格局分析;探索性分析;地理加权回归
人口空间分布是指一定时间点上人口在特定地域的分布状况,反映了一个地区自然条件经济发展水平的差异。随着我国经济的不断发展,各地人口发生很大变化。人口增长过快,会加大资源和环境的压力;人口增长缓慢,则会造成产业缺少劳动力的现象。因此,充分了解人口空间分布状况,构建人口空间分布模型,对人口合理再分布,以及可持续发展、资源的合理分配具有重要的意义[1]。
近年来,人口空间分布领域引起了诸多学者的关注和重视,如邓羽等[2]基于省级人口数据构建了自上而下的人口预测方法,对2010—2050年间人口总量进行了预测,并研究了我国人口空间格局的发展情景和演化特征;李莎等[3]基于俄罗斯历年人口统计数据,利用空间自相关模型探讨了欧洲部分人口分布及演化时空特征。潘倩等[4]利用分布重心、不均衡指数等分析方法研究了自清朝以来近300年的中国人口数量变化及时空分布格局;Tobias Lung等[5]根据肯尼亚西部地区高分辨率卫星影像研究了人口与河流、学校、坡度等因素的关系,并根据不同因素分析其原因;金君等[6]将人口数据分布到规则格网上的数字人口模型(digital population model,DPM),改变了传统的人口按行政区划的统计方法,实现了人口数据的格网化统计,并验证了模型表示分布人口的准确性、合理性。国内外学者从不同理论角度在不同尺度对人口分布进行的研究,主要从人口的时空演变特征、空间分布角度进行,研究对象多为国家、省级等大尺度地方,缺少基于地级市的研究,并且研究中未考虑地理位置这一因素,而地理学中研究对象、对象结构均会随着地理位置变化而变化。
线性回归模型(ordinary least squares,OLS)是较为简单的分析模型,可在一定程度上分析变量之间的相关关系,并根据相关系数的大小对因变量进行分析与预测,但未涉及空间差异性;地理加权回归(geographical weighted regression,GWR)是应用广泛的空间分析方法,它在线性回归模型基础上嵌入空间信息,从而分析不同地理位置上变量的回归系数的差异性,对空间关系的非平稳性进行分析和探测[7],在房价估计、传染病预测等各方面广泛应用[8-10]。近几年,应用范围逐渐扩大,武文娟等利用空间分析技术首先研究了区县床位的时空变化特征,并采用地理加权回归模型方法解释了经济、人口、交通、地形等因素对时空异质性的影响[11];李祥等采用自然正交函数分析了北京市空气质量变化的时空特征,同时借助地理加权回归模型揭示了其驱动力,同时探讨了驱动力的异质性[12]。
长江经济带人口密集,经济发达,交通便利,是国家重点研究区域,但不同的地级市因自然、社会、经济条件的不同,发展模式存在明显差异,人口空间分布也具有鲜明的地域分布特征。本文在现有研究方法的基础上,综合利用探索性分析方法中Moran’s I统计量分析总结人口的空间分布特征与集聚特征;在分析多种因素影响因子的基础上对人口空间分布构建OLS与GWR模型,分析人口空间分布特征的成因,为人口合理增长和资源合理分配提供参考。
1 研究区概况与数据
1.1 研究区域
长江经济带区域覆盖了上海、江苏、浙江、安徽、江西、湖北、湖南、重庆、四川、云南、贵州等11个省市,130多个地级市,面积约205万km2,人口超过全国的40%,GDP占全国的41%,且横跨我国东中西三大区域,具有独特的优势和巨大的发展潜力(如图1所示)。2014年国务院提出了关于依托黄金水道推动长江经济带发展的指导意见,改革开放以来,长江经济带已发展成为我国综合实力最强、战略支撑作用最大的区域之一,而人口问题始终是制约其全面协调可持续发展的重大问题,是影响经济社会发展的关键因素。
1.2 数据来源
基础统计数据包括:①人口统计数据,主要指研究区人口、社会、经济数据,尺度为市域,来源于统计年鉴;②行政区划数据,指长江经济带市域,来源于中国行政区划矢量图。
图1 长江经济带行政区划
遥感信息数据包括:①土地利用现状数据,主要指研究区不同土地类型的分布情况,因无法获取最新土地类型情况,以2010年土地利用数据代替,来源于中国科学院资源环境科学数据中心(http:∥www.resdc.cn),由Landsat TM/ETM卫星获取,分辨率为1 km×1 km;②数字高程数据,主要指研究区内高程值,在其基础上可提取坡度、坡向等,分辨率为30 m,来源于地理空间数据云的GDEMV2数据集;③气象数据,主要指研究区内市域气温与降水量情况,来源于中国科学院资源环境科学数据中心,由全国1915个站点的气象数据整理检查形成,其分辨率为0.5 km×0.5 km。
1.3 数据预处理
为了构建人口空间分布模型的正确性,需要对数据进行预处理操作。根据2015年城市经济统计年鉴统计长江经济带市域的人口、社会、经济数据,并且为了数据的无量纲性,将人口、经济、社会数据按照地区人均或每万人计量进行处理,消除因单位不同造成的干扰。
土地利用现状、数字高程模型、气象数据等遥感信息的获取则相对复杂,因数据分辨率与投影方式的不同,需要进行统一坐标系操作,均采用双标准纬线等面积圆锥投影坐标系;需要对数据重采样,分辨率标准为0.5 km×0.5 km,并且需要对长江经济带进行掩膜处理,从而实现区域统计。
2 研究方法
2.1 人口地理集中度分析
人口地理集中度是指在一定地理单元上人口的集中化程度。人口集中指数是衡量人口集中化程度最为经典的方法,是表明某项经济活动在地域上集中程度的指标,也是分析城市密集人口分布与分散化变动趋势的重要指标之一,其计算公式为
(1)
式中,C为人口集中指数,分别为第i个区域的人口数量和土地面积;P和S分别为整个区域的总人口和总面积。C的值在0和1之间,C值越接近于1,说明人口向某些地域集中的程度越大,人口分布越不均匀;C值越接近于0,说明人口向某一地域集中的偏向越小,人口分布越分散。人口集中指数反映了人口分布相对于土地面积的集中和分散情况。
2.2 探索性空间数据分析
探索性分析方法主要是通过全局空间自相关分析和局域空间自相关分析对空间关联模式进行度量与检验的方法。其中全局自相关分析主要是反映某种属性值在整个研究区域的空间关联模式;而局域自相关分析用于反映某区域单元上的某种属性值与邻近区域单元上同一属性值的相关程度。本文采用全局与局部的方法对人口的空间格局进行分析。
空间自相关是用于分析不同空间位置某一属性值之间相关性的指标,是空间集聚程度的一种度量,通过空间自相关系数大小度量空间相关性强弱[13-17]。本文采用Moran指数(Moran’s I)测度空间关联程度,其公式如下
(2)
用标准化统计量Z对Global Moran’s I进行显著性检验,计算公式为
(3)
式中,Z(I)表示标准差的倍数,其中I即为Moran指数;E(I)为期望值;VAR(I)为变异系数。若Z(I)的值大于2.58,则置信度为99%,即小事件发生的可能性为1%;若Z(I)的值大于1.96,则置信度为95%,即小事件发生的可能性为5%。
2.3 地理加权回归分析
地理加权回归是Fortheringham等[18]基于局部光滑的思想,将数据的空间位置嵌入到回归参数中,利用局部加权最小二乘法进行逐点参数估计[19-20]的分析方法。其模型表达如下
(4)式中,yi为因变量在点(ui,vi)处的观测值,i=1,2,…,n;xik为自变量x1,x2,…,xn在点(ui,vi)处的n个观测值;(ui,vi)为i点的坐标;βk(ui,vk)是第i个采样点上的回归参数;εi为误差项。模型的核心是空间权重矩阵,它通过选取不同的空间权函数来表达对数据间空间关系的不同认识。空间权函数的正确选取对地理加权回归模型参数的正确估计非常重要[21]。
3 长江经济带人口空间格局分析
利用人口地理集中度与探索性分析方法对长江经济带人口格局展开分析,其人口分布从西向东逐渐增加,集聚效应较强的地区也出现在东部,中部地区人口则处于中等,因此,形成了总体为“圈层相对集中—东西对立—南北差异—四周分散”的分布特征。
3.1 空间分布分析
长江经济带市域范围内人口密度如图2所示。各地区之间人口差异较为明显,基本从西向东逐渐增加,10%的市域人口密度大于800人/km2,25%的市域人口密度小于200人/km2,其他市域人口密度均在200~800人/km2之间。其中,环绕长江中下游流域的上海市、扬州市、无锡市、常州市、南京市、池州市、武汉市等形成人口密集高值带,这一带区位优越、交通便利、经济发展较快,在一定程度上促进了人口的聚集;同时,部分城市如十堰市、襄阳市、宜昌市、永州市、郴州市等由于远离大中城市,受其辐射较少,且耕地面积较少,造成其经济落后,从而人口密度较低。由此可见,长江经济带市域人口密度相对不高,且分布不均衡。
图2 长江经济带市域人口密度分布
3.2 集聚效应分析
针对长江经济带人口,利用探索性分析方法,Moran’s I值为0.45,Z值为13.4,p值为0.00,在0.01的水平下通过检验。因此,数据集的值在空间上倾向于聚类,即高值聚集在其他高值附近,低值聚集在其他低值附近。该结果的置信度为99%,具有较高的可信性。局部Getis-Ord Gi指数Z值介于-3.217~6.182之间,如图3所示,人口集中指数范围在0~0.52之间,说明长江经济带人口数据相对集中,部分集中区分布在长江三角洲附近,估计是由于该地区经济发达引起的。
图3 长江经济带市域人口集中指数与散点分布
图3(b)中横轴为地级市尺度下的人口密度,纵轴为该尺度下人口密度的空间滞后变量,其斜率即为Moran’s I值。由图可发现,点分布在4个象限,分布于一、三象限的说明呈正相关,分布于二、四象限的呈负相关。比较发现,位于二、三象限的地级市较多,说明正负相关均存在,即集聚程度较为明显。
3.3 空间趋势分析
针对长江经济带地区进行人口密度与常住人口总量的趋势分析,图4两个走势图中灰色线代表东西方向,黑色线代表南北方向。由图4(a)的两条走势线可知,该经济带出现了“东西对立—南北差异”的格局,在东北部人口密度值达到最大;由图4(b)的两条走势线可知,常住人口也由东向西、由南向北进行着不同程度的变化,总体趋势为增加。这是因为东北部经济、社会等较为发达,促进了人口的聚集,同时环境等条件也适宜人居住。
图4 长江经济带市域人口密度与常住人口趋势
4 长江经济带人口分布特征因子提取与模型构建
根据上述对长江经济带人口分布的空间格局分析,可发现地级市之间人口空间分布的差异受多种因素的综合影响,本文选取经济、社会、环境、土地利用等几个方面的13个指标,主要包括人均国内生产总值、人均社会消费品零售总额、人均公共财政预算收入、人均固定资产投资、人均可支配收入、每万人拥有卫生机构床位数、每万人拥有在校大学生数、平均高程、平均气温、年平均降水量、林地面积、耕地面积、城镇用地面积等。
4.1 特征因子提取
由于影响因素之间存在一定的相关性,需要对特征因子进行提取。采用因子分析的主成分分析,将影响人口空间分布强的特征因子提取出来,KMO为0.789,接近于1,sig值为0.00,适合进行因子分析;将关键因素进行得分处理归结为经济、社会、自然、土地利用4个因子,累计方差的贡献率为82%,利用这4个因子可以有效地解释82%的地区人口分布情况。
4.2 模型构建
根据以上分析,构建了人口空间分布模型,一方面为了分析长江经济带人口格局与影响因子,另一方面为了比较OLS模型与GWR模型的可用性,本文以长江经济带人口密度数据作为因变量,上述提取得到的因子作为自变量,展开模型的构建及对比分析。
4.2.1 人口空间分布OLS模型
构建的长江经济带人口空间分布OLR模型为
Y=0.114 947+0.082 5Xjj-0.002Xhj+0.03Xsh-0.03Xtd
式中,Xjj代表经济因子;Xhj代表环境因子;Xsh代表社会因子;Xtd代表土地因子。AIC值为-349.52,拟合度R2为0.803。由上述系数可知,经济因子、土地利用因子、社会因子均与人口空间分布呈正相关状态,而环境因子与人口空间分布呈现负相关状态;由系数大小可知,经济因子对人口空间分布影响最大,经济越发达的地区人口越集聚。
4.2.2 人口空间分布GWR模型
GWR模型表达了空间异质性,体现了其与地域是否存在相关性,涉及人口分布、房价评估、地址选择等各领域,因此,构建的长江经济带人口空间分布GWR模型如下
Yi=β0(ui,vi)+β1(ui,vi)(jj)+β2(ui,vi)(hj)+β3(ui,vi)(sh)+β4(ui,vi)(td)+εi
式中,jj代表经济因子;hj代表环境因子;sh代表社会因子;td代表土地利用因子;(ui,vi)代表编码为i的市域的地理中心坐标。模型带宽计算运用了AIC的方法,AIC值为-409.56,拟合度R2的值为0.894,调整后R2的值为0.876,拟合效果较好。
4.2.3 模型对比分析
针对相同的参数进行对比分析(见表1),从AIC的角度分析,GWR模型的AIC值比OLS模型得到的AIC值低59.94,该值大于3,说明GWR模型相比OLS模型在对长江经济带人口空间格局表达方面有所提升与改善;从拟合度R2的角度分析,GWR模型的拟合度与调整后的拟合度均高于OLS模型,说明GWR模型相比OLS模型在表达人口空间格局分析时,结果更为显著,能够更好地表达空间异质性。
表1 OLR模型与GWR模型参数对比
OLS模型的经济、环境、社会、土地利用回归系数分别为0.082 5、-0.002、0.03、0.03;由于GWR模型表达的是地理空间对人口的作用,因此相同变量不同市域回归系数也不相同。表2统计了最大值、最小值与均值,两种模型参数具有统一性,其中经济、社会与人口空间分布均表现出正相关性,而环境、土地利用均表现出负相关性,说明各因子与人口空间分布正负相关性得以正确表达;同时,GWR模型中标准残差较小,能有效地表达人口空间分布情况。
表2 GWR模型回归系数及标准残差统计
4.3 结果分析
4.3.1 特征因子角度
在提取的4种特征因子中,经济、社会与人口空间分布呈正相关,而环境因子、土地利用因子与人口空间分布呈负相关。原因分析如下:经济与社会方面,主要是由于现代各行各业的迅猛发展,促使大量人口向经济发展较好、生活质量条件优越的地市迁移,而在经济落后、条件较差的地区,人口越来越少,造成了现在这种地域上人口差异较大的情形;环境与土地利用方面,在环境较为恶劣,如高程值较大、坡度较陡的地区,不再适宜人的居住,同时也不适宜进行耕作,此处表现为大量的林地覆盖,造成了越来越多的人迁出,使得最终与人口分布呈负相关。
4.3.2 GWR模型角度
GWR模型能够表现空间的异质性,反映变量之间的关系及局部特征,同时可以揭示与影响因子之间的关系。比较OLS与GWR模型各项参数可知,GWR模型对于长江经济带人口空间分布格局拟合较好,因此,笔者对GWR模型结果从回归系数的变化情况与长江经济带市域展开分析,如图5所示。
在回归系数变化方面分析,长江经济带人口密度由西向东逐渐递增,上述4种影响因子系数图也沿着相同方向发生着变化,表现出明显的空间异质性。经济因子影响系数由西向东逐步增加,系数范围为0.05~0.20,相比其他因子,其范围值最大,因此,更容易表现出空间异质性;环境影响因子表现为负值,自东向西逐渐递增,较大值出现在四川、贵州地区,其变化与高程值变化尤为相近,说明西部地区不适宜人居住;社会因子影响系数在0.005~0.035之间,其影响程度较低,自东向西逐渐递增;土地利用因子影响系数自东向西先减小再增大再减小,说明在四川、贵州、安徽等地影响人口分布强度较大,与这些地区林地面积较广泛有直接的关系。
图5 GWR模型回归系数空间分布
在长江经济带市域方面分析,在上海市、江苏省与浙江省等经济发展水平较高的地区,影响人口的主要因子为经济因子,其他因子影响较小,该地区地势较为平坦,温度适宜,适合人类居住;在中部湖南、湖北、江西、安徽等经济发展中等地区,主要影响因子为社会与土地利用因子;西部贵州、重庆、四川和云南等发展水平较低的地区,主要影响因子为土地利用与环境因子,该地区高程值较大,多山,地势不平坦,近一半面积的地区无法居住。
5 结 语
本文以市域为单位对长江经济带人口进行了空间格局分析,总结了长江地区人口空间分布的特征,表现为“圈层集中—东西对立—南北差异—四周分散”的分布特征;同时构建了人口空间分布模型OLS与GWR模型,并进行了对比分析,从多个方面解释了GWR模型相对于OLS在空间异质性方面的优越性,更加揭示了影响各地区的主要特征因子;据各因子回归系数发现,经济、社会因子与人口空间分布呈正相关,环境、土地利用因子与其呈负相关。
总的来说,不同地区因不同原因在人口方面总会产生差异,海拔方面的条件无法更改,但经济、医疗必须去适当提高。对于低-低集聚区,需要发挥该地区的区域优势,积极引进人才和先进技术,提高经济发展,促进人口聚集;对于高-高集聚区,需要适当控制人口数量,不能让资源人口处于失衡的状态。
[1] 段学军,王书国,陈雯.长江三角洲地区人口分布演化与偏移增长[J].地理科学,2008,28(2):139-144.
[2] 邓羽,刘盛和,蔡建明,等. 中国省际人口空间格局演化的分析方法与实证[J]. 地理学报,2014,69(10):1474-1486.
[3] 李莎,刘卫东. 俄罗斯人口分布及其空间格局演化[J]. 经济地理,2014,34(2):42-49.
[4] 潘倩,金晓斌,周寅康.近300年来中国人口变化及时空分布格局[J].地理研究,2013,32(7):1291-1302.
[5] LUNG T, LÜBKER T, NGOCHOCH J K, et al. Human Population Distribution Modelling at Regional Level Using Veryhigh Resolution Satellite Imagery[J]. Applied Geography, 2013,41:36-45.
[6] 金君,李成名,印洁,等.人口数据空间分布化模型研究[J].测绘学报,2003,32(3):278-282.
[7] FOTHERINGHAM A S,BRUNSDON C,CHARLTON M. Geographically Weighted Regression: The Analysis of Spatially Varying Relation-ships[M].Chichester: Wiley, 2002.
[8] 汤庆园,徐伟,艾福利. 基于地理加权回归的上海市房价空间分异及其影响因子研究[J].经济地理,2012,32(2):52-58.
[9] 肖雄,杨长虹,谭柯,等.地理加权回归模型在传染病空间分析中的应用[J]. 中国卫生统计,2013,30(6).
[10] 张耀军,任正委. 基于地理加权回归的山区人口分布影响因素实证研究——以贵州省毕节地区为例[J].人口与资源环境,2012,36(4):53-63.
[11] 武文娟,徐京华,时进,等.基于GWR的四川省医院床位数时空分布及其影响因素研究[J].测绘通报,2016(4): 49-53.
[12] 李祥,彭玲,池天河,等.北京市空气质量时空特征分析[J].测绘通报,2016(9):47-51.
[13] 邱炳文,王钦敏,陈崇成,等. 福建省土地利用多尺度空间自相关分析[J].自然资源学报,2007,22(2),311-321.
[14] 谢花林, 刘黎明,李波,等.土地利用变化的多尺度空间自相关分析——以内蒙古翁牛特旗为例[J]. 地理学报,2006,61(4):389-400.
[15] 吕韬, 曹有挥. 时空接近空间自相关模型构建及其应用——以长三角区域经济差异分析为例[J].地理研究,2010,29(2):351-360.
[16] 赵建有,周孙锋,崔晓娟,等. 基于模糊线性回归模型的公路货运量预测方法[J].交通运输工程学报,2012,12(3):80-85.
[17] 王彤,何大卫. 线性回归中多个异常点的诊断[J].中国卫生统计,1997,14(6):7-10.
[18] BRUNSDON C, FOTHERINGHAM A S, CHARLTON M. Some Notes on Parametric Significan Cetests for Geographically Weighted Regression[J].Journal of Regional Science,1999,39(3):497-524.
[19] 覃文忠,王建梅,刘妙龙. 混合地理加权回归模型算法研究[J].武汉大学学报(信息科学版),2007,32(2):115-119.
[20] 张楚. 基于 OLS 和 GWR 模型的区域土地适宜性模拟研究——以合肥市包河区为例[J].科学视界,2014(4):169-171.
[21] 李凤霞,石辉,冯晓刚,等.西安市土地利用格局动态演变及其驱动力研究[J].测绘通报,2015(12):41-45.
Analysis of Population Spatial Pattern of Cooperative Remote Sensing Information and Statistical Information
DONG Zhenzhen,WANG Liang,QIU Agen
(Chinese Academy of Surveying and Mapping, Beijing 100830, China)
The article analyses the population spatial distribution pattern of the problem of insufficiency. With the aid of remote sensing information and basic information, we quantitatively analyse the spatial heterogeneity of the range area with the introduction of the population geographical concentration, exploratory spatial data analysis and quantitative analysis of the characteristics of geographical weighted regression model. The population concentration index and Moran index effectively reflect the close relationship among the space objects, better evaluate the agglomeration effect in industrial spatial distributron, and reflect the space distribution state. Based on the study area of the Yangtze River economic belt, with the study of spatial distribution of population, it concluded thelayersoffocus-opposites-thenorth-southdifferences-scatteredarounddistribution characteristics, and analyzed the causes from the aspects of economy, society, environment, land use analysis. Thus, it provided a reference for reasonable population growth and resources distribution.
population; spatial pattern analysis; exploratory spatial data analysis; GWR
董珍珍,王亮,仇阿根.协同遥感信息与统计信息的人口空间格局分析[J].测绘通报,2017(5):88-94.
10.13474/j.cnki.11-2246.2017.0162.
2016-10-12;
2016-12-05
测绘地理公益性行业科研专项(201512032);基础测绘(201512027)
董珍珍(1990—),女,硕士生,主要从事地理信息服务、空间分析方面的研究。E-mail :13051575673@163.com
P208
A
0494-0911(2017)05-0088-07