基于GIS技术的泉州市人口空间分布及其与地形关系研究
2020-12-09黄耀裔
黄耀裔
(泉州师范学院 资源与环境科学学院, 福建 泉州 362000)
泉州市作为福建省主要经济发达的地级市之一,由于境内覆盖有丘陵、低山、平原等各种地形地貌,因此研究泉州市的人口空间分布与地形相关要素的关系,有利于了解境内人口空间分布规律及与地形的密切程度[1]。
人口空间分布是区域人口分布的最直接体现,其人口空间网格化的网格单元较行政单元下的平均人口密度更能够反映行政区划内部人口差异,更客观反映区内空间实际分布状态。随着GIS与RS技术的快速发展,可为人口空间网格化提供了有效的技术工具和数据来源,目前常用的人口网格化方法有:人口密度模型法[2]、地统计插值模型法[3]、人口重心模型法[4]、遥感估算法[5]等,基于多源数据的多因子回归建模具有数据来源广泛、快速反演区域人口空间分布而被广泛应用区域人口网格化[6-8]。地形作为影响人口分布的重要因素之一,封志明[9]研究了中国地形起伏度及其与人口分布的相关性,许多学者如钟静、章金城等[10-12]则更多研究局部区域的地形起伏度与人口经济的相关耦合关系。本文以泉州市(不包括金门县)为例,采用2015年5%抽样调查的泉州市乡镇、街道人口普查数据,应用相关分析识别人口空间网格化的关联因子,探索植被指数、NPP-VIIRS、土地利用、DEM数据等多源异构数据的关联性,利用多源数据的多元回归结合个案加权和最小二乘个案加权估计进行人口空间网格化建模,实现500 m×500 m尺度大小的泉州市人口网格化。运用空间分析、重分类、地图代数、分区统计、自然间断法等GIS技术,定量和定性分析泉州市网格化人口与DEM、坡度、坡向、地形起伏度的关系,对于协调该地区的人口—经济—环境协调发展具有实际意义。
1 研究区概况
泉州市(17°25'-119°05'E,24°30'-25°56'N)位于福建省东南沿海地带,根据《泉州市统计年鉴》,截至2019年末,该区常住人口为874万人,户籍人口760.70万人,人口出生率约为11.7‰,死亡率约为6.7‰,自然增长率约为5.0‰,常住人口城镇化率为67.2%。截至2019年,地区生产总值(GDP)约为9 946.66亿元,其经济总量连续21年保持福建省第一。
2 数据来源与预处理
数据来源主要来源以下几个部分:①行政区划及其网格化数据:泉州市区划数据来源于国家测绘地理信息局网站(http://zwfw.nasg.gov.cn)发布的地图在GIS软件中配准投影为通用横轴墨卡托(UTM)后进行矢量化采集(*.shp格式),500 m×500 m尺度大小的面状网格化数据利用ArcGIS的“网格”工具实现,再与泉州市市界行政区划相交得到该区内网格范围作为基准统计网格,利于将其他多源数据以属性值赋值于该网格中以消除不同来源遥感数据的空间位置和像元尺度不一致等问题,实现多源数据空间位置和像元大小的同一。②NPP-VIIRS夜间灯光数据:NPP-VIIRS数据来源于使用2015年年均夜间灯光光合成(SVDNB_npp_20150101-20151231_75N060E_vcm-ntl_v10_avg_rade9.tif),根据泉州市行政区划裁剪,利用QGIS软件的“分区统计”将500 m×500 m尺度内的灯光DN平均值赋值于网格中,实现数据的网格大小与空间位置同一,利于后续的空间地图代数运算或属性运算。③土地利用数据:来源于2015年的30 m×30 m像元大小的Landsat8陆地卫星遥感影像数据通过ENVI遥感软件的SVM监督分类提取植被、建筑用地、水体、裸地四类土地类型,再分别统计其在500 m×500 m尺度网格内面积百分占比,分别赋值于单元网格中作为其属性值。④DEM、坡度、坡向、地形起伏度、地形粗糙指数数据:DEM来源于30 m×30 m分辨率的ASTER GDEM,坡度、坡向、地形起伏度为DEM的派生数据、利用QGIS软件的“分区统计”分别统计500 m×500 m内的DEM、坡度、坡向、地形起伏度等等指标的平均值、最大值、最小值、极差值后再赋值于网格中,作为后续的分析变量(指标)。
3 研究方法
3.1 人口空间网格化
3.1.1 人口网格化指标因子
人口网格化指标因子主要来源于上述多源遥感数据及其派生数据,主要指标因子有:NDVI植被指数(X1),NPP-VIIRS夜间灯光强度(X2),土地利用-建设用地面积占比(X3),土地利用-植被面积占比(X4),土地利用-裸地面积占比(X5),土地利用-水体面积占比(X6),DEM高程数据(X7)。
3.1.2 指标因子相关分析
人口指标因子相关分析可揭示指标之间相互关系的密切程度,相互关系密切程度主要通过相关系数计算与显著性检验来判别。其相关系数的计算模型如下:
(1)
3.1.3 多元回归分析法的人口分布关联因素探索性分析
由于变量存在不同量纲及不同变量间的变量值都存在数量级上的差别,因此需对参加分析的所有变量进行标准化变换以消除量纲问题[13],其变换公式如下:
(2)
设以人口y为因变量、人口分布的相关潜在的关联因素xj(j=1,2,…,m)为自变量,经样本数据按“最小二乘法”进行多元回归分析拟合,以通过F显著性检验下的回归模型如下:
y=a0+a1·x1+a2·x2+…+aj·xj+…+am·xm
(3)
式(3)中,aj为xj的偏回归系数,aj≠0时表示如果xj改变(增或减)1单位则人口y对应改变aj单位,因此若aj≠0则说明xj为人口分布的关联因素。
3.1.4 人口加权个案及加权最小二乘估计建模
选择网格化后的人口为自变量。先通过IBM SPSS统计软件分别进行无加权个案与以n,j,k为权加权个案的相关分析,探索y,j,k与x,j,k(k)相关关系的类型,作为选择人口网格化模型函数形式的依据,再进行回归分析建模:
(4)
3.1.5 人口零误差调整
以“保持总人口一致”的县域控制原则、方法,对初估的网格人口按照下式进行优化人口零误差调整:
(5)
(6)
式(5)中yj为k类区j县域的总人口,yi,j,k为其i网格的人口数,为根据xi,j,k、式(3)、(4)初估i网格的人口数,则为k类区j县域的网格人口初估数的优化调节系数,作为j的属性,通过叠置传递给相关网格。所以,式(6)中的pi,j,k为最终预测即人口网格化的k类区j县域i网格的人口数。
3.2 技术流线图
根据上述的数据与建模方法,构建人口与地形相关性分析技术流程,如图1所示。
图1 技术路线图
3.3 地形
3.3.1 DEM
数字高程模型(DEM,见图2-B)是通过有限的地形高程数据实现对地面地形的数字化模拟(即地形表面形态的数字化表达),用一组有序数值阵列形式表示地面高程的一种实体地面模型。本文采用美国和METI共同制作的ASTER GDEM,其像元分辨率为30 m×30 m。
3.3.2 地形起伏度
地形起伏度表达一个特定范围内的地形的起伏变化状态。一般有两种表达形式:
1)一种为在一定范围内的海拔高度最高点与最低点差值,反映地面相对高差(见图2-E)。公式如下:
RDLS1=Hmax-Hmin
(7)
式(7)中,RDLS1代表地形起伏度,Hmax与Hmin分别代表单位面积内最大高程值和最小高程值(m)。
2)另一种为在一定范围内的海拔平均高度,海拔高度最高点与最低点差值与面积的相关计算(见图2-F),公式如下[14]:
(8)
式(8)中,RDLS2代表地形起伏度,Hmean代表网格单元内的平均海拔,Hmax与Hmin分别代表单位面积内最大高程值和最小高程值,Sp为网格单元内平地面积(m2,本研究将坡度≤5°的区域视为平地),S为网格单元面积(m2)。
3.3.3 坡度
坡度(Slope)表达一定区域内的地表单元陡——缓程度(见图2-C),根据《土地利用现状调查技术规程》[15],将坡度分为5级,分别为0°~2°、2°~6°、6°~15°、15°~25°、大于25°参与人口相关性分析,分析不同坡度的人口分布状态。
3.3.4 坡向
坡向(Aspect)表达坡面法线在水平面上的投影的方向,坡向格网中各像元的值均表示该像元的坡度所面对的方向。将坡向重分为9类,分别为无坡向、东、西、南、北、东北、东南、西南、西北方向参与人口相关性分析。
3.3.5 地形粗糙指数
地形粗糙指数(TRI)反映出地面凹凸不平的程度,也称地表微地形,见图2-D。
4 结果与分析
首先对参与人口网格化的指标因子根据相关分析分析人口与指标的密切程度,对泉州市乡镇、街道行政尺度的人口与指标变量进行相关性分析,本研究通过IBM SPSS软件计算,结果见表1,计算结果显示人口与指标因子均存在极显著相关,除与水体存在显著相关。
通过回归分析进行建模与显著性检验判别,包括模型F检验与R2拟合精度,评价、系数t检验,因此得到的偏回归系数aj(j=0,1,2,…,m)可进行人口关联因素。此外,因为考虑到不同因素间可能存在相关性甚至多重共线性,因此还进一步时行了逐步回归分析,则入选模型的为最优组合的作用显著的人口分布关联因素。从而aj的绝对值越大则xj对y贡献越大、作用越大、关联性越大。其中aj>0为正关联、aj<0负关联,并根据aj的显著性检验划分为显著即显著水平取0.1时通过了aj≠0检验、非显著即在0.1显著水平不能否认aj=0。
图2 泉州市人口网格化及地形相关图
表1 人口与指标相关性
表2 人口网格化回归建模
Y1=if(128.985×X2-12814.924×X6>0, 128.985×X2-12814.924×X6,0)
Y2=if(41.788×X2+275.184×X3-463.466X6-96.024×X5+16.39×X4>0,41.788×X2+275.184×X3-463.466X6-96.024×X5+16.39×X4,0)
Y3=if(281.964+41.462×X2-723.128×X6-387.027×X5-263.801×X4>0,281.964+41.462×X2-723.128×X6-387.027×X5-263.801×X4,0)
对Y2利用式(5)和式(6)进行人口零误差调整,得到图1-A的500 m×500 m尺度人口空间网格化结果图,依图可知,人口空间分布介于0~5 135人/500 m2,泉州市的人口主要分布在东南环泉州湾沿海的石狮市、晋江市青阳街道、鲤城区、丰泽区、洛江区、泉港区的部分地区这些地区地形比较平缓,经济发达,房地产等建筑用地面积较多,造成人口集聚。
人口网格化结果与地形关系:
通过网格化后的单元网格的人口与单元网格的地形中的DEM、两种地形起伏度、坡度、地形粗糙指数的相关性分析,结果均呈现极显著的负的相关性,而与坡向不存在显著相关性。因坡向与人口不存在相关关系,故不加以分析,见表3。
表3 人口网格化结果与地形相关性
1)人口网格化结果与DEM关系。将DEM按H=200 m间隔进行重分类后作为分区统计,分别统计区内的人口数,从定量角度分析研究区人口与DEM之间的关系,结果显示,在0~200 m(合计6 477 874人);200~400 m(合计339 575人);400~600 m(合计328 077人);600~800 m(合计166 893人);800~1 000 m(合计39 413人);1 000~1 200 m(合计3 789人);1 200~1 400 m(合计132人)。在海拔高度200 m内的人口数占全部人口数的88.1%,1 000 m内的人口数占99.9%,说明泉州市的人口主要在低海拔地区,分布于区内环泉州湾的晋江市、石狮市、鲤城区、丰泽区、洛江区、惠安县、泉港区、南安市这些沿海地区。从图3所示,在0~200 m和400~600 m呈现两个峰值,说明人口主要分布在这两段海拔高度。
图3 DEM与人口关系散点图
2)人口网格化结果与地形起伏度关系。根据ArcGIS的自然间断法划分为5类,RDLS1按分0~67 m(合计6 162 940人)、67~129 m(合计713 243人)、129~186 m(合计377 954人)、186~254 m(合计97 034人)、254~505 m(合计6 557人)为5类,平均人口密度分别为0~67 m(2 444人/km2)、67~129 m(260人/km2)、129~186 m(127人/km2)、186~254 m(46人/km2)、254~505 m(9人/km2);RDLS2按0~0.295(合计5 730 341人)、0.296~0.662(合计1 098 773人)、0.662~0.981(合计355 095人)、0.981~1.326(合计143 764人)、1.326~2.340(合计29 756人),平均人口密度分别为0~0.295(1 936人/km2)、0.296~0.662(620人/km2)、0.662~0.981(122人/km2)、0.981~1.326(54人/km2)、1.326~2.340(35人/km2)。人口数分布如图4所示。从图4可知,两种地形起伏度的人口数在不同区间基本保持一致,趋势也基本保持一致,说明两种地形起伏度均能描述与人口的关系,RDLS1的拟合函数为:y=3E+07e-1.569x(R2=0.958);RDLS2的拟合函数为:y=2E+07e-1.255x(R2=0.990)。RDLS2的拟合精度高于RDLS1。
图4 地形起伏度与人口数的关系折线图
图5 坡度与人口数的关系折线图
3)人口网格化结果与坡度关系。根据《土地利用现状调查技术规程》,将坡度分为5级,分别为0°~2°(合计28 715人)、2°~6°(合计1 771 991人)、6°~15°(合计705 961人)、15°~25°(合计15 005人)、大于25°(合计0人);根据图5所示,人口主要分布在2°~15°之间,占全部人口数的90.0%。人口密度分别为0°~2°(757人/km2)、2°~6°(1 058人/km2)、6°~15°(257人/km2)、15°~25°(3人/km2)、大于25°(0人/km2)。
4)人口网格化结果与坡度关系。根据ArcGIS的自然间断法划分为5类,每一类人数分布0~3.75(合计3 385 660人)、3.75~7.12(合计2 261 387)、7.12~10.75(合计1 299 569人)、7.12~15.62(合计395 824人)、15.62~69.62(合计12 382人)。在0~7.12的人口数占总人口数的77.26%,说明人口主要分布在地形较为平整的地区。
图6 地形粗糙指数与人口的关系折线图
5 结语
本文利用GIS技术结合多元回归、个案加权、最小二乘法个案加权建模分析得出最优模型为最小二乘法个案加权建模,并实现500 m×500 m尺度的泉州市人口网格空间分布图,基于地形中的DEM、RDLS1和RDLS2两种地形起伏度、坡度和格网人口图及相关性分析阐述泉州市人口分布特征与地形的关系。相关研究总结如下:
1)泉州市的人口主要分布在环泉州湾的石狮市、晋江市、鲤城区、丰泽区、洛江区、惠安县和泉港区,呈现集聚状态。人口网格化结果图可为相关部门在灾害风险评估救援、疾病防疫防控、商业决策、区域规划与开发等领域提供辅助决策。
2)泉州市的人口分布在海拔高度200 m内的人口数占全部人口数的88.1%,1 000 m内的人口数占99.9%,说明泉州市的人口主要在低海拔地区。人口分布在TRI指数的0~7.12占总人口的77.26%,说明人口主要分布在地形较为平整的地区。
3)RDLS1和RDLS2两种地形起伏度的人口数基本保持一致,说明两种地形起伏度均能描述与人口的关系,RDLS2的拟合精度高于RDLS1。而空间人口网格化与坡向不存在相关性。