基于多源遥感数据的福建省人口数据网格化研究
2021-11-19
(闽江学院地理与海洋学院,福建 福州 350108)
精确的人口空间信息在科学和政策领域有非常广泛的应用。传统上,人口数据以行政区域为基础统计单元进行数据的收集、存贮和分析,这种统计方法在实际应用时存在着许多问题,如空间分辨率低、与其他数据空间单元尺度不匹配等[1]。这使得不同部门、行业以及学科之间的数据在空间定位上无法相互引用,不能充分揭示社会经济现象的空间差异性,妨碍了社会经济要素与自然要素的数据共享、融合以及综合分析[2-4]。因此,如何快速获取精确的人口空间信息成为近年来跨学科研究的热点问题之一。
目前,已有多种方法和数据用于人口空间化分析,其中于书媛等利用夜间灯光数据和房屋建筑数据,建立500 m分辨率精细化格网对合肥市人口密度情况进行研究[5]。黄杰等以DMSP/OLS夜间灯光数据和土地利用数据,采用空间滞后回归模型对江苏省进行人口建模[6]。卓莉等利用DMSP/OLS夜间灯光数据,辅以SPOT VGT-10天最大化合成的NDVI数据,对中国进行分区建模,估算人口密度[7]。高义等基于DMSP/OLS、NPP-VIIRS两种夜间灯光数据,利用回归分析,对我国沿海地区人口统计数据进行空间化研究[8]。黄益修在NPP-VIIRS夜间灯光数据的基础上,利用出租车轨迹数据提取了上海市人口分布矫正格网[9]。祝汉收在OLS夜间灯光数据与NDVI构建人居指数的基础上,利用DEM对人居指数进行修正,实现重庆人口空间化[10-11]。
在已有的人口空间化研究中,多采用夜间灯光数据、土地利用数据与NDVI数据实现人口空间化[12-18]。因此,本研究以福建省(未包含金门县)为例,选择2018年的NPP-VIIRS夜间灯光数据、NDVI植被覆盖数据和常住人口数据,通过SPSS25软件建立人口密度的回归方程,再应用arcgis10.2利用NPP-VIIRS、NDVI反演出福建省1 km×1 km的人口密度分布图。
1 研究区概况
图1 福建省区位图Fig.1 Location map of Fujian Province
福建省位于我国东南沿海,介于23°33′N-28°20′N、115°50′E-120°40′E之间,北与浙江省毗邻、西北与江西省接界、西南与广东省相连,东南隔台湾海峡与中国台湾地区相望。地势西北高,东南低,素有“八山一水一分田”之称。气候属亚热带季风气候,夏季台风暴雨频发。福建省辖9个地级市,福州市、厦门市、泉州市、漳州市、莆田市、宁德市、龙岩市、三明市、南平市,总面积达12.4万km2(图1)[19]。根据《福建省统计年鉴2020》,其2019年常住人口在3 973万人左右,地区生产总值达42 395亿元。
2 数据来源与预处理
2.1 NPP-VIIRS夜间灯光数据
NPP-VIIRS夜间灯光数据为NOAA/NG-DC所属的地球观测小组利用Suomi国家极地合作卫星Suomi-NPP上搭载的可见红外辐射成像计VIIRS的Day/Night波段(DNB)获取的夜间灯光数据产品。数据源于佩恩公共政策研究所提供的2018年12个月份的月均“vcmcfg”数据,下载网址为https://payneinstitute.mines.edu/eog-2/viirs。将其从WGS-84坐标系投影到CGCS2000坐标系以117°为中心的3度带下,并利用福建省的行政区划矢量数据进行裁剪。参照粱丽等学者的研究,求出2018年中12个月份的夜间灯光数据的均值[20],同时重采样为1 km分辨率,并参照于书媛等学者将灰度值除以最大值,将影像灰度值标准化为0~1(图2)[5]。
2.2 NDVI植被覆盖数据
植被指数(normalized difference vegetation index, NDVI)可以准确反映地表植被覆盖状况。目前,基于SPOT/VEGETATION以及MODIS等卫星遥感影像得到的NDVI时序数据已经在各尺度区域的植被动态变化监测、土地利用/覆被变化检测、宏观植被覆盖分类和净初级生产力估算等研究中得到了广泛的应用。该研究选择的数据为中国科学院资源环境科学与数据中心提供的1 km分辨率影像,该数据由SPOT/VEGETATION NDVI卫星遥感数据,采用最大值合成法生成的。数据的原始坐标系为WGS-84,统一改为CGCS2000坐标系下以117°为中心的3度带投影,并裁剪出研究区域(图3)。
图2 2018年福建省夜间灯光数据Fig.2 Night light data of Fujian Province in 2018
图3 2018年福建省NDVI数据Fig.3 Fujian NDVI data in 2018
2.3 人口密度数据
区县常住人口数据来自福州市、厦门市、泉州市、莆田市、宁德市、南平市、三明市、龙岩市、漳州市统计局发布的统计年鉴(2019)。通过福建省县级行政区划的矢量数据统计出每个区县的面积,并结合统计局提供的常住人口数据计算出每个区县的人口密度。
2.4 矢量边界数据
区县矢量数据来源于全国地理信息资源目录服务系统提供的1∶100万标准图幅,选择其中的边界图层,并未对边界进行修改。
3 研究方法
3.1 研究思路
根据于书媛、邹雅婧等众多学者的研究表明夜间灯光、植被覆盖与人口空间分布有极大的相关性[2,5]。因此,将夜间灯光与植被覆盖影像的灰度值以区县为单位分别统计出灰度值的总和与均值,并分别分析这些数据与人口密度的相关性,选择相关性较高的数据参与模型建立。
得到相关性最高的数据后,以区县为单位,采用SPSS软件建立人口密度和NPP-VIIRS、NDVI间的回归模型。得到初步反演结果后,利用县域实际人口密度与反演人口密度的比值进行修正,得到最终的人口密度图。
3.2 模型建立与反演方法
根据学者们的研究结论,人口密度与夜间灯光呈正相关,与植被覆盖呈负相关,故推断NPP-VIIRS与NDVI的比值M也与人口密度存在一定的相关性。因此在建立人口密度模型时,引入一个变量M,M的计算公式为
(1)
式中,M为引入的变量,N1为相应区县统计NPP-VIIRS得到的数据,N2为相应区县统计NDVI得到的数据。
利用SPSS软件对人口密度和VIIRS、NDVI数据、M进行线性回归分析,分析得到回归方程,相应回归方程为
(2)
而得到县域的反演方程后,将式(2)应用到1 km分辨率的遥感影像上,利用NDVI、NPP-VIIRS遥感影像反演出1 km分辨率的人口密度图。
3.3 误差修正
反演得到的人口密度与区县实际人口密度存在一定误差,为使反演各区县人口密度与实际人口密度相吻合,所以引入修正参数对每个格网的人口密度进行修正,修正公式为
(3)
(4)
4 结果与分析
4.1 空间相关性分析
本研究利用县域矢量图,统计出各个区县中NPP-VIIRS、NDVI数据DN值的总和与均值,并分别研究NPP-VIIRS、NDVI、M与人口密度的相关性。通过分析得出以下结果,在NPP-VIIRS数据DN值的均值与总和中,均值与人口密度的R2高达0.817,而总和却只有0.003;在NDVI数据DN值的均值与总和中,均值与人口密度的R2为0.439,而总和只有0.188;在变量M与人口密度的相关性的验证中,经栅格运算得到变量M的栅格影像,再统计其在各个区县DN值的均值与总和,均值与人口密度的R2为0.701,而总和只有0.034,如表1所示,各数据与人口密度均有一定相关性,所以本文选择M与NPP-VIIRS、NDVI数据DN值的均值参与建模。
表1 福建省人口密度与各要素的相关性分析
4.2 模型分析
经SPSS软件回归分析,得到NPP-VIIRS、NDVI、M与人口密度的R2为0.903,拥有较高的相关性,并在SPSS中得到相应的回归方程,即得到人口密度的反演模型,模型为
(5)
4.3 误差修正分析
图4 福建省人口数据空间网格化人口密度图Fig.4 Spatial grid population density of population data in Fujian Province
考虑到人口密度不可能为负,故将反演后人口密度为负的格网归为零,并统计出各个区县的人口密度,对比反演得到的人口密度与实际人口密度,发现反演得到的人口密度误差较大,所以引入修正系数,对初步反演得到的人口密度图进行修正。
经过修正后,反演得到的区县的人口密度理论来说会与实际的常住人口相吻合,但在实际的反演过程中,往往会因为栅格在运算时,不同的图层不能做到栅格间的完全叠合,导致在区县边界的栅格应用了与其相邻区县的修正参数,使得修正后的区县人口密度与实际人口密度会出现细微偏差。得到修正后的福建省人口数据空间化图(图4)。
以福建省的区县行政区矢量图为边界,对修正后的人口密度图分区县进行统计,得到各个区县的人口总数与人口密度,与各地级市统计局提供的区县人口总数与人口密度进行比较。以反演人口总数为横坐标,实际人口为纵坐标绘制散点图(图5),得修正后的反演人口与统计局提供人口的R2为0.992,表明反演人口与实际人口基本吻合。图4中人口密度大的主要集中在福建省沿海厦门、泉州、漳州、福州等地区,其中福州、厦门城区的人口密度最大,其次为漳州市、泉州市、福清市。以福建省各个地级市统计单元,分别统计各市的反演人口密度与实际人口密度,利用式(6)实现对反演精度进行检验。
(6)
由表2可知,福建省大部分地区的反演人口密度与实际人口密度吻合,福州市与厦门市的反演人口密度与实际密度存在一定误差,但总体程度上在可以允许的范围内,结果在一定程度上比较准确。
图5 实际人口与反演人口相关性Fig.5 Relevance of actual population and inversion population
表2 福建省反演精度分区检验表
5 结论
针对基于行政区人口统计数据空间分辨率低的不足,本研究以福建省为研究区,利用福建省2018年常住人口统计数据、NPP-VIIRS夜间灯光数据与NDVI植被覆盖数据,构建福建省人口数据空间化模型,反演生成1 km×1 km福建省人口分布密度图。结果表明,基于多源遥感数据构建的人口网格化图可以更好地反映人口的空间分布规律。同时,相较于传统人口统计方法,该方法省时省力且精度较高,有助于提高人口、资源、环境数据的跨学科融合,是提高人口、资源、环境综合管理能力的重要途径之一。此外,高精度空间化人口数据也是受灾人口评估与搜救、灾后重建的有力支撑,对防灾减灾工作具有重要现实意义。