APP下载

基于DMSP-OLS灯光数据的广东省城市人口估算

2015-12-14洪浩霖

关键词:阀值人口密度年份

李 鹏 ,洪浩霖

(华南师范大学地理科学学院,广州510631)

人口再生产是人口地理学最重要的领域之一,指的是一个地区的人口,因为由不同年代的人构成,随着人口的死亡与新生而不断更新的过程[1]. 人口再生产过程对人口的估算带来巨大挑战,尤其随着城市日益成为人类生活的聚集中心,日益庞大的城市人口规模使得对城市人口的估算成为世界性的难题.对于城市人口的估算,传统的方法是由国家统计部门进行人口普查或抽查调查完成,需要耗费大量的时间,并且在面对中国这种人口大国时,因为时间跨度大,不能及时反映当下的人口规模.中国的人口统计工作是采取10年1 次的全国人口普查. 自1995年起,国家在每逢2个全国普查年的中间年份进行全国1%人口抽查. 其余年份的人口统计则以每10年1 次的全国人口普查数据和中间年的1%人口抽样数据为依据,进行平滑估算得到. 因此,我国传统的城市人口统计数据不仅获取的时间间隔过长,并且难以客观及时地反映城市人口再生产的过程.除此以外,我国的城市人口统计上还因为不同行政区的人口统计口径不统一而带来横向纵向数据都不可比的问题,这为客观认识中国城市人口的变化带来诸多不便.

自20世纪60年代以来,遥感图像逐渐被应用于城市人口估算,这一地理学的方法革命使城市人口的实时估算成为可能.至今,根据统计变量的不同可以将人口遥感估算的思路分为以下几种:城市面积估算法、土地利用类型估算法、居住单元估算法和影像像元估算法[2].已有的大部分的人口遥感估算都需经过精确的地物判读、解译,工作量较大,且估算精度受图像质量、空间分辨率因素影响很大. 近20年来,国内外学者在利用DMSP/OLS 数据进行城市化研究中,发现夜间灯光覆盖面积、灯光强度与区域人口数量存在一定的函数关系,为人口估算提供了一个无需解译、计算过程自动化程度更高的新方法.1997年,Sutton[3]利用1994—1995年稳定灯光产品,将美国人口密度栅格图像与DMSP/OLS 数据图像进行比较,研究了在州、县不同尺度下,2 种图像数据的相关性. 卓莉等[4]利用DMSP/OLS 数据,使用人口密度格网化的方法,将中国城市分为4 种类型,提出用灯光强度模拟灯光区内人口密度,用人口—距离衰减规律和电场叠加理论模拟灯光区外的人口密度.这些研究直接证明灯光强度、覆盖面积与人口间的内在关系,其他类似研究通过灯光数据与碳排放量、电能消耗量等数据的关系,也间接证明灯光与人口间的密切联系.1980年,Welch[5]根据美国DMSP/OLS 数据图像,建立人口、城市面积以及电力能消耗量之间的关系模型.1997年,Elvidge 等[6]以美国、巴西和哥伦比亚等21个国家作为研究区,利用无云观测DMSP/OLS 数据分析了区域灯光灰度值与当地人口数量、GDP、电力能源消耗量之间的相关性. 从国内外的已有研究看,基于DMSP/OLS 数据的人口估算所采用的数学模型,研究区域的空间尺度各不相同.而基于DMSP/OLS 数据针对广东省城市的人口估算研究尚属空白. 本文基于2000、2010年的DMSP/OLS 数据和人口普查数据,对2 种基本估算模型的估算精度进行检验,在此基础上,结合广东省各地级市的情况建立新的人口估算模型,对各地级市1992—2012年的实际居住人口进行了估算,为中国城市提供一个便捷和精确的人口估算新方法.

1 数据来源与校正

1.1 数据来源

使用的DMSP/OLS 数据来源于1976年美国发射的 DMSP(Defense Mete-orological Satellite Program)Block 5D21 Satellite F21 卫星搭载传感器OLS(Operational Linescan System). 该卫星以一天14 轨的速度飞行,每一个OLS 传感器有可见光和热红外2个通道,每天都能获取覆盖全球黑夜和白天的图像,整个卫星系统一天能提供全球黎明、白天、黄昏和夜晚4个时段的观测数据. 本文利用的数据为1992—2012年广东省辐射定标的平均灯光强度图像(图1).

图1 2012年广东省DMSP/OLS 原始数据Figure 1 The original DMSP/OLS data of Guangdong province in 2012

1.2 数据校正

首先,将DMSP/OLS 夜间灯光数据的参考椭球转化为WGS84,投影格式转化为高斯克吕格投影,与行政区划矢量图保持一致. 然后,根据Elvidge 的校正模型对广东省的灯光数据进行校正. 采用Elvidge 提出的一元二次数学模型对多卫星灯光数据进行相互校正,该模型为

其中,DN 为原始灰度值,DNcalibration为相互校正后的灰度值,ci(i=0,1,2)为系数.

在校正区域的选择上需要考虑被选区域多年间发展的稳定性与区域的相似性原则. Elvidge 的研究中采用的西西里岛属于经济发达地区,城市化已进入高水平阶段,甚至已进入郊区化或逆城市化阶段,体现在夜间灯光数据上,就是灯光强度已达到“饱和”,即使人口有所增长,经济仍快速发展. 考虑到广东省与西西里岛可能存在差异,选择了香港作为校正地区,以2007年F16 卫星灯光数据为基准,应用模型(1)对广东省1992—2012年的DMSP/OLS数据进行校正,校正参数见表1.

表1 1992—2012年DMSP/OLS 数据相互校正参数Table 1 Adjusted parameters of DMSP/OLS datas from 1992 to 2012

最后,将每一年的数据与后一年的数据进行对比,在后一年中年平均灯光强度为0,而前一年平均灯光强度大于0 的像元,则视为误差像元,其灰度值归为0.与Liu 等[7]不同的是,考虑到中国部分村庄退化,甚至消失的实际情况,本文的校正结果中后面年份的灯光强度大于前面年份的灯光强度.

2 基于DMSP-OLS 的人口估算模型

2.1 建立模型

与以往基于DMSP/OLS 建立的人口估算方法不同,本文通过建立城市夜间灯光的灰度密度与城市人口密度的方程关系,来构建城市人口的估算模型.首先,计算出广东省各地级市的灯光灰度密度,其计算方法如下:

其中t 为年份,Dtn为某市t年份阀值取n 条件下的灰度密度,Stn为该市t年份行政范围内灰度值大于或等于n 的所有像元的灰度值之和,Atn为该市t年份行政范围内灰度值大于或等于n 的像元总数.

其次,选用2000年和2010年的全国人口普查年份的灰度密度、人口密度数据来确定阀值,依次计算各个预设阀值下,城市灰度密度与人口密度的相关系数(表2).计算结果显示各阀值下的相关系数都在0.8 以上,且最佳阀值为29.由此将式(2)改为

下文的计算均在阀值为29 的条件下进行,Dt29、St29、At29分别简写为Dt、St、At.

同时,考虑到广东省区域间的城市发展存在较大差异,加之人口流动的影响,为了更准确地估算2000年和2010年以外其他年份各市的人口密度,假设每个城市人口密度与灰度密度之间都存在一个比值,且不同城市的比值的差异不可忽略. 仍然以DN=29 为阀值,分别计算2000年和2010年省内21个地级市人口密度与灰度密度的比值,每个城市都可得到2个比值K2000和K2010.以K2000和K2010作为控制点,用于推算出其他年份的对应比值Kt. 其他年份的人口密度则由该年的灰度密度Dt和Kt之乘积得到.经观察发现,大多数城市K2010大于K2000,为反映出这个时间段内各城市人口的增长情况,我们再引入一种普遍适用于各个城市的比值变化规律,即马尔萨斯提出的人口增长理论[8],Xt= X0·(1 +r)t,Xt为t年后的总人口数,r 为增长率,X0为基期总人口数,t 为经过的年份. 将此规律应用于本文的“灰度密度-人口密度”模型中,计算方法如下:其中t 代表年份,Dt为某市t年份的灰度密度,Pt为该市t年人口密度,Kt为该市t年份人口密度与灰度密度的比值.

表2 不同阀值条件下的灰度密度与人口密度相关系数Table 2 The correlation coefficients between night density and population density under different thresholds

该模型的原理是以2000年和2010年人口普查年份的人口数据为基础的,用插值法推算出10年间任意年份的人口. 对于2011—2019年的人口数据,同样可以遵循马尔萨斯的理论,依据式(4)进行外推.对于1992—1999年的数据(目前,DMSP/OLS 夜间灯光数据的覆盖年份为1992—2012年),可利用1990年第四次全国人口普查资料,对参数Kt进行调整,以获得更高的估算精度.

2.2 模型检验

为了对模型进行检验,选取2005年全国1%人口抽样的统计数据与基于该方法的估算数据进行检验.检验结果如表3 所示.总体而言,该方法对广东省城市人口数量估算的整体效果良好,21个地级市平均估算相对误差为3.69%,全省总常住人口估算相对误差为5.02%. 误差最大的3个城市为广州、东莞和中山,最高误差21.46%;误差最小的3个城市为珠海、韶关和湛江,最小误差0.88%,接近全国1%抽样统计数据.由本模型估算出来的大多数城市的人口数量大于统计人口数量. 误差的来源很有可能和城市流动人口的规模相关,因为“灰度密度-人口密度”模型假设城市的人口变化均匀、平稳增长.但是,广东省是我国改革开放的前沿阵地,也是全国流动人口数量最庞大的地区,直接导致以往国家的人口统计工作很难反映实际生活在广东省各城市的人口规模.由检验结果可知,本模型检验结果误差较大的城市都属于珠三角地区流动人口数量庞大的地区,误差较小的地区则是广东省流动人口偏少的地区,应征了模型的偏差可能不是由于模型本身的科学性导致的,反映了我国人口统计工作的误差问题.

表3 灰度密度-人口密度模型精度验证结果Table 3 The results of accuracy verification about night-population density model

为了进一步检验本模型的适用性. 笔者又对比了目前国内外其他学者提出的2 种基于DMSP/OLS数据的人口估算模型.

第1 种模型是直接从灯光强度(即像元的DN值)入手,分析灯光强度与人口数的关系. 例如,曹丽琴等[9]在利用DMSP/OLS 数据研究湖北省各市人口时,建立线性模型

进行人口估算(y 为某市某年总人口,x 为该市当年灯光强度总值).据此,本文在该模型的基础上新增模型

再考虑到2000、2010年有人口普查,数据精准度较高,笔者将这2年广东各市的总DN 值作为自变量,该年该市的年末常住人口数(单位:万人)作为因变量,21个市2年共得到42 对数据,然后经Matlab 函数工具拟合得到3 种函数的拟合参数. 比较结果是模型(6)的拟合优度最佳,模型(5)次之,模型(7)最差.利用模型(6)估算2005年广东21个市的人口,经2005年全国1%人口抽样调查数据检验,发现少部分城市人口估算相对误差在10%以内,而广州、东莞、深圳等城市相对误差接近50%,显然,仅根据灰度总值的人口估算模型在广东省内并不适用于各种经济规模、各种人口组成结构的城市.

第2 种模型是从建设用地入手,由灯光强度提取建设用地,再分析建设用地面积与人口数的关系.早在2001年,Lo[10]就已发现,在国家级、省级和市级等3个尺度上,都可以用建设用地面积估算对应尺度的总人口数.2012年,Pranab 等[11]将印度恒河平原地区城市建设用地的灯光强度阀值确定为35,然后统计灯光强度达到阀值标准的像元数,估算印度恒河平原地区的城市人口,代表了印度大部分地区的城市人口分布特点.该方法使用的数学模型为:

其中P 表示总人口,A 表示灰度值大于或等于阀值的像元总数,a 和b 均为系数.

借鉴该数学模型,本文选取2000、2010年的数据,按照从1 ~63 的次序,将所有可能的DN 值依次设为阀值,算出广东各市灰度在阀值以上的像元数(作为自变量),而各市年末常住人口数作为因变量,并依次比较不同阀值下模型(8)拟合后的调整确定系数Adj R2,以此衡量函数拟合优度高低.Adj R2是在确定系数R2基础上派生出的系数,用于消除自变量个数对R2的影响,其值越接近1,表明函数拟合优度越高.比较结果是预设阀值在0 ~37 范围内,Adj R2递增;在阀值为38 时,Adj R2最大,达0.49;阀值在39 ~63 范围内,Adj R2递减. 但即使是在最佳阀值38 的条件下,Adj R2也不超过0.5,用该模型进行2005年人口估算,以广州为代表的大城市估算相对误差仍接近50%,整体估算效果同样不如“灰度密度-人口密度”模型.

3 讨论

早期的OLS 数据产品仅记录一段时间内无云观测下不同区域灯光被探测到的频率,后来经辐射定标,才发展出能记录灯光强度信息的产品.本研究所使用的就是辐射定标平均灯光强度的图像产品.对DMSP/OLS 不同年份的原始数据进行校正是开展DMSP/OLS 遥感分析的基础性工作,因为由不同传感器获取而没有进行针对传感器差异的相互校正的DMSP/OLS 数据会导致多份数据间缺乏可比性.针对上述问题,Elvidge 等[12]曾提出将意大利西西里岛作为多年的灯光校正区域,其依据是西西里岛自90年代以来经济发展较缓慢,城市建设用地扩张趋势不明显,且人口数量较稳定. Liu 等[7]利用Elvidge 的数学模型,选用黑龙江鸡西市作为校正区域,以2007年F16 卫星灯光数据为基准进行过校正.而本文则是结合珠三角的地理特征以香港作为校正区域.

研究结果表明,DMSP/OLS 对广东省的人口数量规模的估算具有非常准确的应用价值,可以成为一种简洁有效和及时的人口估算方法. 研究同时发现,目前国内外学者根据DMSP 数据提出的估算人口方法大多数都能在大空间尺度下拟合出区域性的人口估算函数模型,但每一个模型的适用性具有一定的区域局限性,往往不能充分考虑到某些区域内不同城市人口密度和分布的差异. 因此导致这些模型在经济发展程度悬殊、人口密度差距巨大的城市间进行应用时仅能准确估算同类别的城市的人口,对其他异质性城市的估算误差过大. 本文基于灯光灰度密度和人口密度间关系的模型在广东省各城市人口估算方面的研究和检验证明了其对于广东地区的适用性.

本模型建立的样本区域(广东省)是中国人口净迁入最大的省份.不仅如此,珠三角地域粤东西北间的人口流动特征也有很大区别,这一复杂的人口格局使得历来广东省的人口普查工作都是一个难解之题.本研究针对广东省这一特殊人口区域,建立起“灰度密度-人口密度”模型,在市级尺度上对各地级市的人口数量进行了精确的估算. 实际上提出了一种能适用于不同经济规模、不同人口分布特征的城市人口估算模型,从而可以简便快速地推算对应年份各城市的人口规模.由于DMSP 夜间灯光数据的DN 值表示的是一个地区全年平均灯光强度,因此测算出的人口数为该地区的实际居住人口数,这一估算结果对应于国家人口普查最近几年出现的“年末常住人口数”.本方法可以对“年末常住人口”统计指标出现以前的年份的人口状况进行估算,最远可以估算到1992年.这为了解广东省长期的人口实际状况提供了强大的技术支撑.

本文建立“灰度密度-人口密度”模型理论上可以应用到对全中国常住人口的估算研究中,但是基于不同地区的城市化水平和经济发展程度,需对此模型进行相应的修正与调整,并有待进一步的实践检验. 基于DMSP/OLS 数据应用研究逐渐被国内外学者重视. 从城市发展到人类活动研究,再到环境研究,其应用价值不断得到挖掘,其他类型数据与DMSP/OLS 数据的集成应用研究也日益成为未来的发展方向.

[1]李玉江,张果. 人口地理学[M]. 北京:科学出版社,2011.

[2]Wu S S,Qiu X M,Wang L. Population estimation methods in GIS and remote sensing:A review[J]. GIScience and Remote Sensing,2005,42(1):80-96.

[3]Sutton P. Modeling population density with nighttime satellite imagery and GIS[J]. Computers,Environment and Urban Systems,1997,21(3):227-244.

[4]卓莉,陈晋,史培军,等. 基于夜间灯光数据的中国人口密度模拟[J].地理学报,2005,60(2):266-276.Zhuo L,Chen J,Shi P J,et al. Modeling population density of China in 1998 based on DMSP/OLS nighttime light image[J]. Acta Geography Sinica,2005,60(2):266-276.

[5]Welch R. Monitoring urban population and energy utilization patterns from satellite data[J]. Remote Sensing of Environment,1980,9(1):1-9.

[6]Elvidge C D,Baugh K E,Kihn E A,et al. Relation between satellite observed visible near infrared emissions,population,economic activity and electric power consumption[J]. International Journal of Remote Sensing,1997,18(6):1373-1379.

[7]Liu Z F,He C Y,Zhang Q F,et al. Extracting the dynamics of urban expansion in China using DMSP-OLS nighttime light data from 1992 to 2008[J]. Landscape and Urban Planning,2012,106:62-72.

[8]马尔萨斯.人口论[M].北京:北京大学出版社,2008.

[9]曹丽琴,李平湘,张良培.基于DMSP/OLS 数据的城市人口估算——以湖北省各县市为例[J]. 遥感信息,2009(1):83-87.Cao L Q,Li X P,Zhang L P.Urban population estimation based on the DMSP/OLS night-time satellight data——A case of Hubei province[J].Remote Sensing Information,2009(1):83-87.

[10]Lo C P. Modelling the population of China using DMSP operational linescan system nighttime data[J]. Photogrammetric Engineering and Remote Sensing,2001,67(9):1037-1047.

[11]Pranab K R C,Sandeep M,Vinay K D. Estimation of urban population in Indo-Gangetic Plains using night-time OLS data[J]. Remote Sensing,2012,33(8):2498-2515.

[12]Elvidge C D,Daniel Z,Baugh K E,et al. A fifteen year record of global natural gas flaring derived from satellite data[J]. Energies,2009,2(3):595-622.

猜你喜欢

阀值人口密度年份
特殊的一年
光敏传感器控制方法及使用其的灭蚊器
基于小波分析理论的桥梁监测信号去噪研究
激光多普勒测速系统自适应阀值检测算法
高速铁路与经济增长的因果关系
关于我国房地产价格的思考
什么是闰年?
厦门市流动人口分布研究
一样的年份
深度学习在无人驾驶汽车中的应用