基于DMSP/OLS夜间灯光数据的省域GDP统计数据空间化方法——以广西壮族自治区为例
2014-08-08杨妮吴良林邓树林张超
杨妮,吴良林,邓树林,张超
(广西师范学院资源与环境科学学院,广西 南宁 530001)
0 引言
统计数据空间化[1-4]是利用适宜的指标系统和模型方法反演一定时间、空间中的统计数据空间分布状态的过程,其实质就是在区域范围内建立连续的统计数据。随着社会科学的发展,传统的GDP统计数据并不能满足资源环境研究领域对空间型社会经济数据的需求。对于省域小尺度的研究更是缺乏空间数据的支持,很多省份仍局限于行政单元的均值统计形式,无法反映全省GDP宏观分布,限制了省级层面的经济决策和产值估算。为解决该问题,有必要研究省域社会经济统计数据空间化[5,6]问题。
最初地理学家提出了用点值法进行统计数据的模拟,但该方法具有较大主观局限性而难以操作。随后制图学家尝试利用格网生成技术完成社会经济统计数据格网化,但当规则的格网越来越小时传统制图技术无法满足要求。随着对高分辨率GDP密度数据的需求日益扩大及3S技术的引入,现多采用栅格数字模拟技术,并取得了一定的研究成果。如国际上较有影响力的 GPW[7]、LandScan[8]等研究了全球性人口数据和美国CIESIN的全球人均GDP数据等。1997年Elvidge等[9]根据DMSP/OLS数据发现了各国家的灯光面积与国内生产总值(GDP)具有高度相关性,但未能提取其空间信息。2003年Henderson等[10]确定DMSP/OLS稳定灯光图像和辐射标定灯光图像两种数据的最佳阈值,正确提取了美国旧金山以及中国北京、拉萨的城市化水平及经济发展水平有所差异的空间信息。刘红辉等[11]在综合分析我国社会经济的区域差异的基础上,实现了1km格网社会经济数据的空间定量模拟,但仅局限于在土地利用数据的基础上实现GDP的模拟。韩向娣等[12]对第一产业基于土地利用数据建模,第二、三产业基于DMSP/OLS与土地利用数据结合建模,生成的GDP密度图能较完整地反映全国GDP分布细节及宏观分布特征。上述研究对社会经济统计数据的空间化多在全球或国家尺度上进行,对其影响因素往往进行简化。本文综合分析广西经济发展规律和DMSP/OLS夜间灯光数据与省域GDP的相关性,建立适用于广西小尺度研究区域的GDP空间化模型,利用RS与GIS集成技术,实现GDP的空间化,以真实反映该地区的经济分布现状,为政府部门的经济决策和产值估算提供可靠依据。
1 数据来源
采用的2009年广西DMSP/OLS夜间灯光数据来源于美国国家地球物理数据中心网站(http://www.ngdc.noaa.gov/dmsp/downloadV4composites.html(图1),该数据有以下优势:1)DMSP/OLS影像分辨率通常在1km左右,影像数据量非常小,甚至不到TM数据的1%;2)DMSP/OLS夜间灯光影像能反映综合性信息,它涵盖了交通道路、居民地等与人口、城市等因子分布密切相关的信息[9,13-15]。
图1 2009年广西夜间灯光数据分布Fig.1 Night light data of Guangxi in 2009
2 GDP空间化建模
本研究以地级行政边界为基础,以14个地级市为研究单元。GDP空间化模型如图2。
图2 GDP空间化模型Fig.2 Model of GDP spatialization
2.1 市级灯光指数建立与统计
灯光指数CNLI即某区域内灯光斑块的平均相对灯光强度(I)与灯光斑块面积占区域总面积比(S)的乘积[12,16,17],即:
式中:DNM为最大可能灰度值(本文取63),DNi表示区域内第i级像元灰度值,ni为区域内该灰度级像元总数,P为去除误差的阈值,NL、AreaN分别为区域内满足条件DNM≥DN≥P的像元总数和占据的总面积,Area为整个区域的面积。
按上式分别计算各行政统计单元内灯光斑块的平均相对灯光强度I、灯光斑块面积占区域总面积比S和区域灯光指数CNLI(表1)。
2.2 灯光指数与GDP统计数据的回归分析
利用SPSS软件分析不同的灯光指数与各市生产总值(GDP总)、第一产业(GDP1)、第二产业(GDP2)、#工业(GDP#)和第三产业(GDP3)之间的相关性,得到各产业灯光指数的相关系数R2。各产业分别选取与其相关性最大灯光指数的R为其相关系数Ri,具体见图3。
2.3 灯光指数与GDP统计数据回归模型的建立
通过以上分析,得出不同的夜间灯光指数与各市的GDP总、GDP1、GDP2、GDP#和GDP3之间的相关性,确定分产业的最佳灯光指数,进行回归分析并建模。对全区回归分析建立的模型如下:
式中:GDPi表示GDP总、GDP1、GDP2、GDP#和GDP3,P0和Ri为回归模型系数,b为相关分析中选取的最佳夜间灯光指数的系数,Qj代表I、S或CNLI。
表1 2009年广西各市I、S、CNLI统计值Table 1 I,S,CNLIstatistical value of each city of Guangxi in 2009
图3 全区灯光指数与GDP回归分析结果Fig.3 The regression analysis results of lights index and GDP
图4为按市分区的 GDP总、GDP1、GDP2、GDP#和GDP3与对应的最佳灯光指数的线性回归模型的拟合度。比较各市的拟合精度,最终选择GDP2的预测模型来预测全区GDP分布。
图4 分区灯光指数与GDP的拟合度Fig.4 The fitting degree index of partitions lighting and GDP
2.4 GDP统计数据空间化
2.4.1 GDP密度图的制作 按模型把GDP统计数据分配到每个像元,利用县级GDP统计数据作为线性调整来纠正每个像元值(式(5)),最后制作1km*1km广西2009年GDP密度图(图5)。
式中:GDPz为使用统计数据按县纠正后的GDP密度,GDPi为预测每个格网的GDP密度,GDPt为该县统计GDP,GDPall为该县预测GDP。
图5 模拟的2009年广西GDP密度Fig.5 GDP density simulation of Guangxi in 2009
2.4.2 GDP空间分布状况分析 图5反映出广西GDP的空间分布状况:南宁、柳州、桂林形成一条经济线,三市的经济密度基本大于250万元/km2;北部湾经济开发区的钦州、北海和防城港经济密度在200万元/km2左右;桂东的贵港、梧州和桂东南的玉林,有着珠江流域的优势及广东省的带动,经济密度基本达200万元/km2;典型喀斯特地区的河池、百色、崇左、贺州,自然环境比较恶劣,经济相对比较落后,其经济密度基本小于150万元/km2。
3 GDP空间化结果精度检验
用模拟的GDP密度求出各市的GDP总值,然后与统计的GDP总产值比较,分析GDP模拟值与统计值的相关性(图6)。
图6 GDP模拟值精度检验Fig.6 Test chart of GDP simulation accuracy
(1)图6a中GDP模拟值与统计值的曲线大体相符,南宁、防城港、玉林、百色、贺州等市模拟值与统计值较吻合,柳州、桂林和来宾、崇左误差较大。柳州为广西工业城市,GDP#比重较大,以整个广西的GDP回归模型来模拟会造成一定的误差。桂林是旅游城市,第三产业产值占GDP总产值比重较大,另外旅游产值估算比较复杂,仅依赖于夜间灯光数据远远不够。广西经济相对落后,各市灯光强度普遍较弱,只有南宁市达到饱和,从而减小了灯光饱和度造成的误差。因此全区模拟曲线总体走势与实际相符,能真实反映GDP宏观分布。
(2)图6b中GDP模拟值与统计值存在较强的相关性,即夜间灯光数据与省域社会经济统计数据之间有较强的空间相关性,相关系数R2达0.9755,充分证明了夜间灯光数据适用于省域尺度的社会经济统计数据研究。基于夜间灯光数据的省域GDP空间化拓展了夜间灯光数据的应用领域,同时探索了省域GDP空间化新的研究方法。
4 结论与讨论
目前基于DMSP/OLS方法研究省域GDP空间化较少,较多方法是基于土地利用数据且GDP建模精度较高。第一产值与耕地相关性较高,能较好反映城市与农村地区的经济差异,但大城市内部未能分辨GDP的空间分布差异。夜间灯光数据获取便捷,在一定程度上可反演省域经济分布状况,特别是第二、三产业产值的空间分布。挖掘DMSP/OLS数据与省域GDP空间分布的潜在规律,为省域GDP研究提供一种新的技术方法。
利用DMSP/OLS反演省域GDP分布趋势,辅以县级统计数据对回归模型进行线性纠正,其误差减小到县级,故其只适合作为县级以上的社会发展和规划定量化参考指标,不适用于乡镇级别区域的定量化指标。如需利用DMSP/OLS数据反演空间尺度更小的研究单元的GDP空间分布,则可以采用土地利用和人口等数据相结合的方法,进而改进空间化的方法,拓宽空间化的应用领域。
[1] DOBSON J E,BRIGHT E A,COLEMAN P R.LandScan:A global population database for estimating populations at risk[J].Photogrammetric Engineering and Remote Sensing,2000,66:849-857.
[2] 曾祥贵,赖格英,易发钊,等.基于GIS的小流域人口数据空间化研究——以梅江流域为例[J].地理与地理信息科学,2013,29(6):44-48,133.
[3] 梁友嘉,徐中民.基于夜间灯光辐射数据的张掖市甘州区GDP空间分布建模[J].冰川冻土,2013,35(1):249-254.
[4] 杨续超,高大伟,丁明军,等.基于多源遥感数据及DEM的人口统计数据空间化——以浙江省为例[J].长江流域资源与环境,2013,22(6):729-734.
[5] SUTTON P C,COSTANZA R.Global estimates of market and nonmarket values derived from nighttime satellite imagery,land cover,and ecosystem service valuation[J].Ecological Economics,2002,41(3):509-527.
[6] DOLL C N H,MULLER J P,MORLEY J G.Mapping regionaleconomic activity from night-time light satellite imagery[J].Ecological Economics,2006,57(1):75-92.
[7] TOBLER W,DEICHMANN U,GOTTSEGEN J.World population in a grid of spherical quadrilaterals[J].International Journal of Population Geography,1997,3:203-225.
[8] DOBSON J E,BRIGHT E A,COLEMAN P R.LandScan:A global population database for estimating population at risk[J].Photogrammetric Engineering and Remote Sensing,2001,67(9):1037-1047.
[9] ELVIDGE C D,BAUGH K E,KIHN E A,et al.Relation between satellite observed visible near infrared emissions,population,economic activity and electric power consumption[J].International Journal of Remote Sensing,1997,18(6):1373-1379.
[10] HENDERSON M,YEH E T,GONG P,et al.Validation of urban boundaries derived from global night-time satellite imagery[J].International Journal of Remote Sensing,2003,24(3):595-609.
[11] 刘红辉,江东,杨小唤,等.基于遥感的全国GDP 1km格网的空间化表达[J].地球信息科学,2005,7(2):120-123.
[12] 韩向娣,周艺,王世新,等.基于夜间灯光和土地利用数据的GDP空间化[J].遥感技术与应用,2012(3):74-83.
[13] MA T,ZHOU C,PEI T,et al.Quantitative estimation of urbanization dynamics using time series of DMSP/OLS night time light data——A comparative case study from China′s cities[J].Remote Sensing of Environment,2012(124):99-107.
[14] 王鹤饶,郑新奇,袁涛,等.DMSP/OLS数据应用研究综述[J].地理科学进展,2012,31(1):11-19.
[15] 米晓楠,白林燕,谭雪航,等.基于DMSP/OLS数据的城市中心城区提取新方法[J].地球信息科学学报,2013,15(2):255-261.
[16] 陈晋,卓莉,史培军,等.基于DMSP/OLS数据的中国城市化过程研究[J].遥感学报,2003,7(3):168-176.
[17] 卓莉,史培军,陈晋,等.20世纪90年代中国城市时空变化特征——基于灯光指数CNLI方法的探讨[J].地理学报,2003,58(6):893-902.