基于夜光遥感数据的不同产业GDP估算精度影响因素分析
——以中国沿海16个城市为例
2021-10-12张正鹏尹茁高嵩卜丽静许峥辉
张正鹏,尹茁,高嵩,卜丽静,许峥辉
(1.湘潭大学 自动化与电子信息学院,湖南 湘潭 411105;2.辽宁工程技术大学 测绘与地理科学学院,辽宁 阜新 123000)
0 引言
夜晚的可见光和人类社会活动密切相关,夜光遥感影像作为一种重要的遥感产品,在城市范围绘制[1]、社会经济参数分析[2]和模拟人口分布[3]等领域中已得到广泛的应用。夜光遥感影像中的灯光亮度值能有效地反映出社会经济发展水平,为预测社会经济参数提供数据基础。
国内生产总值(gross national product,GDP)代表某一既定时期一个国家国内生产的所有最终物品与劳务的市场价值[4],能够对一个国家总体经济情况进行衡量,是国民经济核算的重要指标。大量研究表明,夜光数据在估算和分析GDP方面表现出很高的潜力[5]。Elvidge等[6]研究发现美国国防气象卫星计划-线性扫描业务系统(DMSP-OLS)夜光数据与GDP的相关性较高,并采用线性回归方法定义了回归方程。刘佳等[7]通过皮尔森相关系数对GDP与DMSP-OLS的夜光数据进行分析,分析发现GDP和夜光数据存在显著正相关关系。2011年美国成功发射国家极地轨道卫星(national polar orbit partnership,NPP)。2018年6月由中国武汉大学研制的“珞珈一号”卫星成功发射升空。作为新一代夜光遥感卫星,“珞珈一号”夜光数据具有高分辨率、高信噪比和获取简易等特点,弥补了我国在夜光数据获取方面的不足[8]。NPP-VIIRS和“珞珈一号”夜光数据都具有更高的空间分辨率,对灯光的感知敏感[9-10]。
夜光遥感影像的灯光亮度值能在一定程度上有效反映出经济贡献,但并非影像中的所有具有像素值的点都有经济意义。因此,能否有效地去除这种与经济无关的像素点,对利用夜光数据分析经济参量尤为重要。文献[11-15]在进行夜光数据与经济参量相关性分析前,去除了NPP-VIIRS夜光数据存在的背景和一些临时光源噪声,消除了与经济活动无关的混淆因素。结果显示,经济与夜光数据的相关性均有明显的提高。文献[16-17]中提到云和月光会影响“珞珈一号”夜光数据的质量,但是否存在影响经济分析的干扰因素,尤其在产业结构经济分析方面目前没有明确文献记载,本文针对这一问题进行了相关探讨。目前基于夜光遥感的经济分析研究大多停留在县级、市级和省级等城市整体尺度空间上,反映城市的整体经济发展水平。而城市的经济发展水平受城市产业结构发展的影响[18-19],因此研究产业结构尺度空间的夜光遥感经济分析具有重要意义。由于无法获取城市准确产业结构分布图,目前夜光数据的产业经济分析大多使用土地利用数据模拟第一产业的经济产出,夜光数据模拟第二、第三产业的经济产出[20-21],但存在夜光数据对产业经济贡献反映不精确的问题。
综上,本文以中国沿海的16个港口城市作为研究区域,利用夜光数据分析产业结构对城市经济的影响。首次在产业结构尺度上,对比了“珞珈一号”和NPP-VIIRS夜光数据的GDP相关性,分析了影响夜光数据预测经济参量的主要因素。针对影响夜光数据预测经济参量的主要因素,提出多帧阈值去噪方法去除“珞珈一号”夜光影像中影响产业结构分析的“噪声”;提出将公开地图(openstreetmap,OSM)道路网络和兴趣点(point of interest,POI)重分类法相结合的方法来划分产业结构,解决了在产业结构经济分析中使用的灯光值不准确的问题。
1 研究区及方法
本文以16个沿海城市(上海、天津、宁波、舟山、广州、深圳、湛江、汕头、青岛、烟台、大连、福州、厦门、泉州、海口和三亚)作为研究区域。16个沿海城市的社会经济发展状态不同,研究该区域GDP和夜光数据间的相关性具有一定实际意义。本文技术方案如图1所示。
图1 技术方案
1)数据预处理。包括“珞珈一号”夜光数据的配准和去噪,并采用OSM数据与POI数据进行产业结构的划分。
2)模型构建。利用预处理之后的夜光数据和产业结构分布图,构建线性回归模型。
3)产业结构经济分析。采用线性回归模型,对比NPP-VIIRS数据和“珞珈一号”数据在产业尺度中的相关性,分析和估算沿海16个城市的GDP。
1.1 夜光遥感与OSM数据配准
OSM数据作为由全球用户参与并提供数据的在线开源地图,提供了多种类型的道路数据,包括高速公路、主干道、一级公路和二级公路等数据。城市道路上的路灯是市政工程,属于第三产业,利用道路数据可以相对准确地提取出路灯贡献的灯光值,因此,OSM道路数据与“珞珈一号”影像上的道路网的重合度直接会对产业结构经济分析产生影响。“珞珈一号”夜光遥感影像在发布前经过了系统的几何校正,但其定位精度较低在0.49~0.93 km之间[22],与OSM道路数据叠加时存在偏移现象。为了更准确地提取产业灯光值,采用多项式仿射变换方法进行影像配准,配准后均方根误差为0.213~0.346像素之间。
1.2 夜光“噪声”分析与处理方法
实验数据为2018年的NPP-VIIRS和“珞珈一号”夜光数据,主要参数见表1。其中,NPP-VIIRS数据产品是经过异常值(火灾、其他短暂发光光源)去除的无云平均辐射值数据[23]。利用文献[12]提出的数据处理方法对NPP-VIIRS夜光遥感影像进行预处理,去除影像中的背景噪声和其他干扰因素。
表1 “珞珈一号”与NPP卫星的主要参数
“珞珈一号”卫星成像模式为帧推扫成像模式[24],采样间隔为5 s/帧,可以完成对城市的连续拍摄。因此,同一区域在同一天会有连续拍摄的多张夜光遥感影像。通过观察16个城市的“珞珈一号”夜光遥感影像,发现每个城市在没有明确灯光的地方会存在白点状的“噪声”,影像中这些“噪声”呈随机分布,如图2(a)~图2(c)所示。通过图2(d)的Landsat-8影像与夜光遥感影像的对比可发现,这些地方多为林地、草地等属于夜晚不发光区域。这些“噪声”会对灯光值的准确性产生影响,进而影响灯光值与GDP的相关性。因此,本文提出多帧阈值法去除“噪声”,提高夜光数据的可靠性,如式(1)所示。
注:该图基于福建省自然资源厅福建省标准地图服务下载的审图号为闽S(2018)38号的标准地图制作,底图无修改。图2 福州市影像
(1)
(2)
式中:Iavg为平均影像;n为影像数量;(u,v)为像素位置;T为阈值(实验设置T=1 000);Ix为多帧影像中质量最好(“噪声”最少)影像;Iy为经多帧阈值法处理后的结果影像。
1.3 OSM与POI数据的产业结构划分方法
地块是以道路数据为边界的多边形,是城市区域内的自然分割边界[25],同时地块也是城市管理和城市规划中承载社会经济功能的基本单元[26]。本文根据文献[25]中提到的方法,利用OSM道路数据对研究区域进行地块划分。OSM道路数据使用前需进行预处理。对数据中长度小于300 m的道路进行修剪,以移除悬挂路段,将道路两端分别延长80 m以连接相邻但未连接的道路。通过处理可闭合一些道路,同时也可以将不完整的道路移除。道路级别不同其宽度也不同,因此综合研究区域的实际道路情况,采用统一标准对16个城市的道路宽度进行定义,将道路宽度定义为5~40 m不等。通过对道路的扩张操作,可以消除道路间不具有社会经济功能的小地块。图3为广州市基于OSM数据地块划分图,其中图3(a)和图3(b)为局部放大图。
注:该图基于广东省自然资源厅广东省标准地图服务子系统下载的审图号为粤S(2018)121号的标准地图制作,底图无修改。图3 广州市OSM数据地块划分
POI数据是通过高德地图服务提供的应用程序编程接口(API)进行获取的,数据包括餐饮、购物、住宿、医疗保健和公司企业等20个类别,根据《国民经济行业分类》(GB/T 4754—2017)对POI数据类别中的公司企业进行重分类,再结合POI数据中的其他类别,将POI数据重新分为三个类别:第一产业、第二产业和第三产业,重分类具体对应关系如表2所示。
表2 POI数据重分类
利用POI重分类数据对OSM道路生成的产业地块赋予属性。为了统计研究区域内三大产业各自的POI总数和地块单元内每个产业的POI数量,将POI数据叠加在地块数据上。同时,为了确定每个地块的主要属性,采用频率密度指数(Fi)和比值指数(Ci)两个指标来判断每个地块的类型,计算如式(3)、式(4)所示[27]。
(3)
(4)
式中:i为POI代表的产业类型;qi为地块单元中i类型POI的个数;Qi为i类型POI的总数;Fi为单元中i类型POI的频率密度;Ci为地块单元中i类型POI的频率密度的比例。
根据每个单元地块的Fi和Ci结果,通过数值对地块进行产业判别。当单元地块中某一产业类型的Ci大于50%时,将该地块定义为单一产业区域并为该产业类型。当单元地块中三个产业的Ci都小于50%时,将该地块定义为混合产业区域。当单元地块中不存在任何类型的POI数据时,将该地块定义为无数据区域。产业结构分布图见图4(a)。
1.4 回归模型
目前,在利用夜光数据进行社会经济参量相关性分析中,多使用线性、对数和二次回归模型[28]。相比于对数和二次回归模型,线性回归模型具有建模速度快、计算简单和易于实现等特点。因此,本文采用线性回归模型对“珞珈一号”夜间灯光值和GDP之间的关系进行研究(式(5))。
G=a·TNL+b
(5)
式中:G代表GDP;TNL(total night light)代表总灯光亮度值;a和b分别是回归系数和截距。
2 结果
2.1 产业结构划分结果与验证
GDP按产业尺度可划分为三大产业,分别是以农业等为主的第一产业(GDP1)、以工业等为主的第二产业(GDP2)、以批发和零售业等为主的第三产业(GDP3),不同的产业结构对GDP预测可能会产生影响。由于每个城市准确的产业结构分布数据难以获取,目前主要通过研究城市灯光总亮度值与产业GDP相关性来近似表达[29],但是通过灯光总亮度值的近似表达会影响实验结果的准确性。因此,本文结合OSM数据和POI数据模拟出研究区域的产业结构分布图,该方法有助于获取每个产业的灯光值,为接下来的分析提供较为准确的数据基础。
图4(a)为本文方法模拟出的厦门市产业结构分布图。根据OSM数据划分的地块可以发现,在图中面积较大的地块代表的是远离城市中心即经济发展缓慢的区域,这些区域多为第一产业。面积较小且分布密集的地块代表的是经济发展繁荣的区域,这些区域以第二、三产业为主,第一产业较少。
采用厦门市的土地利用类型图(图4(b))和夜光遥感影像(图4(c)和图4(d))来验证本文模拟产业结构分布的准确性。从图4(b)厦门市土地利用类型分布地图中可看出,土地利用类型中的城乡、工矿居民用地和图4(a)中的第二、第三产业的分布相近。图4(a)中第一产业和土地利用类型中的水域、草地、林地和耕地的分布相近。在夜晚,第二、第三产业贡献灯光较多,第一产业在夜晚几乎不贡献灯光。图4(c)和图4(d)分别为厦门市的“珞珈一号”和NPP-VIIRS的夜光遥感影像,从影像可以观察到,发光的区域和图4(a)中的第二、第三产业分布接近,不发光的区域和图4(a)中的第一产业分布接近。从图4(a)中可以看出,混合区域面积较小,说明本文模拟产业结构分布的方法虽然存在混合区域,但混合区域实际的面积很小,对实验产生的影响也会较小。
注:该图基于福建省自然资源厅福建省标准地图服务下载的审图号为闽S(2018)40号的标准地图制作,底图无修改。图4 厦门市产业结构分布验证结果
2.2 “噪声”对产业结构经济影响分析
图5为福州市“噪声”处理后影像。图6(a)~图6(c)分别为图2(a)~图2(c)对应影像的细节图,图6(d)为图5的细节图。通过对比处理前后的影像,并结合Landsat-8影像(图2(d)和图6(e)),可发现在林地和草地等不发光区域,处理后的影像中随机产生的“噪声”明显变少。在居民地等随机“噪声”较少的发光区域,处理后的影像中灯光值基本不变。因此,本文方法可以有效抑制影响第一产业经济分析的夜光“噪声”,提升“珞珈一号”夜光影像质量。但是由于多帧影像之间的差异,处理后的结果中可能还会存在少量噪声现象。
注:该图基于福建省自然资源厅福建省标准地图服务下载的审图号为闽S(2018)38号的标准地图制作,底图无修改。图5 福州市“噪声”处理后影像
图6 福州市影像细节图
利用16个城市的GDP数据分别与通过多帧阈值法处理前后的夜光数据构建线性回归关系,通过对比数据处理前后R2的大小证明本文去噪方法的有效性。本文使用的GDP数据均来自2018年的《中国城市统计年鉴》,统计口径为城市数据。由图7(a)和图7(b)中R2对比可知,经多帧阈值法处理后夜光数据与GDP的相关性在处理之后有了一定的提升。说明经过本文提出的影像预处理方法能够消除影响GDP和TNL相关性的负面因素,提高了数据的准确性。
根据GDP与夜光数据生成的线性回归模型,对16个城市的GDP进行预测,使用相对误差来评估模型的预测能力,结果见表3。利用本文数据处理结果生成的模型预测能力要优于原始夜光数据生成的模型。由2.2小节分析可知,16个城市的夜光遥感影像中的“噪声”影响了第一产业灯光值的可靠性。通过本文提出的多帧阈值法处理后,第一产业灯光值改变明显,其灯光值趋于准确,GDP的预测也更准确。由表3中原图的相对误差和处理后的相对误差对比可知,福州、舟山和烟台误差分别降低了10.64%、10.55%和5.93%,16个城市总的误差共降低了将近8%,由此证明了本文提出去噪方法的有效性,提高了模型预测的准确性。
图7 夜光数据去噪前后与GDP相关性
表3 夜光数据去噪前后预测GDP准确性 %
青岛、汕头、泉州、三亚、海口和厦门这6个城市的影像经过去噪处理后,其误差不降反升。分析发现,这6个城市的夜光遥感影像质量相对其余10个城市的影像质量较好,通过本文方法处理后,其灯光值的改变量相对较少。其中青岛的改变量仅为原图的0.628%。这6个城市的灯光值相对偏离了其余10个城市灯光值的变化趋势,进而导致了这6个城市预测误差变大。本文方法对夜光遥感影像质量较差的城市经济预测精度提升效果相对明显。
2.3 夜光遥感的产业结构经济分析
夜晚的灯光亮度和分布能够反映区域的繁荣程度,通过灯光亮度值可以分析该地区的经济发展水平。本文通过构建夜光数据和GDP的线性回归模型,根据相关性的高低对“珞珈一号”和NPP-VIIRS两种夜光数据反映经济能力的强弱进行判断。
图8 夜光数据与GDP的相关性
由图8可知,“珞珈一号”夜光数据与GDP的相关性高于NPP-VIIRS夜光数据。P值均小于0.001,说明两种夜光数据与GDP呈显著正相关。说明“珞珈一号”夜光数据对经济的反映能力更强,这主要是由于“珞珈一号”数据的空间分辨率相对于NPP-VIIRS更高,更能详细和准确地反映出夜晚的经济活动。从线性回归拟合直线中能够明显地看出深圳市的拟合结果异常。深圳的GDP在16个城市中位于第二,但是其面积仅为1 996.85 km2,在16个城市是排名15,只比GDP最低的三亚多77.89 km2。因此,初步分析回归异常的原因是由于深圳面积太小但经济又非常发达,灯光亮度值已经达到了影像的极限值,夜光未能完全反映出它的经济真实水平。
图9 夜光数据与第一产业GDP相关性
图10 夜光数据与第二产业GDP相关性
图11 夜光数据与第三产业GDP相关性
第一产业主要包括农、林、牧、渔业等。这些行业在夜晚中几乎不会产生灯光,因此,仅根据夜光数据是无法反映出第一产业的经济贡献。由图9可知,第一产业GDP和“珞珈一号”、NPP-VIIIRS两种夜光数据的相关性都非常低,R2均低于0.1;P值均大于0.001,说明两种夜光数据与第一产业GDP相关程度不显著。第二产业由工业和建筑业等构成,在夜光中反应明显。由图10可知,第二产业GDP和两种夜光数据的相关性较高且接近,R2均在0.72以上;P值均小于0.001,说明两种夜光数据与第二产业GDP呈显著正相关。“珞珈一号”和NPP-VIIRS夜光数据尽管在空间分辨率上有一定差距,但对第二产业经济的反映能力是相近的。第三产业以服务业为主,主要有批发和零售业以及住宿和餐饮业等。这些行业同样在夜光中反应较为强烈,贡献了更多的灯光。由图11可知,第三产业GDP和夜光数据的相关性较高,数据的拟合程度也相对较好;P值均小于0.001,说明两种夜光数据与GDP呈显著正相关。第三产业GDP与“珞珈一号”数据的相关性相对于NPP-VIIRS数据更高,R2为0.830 8。由厦门市产业结构分布图(图4(a))可发现,第一产业的面积相对最大,其次是第二产业,第三产业的面积相对最小。两种夜光数据和第一产业与第二产业GDP在相关性方面差距较小,但两种夜光数据和第三产业GDP的相关性差距相对明显,分析导致这一结果的原因是“珞珈一号”夜光数据的分辨率较高,在相对更精细的尺度中对经济的反映更准确。
2.4 基于产业结构的误差分析
1)产业结构占比分析。为评估“珞珈一号”夜光数据预测GDP的能力,利用GDP与夜光数据生成的线性回归模型,对16个城市的GDP进行预测,并使用相对误差进行评估。根据产业的GDP数据,计算16个城市每个城市的第一产业、第二产业和第三产业的GDP占城市总GDP的比值。
由图12可看出,宁波、青岛、烟台、海口、大连、广州、天津和上海这8个城市的相对误差较小,均在40%以下。分析发现这8个城市的第一产业GDP贡献相对较低。其中,宁波和烟台的第二、三产业对GDP的贡献量差距很小。除去这2个城市,其余6个城市的第三产业贡献量都远高于第二产业。从图中还可看出,三亚和舟山的相对误差较大,均在80%以上。三亚和舟山的第一产业较发达,第二产业相对落后。夜晚的灯光主要反映的是第二、三产业的经济贡献,而忽略了第一产业的经济贡献[30]。因此,对于第一产业较发达,第二产业相对落后的城市,整体的预测误差也会较大。湛江的第一产业很发达,但其第二、第三产业的发展相对均衡,且第三产业最发达。因此,湛江的GDP预测误差没有很高。综上,第一产业发达但是第二产业或第三产业落后的城市,GDP预测误差会较大。第一产业相对落后,第三产业比第二产业发达程度较高的城市,预测误差相对较小。
图12 预测相对误差和三大产业所占GDP比值折线关系
3)其他相关分析。本文的研究区域为16个沿海城市。这16个城市的植被覆盖情况不同,植被的大量存在会导致部分灯光值无法真实地反映在夜光遥感影像上。而且由于植被的大量存在,光溢出效应也会明显减弱,进而对GDP的预测产生影响[31]。本研究中三亚和舟山的GDP预测误差相对较大。三亚和舟山是沿海城市,城市空气质量高,森林和植被覆盖率较高,植被的大量存在对GDP预测结果的准确性产生了影响。16个城市中天津和上海的森林和植被覆盖率相对较低,植被对灯光的影响较小。因此,这两个城市通过夜光数据预测GDP的准确性也相对较高。综上,夜光数据和GDP有很强的相关性,但是仅通过夜间灯光来描述区域GDP经济产值是不准确的,有些区域对GDP的产出可能是在白天,这样就会造成数据误差,影响数据分析的结果。
3 结束语
本文针对中国16个沿海城市,提出了多帧阈值法对“珞珈一号”影像进行预处理,对比了“珞珈一号”和NPP-VIIRS夜光数据在产业尺度上与GDP的相关性,分析了影响夜光数据预测GDP准确性的因素。结论如下。
1)采用OSM和POI数据模拟产业结构分布,实验表明该方法可较好地表达产业结构的空间分布,但仍存在少量区域未被准确定义产业类型。
2)针对“珞珈一号”夜光遥感的产业结构“噪声”敏感性,提出一种多帧阈值去噪方法。实验表明该方法可有效去除灯光统计中,尤其第一产业的噪声,提升了16个城市GDP整体预测精度。其中,福州、舟山和烟台预测误差分别降低了10.64%、10.55%和5.93%。
3)首次对比“珞珈一号”与NPP-VIIRS夜光数据在产业结构经济分析中的相关性。实验表明,相对于NPP-VIIRS夜光数据,在产业尺度上,第三产业中“珞珈一号”夜光数据与GDP的相关性更高,R2为0.830 8。第三产业的面积相对于第一、第二产业面积较小,说明“珞珈一号”夜光遥感影像在精细尺度中更能准确地反映出经济贡献。
4)分析了影响“珞珈一号”夜光数据预测GDP准确性的因素。第一产业发达但第二产业或第三产业落后的城市,预测误差会较大,在80%以上(如舟山等城市)。第一产业相对落后,第三产业比第二产业发达程度较多的城市,预测误差相对较小,在30%以下(如上海等城市)。在夜晚,等级高的城市对人类的活动反应较强烈,GDP预测误差也相对较小,在50%以下(如广州等城市)。等级相对低的城市则相反,预测误差相对较高,在50%以上(如汕头等城市)。城市里的植被覆盖率也会对夜光数据预测GDP的准确性产生影响。
综上所述,“珞珈一号”和NPP-VIIRS夜光数据与经济统计数据都具有较高的相关性,“珞珈一号”比NPP-VIIRS数据在经济预测方面具有更大的潜力。在GDP等相关经济指标估算或分析时,第二、第三产业发展结构对经济预测的影响较大,以第二、第三产业为主城市(如天津等城市)夜光数据估计GDP时精度会较高;等级高的城市(如上海等城市)其经济与夜光数据的耦合度更高。在未来根据夜光数据对经济指标进行研究时,将根据研究区域的产业结构和城市级别等特点建立合理的回归模型,提高夜光数据估算经济的准确性。