中国区域NPP-VIIRS年度夜间灯光数据的合成方法与对比验证
2021-06-05胡为安刘传立詹淇雯
胡为安, 刘传立, 詹淇雯
(1.江西理工大学 土木与测绘工程学院, 江西 赣州 341000; 2.广东工贸职业技术学院,广州 510510)
0 引 言
当夜间天空无云时, 遥感卫星传感器能够捕捉到城市灯光、渔船灯光、火点等可见光辐射源, 这些为夜间无云条件下获取的地球可见光的影像即为夜间灯光数据。目前使用最为广泛的夜间灯光数据是美国国防气象卫星(defense meteorological satellite program, DMSP)搭载的可见红外成像线性扫描业务系统(operational linescan system, OLS)数据和美国新一代国家极轨卫星(Suomi national polar-orbiting partnership, Suomi-NPP)搭载的可见光近红外成像辐射(visible infrared imaging suite, VIIRS)传感器数据[1]。DMSP的设计初衷是为了获取月光照射下的云层信息, 由于OLS传感器具有较强的光电放大能力使其可探测到夜间地表微弱的近红外辐射[2], 敏锐地捕捉到地表极光、火光以及夜间城市灯光等辐射光源, 对人类社会活动有较好的表征, 从此拉开了基于夜间灯光数据科研工作的序幕。2011年美国航天局成功发射了Suomi NPP卫星, 其搭载的VIIRS传感器相比与OLS传感器而言, 具有更高的时间和空间分辨率, 辐射探测范围更广, 相比于传统DMSP-OLS夜间灯光数据更具发展潜力[3]。
DMSP-OLS稳定年度夜间灯光数据产品包括由6个不同卫星传感器获取的1992—2013年共34期年度影像, OLS传感器的设计缺陷导致影像之间存在不连续、未经星上辐射校正[4]和像元DN值过饱和等问题。由于DMSP-OLS稳定年度夜间灯光数据发布较早, 目前校正方法有像元DN值频率分布法[5]、不变目标法[6-7]、辅助参数法[8]等, 影像校正研究已相对成熟。
反观NPP-VIIRS夜间灯光数据, 其作为未来研究新的数据源, 分为年度平均数据和月度平均数据两种。目前发布经过校正的年度夜间灯光数据只有2015和2016年两期, 未校正的月度数据从2012年4月起每月一期。针对NPP-VIIRS年度夜间灯光数据缺乏和月度数据校正的问题, 一些学者提出过相应的解决方法: Shi等[9]、柴子为等[10]提出利用DMSP-OLS夜间灯光数据剔除NPP-VIIRS月度数据中噪声的方法, 由于DMSP-OLS数据存在灯光饱和效应且仅适用于2012和2013年, 并不适用于长时间序列NPP-VIIRS夜间灯光数据的校正; 陈慕琳等[11]针对NPP-VIIRS部分月度数据中高纬度地区灯光缺失的情况, 对比了4种插补方法的适宜性, 研究对象只适用于反映社会经济因素的稳定光源; 周翼等[12]采用12个月的月份数据合成年度数据, 忽略了部分月度数据中高纬度地区灯光缺失的不足; 李明峰等[13]提出了NPP-VIIRS多时相影像的校正方法, 缺乏对年度数据合成方法的研究。为了弥补NPP-VIIRS夜间灯光数据在年际研究中的不足, 本文提出一种基于部分月度(不包括5—7月)夜间灯光影像数据合成年度夜间灯光影像数据的方法, 通过将其他类型的NPP-VIIRS数据与合成数据进行定性和定量对比分析, 验证了合成年度夜间灯光方法的可靠性和科学性。
1 数据来源与分析
1.1 数据来源
NPP-VIIRS夜间灯光数据来源于美国国家海洋和大气管理局(NOAA/NGDC)。NPP-VIIRS有云掩膜处理数据(vcmcfg)和云掩膜散光校正数据(vcmslcfg)两种数据格式。由于2013年缺少vcmslcfg类型数据, 本文选择时序性相对完整的vcmcfg类型数据进行研究, 该数据可通过网址https: //eogdata.mines.edu/download_dnb_composites.html获得。将NOAA/NGDC网站提供的2015和2016年两期年度夜间灯光数据设为标准年度数据。“火石(Flint)”夜间灯光数据通过中国科学院提供的网址https: //pan.baidu.com/s/17UqS7P66_6AMdr-a4sfUXA获得。
省、市级行政区划数据来源于国家基础信息中心的1∶4×106的数据库(审图号: GS(2016)2556号), 社会经济参量等数据来源于中国国家统计局发布的《中国城市统计年鉴》和《中国统计年鉴》。
1.2 数据分析
DNB(day night band)是NPP-VIIRS用于探测夜间灯光强度的重要波段, 波长范围为0.5~0.9 μm, 空间分辨率约为0.5 km, 辐射分辨率为14 bit且经过在轨辐射定标操作, 这就意味着DNB传感器不但可以探测到稳定的城镇灯光, 同时可以捕获火光、渔船和油气井等短暂光源及冰雪高反射导致的异常灯光, 降低了灯光数据的质量。 此外, 由于DNB数据产品未进行去光处理, 导致NPP-VIIRS月度夜间灯光数据中存在负值和大量背景噪声, 这些影响因素仍在一定程度上限制了该数据的应用。 因此, 利用月度数据合成年度数据的过程中, 仍需对负值、背景噪声、不稳定光源和连续性问题进行处理。
2 NPP-VIIRS年度数据的合成
2.1 数据预处理
NPP-VIIRS月度夜间灯光数据地理坐标系为GCS_WGS_1984, 影像网格会随着纬度的变化而发生变形, 需要对下载的数据进行预处理。首先将影像数据投影至符合中国地形的Albers等面积投影坐标系, 并将像元大小重采样至0.5 km×0.5 km, 利用中国行政区划数据掩膜裁剪出中国区域的夜间灯光影像数据。由于裁剪出的影像存在极少数的异常值(DN值大于原始月度数据的最大值), 利用原始月度数据中的最大值将异常值进行替换。
2.2 年度均值图像合成
由于受到杂散光污染的影响, 中国夏季中高纬度地区的灯光数据严重失真(全部像元值为0), 该情况集中体现在5—7月的数据中, 因此利用月度数据合成年度数据时将5—7月的灯光数据进行剔除, 利用2012—2018年的其他9个月的灯光数据合成年度灯光数据
(1)
其中,DNi表示某月的灯光亮度值,DNj表示某年的平均灯光亮度值。
2.3 负值消除
通过将合成年度灯光数据导入ArcGIS软件可知, NPP-VIIRS月度灯光数据中存在负值的情况在合成的年度灯光数据中并未得到解决。但是, 理论上灯光辐射值应该大于等于0, 本文按照式(2), 利用网站提供的2015年的标准年度数据替换2015年合成年度数据中的负值, 然后以2015年合成年度数据为基准数据, 2012—2014年按照各年数据中的负值由后一年的均值图像中的非负值替换, 2016—2018年按照各年数据中的负值由前一年的均值图像中的非负值替换, 最后得到不包含负值的2012—2018年的合成年度灯光数据。
(2)
式中:DNi表示2015年合成年度夜间灯光像元值,DN2015表示NOAA/NGDC网站提供的2015年标准年度数据的夜间灯光像元值。
2.4 不稳定光源与背景噪声消除
DNB波段对于波段范围内的微弱光源具有非常高的敏感性, 探测城镇灯光的同时也能捕获渔船灯光、人为火点和气体燃烧等不稳定光源。这些不稳定光源不可能同时存在于连续两年的夜间灯光数据的同一位置, 可以认为上一年(下一年)的灯光在下一年(上一年)中没有出现, 即可认定其为不稳定光源。此外, 合成的年度夜间灯光数据中仍然存在大量背景噪声, 需要对不稳定光源和背景噪声进行剔除。
NOAA/NGDC网站发布了已经去除不稳定光源和背景噪声的2015和2016年两期年度夜间灯光数据, 因此其他各年均值影像中的不稳定光源和背景噪声可以利用该两年数据对其进行去除。先将两期年度夜间灯光数据的二值图像相乘得到合成二值图像,DN>0的部分设置为1,DN≤0的部分设置为0,DN=1的部分认定为稳定光源和无背景噪声区域。将合成二值图像与2015和2016年均值影像相乘去除不稳定光源和背景噪声, 从而获得稳定可靠的2015和2016年均值影像。分别提取其他各年均值影像的二值图像, 以合成二值图像为基准数据, 2012—2015年年度数据按照式(3)获取稳定可靠光源区域, 2016—2018年年度数据按照式(4)获取稳定可靠光源区域, 将稳定可靠光源区域与对应年份均值影像相乘, 得到去除不稳定光源和背景噪声的2012—2018年长时间序列影像。
(3)
(4)
式中:DN表示待校正年份均值影像中的稳定可靠光源;DNk表示待校正年份影像的稳定可靠光源;DNk+1表示校正年份后一年二值影像的稳定可靠光源;DNk-1表示校正年份前一年二值影像的稳定可靠光源。
2.5 极高值消除与连续校正
由于地表存在发射率较高的表面, 使得月度夜间灯光影像数据中部分灯光亮度值发生异常, 这些异常值一般都较高, 远远高于实际情况, 因此需要消除影像中的极高值。利用MATLAB编程对合成的年度夜间灯光数据中的亮度值进行提取, 去除非连续的极高值, 经统计分析得出2012—2018年各年中国区域的最大灯光亮度值分别为157.41、172.16、195.39、220.92、243.86、269.88和293.27。若将灯光亮度值大于该年最大灯光亮度值视为极高值, 应对其进行消除。对各年合成年度均值影像的灯光亮度值进行提取, 发现极高值只是数值较高, 但数量较少。为了消除合成年度均值影像中的极高值, 本文采用均值滤波法[14]和降值法进行效果对比研究。用均值滤波解算出极高值周围24个像元的平均值, 再用平均值替换极高值; 消除极高值的目的是为了降低其对整体灯光的影响, 可通过对极高值进行降值处理来削弱这种影响, 本文用中国区域最大亮度值将该年中所有的极高值进行替换, 达到降值的目的。研究表明均值滤波法和降值法对消除极高值的效果差异不大。
以上仅消除了合成年度均值影像中的极高值, 但是对于长时间序列的夜间灯光影像数据仍存在连续性的问题, 需要进一步校正。按照下一年的灯光亮度值不低于上一年的原则, 以2018年年度均值夜间灯光数据为基准数据, 对其他年份数据进行逐年校正, 从而得到2012—2018年长时间序列稳定可靠的年度夜间灯光数据
(5)
式中:DN表示经过校正后的年度灯光亮度值;DNx表示待校正的年度灯光亮度值;DNx+1表示后一年经过校正的年度灯光亮度值。
3 合成结果对比分析
为了验证合成年度夜间灯光数据方法的可靠性与科学性, 分别进行了定性和定量对比分析。定性对比分析采用目视解译法比较合成年度数据校正前与校正后相比同年度间像元DN值的变化, 检验校正后的灯光数据是否解决了校正前存在的问题。定量对比分析利用合成的年度夜间灯光数据、NOAA/NGDC网站提供的2015和2016年年度夜间灯光数据、中国科学院用NPP-VIIRS月度数据合成的年度数据“火石”和月度夜间灯光数据在省级[15]和市级[16]两方面的社会经济参量拟合[17]能力进行对比, 从像元DN值变化和社会经济参量拟合能力两方面来对比验证合成方法的可靠性与科学性。
3.1 像元DN值对比
由于未经校正而直接合成年度均值夜间灯光数据没有解决月度夜间灯光数据中存在的问题, 从校正后的长时间序列的NPP-VIIRS数据集中选择2012和2018年的合成年度数据与校正前的合成年度数据进行对比分析, 如图1所示。夜间灯光数据与社会经济参量存在较好的线性相关性早已得到证实, 说明灯光可以反映城市的发展水平, 2012—2018年间广东省是全国GDP贡献最大的省份, 因此本文以广东省作为典型区域, 选取2013、2015和2017年的影像数据直观地对比校正前后夜间灯光影像局部的变化, 如图2所示。
图1 中国区域校正前后对比(底图审图号: GS(2016)2556号, 自然资源部监制)Fig.1 Comparison before and after correction in China
图2 广东省校正前后对比Fig.2 Comparison before and after correction in Guangdong
可以看出, 校正前的年度灯光数据中存在负值、大量背景噪声和不稳定光源, 影像中存在年际之间不连续的情况, 与实际情况不符。经过校正后的合成年度灯光数据在一定程度上消除了负值、背景噪声和不稳定光源, 最大DN值也较为合理, 说明合成年度夜间灯光数据更符合实际情况。
3.2 经济参量拟合能力对比
本文从省级和市级两方面比较其他类型NPP-VIIRS数据与合成年度数据的社会经济参量拟合能力来验证合成年度数据方法的可靠性和科学性。中国科学院利用NPP-VIIRS月度数据合成了名为“火石(Flint)”的年度数据, 该数据具有更高的准确性、稳定性和易用性。鉴于此, 本文选择NOAA/NGDC网站发布的两期标准年度数据、“火石”年度夜光数据和12月份的月度数据与合成年度数据进行比较。
根据《中国统计年鉴》和《中国城市统计年鉴》, 提取2012—2018年中国31个省级行政区(不包括香港、澳门、台湾地区)的GDP和电力消费量与2015—2016年中国336个市级行政区的GDP和年末常住人口, 利用提取的社会经济参量与省级和市级尺度的TDN进行线性回归分析。
图3a、b分别是省级尺度下4类数据与GDP和电力消费的回归决定系数R2的对比结果。可知: 2012—2018年长时间序列的合成年度夜光数据的决定系数R2均大于0.81, 比标准数据略高, 明显高于“火石”年度夜光数据的决定系数R2范围0.10~0.50和12月原始月度夜光数据的决定系数R2范围0~0.60。
图3 4类数据省级尺度下的线性回归决定系数对比Fig.3 Comparison of 4 kinds of data of linear regression determination coefficients at the provincial scale
图4、5分别是2015—2016年市级尺度下4类社会经济参量数据与GDP的线性回归结果。 可知, 2015—2016年合成年度夜光数据质量不亚于标准数据, 与GDP的线性回归决定系数R2高达0.843 4~0.849 8, 远远高于“火石”年度夜光数据的0.657 0~0.658 9和12月份原始月度夜光数据的0.469 7~0.555 0。
图4 2015年4类数据与市级GDP的线性回归结果Fig.4 Linear regression results of 4 types of data and municipal GDP in 2015
图6、7分别是2015—2016年市级尺度下4类数据与常住人口的线性回归结果可知, 2015—2016
图5 2016年4类数据与市级GDP的线性回归结果Fig.5 Linear regression results of 4 types of data and municipal GDP in 2016
图6 2015年4类数据与市级常住人口的线性回归结果Fig.6 Linear regression results of 4 types of data and municipal resident population in 2015
图7 2016年4类数据与市级常住人口的线性回归结果Fig.7 Linear regression results of 4 types of data and municipal resident population in 2016
年合成夜光数据与常住人口之间的线性回归决定系数在0.567 3~0.588 7, 同样高于“火石”年度夜光数据的0.437 5~0.455 1和12月原始月度夜光数据的0.307 4~0.351 6。
从省、市级两方面的社会经济参量拟合能力上看, 合成年度夜间灯光数据质量不亚于NOAA/NGDC网站提供的年度夜间灯光数据, 且远远优于“火石”年度夜间灯光数据和12月原始月度夜间灯光数据。通过对“火石”年度夜间灯光数据和月度夜间灯光数据进行分析, 表明该两种数据不能直接用于年度社会经济参量研究。“火石”年度夜光数据中人为设定的最大DN值为2 000, 远远超过实际情况, 意味着数据中存在较多极高值, 直接影响了数据质量; 而月度原始夜间灯光数据具有存在负值、背景噪声和极高值等缺点。因此, 通过与NOAA/NGDC提供的标准年度数据、“火石”年度夜光数据和12月原始月度夜光数据在省级和市级尺度上的社会经济参量拟合能力进行对比, 表明了合成年度夜间灯光数据方法的可靠性和科学性。
4 结束语
NPP-VIIRS夜间灯光数据比DMSP-OLS夜间灯光数据更具发展潜力, 如今已被国内外学者广泛应用于各类科研之中, 如社会经济参数估算[10, 18]、生态环境和健康效应[19-21]、城市化监测[22]等。除上述研究之外, NPP-VIIRS夜间灯光在渔业研究、重大事件评估[23]、流行病研究、油气田监测和森林火灾等研究领域均发挥着重要的作用。DMSP/OLS夜间灯光数据发布较早, 且提供了1992—2013年长时间序列稳定的年度数据。第二代夜间灯光数据NPP-VIIRS提供了2012年4月—2019年8月的月度数据, 稳定的年度夜间灯光数据只提供了2015—2016年两期。针对于NPP-VIIRS年度数据缺失的不足, 大多数相关研究均采用12个月的月度夜间灯光数据进行简单的合成年度数据或直接利用某月的月度数据直接代替年度数据, 忽略了某些月度数据(5—7月)中高纬度地区灯光数据缺失的情况。鉴于此, 本文提出采用部分月度夜间灯光数据(不包括5—7月)合成年度夜间灯光数据的方法。
本文利用其他3类NPP-VIIRS夜间灯光数据与合成年度夜间灯光在省级和市级尺度上进行社会经济参量拟合能力对比, 线性回归决定系数R2与标准年度数据相当, 但远远高于中国科学院发布的“火石”年度夜间灯光数据和12个月份的原始月度夜间灯光数据, 证明了合成年度夜间灯光数据的可靠性和科学性, 一定程度上弥补了NPP-VIIRS年度数据较少的不足, 可将其应用于长时间序列的年际变化研究。