NPP-VIIRS年度夜间灯光数据合成方法
2023-09-02李启华谭荣建
李启华,谭荣建
(1.昆明理工大学 国土资源工程学院,昆明 650000;2.昆明理工大学 国土资源工程学院,昆明 650000)
0 引言
夜间灯光遥感图像有效地描述了人造光在地球表面的分布,能够反映人类夜间活动,已成为城市社会和经济夜间活动强度的重要指标,并已广泛地应用于城市化研究[1]。与传统的统计核算数据相比,夜间灯光数据具有其独特的优势。传统数据常常以行政单元作为统计单位,缺乏有效和准确的空间位置信息,而夜间灯光数据能够不受行政边界的限制,在栅格尺度上对人类经济活动进行研究,并且还具有易获取、能够分析城市内部活动等优势。
最常用的两种灯光数据是DMSP-OLS(the defense meteorological satellite program’s operational linescan system)和NPP-VIIRS(national polar-orbiting partnership’s visible infrared imaging radiometer suite)。DMSP-OLS稳定夜间灯光数据产品包括由6个传感器获取的1992—2013年共34期年度影像[2],由于缺乏机载校准系统和传感器的退化,不同年份的或同一年份不同传感器之间的数据不具有可比性,并且其探测能力的不足造成城市中心像元灯光过饱和。而新一代夜间灯光数据NPP-VIIRS具有更高的分辨率,没有灯光像元饱和、溢出现象,其数据质量相比DMSP-OLS有很大改善。NPP-VIIRS夜间灯光数据分为月度数据和标准年度数据,其中月度数据包括2012年4月起每月一期,标准年度数据包含2015年和2016年两期数据,年度数据已校正过滤火光、气体燃烧、极光和背景噪声的影响。
由于NPP-VIIRS年度夜间灯光数据的缺乏和月度数据未校正一定程度上限制了该数据的应用[3],因此一些学者提出了相应的解决办法:Shi等[4]提出利用DMSP-OLS夜间灯光数据剔除NPP-VIIRS月度数据中噪声的方法,由于DMSP-OLS数据存在灯光饱和效应且自2013年以后没有再更新数据,难以建立2013年之后的校正模型;周翼等[5]采用不变目标区域法结合2016年标准年度数据对年度均值图像逐年校正,但并不存在绝对不变的区域,这会造成一定的误差;胡为安等[6]利用两期标准年度数据合成二值图像来对年度均值影像进行校正,但这会忽略新增或消失的有效灯光;钟亮等[7]利用中值滤波和低阈值去噪相结合的方法过滤年度均值影像中的异常值和背景噪声,取得了很好的效果。此前大部分对NPP-VIIRS数据的校正基本都是基于年度均值影像进行的,而相同年份各个月度的影像间又存在较大差别,直接对年度均值影像进行校正处理会使得误差累积。针对上述情况,本文尝试结合建设用地数据对夜间灯光影像进行逐月校正,以期合成可靠性较高的年度NPP-VIIRS夜间灯光影像。采用建设用地数据参与影像校正的原因主要有两点。一是相关性。由于夜间灯光主要分布在人类活动的有灯光区域,而建设用地主要涵盖了这些区域,二者在空间上具有相关性。二是时效性。每年的统计年鉴都会公布上一年的建设用地数据,而夜间灯光影像上的灯光范围也是不断更新的,采用建设用地数据对影像进行校正能够避免因传统掩膜法校正导致对影像灯光区域的误判。对影像逐月校正能够避免影像本身的月度间差异带来的影响,相比传统直接基于年度均值影像的校正,先对影像逐月校正再合成年度影像的方法可以减少误差的累积。经济参数拟合能力是检验夜间灯光数据质量的标准。最后,本文结合统计数据对校正后的夜间灯光数据进行检验。
1 研究区域与数据
NPP-VIIRS夜间灯光数据由于受到杂散光源的影响,中国夏季中高纬度地区的灯光值会出现失真现象[8],数据表现为像元值全为零。因此本文选择位于低纬度地区的云南省为研究范围。
NPP-VIIRS夜间灯光数据由美国国家海洋和大气管理局提供。NPP-VIIRS月平均数据只是将原始DNB(day/night band)辐射值乘以109,并没有过滤极光、火光、气体燃烧等杂散光,导致数据存在大量背景噪声,所以利用月度数据合成年度数据时最主要的就是尽可能地去除这些背景噪声,提取出有效灯光。
云南省行政区划数据来源于国家基础信息中心的数据库,云南省社会经济指标数据和建设用地数据来源于云南省统计局发布的《云南省统计年鉴》。
2 年度夜间灯光数据合成
2.1 数据预处理
NPP-VIIRS原始影像采用的是GCS_WGS_1984地理坐标系,为使投影变形最小,把数据转换为Albers等面积投影,并将像元大小重采样至0.5 km×0.5 km,最后利用云南省行政区划矢量数据裁剪出云南省区域的夜间灯光影像。图1为通过预处理得到的2015年12月云南省夜间灯光影像。
图1 2015年12月云南省NPP-VIIRS影像
2.2 确定阈值及有效灯光提取
传统的影像提取采用掩膜法提取法:将2015年和2016年标准年度数据进行镶嵌,并将得到的影像有灯光的像元赋值1,没有灯光的像元赋值为0,这样就生成一个二值图像,以此作为掩膜对影像进行提取,对应值为1的像元保留其亮度值,而为0的剔除其亮度值,从而提取出有效灯光值。该方法虽然简单、直观,但也存在弊端,利用二值图像作为掩膜提取灯光影像,提取出的像元是固定的,而社会在不断进步、发展,有效灯光区域也在随时间发生着变化。该方法可能对临近两年影像提取有效,但随着时间推移,会忽略新增或消失的有效灯光,其有效灯光的提取能力会急剧降低,并不适用于长时间序列的影像提取。
现有的夜间灯光影像处理都是基于年度均值灯光影像(初始的月度影像数据求平均值)来进行的,但同一年度不同月份之间灯光数据的差距显著。如图2所示,2016年夜间灯光影像中非零像元数1月份为257 025个,而5月份为1 526 843个。在TDN值(总DN值)方面,2018年4月为966 209,而12月为771 279。图3统计了2015年至2020年各月影像的最大DN值,其中2015年8月最大DN值为1 242.94,4月最大DN值为207.3。总之,无论在影像DN值方面还是影像非零像元数方面月度间差距过大,这种差异在各年影像中均有体现,这会导致直接基于年度均值影像进行影像提取过程中的误差累积。
图3 各月灯光数据最大DN值统计图
NPP-VIIRS夜间灯光数据由于受到大气、云层、极光、闪电等杂散光源的影响,影像存在大量背景噪声[9-13],噪声呈现值小范围大的特点。背景噪声广泛地分布于影像各点上,当其分布在建设用地范围内时,与有效灯光叠加在了一起,而当其分布在非建设用地区域内时,因为非建设用地包括农用地和未利用地,这些区域基本没有灯光,所以可以认定分布在非建设用地区域内的都为背景噪声,这些区域的灯光会影响灯光影像数据的应用,属于无效灯光,需给予剔除。综上,建设用地面积的占比可近似当作有效灯光的像元数量占比。
因此,本文提出以建设用地数据为辅助数据,采用阈值法逐月对灯光影像进行提取。首先结合建设用地数据分别求出各月阈值,即有效灯光的最小值,然后对阈值以上的灯光认定其为有效灯光并保留其亮度值,而阈值以下的灯光认为其为背景噪声并进行剔除。由于2012—2014年的建设用地数据没有更新,这3年使用的数据仍是2008年的。所以选择对2015—2020年共72个月的数据进行处理。如式(1)所示,求取各月有效灯光像元数,并根据有效像元数统计出各月阈值(表1)。
表1 各月度阈值
(1)
式中:Sn表示各年云南省建设用地面积;S=394 100 km2为云南省全省面积;Tn为有效灯光像元数;T=1 532 714为总像元数。
得出阈值后,按式(2)分别对各月夜间灯光影像进行去噪。
(2)
式中:DN表示月度夜间灯光数据中的实际DN值;DNi表示各月阈值。
2.3 极高值的消除
火光等短暂光源或地表反射率过高会使得夜间灯光数据出现少部分极高值,不符合实际情况[14-16]。传统的处理方法是假定随着发展,越接近当前的夜间灯光数据其灯光亮度越大,并结合统计数据选取出发展最好的一个区域,取其最大灯光值,最后依照其他灯光值不大于选取的最大灯光值为原则进行剔除。但从2015年和2016年的标准年度影像来看(2015云南省最大灯光值为212.305,2016年云南省最大灯光值为181.408),其灯光值并不是越接近当前灯光亮度越高,所以本文采用中值法来去除高辐射值,即求取12个月最大中位数作为其最大阈值,这就能避免产生因为年份不同而引起的偏差,还不会受个别月份最大灯光值较小的影响,计算如式(3)所示。
(3)
式中:DN表示月度夜间灯光数据中的实际DN值;DNmax表示最大阈值。
2.4 年度夜间灯光数据合成
由于选择的研究区位于低纬度地区,夜间灯光数据不会出现夏季失真的情况,12个月份的数据都正常可用,经过逐月对数据进行处理,原始月度数据中的背景噪声和异常高值都已经被去除。利用式(4)对处理得到的12个月数据求取均值最终得到所需的年度均值影像。
(4)
式中:DNj表示某一年的灯光亮度值均值;DNi表示某月的灯光亮度值。
3 结果与验证分析
3.1 阈值去噪结果
结合建设用地数据按比例统计出每月夜间灯光数据阈值,对影像重分类,剔除了阈值以下的灯光。图4和图5分别是2015年阈值去噪前后的云南省夜间灯光影像部分灯光亮度值的数量关系。图4中亮度值在(0.03,0.24)的数量远大于其他亮度值数量,同时影像中还存在少量亮度值为负值的像元,这些就是影像中需要剔除的背景噪声和负值。图5中不同大小亮度值的分布更为均匀,且最小灯光亮度为0,说明经过低阈值去噪处理过后的影像各个点上的背景噪声得到了很好的剔除,同时其影像上存在的个别负值也得到了消除。
图4 阈值去噪前云南省夜间灯光影像部分灯光亮度值的数量关系
图5 阈值去噪后云南省夜间灯光影像部分灯光亮度值的数量关系
3.2 极高值剔除结果
虽然经过阈值提取后的影像背景噪声得到了很好的剔除,但通过对比同一年12个月份的影像发现有一半以上月份的影像中存在少数的灯光异常值,这些灯光值表现为DN过高,远远超出其实际情况,需给予剔除。表2为利用中值法剔除影像异常值前后的灯光最大值对比表。
表2 影像异常值剔除前后最大DN值对比表
3.3 年度均值图像合成结果
通过阈值降噪、中值法剔除极高值后,得到校正后的月度夜间灯光数据,最后利用校正后的月度数据合成年度均值影像。图6、图7为2020年云南省未校正的夜间灯光影像和校正合成后的夜间灯光影像。从图中可以看出,未校正的影像中整个研究区的像元都有灯光值,这是因为影像存在大量背景噪声,而校正后的影像中大部分像元灯光亮度值为0,有灯光值的区域主要在城区及其周边地区,这与实际相符,同时也说明影像中的背景噪声得到了很好的剔除。
图6 2020年云南省未校正影像
图7 2020年云南省校正合成影像
为进一步对比校正前后的影像变化,本文从像元层面对校正前后的夜间灯光影像作对比分析。表3列举出校正前后云南省夜间灯光影像的最小DN值、最大DN值、总DN值、非零像元数和非零像元数占总像元数的比例。通过表3对校正前后夜间灯光影像对比发现,校正后的夜间灯光影像的像元情况更符合实际。
表3 校正前后年度均值影像对比表
3.4 精度分析
经济参数拟合能力是评价夜间灯光影像校正效果的重要指标,除了GDP外,夜间灯光数据还与用电量数据高度相关。为了更进一步验证灯光数据的校正效果,利用GDP统计数据和用电量数据对校正后夜间灯光影像的TDN数据通过SPSS软件做回归分析,定量地说明其校正合成效果,同时为了说明本文校正方法的可靠性,将拟合结果与传统的掩膜法校正方法通过相关系数进行比较,其模型相关性系数如表4所示。从表中可以看出,无论是对GDP还是对用电量,本文提出的阈值法校正结果的相关系数都要优于传统的掩膜法,说明本文的夜间灯光数据校正方法对灯光数据的校正效果更好。
表4 回归模型系数对比表
比较3种回归模型,其中线性回归模型精度最高,图8为掩膜法和阈值法校正的灯光数据与GDP和用电量数据的线性回归图。云南省2019年和2020年GDP分别为23 223.75亿元、24 521.90亿元,其阈值法线性模型计算值为23 143.67亿元、24 368.71亿元,相对误差分别为0.34%、0.62%,掩膜法线性模型计算结果为23 120.05亿元、244 311.92亿元,相对误差为0.45%、0.86%。而2019年、2020年云南省用电量为3 251.88亿千瓦小时、3 451.17亿千瓦小时,其阈值法线性模型计算值为3 112.61亿千瓦小时、3 246.86亿千瓦小时,相对误差分别为4.28%、5.92%,掩膜法线性模型计算结果为3 407.70亿千瓦小时、3 565.51亿千瓦小时,相对误差为4.79%、3.31%。综上,与传统掩膜法校正的年度灯光数据相比,本文的阈值法逐月对灯光数据校正合成的年度数据经济参量、用电量估算能力明显提高,数据更可靠,可用性增强。
图8 掩膜法、阈值法校正结果与GDP、用电量数据的线性回归图
4 结束语
本文以云南省为例,结合建设用地数据求出各月夜间灯光亮度阈值,逐月对2015—2020年的月度夜间灯光数据提取有效灯光,然后在利用中值法去除异常值,得到合成年度均值影像,并将原始数据与合成数据结合GDP进行了精度对比分析。结果表明,合成年度数据有较高的可用性,其合成方法避免了误差累积,更加科学地提取出了有效灯光。同时,合成的年度数据较传统掩膜法校正得到的灯光数据精度更高。通过本文的研究在一方面弥补了NPP-VIIRS夜间灯光数据年度数据的不足,可为之后长时间序列的夜间灯光数据研究提供一定的数据支持。另一方面,本文的校正方法避免了误差的累积,相比传统的掩膜法提高了夜间灯光数据的精度。