珞珈一号夜间灯光影像的建设用地提取①
2022-02-10李外宾汤军高贤君
李外宾,汤军,高贤君
长江大学 地球科学学院,武汉 430100
21世纪以来,中国各大中小城市均出现“冒进式”或“大跃进式”城市化现象[1],不断推进的城市化带来的是大面积建筑用地的出现、聚集和扩张,社会经济发展活跃,但经济、社会、环境等城市病也屡见不鲜[2-3]. 科学、高效、准确地掌握建筑用地的实际情况,对发现的城市问题提出有效管理措施和预防再发生尤为重要[4-5].
夜间灯光遥感可在夜间工作,有效捕捉夜间城镇灯光及微弱光源,明显区分建设用地与非建设用地[6-7]. 当前常见数据有1km分辨率的实用行扫描系统(Defense Meteorological Satellite Program’s Operational Linescan System,DMSP/OLS)和500m分辩率的可见光红外成像辐射仪(Visible Infrared Imaging Radiometer Suite,VIIRS)生成的数据,但二者都因为分辨率低,多被用于大尺度区域的提取,而且存在不同程度的灯光溢出和灯光过饱和的问题,会进一步加大数据的误差[8]. 因此,许多研究为了提高精确度,利用不同特征多源数据获得更丰富的城市建设用地信息. 王若曦等[9]将Landsat影像监督分类后与DMSP夜间灯光数据结合,在一定程度上消除了噪声区域影响,但空间细节度较差;Lu等[10]将夜间灯光影像与归一化植被指数(Normalized Difference Vegetation Index,NDVI)相结合,提出了人类居住合成指数(Human Settlement Index,HSI),它对城郊地区的光信号进行了过度校正,光源溢出在归一化植被指数为0的裸地区仍然明显;Zhang等[11]提出了结合NDVI和夜间灯光影像的VANUI,丰富了城市边缘信息,在城市建设用地提取中得到了广泛应用,然而VANUI在植被值和夜光值都较高的地区仍有局限性. 通过引用一些高分辨率的影像数据,虽然存在一些局限性,但在整体精度上都有不小的提高,还是一种可行的办法.
2018年6月武汉大学成功发射科学实验卫星01星(珞珈一号),并向外提供130 m分辨率、250 km幅宽的影像数据,该数据不仅极大地提高了分辨率,而且在灯光溢出与饱和问题上也有明显改善[12],将珞珈一号应用到建设用地的提取中会进一步提高精度,高分辨率让小尺度区域的高精度研究已成为可能.
有研究证明兴趣点(Point of Interest,POI)与建设用地正相关,是人类活动的一种社会感知数据,其密度的有效划分可以很好地提取建设用地[13-14]. 本研究在小尺度城区上结合珞珈一号夜间灯光数据、地表温度(Land Surface Temperature,LST)和POI数据,采用经验阈值法对天津6个主城区的建设用地进行提取,依据天地图影像数据校正的样本点为参考依据,评估各点提取的准确度. 珞珈一号数据与LST结合提取的建设用地,在具有较多的细节部分和较高的连通性与复杂性下,还可以保持较高的精确度.
1 研究区与数据源
1.1 研究区概况
华北平原北部的天津,东临渤海,北依燕山,是中国北方最大的沿海开放城市,发展程度较高. 2018年常住人口达1 559.6万人,人均生产总值120 711元,建设用地总计950.6 km2. 如图1所示,具体选取了天津的和平区、河东区、河西区、南开区、河北区、红桥区6个主城区作为研究对象.
图1 研究区概况图
1.2 数据源
1)珞珈一号夜间灯光数据:武汉大学团队与相关机构共同研发的珞珈一号拥有高灵敏度的夜光相机,影像的空间细节化更高,分辨率可达到130 m[15]. 本研究使用2018年珞珈一号夜间灯光数据,数据来源于高分辩率对地观测系统湖北数据与应用中心.
2)Landsat8数据:选取于2018年9月29日,并且研究区内没有云,成像时间最接近珞珈一号影像的数据,短时间内的地表变化不会太明显,这样可以尽可能减小误差.
3)POI数据:通过百度地图获取天津6个区的POI数据点,数据点类型有:餐饮服务、公司企业、交通设施、教育机构、商场、休闲娱乐、医药卫生、住宅小区,经过筛选共有76 334个POI数据点.
4)样本点:通过ArcGIS自带功能随机生成的1 000个随机点,然后计算出经纬度,通过高分辨率的天地图进行标识,分出816个建设用地数据点和184个非建设用地数据点.
2 研究方法
1)对珞珈一号影像进行几何校正、辐射定标、裁剪,用夜间灯光数据提取建设用地,得到LJ结果数据.
2)对POI数据进行投影、核密度计算,通过平均值法与珞珈一号影像数据整合得到LJ/POI,用经验阈值法得到LJ&POI结果数据.
3)对Landsat8数据进行辐射定标、大气校正、裁剪、LST计算,结合珞珈一号数据得到LJ/LST,用经验阈值法得到LJ&LST结果数据.
2.1 核密度估计法
核密度估计是将空间中任意一点周围的一定规则区域作为密度计算范围,根据与中心点的距离赋予权重,距离越近权重越高,反之越低[16].Vi是任意点i的核密度值,计算公式为
(1)
其中,Wj为数据点j的权重;Dij为空间点i与点j的欧式距离;R为计算规则区域的带宽(Dij 有研究表明夜间灯光数据的亮度值和POI核密度计算值与建设用地都成正相关性[13],选取平均值法来综合两种数据,可以消除噪声数据点,减小极端值的影响达到更理想的效果. 计算公式如下: (2) 其中,Pi为两种数据综合后的结果数据;Vi为POI核密度值;LLJi为亮度值. 在NASA官网(http://atmcorr.gsfc.nasa.gov/)输入成像时间、中心经纬度等信息后可以获取大气透过率、大气向上辐射亮度、大气向下辐射亮度信息,所以选择使用辐射传导方程法进行地表温度的计算. 辐射传导方程法就是先获取到大气水汽含量等信息后预估大气对地表热辐射的影响,再把这些大气影响从卫星传感器观测到的热辐射总量中减去,最终得到地表热辐射强度,最后把这一热辐射强度转化为相应的地表温度[18]. 公式如下: (3) (4) ε=0.004Pv+0.986 (5) Lλ=[εB(Ts)+(1-ε)L↓]τ+L↑ (6) (7) (8) NNIR和R分别为近红外波段和红外波段反射率值;Pv是植被覆盖度;将NNDVI像元值从小到大排序,NNDVIsoil是通过经验值选取NNDVI像元排序在2%的值;NNDVIveg选取NNDVI像元排序在98%的值;ε为地表比辐射率;Ts为地表真实温度,B(Ts)为黑体热辐射亮度,τ为大气在热红外波段的透过率,大气向上辐射亮度L↑,大气向下辐射亮度L↓[19]. HSI在2008年由Lu等[10]提出,将低分辨率夜间灯光数据中社会经济要素与高分辨率的自然要素数据结合进行人类居住合成指数的提取,后来多被用来建成区的提取. 但是HSI指数需要排除水体干扰,LST同样可以划分自然要素类,于是提出类似HSI指数的LJ&LST综合指数,将NDVI替换成LST. 具体计算公式如下: (9) 本研究首先对经过几何校正、辐射定标处理后的数据进行简单阈值法的建设用地提取. 经验阈值法易操作,并且依据真实的地物划分,精度也相对较高,对辅助数据的依赖性也不高,能够通过珞珈一号数据快速获得建设用地的区域[20]. 本文采用二分法不断在0~20范围内变化二分值,随着阈值的不断变大,划分的区域越来越不合实际情况[21],当阈值选取4为分界值时,最接近真实情况,结果数据如图2. 西湖和东湖、金禧园、长发物流天津分公司附近、富强公园、长虹生态园、勤俭公园、水西庄公园、北岸中心附近、西沽公园、盐坨公园、思源公园、崇德园、四化河、宁远旅游景区及一些其他植被区和暂时闲置土地区域被剔除,因为是在小尺度范围内的研究,光源对周边亮度影响较大,非建设用地会受到临近建设用地光源影响,导致提取的面积与实际面积小了很多,并且城区内海河和新开河完全没有剔除. 图2 珞珈一号提取建设用地结果 已有研究证明POI与夜间灯光影像结合提取建设用地是可行的,关键在于POI带宽的选择,在300~1 000 m的带宽范围内调试,当带宽选择大于500 m时,空间细节化较粗糙,随着带宽变大不断被粗化;当带宽小于500时,细节化有很大提高,但碎斑化严重,边缘被过度平滑. 因此,本研究使用500 m带宽,30 m的栅格单元进行核密度计算,以达到更合理的划分. 珞珈一号数据相比DMSP/OLS和VIIRS,在分辨率和灯光溢出上均有改善,但单独使用在建设用地提取上仍然存在一定误差. 通过平均值法得到LJ&POI数据,可以在一定程度上消除差异过大的影响,解决噪声点和弱光信息缺失的问题. 将15作为最佳的划分阈值,结果LJ&POI数据如图3所示,与图2对比发现,在非建设用地的面积上均有外扩的情况,在一定程度上提高了提取的准确性,并且也把LJ没有提取的向阳便民菜市场附近、古雅博物馆附近、蓝水园附近、柳林公园和詹庄附近这些非建设用地提取出来了. 图3 珞珈一号和兴趣点数据结合提取建设用地结果 有研究表明LST对建设用地的提取是可行的,LST会因为地表的不同属性特征有较大的温差,城区内的建筑用地多会表现出热岛效应,而地表植被覆盖度较高的地方和水体会表现出冷岛效应[22],这样就可以在合理的阈值下,有效地划分出建设用地与非建设用地. 前两种方法均未把城区内的河流剔除,而且对非城区的提取也并不完善,LJ&LST综合指数方法在提取建设用地上大有改善,提取数据更完善更准确,将0.45作为划分界限提取建设用地,LJ&LST结果数据如图4. 图4 LJ&LST数据的建设用地提取结果 通过结果比对看出,LST的加入剔除了未被识别出的非建设用地. LJ&LST数据基本完整地将主城区的海河和新开河剔除,这是LJ数据和LJ&POI数据都没有做到的地方;其次,参照图1影像,东西湖区域和古雅博物馆附近园林可以清晰看出面积再次扩大到更接近于真实的情况,改善了灯光溢出问题;另外其他的非建设用地也在LST的结合下被剔除,其中包括天津城市绿道公园、天津交管局河西支部东、青年湖、南开大学附近、天塔湖景区、复兴公园、北斗公园、诗景公园、河东公园、天津大剧院歌剧厅旁以及其他农用地和高植被区. 利用目视解译的办法对研究区内的1000个随机样本点采取量化. 根据天地图的影像数据作为参考依据,将每个样本点标记为建设用地和非建设用地,再与提取的建设用地进行一一验证,通常用制图精度(Producer’s Accuracy,PA)、用户精度(User’s Accuracy,UA)、总体分类精度(Overall Accuracy,OA)和Kappa系数表示,PA表示建设用地样本点被正确识别的概率,UA表示标记为建设用地样本被确认为建设用地的概率,OA表示所有类正确识别的概率,Kappa系数表示样本点识别情况与样本真实属性的一致性. 由表1可知,单独使用珞珈一号数据提取的用户精度、制图精度和总体精度虽然较高,但Kappa系数较低,这说明与样本点的一致性较差,进一步分析是因为建设用地的样本点比重较大,在提取建设用地中,误将大部分非建设用地提取成建设用地,导致建设用地的样本点能很大程度被正确标识,但是非建设用地的样本点也被误分在了建设用地内,这种看似总体精度较高的提取,实际却并不一致. 在加入POI数据后,用户精度、制图精度、总体精度及Kappa系数分别提高了1.6%,1.1%,2.4%和0.083,对比图2也可以看出提取变化显著,但是Kappa系数为0.442,说明在样本点的一致性上表现一般,仍然有大部分的非建设用地没有提取出来,只是在基于LJ结果数据上有所提高. 为了更大改善提取的效果,提出了采取LJ&LST综合指数法提取,将图4与图2和图3结合比较看出变化明显,海河和新开河被提取,非建设用地的剔除更接近实际,在精度评价上也有很大提高,LJ&LST的用户精度、总体精度和Kappa系数分别比LJ&POI提高了6.1%,2.5%和0.178,Kappa系数也表现出较高一致性,在保证建设用地样本点大部分被正确标识下,非建设用地的样本点也绝大部分被正确标识. 总体来说,在小尺度的研究上,LST数据的加入可以解决河流提取不到的问题,并且可以将公园、耕地、湿地等非建设用地更接近真实面积剔除. 表1 提取结果精度评价 本研究以天津主城区为例,通过珞珈一号、POI数据和LST数据的整合,采用经验阈值法的方式在小尺度区域进行建设用地的提取,并且以高分辨率的天地图影像为参照对样本点进行标识和评价提取精度. 研究表明: 1)小尺度的建设用地提取中,珞珈一号数据虽然与建筑区呈现较好的相关性,但依然受到分辨率的限制和灯光溢出的影响,导致建设用地边界外扩,难以将天津主城区的一些公园及河流剔除. 2)在POI数据的结合后,缓解了灯光溢出产生的边界外扩情况,整体精度都有一定的提高,但还是提取不到位,河流还是被识别在建设用地. 3)LJ&LST综合指数提取,解决了河流被错误识别在建设用地的问题,从精度来看也表现较好,而且与样本有较高的一致性. 4)珞珈一号提供的较高分辨率、更大幅宽的数据和更强的夜间灯光量化能力,在城市尺度研究方面显示巨大的潜力,必将在后续得到更加广泛应用. 此外,LJ&LST综合指数方法为建设用地的提取提供了有效的途径,能为城市扩张、城市规划、城市格局等方面研究提供帮助. 5)LST数据的加入改善了建设用地的提取,但并没有全完消除误分,这与影像分辨率也有一定关系.2.2 平均值法
2.3 LST计算
2.4 LJ&LST综合指数计算
3 结果与讨论
3.1 珞珈一号建设用地提取
3.2 珞珈一号与POI数据结合的建设用地提取
3.3 LJ&LST数据的建设用地提取
3.4 精度评价
4 结论