对ASTER GDEM数字高程模型的精度评价及修正
2021-04-20胡保健胡占占张志号
杨 帅 胡保健 胡占占 张志号
(山东科技大学 测绘科学与工程学院, 山东 青岛 266590)
0 引言
先进星载热发射和反射成像仪全球数字高程模型(Andvanced Spaceborne Thermal Emission and Reflection Radiometer Global Digitial Elevation Model, ASTER GDEM)所获取的近乎覆盖全球数字高程模型是目前大尺度地学分析的基础数据,已广泛应用于测绘、水文、气象、军事等领域[1-2]。然而,ASTER受地形条件、植被条件等因素的影响,获取到的ASTER GDEM数据误差分布不均匀。因此,在数字地形分析前明确ASTER GDEM误差分布至关重要。
自ASTER全球公开以来,ASTER质量问题的研究已取得了不少成果。诸多学者聚焦于ASTER精度评价,目前通过GNSS(全球导航卫星系统, Global Navigation Satellite System)、机载激光雷达等技术获取的地面控制点作为参考数据评估ASTER精度是最常用的验证方式[3-4]。然而,受获取成本及工作量的影响,限制了该方法的大面积应用。另外,DEM(数字高程模型, Digitial Elevation Model)对DEM也是一种常用的验证方式[5]。但是,目前很难获取高精度DEM数据作为参考高程,只能获得相对DEM精度。自2003年星载激光雷达ICESat-1数据发布以来,大量研究证明ICESat-1(冰、云和陆地高程卫星1,Ice, Cloud and Lanel Elevation Satellite-1)数据具有较高的精度[6-7],利用ICESat-1数据评估ASTER精度成为可能。但是,受卫星设备及大气环境的影响,ICESat-1数据采样点密度较低,难以精准验证ASTER数据精度。2018年9月,美国国家航空航天局(National Aeronautics and Space Administration, NASA)发布了一颗新型天基激光测高卫星ICESat-2(冰、云和陆地高程卫星2,Ice, Cloud and Land Elevation Satellite-2),其上搭载的地形激光高度计系统的数据采集频率是地球科学激光高度计系统(Geoscience Laser Altimeter System, GLAS)的250倍。相比ICESat-1数据,ICESat-2具有更高的精度和采样密度,为精确评价DEM精度提供了条件。
近年来有学者开始关注DEM数据修正。例如,杜小平等以ICESat-1高程数据为参考,建立了ICESat-1与SRTM(航天飞机雷达地形测绘使命, Shuttle Radar Topography Mission) DEM之间的一元线性回归模型,对中国典型低海拔沿海平原和高海拔山地地区的SRTM DEM数据进行修正[8];SU等基于线性回归模型,利用植被参数和地形参数因子减少SRTM的系统误差,从而修正美国植被山区的SRTM[9];BAUGH直接从SRTM中减去一定百分比的植被高度来修正SRTM误差[10]。然而,线性模型难以捕捉变量之间的非线性关系,从而限制了线性回归的实用性。
针对上述问题,本文以ICESat-2为参考数据,系统分析了坡度、地形起伏度及土地利用类型对ASTER GDEM精度的影响。然后,充分考虑ASTER GDEM精度影响因素,借助后向传播神经网络(Back Propagation Neural Network, BPNN)对其修正。
1 研究区域以及数据来源
1.1 研究区域
江西省莲花县位于中国东南部长江中下游南岸(26°~27°N,113°~114°E),占地总面积1 072 km2。该地区地貌类型较为复杂,以丘陵、岗地、河谷平原和山间盆地组成,地势北、东、西三面高,中部和南部较低,四周山岭环绕,不少山峰海拔在1 000 m以上,其中,境内最高峰石门山海拔达1 300.5 m、高天岩海拔1 275 m、西部帽子山海拔1 148 m。
1.2 数据来源
ASTER GDEM数据由NASA和日本METI联合开发,其上搭载了METI制造的先进星载热发射和反辐射计,通过近红外波段的垂直向下成像传感器和后视成像传感器获取立体像对,并采用立体像对处理等步骤生成DEM数据。ASTER GDEM数据共有v1、v2两个版本。其中,ASTER GDEM v2是由v1版本采用一种先进的算法改进而来,大大提高了其高程精度。为此,本文以ASTER GDEM v2为研究数据(见图1),该数据源于中国科学院计算机网络信息中心国际科学数据镜像网站(http:∥www.gscloud.cn),以EGM96模型为水准面, WGS84为参考椭球,垂直标称精度约为±20 m。其中,坡度、地形起伏度数据使用ARCGIS直接从ASTER GDEM中提取(图2)。
图1 莲花县ASTER GDEM高程图
ICESat-2于2018年9月由NASA发射,该卫星上的ATLAS用来测量光子从ATLAS到达地球并再次返回地球所需的时间,确定光子的大地经度、纬度、高程等参数信息。ICESat-2共有三级产品(ATLA01、ATLA02、ATLA03),本文使用ATLA03数据,ATLA03数据中有三对地面轨迹,每对轨道中的两条轨道称为强光和弱光,能量比约为4∶1,在地面轨道上相距约90 m。本文下载了研究区域从2018年10月至2020年3月期间所有的ICESat-2点数据,共计4 922 366个点,数据源于美国国家冰雪数据中心(https:∥NSIDC.org/data/ICESat-2)。
图2 研究区域
土地利用数据能够反映土地利用现状、地区地形和植被特征,在土地规划、资源勘查、生态环保等领域已经得到广泛应用。本研究数据源于中国科学院地理科学与资源研究所,以2010年Landsat TM/ETM遥感影像为主要数据源,通过人机交互目视解译的方法,将土地利用类型分为六大类,总体分类精度为92.7%。图2显示了研究区土地利用分布状况,每一个土地利用类型分别占的比例为:耕地占23.8%、林地占69.6%、草地占4.0%%、水域占2.3%、建设用地占0.3%、未利用土地占0%。
2 研究方法
2.1 ICESat-2数据处理
从美国国家冰雪数据中心(National Snow and Ice Data Center, NSIDC)下载了研究区域内共计4 922 366个ICESat-2点数据,其坐标系统的参考椭球体为WGS84。使用Matlab软件提取4种所需参数:h_ph、lon_ph、lat_ph、signal_conf_ph,分别表示经度、纬度、光子高度以及光子信号置信度。其中,光子置信度分为六级:-2、-1、0、1、2、3、4。为了消除噪声光子的影响,我们最终筛选出高置信度的ICESat-2数据,共剩余211 051个点数据。此外,我们计算ICESat-2点相应位置的ASTER GDEM高程差。首先,采用HUANG等提出的方法将GDEM高程差绝对值大于100 m的点作为异常值剔除[11]。然后,利用3σ准则进一步剔除ICESat-2异常点[9],最终剩余195 995个ICESat-2点用于本研究。
2.2 修正方法
后向传播神经网络是目前应用最广泛的神经网络之一。它一般由3层网络结构组成:输入层、隐含层、输出层(图3)。BP算法的学习过程分为信号的前向传播和误差的反向传播两个阶段。在信号的前向传播阶段,输入层神经元接收输入数据,隐含层和输出层对输入数据进行加工处理,最后由输出层神经元输出,如果输出结果与期望值有误差,则进入网络的反向学习阶段。在反向学习阶段,利用梯度下降法将输出误差逐层回传,并且对相应神经元的权值和偏置进行适当调整,重复此过程直到网络输出值与期望值之间的误差最小。
图3 BPNN网络结构图
在BP网络训练之前需要预先设置一些参数,包括隐含层神经元个数、训练次数、激活函数、训练目标误差以及学习率等。在BP网络模型中,我们采用的3个函数分别为‘tansing’、‘purelin’、‘trainlm’。此外,训练精度和学习速率分别设为0.1和0.01。本文将空间位置信息(经度、纬度)、坡度、地形起伏度及土地利用类型作为输入数据,目标输出即为修正后得ASTER GDEM数据。
2.3 精度评价
为了评价ASTER GDEM数据精度,本文采用最大值、最小值、平均误差、中误差4种精度指标描述GDEM误差的基本统计特征。平均误差可以反映GDEM数据的系统误差,中误差是衡量数据精度的常用指标,可以反映误差的总体大小。其中,平均误差(ME)和中误差(RMSE)计算公式为:
(1)
(2)
式中:Hi,ICESAT表示第i个ICESAT-2点高程,Hi,GDEM表示第i个ASTER GDEM高程点,n为ICESat-2点个数。
为了分析坡度、地形起伏度、土地利用类型对ASTER GDEM精度影响,本文首先对它们按照一定等级分级,然后分析每个等级影响因子中ASTER GDEM误差分布情况。
3 结果分析
3.1 ASTER GDEM高程精度分析
ICESat-2和ASTER GDEM高程值基本统计参数结果见表1。由表1可知,在195 995个采样点中,ICESat-2的高程最小值和ASTER GDEM值相差较大,为16.5 m,而高程最大值相近;ICESat-2与ASTER GDEM的平均误差相差10 m,中误差相差0.9 m。
表1 ICESat-2、ASTER GDEM v2的统计数据的比较
以ICESat-2数据为参考高程,对ASTER GDEM数据的垂直误差进行统计分析(表2)。由表2可知,ASTER GDEM的平均误差较大,为10.0 m,中误差为14.1 m,优于其标称精度。为了进一步分析ASTER GDEM高程差的分布特征,将ICESat-2和ASTER GDEM的高程差值做直方图统计分析(图4)。由图4可知,ASTER GDEM误差呈正态分布。
表2 基于坡度的ASTER GDEM v2误差分布
图4 ASTER GDEM误差直方图
3.2 基于地表因子的ASTER高程精度分析
3.2.1基于坡度的精度分析
基于坡度对GDEM误差参数的统计结果见表2。ASTER GDEM在坡度区间5°~10°时平均误差最大,在大于25°时平均误差最小,分别为10.8 m、6.7 m,ASTER GDEM的中误差随着坡度的增加而显著变大,说明ASTER GDEM的精度和坡度有较大的相关性。
3.2.2基于地形起伏度的精度分析
基于地形起伏度对GDEM误差进行统计分析(表3)。表3显示,随地形起伏度增大,ASTER GDEM平均误差逐渐变小;对于中误差,在0~≤10 m至10~≤20 m区间段与30~≤40 m至>40 m区间段变化幅度较大,在10~≤20 m至30~≤40 m区间段趋于稳定。
表3 基于地形起伏度的ASTER GDEM v2误差分布
3.2.3基于土地利用类型的精度分析
基于土地利用类型对GDEM误差统计分析(表4)。ASTER高程精度在不同土地利用类型上存在差异,按误差平均值由小到大排序依次是:林地、草地、耕地、建设用地和水域,GDEM误差均为正值,在水域中最大,为23.7 m;按中误差排序依次是:建设用地、耕地、林地、草地、水域,在建设用地最小,为13.4 m,在水域最大,为26.5 m。
表4 基于土地利用类型的ASTER GDEM v2误差分布 单位:m
3.3 修正结果
基于神经网络的数据挖掘和数据预测能力,本文利用BPNN神经网络建立了ICESat-2与研究区空间位置、地形因子以及土地利用类型影响因素之间的关系来提高ASTER GDEM数据精度(表5)。通过修正,ASTER GDEM系统误差由10.00 m降低至0.02 m,接近于0,标准差和中误差也明显降低,分别由10.0、14.1 m降低至7.4、7.5 m。
表5 ASTER数据修正前后误差统计 单位:m
4 结束语
本文通过利用高精度、高覆盖度的ICESat-2测高数据,基于坡度、地形起伏度、土地利用类型因子对江西省莲花县的ASTER GDEM误差进行统计分析,然后使用BPNN神经网络对其修正,得出以下结论:
(1)在莲花县区域,ASTER GDEM数据的总体平均误差较大,为10.0 m,中误差为14.1 m,在精度方面明显优于其官方标称精度。
(2)ASTER GDEM数据的垂直精度受坡度、地形起伏度、土地利用类型影响严重。坡度越大,GDEM中误差越大,数据精度越差。在坡度大于25°时,ASTER GDEM的中误差达到15.7 m;随地形起伏度增加,ASTER GDEM误差基本呈增大趋势;不同土地利用类型的ASTER GDEM精度不同,其中,在水域精度最差,在建设用地精度最好。
(3)修正后ASTER GDEM系统误差接近于0,中误差降低了47%。
(4)本文对ASTER GDEM v2数据精度的分析及修正结果为ASTER GDEM数据在地形和地理研究中的应用提供了参考。