NASADEM和ASTER GDEM V3数据精度比较
——以大连市市内区域为例
2021-06-07王一泽
王一泽,王 利,何 飞
(辽宁师范大学 地理科学学院,辽宁 大连116029)
数字高程模型[1]是一种在地理学领域应用广泛,便于人们分析利用的数据源。在土壤侵蚀[2]、流域研究[3]、地貌分析[4]及地形因子提取[5]等领域应用广泛。其中NASADEM、SRTM[6]、ASTER GDEM[7]等是全球DEM产品中分辨率较高,质量较好,覆盖范围较广的DEM产品。ASTER GDEM产品是由NASA、METI以及日本航天局等单位共同开发,并于2000年开始回传数据。该数据空间分辨率30m,地理范围大致包括地球83°N到83°S之间的陆地面积,覆盖区域占整个陆地总面积的99%。2009年6月29日,美国国家航空航天局和日本经济产业省发布该产品的V1版本。2015年1月6日,推出V2版本。V2在V1的基础上,进一步扩大覆盖区域并改良了数据分辨率。2019年8月5日,V3版本正式发布。该版本在V2基础上,减少了数值空白异常区域。NASADEM[8]是由美国国家航空航天局综合了SRTM处理改进、高程控制、空洞填充和与原始SRTM生产时不可用的数据合并而成。其测量范围与SRTM一致,涵盖地球60°N到56°S,占整个地球表面积的80%。全球分辨率为30m。相比于原始的SRTM,合并了大量旧版本SRTM无法正常使用的辅助数据,算法得到了进一步升级,并在SRTM处理链的最佳步骤去除伪影,该数据可以通过EARTHDATA(earthdata.nasa.gov/)进行下载。针对各类DEM产品精度比较和相关地形因子对各类DEM产品影响的研究也取得了一定程度的进展。
在国外,Vikas Kumar Rana等[9]人以印度古吉拉特邦的瓦多达拉区作为研究区域,比较SRTM、ASTER以及制图卫星(Cartography Satellite,简称Cartosat)导出的DEM数据,对误差的垂直分量进行定性评估,同时使用统计测量来估计它们的垂直精度。Josyceyla Duarte Morais等[10]人用垂直精度为25cm的激光雷达数据作为验证参考,在城市化地域评估ASTER的V2、V3版本数据以及SRTM数据。J.Shen,W.L.Han等[11]人选取土耳其平坦地区和尼泊尔高寒地区作为A,B两个试验区,采用高程差异数值分析、空间分异分析、斜率谱曲线等方法对ASTER GDEM V2和SRTM3 DEM数据的垂直精度进行比较。Loudi Yap等[12]人采用传统的稳健统计方法、正态检验、孤立点检测和剔除等方法来描述DEM的垂直质量。在俄罗斯中部,Florinsky等[13]人利用试验场内的69个地面控制点以及航空立体声图像生成的DEM参考数据比较ASTER GDEM以及AW3D30DSM[14]两类DEM产品的垂直精度。O.I.Apeh等[15]人利用高精度GPS测量数据,在尼日利亚地区对SRTM 30产品,ALOS W3D30产品以及ASTER GDEM V2产品进行评估,并通过三类数据的均方根误差比较三类DEM数据的精度。在国内,南希等[16]人在青藏高原采用“河流-河谷”位置偏移与高程中误差来评价SRTM3与ASTER GDEM的精度。在中国不同省份地区,崔鹏艳[17]、王欢[18]、秦臣臣[19]、武文娇[20]等人通过对SRTM DEM与ASTER GDEM数据的高程、坡度以及坡向等指标的对比分析,获取两者的分布差异。张朝忙等[21]人以我国东部沿海地区作为研究区域,通过DEM面误差可视化分析方法对ASTER GDEM数据的高程精度做了分析。针对复杂山区地形,胡勇等[22]人运用控制点高程对GDEM 2数据的高程精度进行验证,对坡度以及高程进行分级来对GDEM 2精度进行分析。
我国对各个区域不同DEM产品精度的评估有一定的进展,但焦点都集中在SRTM与ASTER GDEM精度比较,且ASTER GDEM所采用的数据多是V1版本,关于V3版本的精度研究相对较少。而NASADEM数据作为2020年新公布的产品,关于NASADEM的研究更加稀缺。为此,本文以大连市市内区域为例,选取NASADEM,ASTER GDEM V3以及作为高程参考标准的大连市市内地区高程点实测数据对NASADEM以及ASTER GDEM V3进行精度评价。
1 研究区域与数据来源
1.1 研究区域
大连市地处辽东半岛(120°58"E-123°31"E,38°43"N-40°12"N),三面环海,与山东半岛相隔渤海。气候为温带大陆性季风气候,平均气温24℃,全年降水量介于550~960mm之间,夏季炎热少雨,冬季寒冷干燥,呈现四季分明的气候特点。
大连市在地形上从南北方向看,北部高而宽,南部低而窄。从东西方向看,中部高,海拔高程向东西两个方向递减,延伸至海滨,构成丘陵半岛,整个研究区地形起伏度较小,大部分山体的海拔高程值介于400~800m之间,少数山峰如庄河市境内的步云山(1130m)海拔高程值超过1000m。主体地貌以丘陵为主,少部分为位于谷间及河流入海口的平原低地。本文选取大连市市内区域作为研究区域,比较NASADEM和ASTER GDEM V3的精度并分析相关地形因子对两类产品精度的影响。
1.2 数据来源
本文的ASTER GDEM V3是吉萨(GISAT)公司提供的产品,来源于该公司的数字高程模型产品系列。其水平精度为30m,垂直精度为20m,1°标准分幅。数据为GeoTIFF(16位),坐标系统为WGS 84/EGM 96。NADADEM则是在NASA EARTHDATA直接搜索获得,数据为HGT(16位),全球分辨率为30m。分幅标准以及坐标系统与ASTER GDEM V3一致。与以上DEM产品进行对照的是大连市实测高程点数据,简称验证点,共计446个,集中分布在大连市市内四区,该数据通过1:25万标准比例尺地形图获得,并通过实地测量验证得到。
2 研究流程
(1)利用Global Mapper工具的合并以及导出功能[23],将ASTGTMV003_N38E121_dem.tif,ASTGTMV003_N39E1 21_dem.tif以及ASTGTMV003_N39E122_dem.tif文件合并,并以GeoTIFF进行导出,获得整个大连市的ASTER GDEM V3数据文件。同理,对NASADEM产品进行相同的操作,获得整个大连市的NASADEM数据文件。
(2)为了将验证点数据与整个大连市的ASTER GDEM V3以及NASADEM数据进行比较,需要将验证点数据,ASTER GDEM V3和NASADEM两类DEM产品数据转换为同一平面及高程基准。考虑到不同椭球高程的差异,需要将验证点数据的椭球高程转换为以WGS84椭球为参考椭球的高程基准。之后将ASTER GDEM V3,NASADEM以及验证点数据相互叠加,如图1、图2所示。
(3)利用ARCGIS软件下的ArcToolbox中的提取分析功能,将ASTER GDEM V3以及NASADEM的高程值提取至验证点所在的位置,得到与验证点相对应的高程数据。之后将验证点数据分别与ASTER GDEM V3以及NASADEM做差,得到各自对应的高差。统计各高差的点数、平均值、最大值、标准差、最小值,并绘制显示高差分布情况的直方图,进行相应的研究并进一步展开扩展分析。对验证点的海拔高程值以50m为区间进行分类,探究实际海拔高程与两类DEM产品的精度关系。
(4)为进一步研究NASADEM以及ASTER GDEM V3两类数据精度与坡度的关系,对DEM产品进行栅格投影,投影坐标系均设定为WGS_1984,之后提取两类DEM产品坡度,对坡度以5°为区间进行分类,并提取各个坡度区间两类DEM产品的高程差进行分析,研究坡度对数据精度的影响。DEM精度比较和误差与影响因素关系探究流程如图3所示。
3 数据分析
3.1 整体数据精度评价
本文将验证点高程值与NASADEM以及ASTER GDEM V3的高程值做差,对两个DEM产品的高程差进行处理。利用ARCGIS的统计功能得到相应高程差的点数、平均值、最大值、标准差、最小值以及误差总和。通过计数点与空值做差得出有效计数点,以此来判断两类DEM的质量。再通过两类产品的最大值以及最小值,得到其误差区间。通过对误差区间、平均值、标准差的综合比较,判断两类产品的精度。对两类产品的质量和精度进行综合分析,以对NASADEM以及ASTER GDEM V3做出比较评价。对统计得到的数据进行总结如表1所示。
表1 验证点与NASADEM以及ASTER GDEM V3高程差信息统计
根据验证点与两类DEM产品高程差信息统计表,NASADEM以及ASTER GDEM V3的有效计数点与验证点点数一致,无空值存在,说明两类产品在大连市范围内并未出现质量问题。对两类产品的评价以及比较无法从质量上入手,只能从二者的数据精度上分析。NASADEM高程差的误差区间为其最大值以及最小值之差,即98m。ASTER GDEM V3高程差的误差区间为169m。远大于NASADEM的误差区间。此外,由表1可知,NASADEM的平均值为18.82m,标准差为16.35m。ASTER GDEM V3的平均值为22.45m,标准差为20.57m。NASADEM的各项精度判定指标的绝对值均小于ASTER GDEM V3。精度判定指标越接近0,则该数据越趋向于验证点数据,即接近真实数据。因此,在整体评价上,两类产品在质量上相差不大,但NASADEM数据在整体精度上远优于ASTER GDEM V3数据。
3.2 NASADEM与ASTER GDEM V3的误差特征
对NASADEM以及ASTER GDEM V3的整体精度进行初步比较后,继续探究两个DEM产品的误差特征,两类产品的误差分布直方图如图4、图5所示。
图4 NASADEM误差分布图
图5 ASTER GDEM V3误差分布图
NASADEM有效计数点为446个,其中绝大部分计数点集中分布在(-3,39]这一高程差分布区间,共计372个,占所有有效计数点的83.41%。ASTER GDEM V3有效计数点为446个,其中绝大部分计数点集中分布在(-8,48]这一高程差分布区间,共计391个,占所有有效计数点的87.67%,两类DEM产品在误差分布上均呈现为正态分布。
设立(-8,40]为两类DEM产品分布集中程度的判定依据,NASADEM的计数点在这一区域分布点数为390个,占比为87.44%。ASTER GDEM V3的计数点在这一区域的分布点数为361个,占比为80.94%。NASADEM的计数点在该判定区间的点数占比高于ASTER GDEM V3所占比例。NASADEM的误差分布情况相较于ASTER GDEM V3更加集中,更加倾向于正态分布。
3.3 高程精度与实际海拔高程之间的关系
将实际测量的验证点高程值作为实际海拔高程,对实际海拔高程值以50m为间隔进行分带,并对各分带的NASADEM以及ASTER GDEM V3数据高程差的点数、最大值、最小值、平均值、标准差以及误差总和进行统计。NASADEM以及ASTER GDEM V3海拔高程分带统计如表2、表3所示。
表2 ASTER GDEM V3海拔高程分带统计
表3 NASADEM海拔高程分带统计
图6 两类DEM产品误差均值与实际海拔高程关系曲线
图7 两类DEM产品误差范围与实际海拔高程关系曲线
由两类DEM产品数据的误差分带统计数据,进一步绘制NASADEM与ASTER GDEM V3的误差均值及误差范围与实际海拔高程的关系曲线如图6、图7所示。根据两类数据误差均值与高程的关系曲线,NASADEM实际高程值在50m以内的地区误差较低,精度较高,误差随实际海拔高程的增加而呈现递增趋势,二者呈正相关,关联性较强。根据两类数据误差范围与高程的关系曲线,两类DEM产品在高程值在200m以内的地区误差范围值相差较大,ASTER GDEM V3数据误差范围远大于NASADEM,在150~200m这一区间二者误差范围之间的差距达到峰值。在200m以外地区二者误差范围相差不大,进一步证明了根据误差均值所得到的相应结论。ASTER GDEM V3相比于NASADEM误差随海拔高程的变化更大,实际海拔高程对ASTER GDEM V3精度的影响更显著。
3.4 高程精度与坡度之间的关系
确定两类DEM产品的投影坐标系,并对两类DEM产品进行栅格投影,以此为基础得到各个产品的地形坡度后,对ASTER GDEM V3以及NASADEM的高程差相关数据以5°为区间进行统计。统计结果如表4、表5所示。
表4 ASTER GDEM V3坡度分带统计
表5 NASADEM坡度分带统计
图8 两类DEM产品误差均值与坡度关系曲线
图9 两类DEM产品误差范围与坡度关系曲线
对NASADEM以及ASTER GDEM V3进行坡度分带统计,并根据坡度范围在0~35°的统计数据创建两类产品误差均值及范围与坡度的关系曲线如图8、图9所示。根据均值与坡度关系曲线,会发现两类产品的误差均值随坡度的变化与误差均值随实际海拔高程的变化有一定程度的相似性。ASTER GDEM V3以及NASADEM的数据精度整体上均随着坡度的递增而呈现下降趋势。在25~30°这一坡度区间内,NASADEM产品的误差均值高于ASTER GDEM V3,在其他坡度区间,ASTER GDEM V3产品的误差均值均高于NASADEM。根据误差范围与坡度关系曲线,除坡度在20~30°范围内ASTER GDEM V3误差范围小于NASADEM之外,其他区间NASADEM误差范围均小于ASTER GDEM V3,同时二者误差范围与坡度的变化趋势具有一定相似性。相比于NASADEM,坡度对ASTER GDEM V3的影响更大,关联性更强,但坡度对于两类产品数据精度影响的差异小于实际海拔高程这一相关地形因子。
4 结论与展望
本文以大连市市内区域的验证点数据为基础,应用ArcGIS软件,对NASADEM和ASTER GDEM V3产品进行精度评估,运用叠加分析、栅格投影、提取分析等方法探究了实际海拔高程和坡度对两类DEM产品的影响,同时验证点数据通过1:25万标准比例尺地形图获得,部分验证点数据通过实际测量验证,大大降低了验证点数据在获取过程中可能存在的系统误差和偶然误差[24],数据真实性较高。具体结论如下:
(1)大连市市内地区NASADEM高程整体平均误差为18.82m,ASTER GDEM V3高程整体平均误差为22.45m,在整体方面NASADEM产品精度高于ASTER GDEM V3。通过各自的误差分布图发现两类数据的误差均呈现正态分布。其中NASADEM有83.41%的高程差集中位于(-3,39]这一分布区间内,ASTER GDEM V3有87.67%的高程差集中位于(-8,48]这一分布区间。以(-8,40]区间为两类DEM产品分布集中程度的判定依据,推断NASADEM的误差分布相较于ASTER GDEM V3更加集中,倾向于正态分布。
(2)对大连市市内地区实际海拔高程值以及坡度进行分带,并对各个分带的NASADEM以及ASTER GDEM V3误差进行扩展计算并进行相应的汇总统计,发现在其他条件一定的情况下,随着坡度或实际海拔高程值的递增,两类DEM数据的数据精度也相应的降低。ASTER GDEM V3误差的变动普遍大于NASADEM产品,海拔及坡度地形因子对ASTER GDEM V3数据影响较大。
大连市市内地区属于海岸带地区,无高山,海拔与坡度较小,可以代表小范围、地势较低的沿海地区,即本文的相关研究及结论一定程度上适用于低海拔、地势较为平坦的海岸地带。但由于掌握数据有限导致研究区域过小的缘故,在高海拔、地势陡峭的区域以及内陆地区结论是否适用仍然存疑。
虽然在高海拔区域关于SRTM以及ASTER GDEM V1及V2精度比较的研究并不少,NASADEM是在SRTM数据的基础上进行改进和填充空洞形成,同时合并了大量SRTM在使用过程中不可用的数据,因而NASADEM与SRTM数据存在很大的相似性。V3与V2比较,除了精度等方面的改良外并无大的差别。但各类DEM产品乃至于同类但不同版本的产品仍然有各自的特点,直接把前人对高原区域STRM及ASTER GDEM V1/V2的研究成果代入到NASADEM与V3版本在高海拔、地势陡峭的内陆区域进行精度比较是不严密的。后续为了进一步探究两类产品在不同区域的精度比较及特征情况,将借助各个不同地形的验证数据来完善关于NASADEM及ASTER GDEM V3精度的研究成果。