APP下载

SRTM与ASTER加权融合的机器学习方法

2021-12-17郑婷婷陈传法张照杰

遥感信息 2021年5期
关键词:坡向坡度高程

郑婷婷,陈传法,张照杰

(1.山东科技大学 测绘与空间信息学院,山东 青岛 266590;2.浙江正元地理信息有限责任公司,浙江 湖州 313200)

0 引言

数字高程模型(digital elevation model,DEM)作为国家空间数据基础设施的主要数据之一[1-3],广泛应用于水文分析、森林清查、土地利用分类等领域[4]。SRTM(shuttle radar topography mission)和ASTER(advanced spaceborne thermal emission and reflection radiometer)是两种免费的覆盖全球大部分地区的DEM数据集,ASTER由光学影像制成,数据易因云层覆盖、薄雾遮挡等天气影响产生无效值[5];而SRTM由雷达影像制成,受天气影响小,但数据易因起伏地形影响导致空缺,存在雷达阴影[6]、相位解缠[7]等技术问题。光学影像和雷达影像原理制成的DEM优势互补,为DEM融合提供了可能性,因此,充分结合SRTM和ASTER各自的优势,进行有效的数据融合,是充分挖掘现有DEM数据集信息并得到更高质量的DEM的一种有效途径。

目前,国内外学者已经开展了DEM数据融合的相关研究。例如,沈焕锋等[8]基于高差拟合神经网络和TIN差分曲面方法生成了高质量的空间无缝DEM,但利用神经网络模型拟合ASTER的误差分布是对单个DEM质量进行改善,而且SRTM数据的空洞填补只是一种数据替换,在DEM融合过程中没有考虑综合光学技术和雷达技术的优点。Schultz等[9]基于自一致性技术实现了DEM数据的有效融合,但融合数据都是光学影像,在数据融合过程中无法克服光学技术获取DEM的缺陷。Papasaika等[10]基于一个通用的使用稀疏表示框架的方法实现了两个任意DEM的有效融合,但融合方法数学推导严密、不易理解。陈传法等[11]基于快速傅里叶变换实现了SRTM和ASTER的有效融合,但滤波阈值选取过程繁琐,融合效果依赖选择的滤波器,并可能存在细节信息丢失问题。考虑到不同地貌对高程精度的影响,Tran等[12]基于地貌分类采用不同权重实现了SRTM和ASTER的有效融合。在此方法基础上,孟伟等[13]进一步提出了地貌过渡区消除地貌分界线两侧的高程突变,但DEM融合选择的是整体权重,忽略了单个像元对DEM精度的影响。Pham等[14]提出了一种融合SRTM和ASTER有效估计缺少参考数据区域地形的方法,但DEM精度不仅只与坡度相关,还受坡向、地形起伏度等其他地形因子的影响。Bagheri等[15]通过神经网络模型预测TanDEM-X和Cartosat-1融合权重的方法得到精度更高的DEM,但是该方法仅以城区作为实验区,没有考虑在复杂地形是否有效。

为了提高SRTM和ASTER的融合质量,综合两种数据集的优势,充分考虑地形因子同时对DEM精度的影响,本文提出了一种顾及地形因子的神经网络模型的加权融合方法,并以黄土高原典型地貌董志塬区域为研究区验证方法的可行性和有效性。该方法的优势为充分考虑了地形因子对DEM误差的影响,并采用神经网络描述它们的非线性关系。

1 研究区与数据源

本文研究区域为甘肃省庆阳市境内中南部的董志塬地区,在泾河北岸、马莲河和蒲河两大河流之间,面积为2 765.50 km2,高程范围为1 050~1 410 m,经纬度范围为107.46°E~107.96°E、35.26°N~36.06°N。SRTM为C波段传感器干涉测量获取的30 m分辨率的SRTM 1数据,ASTER为对地观测卫星Terra获取的立体像对生成的30 m分辨率ASTER V2版本数据。研究区SRTM和ASTER数据均来源于美国国家地质调查局网站(http://earthexplorer.usgs.gov/),平面基准为WGS84,垂直基准为EGM96。本文获取了高精度控制点为参考数据,点数约为10 000个(图1),控制点均匀覆盖整个研究区,平面基准为北京54坐标系统,垂直基准为1985国家高程基准。

图1 研究区数据

2 研究方法

本文提出了一种基于地形因子预测融合权重的加权融合方法,充分考虑每个像素的地形因子对DEM融合的影响,而不是简单地按地形分类对DEM数据进行融合[16]。首先对DEM数据进行预处理,利用ArcGIS软件提取控制点的横纵坐标、坡度、坡向、坡位、地形起伏度等地形因子,并将控制点随机分为90%的训练集和10%的测试集;然后利用训练集与DEM高程差值和地形因子之间的非线性关系训练出神经网络模型,再以DEM的空间位置和地形因子为网络输入,利用神经网络模型分别对SRTM和ASTER高差分布进行预测,依据DEM预测高差和融合权重计算公式得到SRTM融合权重图;最后将SRTM和ASTER加权融合后得到融合DEM,并进行质量评估。本文实验流程如图2所示。

图2 SRTM和ASTER数据融合流程图

2.1 数据预处理

为了消除高程系统带来的系统偏差,对DEM数据与控制点进行坐标系和高程基准统一。首先,统一投影坐标系为Beijing_1954_3_Degree_GK_Zone_36;其次,统一高程基准为1985国家高程基准。根据郭海荣等[17]的研究成果可知,1985国家高程基准与WGS84定义的似大地水准面之间有0.357 m的垂直偏差,故SRTM和ASTER的高程均加上0.357 m。

2.2 神经网络模型与融合权重确定

神经网络是一种应用类似于大脑神经突触连接结构进行信息处理的数学模型,BP神经网络(back propagation neural network,BPNN)是一种误差反向传播的多层前馈神经网络,由输入层、隐藏层和输出层组成,遗传算法通过优化BPNN的初始权值和阈值,从而优化了网络模型的结构。神经网络的非线性预测能力可用于探究高程值与地形因子之间的关系[18]。在前人的研究基础上[19],综合考虑影响高程误差空间分布的关键因素,并结合研究区特征以及数据可获取情况,本文选取横纵坐标、坡度、坡向、坡位、地形起伏度六个地形因子作为网络模型输入数据。其中,横纵坐标作为空间位置信息输入,坡度、坡向、坡位、地形起伏度作为地形信息输入;为了避免高精度控制点与DEM高程值存在的共线性问题,本文以二者高程差值作为网络模型输出。

首先,以训练集的横纵坐标、坡度、坡向、坡位、地形起伏度(5×5的窗口)六个地形因子作为网络输入,DEM高程差作为目标输出,对BPNN预测模型进行训练。输入层与输出层神经元个数分别是6和1,隐含层可设置为单隐层和多隐层,在网络精度达到要求的情况下,优先选择单隐层;根据Gardner等[20]研究成果,隐藏层神经元个数在6~13之间,经过反复尝试本文设置为12。另外,隐藏层和输出层的转换函数分别选择tansig和purelin函数,训练函数选择为trainlm函数。神经网络预测模型如图3所示。

图3 神经网络预测模型结构示意图

融合DEM计算如式(1)所示。

(1)

(2)

式中:ei为研究区;SRTM第i个像元的预测高程误差;ej为研究区ASTER对应像元的预测高程误差。

2.3 精度评价方法

本文采用检查点法对融合前后的DEM数据进行定量评价,选择平均绝对误差(MAE)、中误差(RMSE)和标准差(SD)三个指标对高程误差进行统计。标准差反映了研究区测试集与DEM高程差值的离散程度,中误差对异常高程敏感,平均绝对误差能更好地反映预测值误差的实际情况。若误差中不包含系统误差,则中误差接近于标准差。

3 实验结果

3.1 DEM精度分析

基于神经网络模型和式(1)~式(2)可得到SRTM融合权重图(图4)。由图4可知,SRTM融合权重图在空间上分布不均匀,研究区南部地区以及北部地区的沟壑部分明显权重较高,大于0.8,西北边缘地区权重明显较低,约在0.2左右,中部地区权重约0.6左右,其他地区权重则大小不一。对SRTM和ASTER加权融合得到融合DEM(图5)。

图4 SRTM融合权重图

图5 融合后DEM

由表1可知,SRTM精度高于ASTER,融合后DEM比二者精度更高。融合后DEM平均绝对误差相比于SRTM和ASTER分别降低了1.29 m和3.66 m,中误差分别降低了0.40 m和3.16 m,标准差分别降低了0.79 m和2.07 m。

表1 不同DEM精度指标 m

3.2 地形因子对DEM精度影响分析

为了探究各地形因子对DEM高程精度的影响,本文首先从SRTM中提取坡度、坡向、坡位和地形起伏度,并采用自然间断点分级法将坡度划分为五级:0~7.4°(Ⅰ级)、7.4°~15.7°(Ⅱ级)、15.7°~23.8°(Ⅲ级)、23.8°~32.7°(Ⅳ级)和32.7°~64.7°(Ⅴ级);将坡向平均划分为四类:-1°~90°(NE)、90°~180°(SE)、180°~270°(SW)和270°~360°(NW);然后基于Weiss[21]研究方法将坡位分为山脊、上坡、中坡、平坡、下坡和谷底六类;再将地形起伏度按0~20 m、20~40 m、40~60 m、60~80 m和80~153 m分为五类,以测试集高程为标准,SRTM、ASTER和融合DEM数据各类型高程误差标准差统计结果见图6。

由图6(a)可知,SRTM、ASTER和融合后DEM各坡度等级误差均随坡度增大而增大,最大可分别达到20.16 m、18.48 m和17.19 m;SRTM误差随坡度增加幅度在三者中最大,说明SRTM受坡度影响最大,融合后DEM误差在Ⅲ、Ⅳ和Ⅴ等级中比SRTM、ASTER小,说明坡度对DEM高程精度的影响在融合之后得到降低。

图6 研究区不同地形因子DEM误差统计

由图6(b)可知,SRTM、ASTER和融合后DEM在NE、NW高程误差较大,SE、SW较小。相比于ASTER,融合后DEM各坡向类型高程误差均得到明显降低,NE、SE、SW、NW高程精度分别提高了2.19 m、2.24 m、2.06 m和2.4 m;SRTM各坡向类型高程误差均低于ASTER,融合后DEM在NE、SW、NW精度均高于SRTM,说明SRTM和ASTER数据融合削弱了坡向对DEM高程精度的影响。

由图6(c)可知,各坡位类型高程误差从大到小分别是谷底、山脊、下坡、中坡、上坡和平坡。相比于SRTM,融合后DEM山脊、上坡、中坡、下坡和谷底误差分别降低了0.40 m、0.79 m、0.99 m、0.39 m和1.32 m,平坡略微增加;相比于ASTER,融合后DEM精度均明显得到提高,山脊、上坡、中坡、平坡、下坡和谷底误差分别降低了6.1 m、2.74 m、1.43 m、1.74 m、3.04 m和1.29 m。

由图6(d)可知,各高程误差均随地形起伏度增加而增加,最大可分别达到18.91 m、17.54 m和16.42 m;当地形起伏度大于20 m时,融合后DEM精度均高于SRTM、ASTER,说明地形起伏度对DEM高程精度的影响在融合之后得到降低。

从整体上看,融合后DEM精度最优,SRTM次之,ASTER最差;但在地形平坦地区,SRTM精度略高于融合后DEM。坡度较大地区往往对应地形起伏大的地区,所以坡度与地形起伏度对DEM精度影响类似。

3.3 实验验证

为了进一步验证该网络对其他不同地形特征区域具有迁移性,本文选取美国爱达荷州北部某区域为验证区(图7(a))。该区域东邻蒙大拿州,处于密苏里河流域,面积约为30 km2,高程范围为1 291.65~2 022.57 m,经纬度范围为114.74°W~114.65°W,46.56°N~46.62°N,平均坡度为20.7°。本文选择将在https://portal.opentopography.org/网站下载的1 m分辨率LiDAR(light detection and ranging)数据作为参考数据;然后,将已训练的BPNN应用于验证区SRTM和ASTER的融合,得到融合后DEM(图7(b));最后,以验证区LiDAR数据随机生成的1 000个点作为检核点统计DEM高程误差,并对融合前后的DEM进行精度分析。

图7 验证区数据

由表2可知,融合后DEM精度最高,其次是ASTER,最后是SRTM。相比于ASTER,融合后DEM平均绝对误差、中误差和标准差分别降低了1.14 m、1.23 m和0.75 m;相比于SRTM,融合后DEM精度分别提高了2.31 m、2.64 m和1.04 m。

表2 不同DEM精度指标 m

为了探究验证区各地形因子对DEM高程精度的影响,本文首先从SRTM中提取坡度、坡向、坡位和地形起伏度,并采用相同的方法分别将坡度划分为五级、坡向划分为四类、坡位分为六类,再将地形起伏度按0~15 m、15~45 m、45~60 m和60~68 m分为四类,以检核点高程为标准,SRTM、ASTER和融合DEM数据各类型高程误差标准差统计结果如图8所示。

图8 验证区不同地形因子DEM误差统计

由图8可知,各地形因子对DEM高程精度的影响在融合之后均得到降低,特别是坡度和地形起伏度。SRTM、ASTER和融合后DEM各坡度等级误差均随坡度增大而增大,SRTM受坡度影响最大;融合后DEM各坡向类型高程误差均低于ASTER,融合后DEM在NE、SE、NW精度均高于SRTM;在各坡位类型中,山脊和谷底高程误差较大,平坡最小,融合后DEM精度均高于ASTER;地形起伏度对DEM精度影响与坡度类似。实验结果表明,验证区与研究区结果趋于一致,BPNN同样适用于其他不同地形特征区域。

4 结束语

为了弥补SRTM和ASTER各自数据获取技术的不足,本文提出了一种基于神经网络预测模型的加权融合方法,实现了SRTM和ASTER数据的有效融合。以具有黄土高原典型地貌特征的董志塬区域为研究区、美国爱达荷州北部某区域为验证区对该实验方法进行验证。结果分析表明:相比于原始的SRTM,研究区融合DEM中误差降低了0.40 m,标准差降低了0.79 m;相比于原始的ASTER,融合后DEM得到显著提高,中误差和标准差分别降低了3.16 m和2.07 m;在各地形因子影响下,融合后DEM精度均是最优,各地形因子对DEM高程精度的影响在融合之后都得到降低。而验证区与研究区结果趋于一致,表明本文提出的顾及地形因子的神经网络方法具有可行性和有效性。

本文提出的神经网络预测方法受地形因子类别和神经网络模型影响,因此,后续将在实验中添加更多有效的地形因子和替换网络模型,增加网络有效输入数据,优化网络结构,以获取最有效的神经网络预测模型。

猜你喜欢

坡向坡度高程
8848.86m珠峰新高程
DEM地表坡向变率的向量几何计算法
关于公路超高渐变段合成坡度解析与应用
GPS控制网的高程异常拟合与应用
基于图像处理的定位器坡度计算
青藏高原东缘高寒草甸坡向梯度上植物光合生理特征研究
坡度在岩石风化层解译中的应用
CT和MR对人上胫腓关节面坡度的比较研究
SDCORS高程代替等级水准测量的研究
回归支持向量机在区域高程异常拟合中的应用