等高线内插DEM算法的质量评价
2012-09-12兰玉芳胡英敏
兰玉芳,徐 霞,胡英敏
(1.北京师范大学地表过程与资源生态国家重点实验室,北京100875;2.北京师范大学减灾与应急管理研究院,北京100875)
等高线内插DEM算法的质量评价
兰玉芳1,2,徐 霞1*,胡英敏1,2
(1.北京师范大学地表过程与资源生态国家重点实验室,北京100875;2.北京师范大学减灾与应急管理研究院,北京100875)
以北方农牧交错带典型丘陵、山地及丘间盆地混合地带为研究区,利用国家测绘局提供的1∶5万地形图,比较ANUDEM方法与生成DEM常用的内插算法TIN、NNI、Kriging和IDW之间的精度。DEM质量评价采用数值精度指标验证,并辅以地形属性可视化分析、等高线分析和不同算法插值结果差异分析等,结果表明不同算法内插高程误差较大的区域主要分布在地形结构线附近;且ANUDEM方法生成的DEM精度较高,在其上提取的等高线与原始等高线吻合度高,能较好地反映研究区的真实地形。
等高线;DEM;ANUDEM;内插;质量评价
数字高程模型DEM的研究一直受到广泛关注,其在描述地貌结构、流域水文过程、生态、环境等领域有重要用途[1];然而,生成DEM时形成的各种误差会在不同程度上影响其质量,严重降低DEM相关产品的可信度[2]。因此,获取高质量、高精度的DEM是提取正确信息的保障。目前,利用等高线生成DEM的方法很多,最为成熟和经济实用的是基于数字地形图生成不规则三角网(TIN),再通过插值建立规则格网的DEM[3,4];另一种方法是将等高线离散化,利用合适的内插算法生成规则的格网(Grid)[5];还有一种国外应用较成熟的ANUDEM方法,但目前该方法在国内应用较少。总体上,国内外学者多侧重于DEM的信息提取及新算法探索等[6,7],对复杂地貌类型区域不同插值方法之间差异研究较少。本文选择我国北方农牧交错带典型丘陵、山地及丘间盆地混合区域作为研究对象,利用5种插值方法生成DEM,探讨基于等高线插值生成DEM不同算法的精度并评价生成的DEM的质量,旨在寻求复杂地貌类型区域最佳的插值方法。
1 研究方法
本文选取的插值方法有ANUDEM算法与TIN及等高线离散化法中的反距离加权(Inverse Distance Weighted,IDW)、克里格(Kriging)和自然邻点(Natural Neighbor Interpolation,NNI)法。TIN方法适应于任何复杂的图形数据,并充分考虑地形特征,但计算较繁琐[1,7];IDW是利用邻近已知点的数值进行加权运算[8];Kriging内插法可在有限区域内对区域化变量进行无偏最优估计;NNI是基于Voronoi图的内插方法,当在数据集中插入一个新数据点时,修改与原始数据对应的Voronoi图,自然形成插值点的邻域点集[6,8,9]。ANUDEM方法利用等高线、高程点、河流湖泊等地形信息插值生成DEM,剔除了地形的伪下陷点,能较好地应用于水文过程分析中,一定程度上提高了利用稀疏数据插值生成DEM的精度[3,10]。该算法经不断完善,成为DEM专业化插值软件,其基本算法由插值、数据平滑、地形强化和局地适应性处理组成[6,10,11]。目前,该算法已被集成到ArcGIS 9.0及其以后版本中,可通过Topo to Raster工具实现。
DEM的精度一般依赖于原始数据质量、采样精度及内插方法等[1]。本文采用数值精度指标,将各种插值方法得到的结果与采样点实际高程数据相比较,通过两者误差评判插值方法的优劣。采用平均误差(MAE)、均方差(RMSE)、拟合优越度(R2)等统计两者间的误差,并对各误差绝对值范围内误差点的分布进行统计。主要计算公式如下[12]:
其中:Zk为采样点k的实际高程,zk为采样点k的高程估算值为实际高程值的均值,n为采样点数。
考虑到单一的数值指标不能完全描述DEM的质量[1],本文采用了一些视觉特征上能体现插值质量的方法。地形属性的可视化分析能客观反映DEM对地形表达的质量,包括晕渲图和地形因子的可视化,本文选择晕渲图进行对比;等高线回放是诊断DEM数据误差和DEM对地形结构表达的有效工具;不同算法插值结果的差异分析可以直观反映出高程误差的总体分布规律。
2 研究流程
本文选择我国北方农牧交错带太仆寺旗宝昌镇中西部(东经115°16′44″~115°26′17″,北纬41°55′4″~42°00′40″)为研究区。该区主要地貌类型为丘陵、山地和丘间盆地,最高海拔1 710 m,最低1 469.5 m,坡度介于0°~29°,面积约90.38 km2。利用国家测绘局提供的太仆寺旗1∶5万地形图,在GIS软件中进行扫描和矢量化,获得间距为10 m的等高线数据;在研究区布设150个具有代表性的不同高程采样点,使其随机均匀分布在整个研究区域;采用GPS对各采样点进行定位,记录各点实际高程值,作为最终分析验证的参照数据。
插值过程:首先利用等高线生成TIN,并内插到规则格网的DEM;再将等高线离散化,用ANUDEM算法和其他3种算法生成DEM;最后对不同算法生成DEM的质量进行评价。根据国家测绘局1∶5万数字高程模型生产技术规定,将插值生成的DEM格网大小均设为25 m。
3 结果分析
3.1 数值精度指标
从表1可以看出,各种方法的DEM中误差均小于7 m(国家测绘局对1∶5万数字高程模型的精度标准规定,丘陵地和山地格网点高程中误差分别在7 m和11 m以内,而研究区最主要的地貌类型是丘陵和山地,有部分沟间盆地),都符合精度要求。整体上,ANUDEM方法生成的DEM高程误差各项指标都最小、R2最大(更接近1,模拟计算结果更好),说明ANUDEM的精度相对较高;其次是TIN和NNI,这两种方法的各项指标都较接近,最大值和最小值相等,但NNI构建DEM的中误差较小,而TIN的R2较大,总体而言,二者构建的DEM精度相当;IDW和Kriging最大值和最小值的跨度都较大,尤其是Kriging,且其DEM的中误差和误差平均值也是所有插值方法中最大的,R2最小,所以其精度最低。
表1 不同算法内插结果误差的总体特征Table 1 General characteristics of the different algorithm interpolation result
表2表明:对于一定的高程误差绝对值,由ANUDEM内插生成DEM高程误差点数远小于其他4种算法,所以,其模拟的地形精度相对较高,与实际吻合度较好;TIN和NNI误差点数接近,Kriging误差点数最多。这些误差点主要分布在山脊、沟谷和等高线较为稀疏的平坦地区。
表2 不同算法在误差绝对值范围内的误差点数分布Table 2 The distribution numbers of error points within some absolute error values for different algorithms
3.2 地形属性可视化分析
通过地貌晕渲图可以探测不同插值方法生成DEM高程数据中的异常部分。由图1(见封2)可以看出:1)与遥感影像相比,不同算法得到的地貌晕渲图均能较准确地反映研究区域的地形状况,但由于原始等高线数据质量(10 m等高距)相对较低,导致局部地形没有得到精确反映;2)TIN和NNI两种方法得到的地貌晕渲图极为相似,TIN、IDW和NNI方法在山脊处都有较多的平顶现象,而由ANUDEM方法得到的晕渲图光滑、连续,基本无平顶现象,与实际地形更相似;3)IDW与Kriging方法晕渲图中有较明显的阶梯地形现象,TIN方法在局部存在轻微的三角形和阶梯地形现象;4)由于等高线离散化中散点不足及DEM分辨率较低,导致Kriging方法内插出现部分空值(晕渲图中白色的点),且其主要出现在山脊等地势较高的地方。总之,TIN、IDW、NNI和Kriging方法得到的晕渲图表面均较粗糙,而由ANUDEM方法得到的晕渲图光滑、连续,克服了平顶和阶梯地形现象,能较好地反映实际地形。
3.3 等高线分析
从生成的DEM上提取等高线(即等高线回放),再通过目视解译的方法发现DEM生成的等高线图上不合理的部分,并与原始的等高线对比,分析不同插值方法的精度。由于Kriging和IDW、TIN和NNI两组方法得到的DEM图上提取的等高线各自较为相似,故从Kriging、TIN和ANUDEM 3种插值方法生成的DEM图提取等高线并与原始等高线相比较(图2,见封2),结果表明:基于Kriging方法得到的等高线与原始等高线差异较大,线条较粗糙,许多地方出现交叉、断裂和假等高线现象,且一些山脊和局部微地形被忽略;基于TIN方法建立的等高线基本保持了原始等高线形状,但也有部分交叉和断裂现象,线条不光滑;基于ANUDEM方法建立的等高线保留了原始等高线的基本形状,与原始等高线位置基本重叠,在平坦区域和坡面吻合度较高,但在山脊和沟谷处吻合效果较差。由此可见,ANUDEM方法模拟的等高线质量比其他4种方法高。
3.4 不同算法插值结果差异分析
不同算法内插高程的差异可通过DEM间的差值反映。利用ArcGIS中的Raster Calculator工具,获得5种算法间10幅差值图。除TIN-NNI和IDW-Kriging以外,ANUDEM与TIN、NNI差异相近,故选ANUDEM-TIN进行分析;ANUDEM与IDW、Kriging,TIN、NNI与IDW,TIN、NNI与Kriging,这3组差异较相似,故选ANUDEM-IDW、NNIIDW和TIN-Kriging进行分析。列出以上六组差异结果图(图3),发现高程差异较大(DEM误差较大)的区域呈现一定的规律性,主要分布在地形结构线附近;ANUDEM与TIN间内插高程的差异主要出现在坡面、山脊、沟谷地形线附近,在坡面上ANUDEM内插高程稍大于TIN内插得到的高程,而在山脊和沟谷地形线附近则小于TIN和NNI内插得到的高程;较为相近的3组其差异较大值主要在等高线两侧呈条带状分布,差异最大的区域出现在山脊和等高线的两侧;TIN与NNI间整体差异较小,差异值主要沿山谷线和山脊线呈对称分布;IDW与Kriging间差异最大的区域也主要分布在山脊和等高线两侧,且地势越平坦差异越小。
图3 不同内插算法插值结果的差值Fig.3 Difference maps of different algorithms interpolation results
4 结论
在北方农牧交错带丘陵、山地及丘间盆地混合区,不同算法内插高程误差主要出现在地形结构线附近。与国内常用的内插算法相比,ANUDEM方法插值得到的DEM精度较高,能对地形进行真实模拟;其次是TIN和NNI方法,TIN是目前国内常用的方法,它充分考虑了地形特征,但插值表面粗糙,且山脊处明显存在很多平顶现象,质量比ANUDEM低;Kriging方法精度最差,建议在地貌类型复杂的区域尽量避免使用Kriging插值;IDW比Kriging精度略高,但插值得到的地形阶梯现象明显,导致失真。ANUDEM方法能很好地描述水文、地貌特征,能为水文和土壤侵蚀模拟研究提供支持[3,6,11,12],本文研究结果也表明,其可为复杂地貌类型区高精度DEM的获取提供参考。
[1] 周启鸣,刘学军.数字地形分析[M].北京:科学出版社,2006.
[2] 齐晓飞,王光霞,崔秀飞,等.DEM误差可视化方法分析与研究[J].测绘科学,2011,36(3):169-171.
[3] 杨勤科,MCVICAR T R,VAN NIEL T G,等.ANUDEM和TIN两种建立DEM方法的对比研究[J].水土保持通报,2006,26(6):84-88.
[4] 宋敦江,岳天祥,杜正平.由等高线建立DEM的YUE-HASM方法研究[J].地球信息科学学报,2009,11(3):325-332.
[5] 张凯选,潘梦清,方辉,等.利用等高线生成DEM方法的研究[J].测绘工程,2007,16(3):15-18.
[6] 陈吉龙,刘洪斌,武伟.用等高线内插DEM的不同算法的误差分析[J].测绘科学,2009,34(4):172-174.
[7] 汤国安,刘学军,闾国年.数字高程模型及地学分析的原理与方法[M].北京:科学出版社,2005.
[8] 韩富江,刘学军,潘胜玲.DEM内插方法与可视性分析结果的相似性研究[J].地理与地理信息科学,2007,23(1):31-35.
[9] 汤国安,杨昕.ArcGIS地理信息系统空间分析实验教程[M].北京:科学出版社,2006.
[10] HUTCHINSON M F.A new procedure for gridding elevation and stream line data with automatic removal of spurious pits[J].Hydrology,1989,106(3-4):211-232.
[11] 杨勤科,MCVICAR T R,李领涛,等.ANUDEM——专业化数字高程模型插值算法及其特点[J].干旱地区农业研究,2006,24(3):36-41.
[12] 宋敦江,岳天祥,龚云,等.散乱数据插值的HASM方法[J].地球信息科学,2007,9(3):45-51.
Abstract:DEM has been widely used in describing geomorphologic structure,exploring hydrological and ecological processes.However,the errors generated from interpolation have a significant effect on DEM′s quality and even,and should reduce the credibility of products related to DEM.High qualified and accurate DEM is prerequisite for extracting information.Take a typical region in the farming-pasture zone of North China as the study area,including hilly region,mountain land and basin.Based on contours which were derived from the topographic maps with a scale of 1∶50 000,the spatial interpolation accuracy of the ANUDEM method and other common interpolation algorithms of TIN,NNI,Kriging,and IDW was compared.Numerical precision indices,terrain visualization analysis and contour analysis were used to evaluate the quality of DEM obtained by different interpolation methods.The results showed that,the larger error of different interpolation methods exists at the nearby of the structure line of the terrain.DEM interpolated by ANUDEM is much more precise than the other interpolation algorithms,and the contours derived from it are the closest to the original contours,which can reflect the real terrain better.Following ANUDEM,TIN and NNI,as well paid attention to topography features.But the interpolation surface was quite coarse,and the hillshading maps showed that there existed many flat-roofed phenomena on the ridge.Kriging method had the lowest accuracy,especially in complex geomorphologic zone.Although IDW method performed better than Kriging,the interpolation surface had obvious terrain ladder phenomenon.This study can contribute to obtaining high-accurate DEM in complex geomorphologic zones.
Key words:contour;DEM;ANUDEM;interpolation;quality assessment
Quality Assessment on Different DEM Interpolation Algorithms Based on Contours
LAN Yu-fang1,2,XU Xia1,HU Ying-min1,2
(1.State Key Laboratory of Earth Surface Processes and Resource Ecology,Beijing Normal University,Beijing 100875;2.Academy of Disaster Reduction and Emergency Management,Beijing Normal University,Beijing 100875,China)
P208
A
1672-0504(2012)04-0025-04
2012-01-18;
2012-03-09
国家自然科学基金项目(30900197);973重大科学计划项目(2011CB952001);中央高校基本科研业务费专项资金
兰玉芳(1987-),女,硕士研究生,主要从事GIS技术及土地利用变化研究。*通讯作者E-mail:xuxia@bnu.edu.cn