基于DEM数据分割的西南地区地貌形态自动识别研究
2011-05-24曹伟超陶和平刘斌涛孙玉莲
曹伟超,陶和平,孔 博,刘斌涛,孙玉莲
(1.中国科学院/水利部成都山地灾害与环境研究所,四川 成都 610041;2.中国科学院研究生院,北京 100049)
中国是一个多山的国家,山地面积占到陆地总面积的46.11%[1],而山区更是占到陆地面积的70%以上。山地又是中国地貌的框架,中国大地貌单元如大高原、大盆地的四周都被山脉环绕:青藏高原是中国最高最大的高原,平均海拔达到了4500m,周围的山脉有喜马拉雅山、喀喇昆仑山、昆仑山、祁连山、横断山等。同时,山地在中国的分布极为不均,西南地区是山地分布最集中的地区之一,各种山地灾害频发。由于地貌形态在很大程度上对山地灾害和局部地区气候能产生影响[2],并控制着其他生态、环境因子的分布与变化,因此研究西南地区地貌形态的分布具有其科学性和必要性。
地貌形态的识别和划分是现代地貌学研究的重点内容,国内外已有不少研究成果[3-6]。不同研究区应选取不同的地理指标,山区应选择适合山区地貌类型划分的指标。山区最大的特点是山地分布广泛,地貌形态识别应考虑山区地貌类型的特征,重点是识别其山地类型分布,确定划分指标。指标选取应体现研究区地貌特点,考虑西南地区的地貌特征,应用于一般地区的地貌形态划分指标对于西南地区具有一定局限性,若以1000m作为低海拔的标准,则四川盆地和整个广西将连成一片,无法体现高程在四川盆地和广西的变化,因此对于具体采用的地形因子都需要确定新的指标来划分。本研究基于DEM数据,采用数据分割方法,从西南山区具体地貌特征出发,对地貌形态划分指标进行详尽分析,确定具体指标,最终考虑高程和起伏度综合作用,得到了西南山区19种地貌形态分布图,对进一步研究地貌形态具有一定的指导意义。
1 研究背景和基本流程
1.1 数据来源
本研究的DEM为地球电子地形数据ASTERGDEM经过校正拼接及重采样所得,基本格网单元大小为90m。行政界限数据、居民点及道路分布数据来自国家遥感应用工程技术研究中心西南分中心,基本比例尺为1∶25万。
1.2 研究区域及基本流程
研究区包括四川省、云南省、贵州省、重庆市以及广西壮族自治区5个省级行政区划,区域内喀斯特地貌发育,地貌类型复杂,根据地貌特征分为4个地貌单元:四川盆地及其周边,云贵高原,青藏高原东缘,广西地区。这4个地貌单元各有特征,在最终得到的地貌类型分布图中都应该有所体现,这些特征也是衡量划分结果是否准确的一个重要参考和标准。研究以地貌形态识别为核心,基本流程见图1。
图1 地貌形态划分流程
2 西南地区地貌形态识别
2.1 西南地区地貌形态分类分级体系的建立
地貌形态识别的关键是建立分类分级体系,可基于高程和地势起伏度。高程揭示不同海拔山地热量、水分(降水)、生物(量)、土壤垂直差异;起伏度揭示坡面环境能量(位能、动能等)特征和环境灾害危险性程度。苏时雨、陈志明等按高程≤500、500—1000、1000—3000(或3500)、3000(或3500)—5000(或5500)和>5000(或5500)m将地形分为低地、低山、中山、高山和极高山五大类,低地即≤500m的一类又可细分为丘陵、台地和平原;按起伏度≤100、100—200、200—500、500—1000、1000—2000(或2500)和>2000(或2500)m将地形分为微起伏、缓起伏、小起伏、中起伏、大起伏和极大起伏六大类,20m以内起伏定义为平原[7-8]。该指标体系在全国范围的地形划分中具有指导意义,但在具体区域应用中有一定的局限性,应结合实际地貌特征建立适合研究区的分类分级指标体系。
(1)高程:区域内四川盆地海拔在500m左右,云南高原和贵州高原的海拔分别为2000m和1000m,而青藏高原东缘的海拔基本在3500m以上,5000m等高线在这里可以作为雪线[7]。综合以上地貌特征,可确定出适合西南地区的高程分类指标体系。
(2)起伏度:DEM中用地势起伏度来表示地面起伏的大小。考虑到西南地区山地分布广泛,整体起伏不是太大,局部起伏度较大,可确定出西南地区地势起伏分类指标体系。
结合高程和起伏度得到适合西南地区的地貌形态分类分级指标体系,见表1。
表1 西南地区地貌形态分类分级指标体系
2.2 地势起伏度的计算
地势起伏度指DEM中某一个范围内最高点和最低点之间高程的差值。从定义可以明显得出,随着“某一个范围”的增大,地势起伏度必然会增加。所以,确定地势起伏度的关键是确定这一范围的大小。这里使用滑动窗口算法,以n×n像元的模板算子对研究区进行滑动计算,分别计算各邻域内最大值和最小值,再获取差值,即得起伏度,表述为
式中:t表示地势起伏度;Hmax和Hmin分别表示海拔最大值和最小值。
经计算,可以得到像元与平均地势起伏度的对应关系,见表2。地势起伏度与统计单元大小间的关系曲线首先利用表2数据得到其散点图,再运用Logarithmic拟合对数方程进行回归分析,回归曲线见图2。
表2 平均起伏度与统计单元大小对应关系
图2 起伏度和统计单元大小的拟合曲线
由图2可以看出,拟合方程y=114.396lnx+303.091的判定系数R2=0.976,拟合效果非常好。
2.3 寻找最佳统计单元
涂汉明等[9]用21km2计算全国起伏度,郎玲玲等[10]在计算福建省起伏度时使用4.41km2,不同区域和不同分辨率DEM所使用的统计单元大小是有区别的。从图2可知平均起伏度起初随着统计单元的增大而迅速增大,但当达到一定的阈值之后增加速度开始减缓,最后趋于平稳,这个趋势开始减缓的阈值就是我们需要寻找的最佳统计单元的大小,且这个阈值是唯一的。
确定阈值的方法一般可以采用手工作图或目视确定法,但是考虑到主观因素的不确定性,这里使用均值变点分析法[10]:该方法认为地势起伏度曲线必然存在一个由陡变缓的拐点,且该点唯一。数学表达式为:有数据序列{xi},其中i=1,2,3,…,N,N为样本数,样本以xi点为界分为两段,分别计算每段样本的算术平均值以及样本均值x,有统计量
式中:Si和S为均值变点分析法中间计算值;下角标t1=1,2,…,i-1;t2=i,i+1,…,N。计算期望值 E(S - Si),最大的期望值对应的窗口大小即为最佳统计窗口。
首先对表2中的起伏度数据t进行处理得到单位面积数据T,再对该数据取对数lnT即得到数据序列{xi},对数据序列按照均值变点分析法进行计算可得到图3的曲线。
由图3可以容易地发现第7个差值即第8个序列点为最大值,也就是说第8个序列点所对应的统计单元大小为地势起伏度的最佳统计单元。由表2可知,第8个序列点对应的是17×17像元,即面积为2.34km2的格网大小为最佳统计单元。
2.4 西南地区地貌形态划分
综合海拔和地势起伏度的影响,将二者的分类结果进行叠加处理,可得到初步地貌分类结果图,产生了30种不同的地貌类型。考虑地形实际情况,将具有极大起伏的地形并为一类——极大起伏山地,同时较低海拔的山地不可能具有极大和大起伏,对生成的地貌分类结果图进行重编码,得到19种地貌形态分布图。
为了去除分类后产生的部分零星像元,采用了聚类分析和剔除分析,其思想是为每个类型定义一个保留的最小图斑面积,将小于该面积的图斑合并到大图斑中。为了统计分析的需要该面积不能取太大,本研究取25×25像元大小,即最小图斑的面积为5km2。最后添加道路和居民点数据进行逻辑判断,得到西南地区地貌形态分布结果图,见图4。
3 结果分析
将图4中各地貌面积进行统计可得表3。由表3可见,各种地貌形态分布广泛均衡,说明地形总体较破碎,特别是云贵高原喀斯特地貌发育区域。其中:低地盆地、平原,小起伏低山和小起伏中山的面积较大,分别占总面积的14.34%、12.22%和15.89%,其和超过总面积的42%,主要分布在四川盆地、广西地区、贵州高原以及云南西南部等地势相对较低的区域;峡谷区主要分布在横断山区,由几大河流如澜沧江、金沙江以及怒江等长期以来剧烈的切割作用造成,表现出极大的地表切割和起伏。研究区海拔从沿海几十米到高原5000m以上变化很大,尤其是川西高原与四川盆地接壤处、横断山区等起伏多大于500m,全区起伏大于500m的地区面积为34.76万km2,占总面积的25.33%,起伏度超过1000m的地区均分布于此。此外四川盆地、广西平原、贵州、云南东部以及川西的若尔盖盆地等在海拔的变化上表现为一个渐变过程,而四川盆地和川西高原连接处以及贡嘎山地区明显存在一个较大面积的大起伏区域。
表3 西南地区地貌形态统计
前文划分的4个地貌单元在图4中界限明显,且其内部地貌特征也得到了明显体现:①四川盆地底部盆西平原、盆中丘陵以及盆东平行岭谷3个区域分布明显,且表现为低海拔小起伏;②青藏高原东缘的川西高原和滇西北地区表现为高海拔较大起伏,只有若尔盖盆地和盐源盆地表现为小起伏,贡嘎山在该区独一无二的特征也得到明显体现;③云贵高原中云南高原海拔明显高于贵州高原,地形破碎,不存在大面积平地,小的平地如云南的昆明、陆良、昭鲁等坝子和贵州的贵阳、毕节等盆地均表现明显;④广西地区地势自西北向东南倾斜,西北部属云贵高原的延伸,地形较破碎,山脉如十万大山、大瑶山及九万大山等都表现为较大起伏,桂中盆地、百色盆地、南宁盆地及浔江平原等表现为小起伏。
进一步研究发现,研究区内有84.62%的居民点分布在小起伏和低海拔区域,626个县级及以上居民点中有593个分布在小起伏和低海拔区域,占到总数的94.73%,同时大起伏、极大起伏区域不存在县级居民点,这也说明人口和城市的分布与地貌形态间存在显著的相关性,与人口空间分布的规律[11]也十分吻合。
与陈志明[12]1993年1∶400万中国地貌图中基本地貌形态部分进行对比分析,由于区域和具体方法的不同,差异是可以预见的,有必要对其进行阐述与分析:①研究区及范围不同,地貌形态是一个相对概念,高低陡缓均是相对而言,本研究选取西南地区更具有针对性;②地势起伏度的统计单元大小不同,前者取21km2,本研究经分析取2.34km2,在数值准确性上能更好地表现地势起伏状况;③分类分级体系不同,前者在全国范围内建立分类分级体系,且考虑大地构造和地质构造地貌,本研究建立适合西南地区的分类分级体系,分类精度必然有所提高。对于西南地区,本研究更具有针对性,在数据准确性和分类结果精度上均有明显提高。
4 结论与讨论
通过本研究可以得到以下结论:①以GDEM为基础,较好地拟合出了起伏度统计单元和起伏度之间的曲线关系,并采用均值变点分析法获得了西南地区起伏度的最佳统计单元大小;②通过综合分析,确定了适合西南地区进行地貌等级划分的划分指标,主要是绝对高程和起伏度的划分指标,并得到了较好的实验结果,具有一定的参考和应用价值;③西南地区的地势和起伏具有一定的规律:划分为4个地貌类型单元——四川盆地及其周边、青藏高原东缘、云贵高原以及广西地区,每个单元的地貌又各有其特点。
基于90m分辨率DEM获得的地貌形态分布图在精度上存在一定的局限性,无法对细部或微观地貌进行较好描述,但对于大区域的西南地区来说可较好描述其地貌形态的整体趋势。对小区域进行更细致的地貌识别应使用更高精度的DEM,并结合遥感影像综合分析。
本研究的指标体系仅基于高度和起伏度,尽管起伏度自身与坡度、粗糙度、高程变异系数具有较大的相关性。考虑到实际地形的复杂性,使用结合多因子的最佳因子组合方法进行地貌类型划分和地貌类型的自动识别将是以后研究的方向。
[1]姜晓波.中国山地范围界定的初步意见[J].山地学报,2008,26(2):129 -136.
[2]罗宏,杨志峰.峡谷暖区农业地形气候垂直分层及其农业发展战略[J].地理研究,1999,18(4):407 -412.
[3]赵洪壮,李有利,杨景春,等.基于DEM数据的北天山地貌形态分析[J].地理科学,2009,29(3):445 -449.
[4]Kühni A,Pfiffner O A. The relief of the Swiss Alps and adjacentareas and its relation to lithology and structure: topographicanalysis from a 250-m DEM[J]. Geomorphology,2001,41( 4) : 285 - 307.
[5]汤国安,杨玮莹,杨昕,等.对DEM地形定量因子挖掘中若干问题的探讨[J].测绘科学,2002,28(1):28 -32.
[6]肖飞,张百平,凌峰,等.基于DEM的地貌实体单元自动提取方法[J].地理研究,2008,27(2):459 -466.
[7]苏时雨,李钜章,苏映平,等.中国1∶100万地貌图设计中若干问题的探讨[J].地理学报,1982,37(1):8-16.
[8]杨斌.“数字山地”框架下的山地本体及数字化分类研究——以四川省为例[D].成都:成都理工大学,2009.
[9]涂汉明,刘振东.中国地势起伏度研究[J].测绘学报,1991,20(4):311 -318.
[10]郎玲玲,程维明,朱启疆,等.多尺度DEM提取地势起伏度的对比分析——以福建低山丘陵区为例[J].地球信息科学,2007,9(6):1 -6.
[11]李雨停,丁四保,王荣成.地理成本与人口空间分布格局研究[J].中国人口·资源与环境,2009,19(5):82 -87.
[12]陈志明.论中国地貌图的研制原则、内容与方法——以1∶4000000全国地貌图为例[J].地理学报,1993,48(2):105-113.