基于面向对象分类技术的雅砻江流域地表信息提取与分析
2016-11-07陈建平
谢 帅, 陈建平, 于 欢, 王 哲, 向 杰
(1.中国地质大学(北京) 地球科学与资源学院,北京100083; 2.北京市国土资源信息研究开发重点实验室,北京100083; 3.成都理工大学地球科学学院,四川成都610059)
基于面向对象分类技术的雅砻江流域地表信息提取与分析
谢帅1,2, 陈建平1,2, 于欢3, 王哲3, 向杰1,2
(1.中国地质大学(北京) 地球科学与资源学院,北京100083; 2.北京市国土资源信息研究开发重点实验室,北京100083; 3.成都理工大学地球科学学院,四川成都610059)
雅砻江是川西最重要的河流之一,雅砻江流域内的土地利用情况与流域内的生态环境及河流水质密切相关。以Landsat 8 OLI遥感影像为数据源,采用面向对象的分类方法,建立分类规则,获取研究区的土地利用情况,利用Fragstats 4.2 软件进行区域景观空间分布特征分析。结果表明:采用面向对象的分类方法的分类总体精度达到 87.11%,Kappa 系数达到 0.855。雅砻江流域内的区域整体景观连接性较好。草地和林地是研究区的主导类型,整体看分布较为集中。
面向对象分类;土地利用;景观格局指数; Fragstats软件;eCognition软件;雅砻江流域;四川西部
0 引 言
雅砻江位于四川省西南部,是原生植物栖息地和具有丰富原生群落的金沙江流域的最大支流,水流湍急,水力资源丰富。近年来,随着人们对雅砻江不合理的开发和干预,导致栖息地退化、生态萧条、水土流失和河谷地质灾害地貌发育,流域的生态环境面临着巨大的压力。土地利用状况对流域面源污染有着重要的影响,同时也是流域面源污染模拟的重要参数。在实际应用过程中,由于流域面毗邻河流,所以其土地利用的方式对河流的水质有着重要且直接的影响。
在流域或区域的景观尺度范围内,遥感技术可以快速、客观、多时段地提供了大量信息,在地面上,通过使用相应的数据管理,RS和GIS的空间分析技术相得益彰(喻锋等,2006)。因此,遥感技术成为土地利用数据的主要获取方式。在应用中,常见的土地利用信息提取方法主要包括:目视解译、基于决策树的分类、基于统计学方法的分类以及混合分类等(高建勇,2013)。因为面向对象分类可以充分利用遥感影像的多种特征,所以对于空间尺度、空间分析等问题的处理更适合,目前被广泛应用到中、高分辨率遥感影像的分类工作中。
基于Landsat 8多光谱遥感数据,应用面向对象遥感分类方法,获取流域范围内的土地利用信息,并进行区域景观空间分布特征分析(王少伟等,2014)。对利用面向对象方法提取流域地表景观信息的有效性进行检验,并为区域土地资源的可持续开发利用提供依据。
1 研究区概况及数据源
1.1研究区概况
以四川省甘孜藏族自治州境内的雅砻江流域作为研究区(图1)。区内雅砻江长度占雅砻江流域全长的3/5,且位于雅砻江的上游段,对整个雅砻江流域的生态环境及河流水质具有重要的影响。研究区面积为70 366 km2,涉及甘孜州的10个县(市)行政区,大部分区域处于山地,地势陡峭,海拔范围为2 207~6 102 m,较大的高差造成了区域气温、降水、植被分布等随地势高低垂直变化异常明显。
图1 研究区位置图Fig.1 Map showing location of the study area
图2 雅砻江流域影像预处理后假彩色合成遥感影像(OLI 543组合)Fig.2 Pseudo-color composite of preprocessed images in the Yalong River Basin
1.2数据源及预处理
采用覆盖研究区的NASA Landsat 8多光谱遥感影像为主要数据源(图2)。Landsat 8上载有2个主要传感器,分别是获取空间分辨率30 m和15 m多光谱影像的陆地成像仪(Operational Land Imager, OLI)传感器和获取空间分辨率100 m热红外影像的热红外传感器(Thermal Infrared Sensor, TIRS)(徐涵秋等,2013)。Landsat 8的30 m分辨率多光谱影像数据可以用于获取土地利用和土地覆盖情况,研究选用2013—2014年无云覆盖的30 m分辨率多光谱遥感影像数据,将数据进行辐射校正和几何校正等预处理,并根据研究的需要对原始影像按照研究区范围进行影像裁剪。
为了更好地建立分类规则,本次研究还采用了数字高程模型(Digital Elevation Model, DEM)等地理辅助数据(图3)。DEM是表示地面高程的一种实体地面模型,可以很好地描述包括高程在内的各种地貌因子及这些因子在空间上的分布情况,同时利用所获得的DEM数据提取坡度和坡向数据(图4、图5)。
图3 雅砻江流域DEM数据Fig.3 DEM data of the study area
图4 雅砻江流域坡度数据Fig.4 Slope degree of the study area
图5 雅砻江流域坡向图Fig.5 Slope aspect of the study area
2 研究方法
2.1建立分类系统
获取土地利用数据首要的是根据区域实际地表覆盖状况建立科学的土地利用分类系统(王少伟等,2014)。参照国土资源部《全国土地分类(过渡期间适用)》(国土资发[2002]247号),同时考虑雅砻江流域地表覆盖实际状况和进一步研究的需要,建立流域土地利用分类系统,将土地利用类型分为11种:农业用地、林地、草地、裸地、居民地、交通用地、工业用地、河流、湖泊、湿地和冰川积雪。
2.2多尺度分割
多尺度影像分割技术是获取遥感数据不同尺度信息的最有效方法,该方法克服了数据源的固定尺度,采用多尺度结构来揭示层次关系(钱巧静等,2005)。对研究区Landsat 8多光谱影像进行多尺度分割,由于不同尺度的影像分割适合不同地物信息的提取,故经过多次分割试验结果比较,最终选定分割尺度为25,该分割尺度能够很好地模拟不同地物的轮廓和大小,为后续分类提供了较好的数据基础(图6、图7、图8)。
图6 原始影像Fig.6 Original image
图7 分割尺度25Fig.7 Split scale 25
图8 分割尺度15Fig.8 Split scale 15
2.3遥感影像分类
2.3.1分类方法根据上述建立的流域土地利用分类系统,对于各个土地利用类型进行严格描述,与传统方法中仅按照对不同类型描述来分析光谱信息的分类方法所不同,利用一定量的、不同的规则对图像进行分类和信息提取。其中,为了提高分类的精度,对于影像中由于光照、天气等因素影响所产生的阴影、云雾等进行专家知识验证与解译,最大程度地保证分类结果的正确性。
采用的分类方法主要为决策树法和最近邻分类法。决策树是一种直观的知识表示方法,同时也是高效的分类器(潘琛等,2008),它以信息论为基础,将复杂的决策形成过程抽象成易于理解和表达的规则或判断。最近邻分类法类似于传统分类方法中的监督分类,通过选择样本的方法来进行影像的分类(高玉蓉,2006),其原理是通过选择的样本统计该样本类的特征,以这个特征为中心,以未分类对象中包含且用于分类的特征与样本类特征之“差”为距离,该对象距离哪个样本类最近,就被分到哪个类别中(石媛媛等,2010)。所有类的分配都由关系度或可能度所决定,图像对象距离样本对象越近,其关系度越大。该方法的优点是分类操作比较简单、直观,能够快速处理类层次关系(蒋永涛等,2009)。
2.3.2分类规则的建立在分类过程中,还利用了NDVI、NDWI、NDBI等多种指标,这些指标和对应的解释如表1所示。并基于这些指标建立分类规则(图9)。
表1 分类指标描述与解释
图9 雅砻江流域土地分类规则Fig.9 Classification rules of the study area
首先计算覆盖研究区遥感影像的NDVI值,当地面覆盖为云、水、雪等对可见光高反射的物体时,NDVI<0;NDVI=0表示没有植被覆盖,此时,NIR≈R;当有植被覆盖时,NDVI>0,植被越茂密,NDVI的值越大。所以,建立规则,将NDVI>0的区域分类为植被区域,NDVI≤0的区域分类为非植被区域。
在植被区域中,草地的植被覆盖度较低,根据研究区的实际情况,草地的NDVI取值范围在0.1~0.2之间。草地具有一定的平均亮度,但亮度值不高,选定亮度值>8 000作为条件之一。另外观察到草地的特征在Landsat 8 的Band 6中与其他土地利用类型有较好的区分特征,经过反复对比验证,采用Band 6≥15 900作为分类条件之一。通过上述3个分类条件的组合,较好地提取了研究区的草地覆盖区域。
在植被区域中,湿地的分布基本都在较平缓的地区,所以首先利用坡度对湿地进行提取,采用坡度(Slope)≤3°的条件。另外,湿地也存在水体特征,所以采用MNDWI,由于是植被区域,所以排除了河流和湖泊的干扰,采用MNDWI>-0.01的分类条件。通过2个分类条件的组合,提取出研究区的湿地覆盖区域。
在植被区域中,林地的植被特征最明显,植被覆盖度最高,首先根据影像选择NDVI>0.29作为分类条件,由于研究区部分地区海拔较高,根据实际情况,林地在一定海拔区域及以上将不再生长,所以采用DEM<4 800的分类条件。同样,林地的特征在Landsat 8 的Band 6中与其他土地利用类型有较好的区分,经过对比观察,采用Band 6≤10 000作为条件之一。通过3个分类条件的组合,研究区林地的覆盖区域得到了较好的提取。
在植被区域中,经过验证,农业用地无法通过特征指标进行分离,根据该地区的土地利用现状图选定了适量样本,然后采用最近邻分类法进行分类,最终提取了研究区的农业用地区域。
在非植被区域中,NDWI对于水体有较好的反映与表现,利用NDWI提取水体,为了更好地区分河流和湖泊,采用了形状指数。在形状指数中,河流由于斑块表现得更细长,所以形状指数相较于湖泊更大,将形状指数=4作为湖泊与河流的界限,对河流与湖泊的区域进行区分并得到其各自的分布情况。
在非植被区域中,裸地在NDVI值上的特征与其他地物类型有明显的区分,采用NDVI提取裸地覆盖区域,经过对研究区的整体把握,将分类条件设定为-0.03≤NDVI≤-0.01,从而提取研究区的裸地区域。
在非植被区域中,同一波段不同地物吸收和反射太阳光的程度各异,同一地物在不同波段吸收和反射太阳光的能力也不同。依据这一原理,发现建设用地在Landsat 8第4波段上具有较特殊的光谱信息,与其他地物光谱有明显不同的特征,因此选取Band 4与亮度值结合用来区分人造地物类型。采用Band 4<13 000、亮度值<10 500的分类条件提取建设用地。在建设用地中,进一步通过NDBI指数进行居民地提取,采用形状指数提取道路,采用最近邻法进行工业用地的提取。
在非植被区域中,冰川和积雪具有较高的亮度值,结合区域实际情况首先采用了亮度值>15 000的分类条件。另外,发现冰川和积雪在Landsat 8第3波段上有与其他地物类型较好的区分特征,所以选择Band 3作为条件之一,采用Band 3≥30 000作为分类条件。通过2个分类条件的组合,可以比较好地提取出冰川和积雪区域。
2.4景观格局指数
景观格局指数易于理解、生态学意义较明确,能够高度浓缩景观格局信息,由于其描述方法带有一定的统计性质和便于分析比较不同尺度格局的优点,对于理解和解释景观功能具有重要作用,已经成为描述景观格局及变化,建立格局与景观过程之间的联系最常用的量化研究方法。景观指数方法在景观格局分析时应用十分广泛,目前发展出的景观指数有几百种之多,可以分为斑块水平指数、斑块类型水平指数和景观水平指数(于欢等,2012)。
考虑到研究内容,分别选择斑块类型水平指数和景观水平指数作为反映生态效应的主要指标。选择斑块类型水平指数中的斑块面积(TA)、景观百分比(PLAND),最大斑块指数(LPI)等,选择景观水平指数中的散布和毗邻指数(IJI)、聚集度指数(AI)、蔓延度(CONTAG)以及分别处于2种水平指数中的斑块数(NP)、斑块密度(PD)、景观形状指数(LSI)等进行观测分析。
3 结果与分析
3.1土地利用提取结果
根据上述研究方法,最终获得了研究区土地利用图(图10)。
图10 雅砻江流域2013年土地覆被结果1-裸地;2-农业用地;3-林地;4-冰川积雪;5-草地;6-居民地;7-工业用地;8-湖泊;9-湿地;10-河流;11-交通用地Fig.10 Land cover of the Yalong River Basin in 2013
对研究区的土地利用覆被情况进行面积统计,获得了不同土地利用类型的面积和百分比数据(表2)。由表2可以看出,研究区的主要土地利用类型为草地和林地,两者合计占比达流域总面积的89%。
表2 研究区土地覆被面积统计
如图10所示,雅砻江流域的土地覆被分类结果比较平滑且紧致,没有传统像元分类中因较多孤立分散点而形成的“椒盐现象”。从中可以看出各类别的形状与实际地物能够保持较高的一致性,各类别总体延伸趋势比较清晰。
3.2土地分类精度评价
遥感图像的分类精度评价一般是用分类结果图与实际数据进行比较,用正确分类的百分比表示精度。目前常用混淆矩阵法来评价分类精度。
研究所采用的评价方法使用eCognition软件本身所提供的误差矩阵统计方法。
选用30 m分辨率的Landsat 8多光谱分辨率遥感影像进行分类,为能够更客观地评价分类结果,在研究区实地验证了273个野外验证点,另选用了177个Google Earth上经过专家知识验证的数据作为精度评价的样本点(图11)。
图11 研究区验证点示意图1-雅砻江;2-县城驻地;3-地表景观采样点;4-专家知识样本点Fig.11 Sketch showing verification points in the study area
样本选择时采用简单随机抽样法在分类结果上选择测试样本,然后根据专家知识判读验证测试样本。混淆矩阵提供了描述分类精度和识别误差的基础,有助于改善分类或由此得到的评价结果(表3)。
表3 土地分类结果精度评价
从评价结果可以看出,河流、湿地、裸地、道路的生产者精度较高,均在88%及以上;河流、湖泊、裸地、冰川积雪的用户精度都在92%以上。草地的用户精度最低为75%,说明错分、漏分比较严重。分类结果的总体精度为 87.11%,Kappa 系数为 0.855,此精度比较高,完全能够满足遥感应用需求。
精度高的主要原因是利用了面向对象技术,在分类中可以充分利用地物光谱、空间、纹理、邻接、形状等特征,最大程度地克服“同物异谱”和“异物同谱”带来的负面效应(罗开盛等,2013)。
在精度验证过程中,发现景观过于破碎地区的错误率较高,而且精度随着样点密度的增大而下降,这表明面向对象技术应用到景观过于破碎的地区有一定的局限性。原因在于遥感获得的像元本身是某一区域的混合信息,即使高分辨率分影像也不能克服这一缺陷,高分辨率影像只是将中低分辨率的线性混合转化成非线性混合;而面向对象技术中对象的光谱特征值是组成该对象所有像元的平均值,平均值起到平滑差异的作用,必然会放大信息的混合效应,形成混合对象,那些十分破碎的地物就淹没在这些混合对象当中而无法提取。但面向对象分类中决策规则的多样性与准确性将有助于减少这方面的误差,起到提高精度的作用。
3.3景观格局分析
3.3.1斑块类型水平指数分析在Fragstats 4.2 软件下基于遥感影像分类结果进行斑块类型水平指数的计算,统计结果如表4所示。
表4 研究区斑块类型水平指数
由表4可以看出,草地和林地的CA指数较大。PLAND指数分别为61.22和27.83,说明草地景观和林地景观对整个区域的影响程度很大,占主导地位;河流在景观中的地位较低,但考虑到水体是生态环境中的核心要素,因此也将其作为重要的景观类型进行分析。NP指数中,农业用地的值较高,但是CA指数并不突出,说明农业用地分布比较分散,同时也表明了农业用地景观破碎化程度较高。PD指数中,草地的PD指数最大,说明草地景观的整体性较好;林地的CA指数最大,但是PD指数相较于草地较小,说明林地景观的破碎程度和草地相比较大,引起这种现象的原因主要为地形和高程因素,但是也不能忽视人为的干扰,需要重点观察人为对林地景观的干扰;河流的NP指数较小,表明河流景观比较完整,未遭到大面积的断流、人为截断等。LPI指数表现出与NP、PD指数相同的规律,侧面验证了前述结论。LSI指数中裸地景观最高,表明区域内裸地景观最为破碎,由于其指标值的量度不受斑块面积的影响,因此肯定了主要是斑块边长的减少造成的斑块形状复杂程度的降低,从这一角度来讲,裸地景观更为分散和破碎,其中可能包括人为的破坏其他景观类型所造成的裸地斑块的增多,破碎性加大的因素,但只是从景观生态学意义上的初步判断,其具体分布规律和影响因素还需结合其他实地观测数据综合进行。
3.3.2景观水平指数分析在Fragstats 4.2 软件下分别基于各时期遥感影像分类结果进行景观水平指数的计算,统计结果如表5所示。
表5 研究区景观水平指数
由表5可以看出:研究区的面积为70 366 km2,PD指数为2.77,表明区域景观的斑块密度较小,多种景观交叉破碎;LPI等于某一拼块类型中的最大拼块占据整个景观面积的比例,表明在区域内草地景观占有相当大的比重;综合CONTAG、COHESION、DIVISION指数,考虑到区域内草地和林地景观占主导地位,表明草地和林地景观具有良好的连接性,区域整体景观格局比较完整;IJI指数为44.27,由于区域处于多山地带,区域内的地表景观受到水因素的影响分布特征显著;综合PLADJ、MESH、SPLIT指数结果,表明区域的最大斑块较大且对区域的影响范围较大;AI随着焦点类型聚集而增大,表明在区域内的草地和林地占据有优势地位,它们对区域的景观格局影响力大;SHDI指数表明区域内的景观多样性较好,从侧面表现出流域内景观比较完整,多样性良好,目前遭受到的人为破坏小。
通过景观水平指数的分析,发现雅砻江流域的区域景观整体连接性好,草地和林地对于区域景观格局整体完整性与稳定性的影响处于优势水平,河流景观对于其他景观的空间分布和位置特征具有显著影响。为了更好地实现雅砻江流域的长效发展和经济效益最大化,在流域内的环境保护与资源开发中,应着重于草地和林地的完整性不被破坏,重点关注河流、湖泊的径流和污染情况。
4 结 论
雅砻江流域内自然资源种类繁多,水电资源丰富,是川西最重要的流域之一。土地利用作为环境变化的重要因子,对流域的建设具有重要意义。土地利用类型是土地利用变化研究的重要数据,通过面向对象遥感影像分类的方法来获取研究区的土地利用类型,得出的主要结论如下。
(1) 在面向对象多尺度分割的基础上,采用决策树方法建立分类规则。根据研究区地物的不同特征,结合地物在不同波段上的反射率不同,按层次提取地物信息,从大的分类中不断进行剥离分析,最终按照规则提取出所有需要的地物类别。这种面向对象的分类方法对影像的波段特征信息进行了充分利用,分类过程直观,便于理解。
(2) 采用的分类方法分类精度较高,总体精度达到87.11%,通过统计分类结果的土地利用类型面积可知,该地区主要土地利用类型为草地、林地。各种土地利用类型的分类精度均能达到研究要求。
(3) 通过分类结果及其统计可知:研究区内占土地利用类型主导地位的是草地和林地,整体看分布较为集中,其中部分林地、草地被建设用地、河流等水体分割为较为破碎的图斑;湿地面积也较大,主要分布在地势平缓的区域,居民地和农业用地的界线较为模糊;水体主要为雅砻江及其支流,居民地多数在河流沿岸,河流为居民地的发展提供资源;林地多分布在海拔4 800 m以下,分布较广泛;冰川积雪、裸地多分布在海拔较高的山区。
高玉蓉,2006. 基于决策树的土地利用现状信息提取研究[D]. 杭州:浙江大学.
高建勇,2013. 基于TM影像的平朔矿区土地利用/土地覆盖变化研究[D]. 西安:长安大学.
蒋永涛,任国业,邓良基,等,2009. 面向对象土地利用信息提取技术研究[J]. 西南农业学报, 22(3):733-738.
罗开盛,李仁东,常变蓉,等,2013. 面向对象的湖北省土地覆被变化遥感快速监测[J]. 农业工程学报,29(24):260-267.
潘琛,杜培军,张海荣,2008. 决策树分类法及其在遥感图像处理中的应用[J]. 测绘科学, 33(1): 208-211.
钱巧静,谢瑞,张磊,等,2005. 面向对象的土地覆盖信息提取方法研究[J]. 遥感技术与应用,25(3):338-342.
石媛媛,邓劲松,陈利苏,等,2010. 利用计算机视觉和光谱分割技术进行水稻叶片钾胁迫特征提取与诊断研究[J]. 光谱学与光谱分析,30(1):214-219.
王少伟,张晓祥,杨晓英,2014. 太湖湖滨敏感区的土地利用遥感分类研究[J]. 遥感技术与应用, 29(1):114-121.
徐涵秋,唐菲,2013. 新一代Landsat系列卫星:Landsat 8遥感影像新增特征及其生态环境意义[J]. 生态学报, 33(11):3249-3257.
喻锋,李晓兵,王宏,等,2006. 皇甫川流域土地利用变化与生态安全评价[J]. 地理学报, 61(6):645-653.
于欢,杨德生,何政伟,2012. 重庆市渝北区地表景观时空演化及生态效应分析[J]. 测绘与空间地理信息, 35(6):4-7.
Landscape information extraction and analysis of the Yalong River Basin using object-oriented classification method
XIE Shuai1,2, CHEN Jianping1,2, YU Huan3, WANG Zhe3, XIANG Jie1,2
(1. School of Earth Sciences and Resources, China University of Geosciences (Beijing), Beijing 100083, China; 2. Key Laboratory of Land and Resources Information Research & Development in Beijing, Beijing 100083, China; 3. College of Earth Sciences, Chengdu University of Technology, Chengdu 610059, Sichuan, China)
The Yalong River is one of the most important rivers in western Sichuan Province. The land use of the Yalong River Basin is closely related to its ecological environment and water quality. In this study, using Landsat 8 remote sensing images as data source, we established the classification rule using an object-oriented classification method to obtain the land use of the study area, and further analyzed the spatial distribution characteristics of regional landscape with the Fragstats 4.2 software. The result shows that the overall classification accuracy was 87.11% by using an object-oriented classification method, and the Kappa coefficient was 0.855. The regional overall landscape in the Yalong River Basin has a good connectivity. Grass and forest lands were the dominant landscape types in the study area, with an overall concentrated distribution.
object-oriented classification; land use; landscape level index; Fragstats software; eCognition software; Yalong River Basin; western Sichuan Province
10.3969/j.issn.1674-3636.2016.03.526
2016-06-09;
2016-06-20;编辑:陆李萍
中国地质调查局项目“矿山环境变化自动监测示范研究”(1212011120029)
谢帅(1992—),男,硕士研究生,研究方向为地球探测与信息技术,E-mail:stevejuskey@foxmail.com
P237
A
1674-3636(2016)03-0526-09