基于特征组合的黄河源园区土地覆被分类
2021-04-25万佳华魏加华
万佳华,魏加华,,3*,李 琼,任 燕
(1.青海大学水利电力学院,青海 西宁 810016; 2.省部共建三江源生态与高原农牧业国家重点实验室,青海大学,青海 西宁 810016;3.清华大学水沙科学与水利水电工程国家重点实验室,北京 100084)
黄河源区是黄河流域最重要的径流来源区及生态涵养地,素有“黄河水塔”之称[1]。在全球变暖和人类活动影响加剧背景下,黄河源区土地覆被(Land Cover,LC)类型发生了显著变化[2-3]。LC变化与近地表面的蒸散发、下渗等水文要素及产汇流过程密切相关,也是大多数气候变化、水文变化区域响应模型的基础数据[4]。因此,快速获取黄河源区土地覆被信息,了解该区域不同地物类型的空间分布格局与特征,是研究该区域下垫面变化以及气候变化的关键内容。
相关学者[5-8]对黄河源流域或者更大范围的三江源区域的土地利用/土地覆被变化进行了研究,多数研究用人机交互的目视解译方法完成研究区域的地物分类工作。目视解译方法虽然可以满足精度的要求,但耗时长,工作量大,有一定的限制性。随着计算机与信息化技术的发展,机器学习(Machine Learning,ML)在土地覆被分类(Land Cover Classification,LCC)中得到广泛的关注,支持向量机[9-10](Support Vector Machine,SVM)、决策树(Decision Tree,DT)、随机森林[11-15](Random Forest,RF)、K近邻(K-Nearest Neighbor,KNN)等方法被用于地物信息提取,成果丰硕,其中RF、KNN和SVM算法取得的分类效果较好[16-17]。黄首畅[18]在对高光谱数据进行降维之后,使用SVM、最大似然(Maximum Likelihood Classification,MLC)、RF 3种方法进行三江源国家公园黄河源区核心区鄂陵湖西部和北部的植被分类。对于地物类型相似、空间分布格局较复杂地区,采用单一的影像特征将导致分类效果不理想。因此,结合能反应地物差异的特征变量[19-22],如光谱、植被、水体、纹理等[23-25]是提高LCC精度的关键。安如等[26]对黄河源典型区玛多县范围的湿地信息进行提取,确定其有效特征(包括光谱、纹理、地形和结构特征),构建面向对象的遥感湿地提取方法,总精度可达90.13%,Kappa 系数为 88.33%。
黄河源园区属于类型相对复杂且类别分布严重失衡的高寒高海拔地区,目前对该区域的土地覆被分类的研究较少,特别是对于多特征组合的研究鲜有涉及。本文以三江源国家公园黄河源园区为研究对象,在综合分析区域植被类型和覆盖特征的基础上,首先构建特征集(光谱特征、植被特征、水体特征及纹理特征);然后利用Relief F特征选择方法,对不同特征在土地覆被分类中的重要性进行评估,完成特征优选;通过组合不同的特征,构建多种试验方案,基于RF方法对比分析不同方案的土地覆被分类结果;对优选特征组合,采用DT、KNN、感知机(Perceptron,PPN)和SVM 4种分类方法与RF方法进行对比,利用精度最优实验方案完成黄河源园区的土地覆被分类,这对高海拔地区土地覆被自动分类的研究具有一定的参考价值。
1 研究区概况
1.1研究区概况黄河源园区主体位于三江源国家公园,在果洛藏族自治州玛多县境内(图1),总面积1.91 万km2,属于高寒生态脆弱区和国家重点生态功能区的重叠区域,平均海拔4 200 m以上,多年平均气温-4 ℃左右,年降水量247.8~484.8 mm。区域内植被类型和结构相对简单,以高寒草原、草甸和高山稀疏植被为主[27]。
1.2遥感数据及预处理本文选取Landsat 8 OLI多光谱影像作为数据源。Landsat 8 OLI传感器包括9个波段,成像宽幅185 km×185 km,除全色波段的空间分辨率为15 m外,其余波段空间分辨率为30 m,回归周期为16 d。影像数据来源于地理空间数据云(www.gscloud.cn)。以2017年7月—2017年8月影像为主,2015年7月—2015年8月和2016年7月—2016年8月影像作为补充,影像数据信息见表1。
表1 研究区域Landsat 8 OLI影像数据信息
对影像进行辐射定标,使DN值变为绝对辐射亮度值,然后进行FLAASH大气校正,获得地物反射率等真实物理模型参数,最后将三景影像拼接,用来源于国家青藏高原科学数据中心(http://data.tpdc.ac.cn)的黄河源园区矢量文件[28],裁剪出研究区域。
1.3样本点选取根据研究区实际的土地覆被情况,参考GB/T 21010—2017《土地利用分类标准》[29]、中国科学院地理科学与资源研究所和中国科学院资源环境科学数据中心发布的《中国多时期土地利用/土地覆盖遥感监测数据库说明》确定黄河源园区地物分类系统,见表2。
表2 黄河源园区土地覆被分类系统
在研究区影像资料的基础上,结合中国科学院2018年黄河源园区的土地覆盖图,在Landsat 8 OLI影像上随机选取样本点并保证样本均匀分布,样本数量按各类地物面积占比设置。选择112 316个像元作为样本数据,随机抽取30%数据作为测试数据,每类样本点数量见表3。
表3 样本数量统计
2 研究方法
2.1特征变量选取光谱、植被、水体和纹理特征构建特征集(表4)。由于缨帽变换能够增强图像的植被信息,还能去除各波段之间的冗余信息,将变换后的亮度指数(Brightness index,BI)、绿度指数(Green index,GI)和湿度指数(Wetness index,WI)前3个分量用于LCC。本文缨帽变换的系数矩阵采用文献[30]的研究成果。纹理通过统计像素点与周围其他像素点间的关系确定,用于反映地物空间结构[31-32]。在原始影像上通过主成分分析得到方差占比为94.35%的第一主成分,采用灰度共生矩阵(Grey-Level Co-occurrence Matrix,GLCM)进行纹理特征的提取。对3×3、5×5、7×7、9×9四种滑动窗口进行对比试验,确定滑动窗口为9×9,移动步长为1。为抑制不同方向的影响,取0°、45°、90°、135°四个统计方向分别计算GLCM,对求得的角二阶矩、相关性、对比度、能量、相异性和协同性6个二阶统计量取平均。
表4 特征描述
2.2特征选择算法Relief F算法基本原理是根据特征对相邻样本的区分能力赋予特征不同的权重,对权重降序排列,取前n个权重所对应的特征作为降维后的数据。每次从样本中随机取出一个样本x,然后从x的同类样本集中找k个近邻样本H(x),从每个x的异类样本集中均找出k个近邻样本M(x),最后计算样本x与k个近邻样本H(x)和M(x)的距离和,并根据距离大小更新特征权重,权重更新公式如下:
(1)
式中:diffa表示在特征a上不同样本间的距离,本文采用欧几里德范数表示;H(x)和M(x)分别表示与x的同类和异类样本集中的最近相邻样本;P表示类的概率,本文简化该项为1/(N-1),N为样本类别数;m表示抽取样本次数;k为最近相邻样本个数。
2.4试验方案基于RF方法研究不同特征组合对分类效果的影响,设计6种试验方案。方案1:光谱特征(6个输入变量);方案2:光谱特征+植被特征(11个输入变量);方案3:光谱特征+水体特征(8个输入变量);方案4:光谱特征+纹理特征(12个输入变量);方案5:所有特征(19个输入变量);方案6:Relief F算法优选的特征。对优选的特征组合,用RF与KNN、SVM、DT、PPN方法进行对比。
2.5 评价指标
精度评价采用混淆矩阵(Confusion Matrix,CM)方法,CM方法能够反映预测结果与真实LC间的相关信息[35]。通过CM方法分析出总体精度(Overall Accuracy,OA)、平均精度(Average Accuracy,AA)、Kappa 系数、生产者精度(Producer’s Accuracy,PA)和用户精度(User’s Accuracy,UA),对各方案进行评价。
3 结果与分析
3.1特征变量重要性评估利用Relief F算法对19个特征变量进行重要性评估,设置最近相邻样本个数k=100,随机抽取样本次数为总体样本数量的0.4倍。为消除随机抽取样本的影响,迭代计算5次取平均,将特征权重从大到小进行排序(图2a)。从图2a可以看出,不同特征的权重差异较大,特征变量重要性排序为DVI>NDWI>NDVI>B7>B6>correlation>ASM>WI>GI>energy>RVI>B5>BI>B4>homogeneity>B3>dissimilarity>B2>contras。总的来看,纹理特征权重和最大,其次是植被特征(图2b)。
3.2基于不同特征组合分类结果的比较基于RF方法,6种试验方案的分类精度见表5。由表可以看出,在加入水体特征和纹理特征后,林地和高覆盖度草地的精度有所提升,尤其加入纹理特征后,河流、滩地和沼泽地分类精度提高明显,其中沼泽地提升幅度最大。由Relief F算法得到的各特征的权重,纹理特征权重和最大,故加入纹理特征后,效果也较好。由于植被特征由光谱特征计算而来,所以在光谱特征的基础上加入植被特征,对分类精度提升贡献率不大。方案4和方案5结果相差不大,其中方案5,OA为96.02%,AA为92.64%,Kappa系数为0.94。从工作效率来看,方案6用时最短,时间相对于方案5和方案4缩短了一倍。由以上分析可知,综合优选特征可以兼顾分类精度和时间效率。
表5 各方案分类精度统计
3.3基于优选特征不同分类方法的比较为评估RF方法的效果,对优选特征使用DT、K近邻、PPN和SVM方法与RF方法进行对比(表6)。由表可知,各分类器都取得了较好的分类精度,OA均在85%以上,其中RF方法的分类效果最好,DT分类性能最差。基于RF方法,林地和高覆盖度草地PA较低,均低于50%,说明这两种地物的漏分误差比较大;而UA均在80%以上,错分误差较低。这是由于各类别像元个数极度不平衡,导致样本个数较少的几类地物存在漏分的情况。总体来看,RF方法比DT、PPN、K近邻和SVM方法更能有效地提取土地覆盖信息。
表6 基于优选特征各分类器分类精度
3.4基于所有特征的分类结果分析基于RF方法,综合所有特征对黄河源园区分类,结果见图3b,各类地物面积占比如图4所示。由图4看出,在整个黄河源园区草地的面积占比最高为85.74%,湖泊的面积占比为7.46%,河流的面积占比为0.33%,林地的面积占比最小为0.06%。在草地中以中低覆盖度的草地为主,低覆盖度草地面积>中覆盖度草地面积,而高覆盖度草地面积很小,占比仅为0.25%。
4 讨论与结论
本文以Landsat 8 OLI为数据源提取多种特征变量,利用Relief F算法完成特征优选,基于RF方法构建6种试验方案,得到不同特征的重要性并验证了RF方法的适用性,完成了黄河源园区土地覆被分类。侯蒙京等[36]在高寒湿地地区同样基于多特征组合也验证了RF的适用性。通过本研究得到以下结论:(1)基于Relief F算法对特征重要性进行评估,得到特征重要性排序为DVI>NDWI>NDVI>B7>B6>correlation>ASM>WI>GI>energy>RVI>B5>BI>B4>homogeneity>B3>dissimilarity>B2>contrast;(2)不同特征对LCC的影响不同,在光谱特征的基础上加入纹理特征有利于提升LCC的精度,综合所有特征取得的分类效果最好,OA为96.02%,AA为92.64%,Kappa系数为0.94;(3)RF法与DT、K近邻、PPN和SVM方法对比,RF方法在高寒地区LCC中具有一定的优势。(4)分类结果表明黄河源园区地物类型以植被为主,中低覆盖度草地面积占比较大,林地最小。
本研究仍存在一些不足之处:(1)样本的选取基于目视解译,具有一定的主观性,还需进行实地考察进一步对模型进行验证;(2)对于林地和高覆盖度草地的识别较差,需要进一步研究,以提高两者的识别精度。