基于MESMA和RF的山丘区土地利用信息分类提取
2017-07-31陈元鹏郧文聚彭军还李少帅
陈元鹏 郧文聚 周 旭 彭军还 李少帅 周 妍
(1.中国地质大学(北京)土地科学技术学院,北京100083;2.国土资源部土地整治中心,北京100035)
基于MESMA和RF的山丘区土地利用信息分类提取
陈元鹏1,2郧文聚2周 旭2彭军还1李少帅1,2周 妍2
(1.中国地质大学(北京)土地科学技术学院,北京100083;2.国土资源部土地整治中心,北京100035)
探讨了基于多端元混合像元分解(Multiple endmember spectralmixture analysis,MESMA)和随机森林(Random forest,RF)相结合的土地利用信息分类提取方法。以Landsat-8 OLI卫星遥感影像为主要数据,基于植被-不透水面-裸土(Vegetation-impervious surface-soil,VIS)模型,利用MESMA将影像分解为植被、不透水面和裸土3类组分,将生成的3类组分变量和基于光谱、纹理信息计算选取的20个特征变量组合后开展RF分类实验,将分类结果与相同特征变量下的支持向量机(Support vectormachine,SVM)、最大似然(Maximum likelihood classification,MLC)分类结果进行比较分析。结果表明:MESMA可以获得较为精确的组分丰度信息;RF分类结果优于相同特征变量下的SVM和MLC分类结果;在MESMA生成的组分信息变量参与分类后,3种方法的分类精度均有所改善,分别达90.50%、88.85%、86.35%,其中RF的分类精度改善最为显著;MESMA与线性混合分解(Linear spectral mixture analysis,LSMA)生成的组分信息变量相比,前者对于改善分类精度效果更为明显。MESMA对于提高影像分类精度起到一定积极作用,基于MESMA和RF的方法对中等空间分辨率影像山丘区土地利用信息分类提取精度较高,利用该方法开展遥感影像解译可为大尺度的土地利用监测和管理工作提供技术支持和理论参考。
土地利用分类;中等空间分辨率;多端元混合像元分解;随机森林;山丘区
引言
准确掌握国家土地资源利用信息是国家相关部门调整土地利用结构、合理开发土地资源、动态监测土地利用状况等工作的基础[1]。土地资源与遥感数据在时空特性方面具有高度一致性,对土地资源的研究成为遥感技术应用的主要领域之一。过去数十年,国内外开展了大量研究,促使了遥感技术在土地资源领域的长足发展。现今遥感技术已为土地利用的信息提取与分类识别提供了丰富的信息源和多元的实现手段[2],为准确掌握国家土地利用信息贡献了巨大力量。
在大尺度的土地资源遥感研究应用中,兼顾经济、效率的同时,中等空间分辨率数据往往成为较佳选择,但在地物异质性和传感器空间分辨率影响下,中等空间分辨率数据普遍存在混合像元,尤其在我国山地丘陵区,地形起伏大、地物分布破碎,导致影像数据中混合像元占比更高,这一定程度上影响了地物识别和分类精度。为此,充分利用混合像元分解技术,并与目前应用范围较广的机器学习分类方法有效结合[3],对基于中等空间分辨率影像的山丘区土地利用信息提取精度的提高很有帮助。
多端元混合像元分解是在线性混合分解基础上发展而来的一种混合像元分解方法,MESMA在引入地物端元波谱库的基础上,充分考虑了像元内地物的不同组合方式及光谱变化性,利用不同类型和数量的地物端元组合模拟每个像元,它针对每一类地物选取多个端元光谱参与混合像元分解,可以有效解决“同物异谱”问题[4-6]。随机森林分类方法目前在基于机器学习的遥感影像分类方法中精度相对较高,处理大数据集时运行速度更快,不容易过拟合,处理多维变量能力强,可生成变量重要性估计,所以该算法在多维数据分类回归中被广泛应用,并取得较好的效果[7]。但与其它的机器学习分类算法相比,国内对于随机森林算法在遥感影像分类中的研究和应用相对较少,已有的研究区域主要集中在平原区[8-10],在山丘区的研究应用不多。
本文提出一种MESMA和RF相结合的遥感影像分类方法,利用该方法对四川省古蔺县域内的土地利用信息进行分类提取研究;以中等空间分辨率Landsat-8 OLI影像为唯一数据源,不使用辅助数据参与分类;利用MESMA方法解混生成植被、不透水面和裸土3种组分信息,将组分信息作为特征变量和基于光谱、纹理信息计算选取的20个特征变量进行组合,构建3种变量组合模型开展RF分类实验;对精度最高的模型3分类结果进行变量重要性估计,分析各变量的重要性成因;将精度最高的模型3分类结果与相同特征变量下的SVM、MLC分类结果,基于LSMA和RF相结合方法的分类结果进行比较分析。
1 研究区概况
研究区位于四川省泸州市古蔺县,地理坐标为27°59'43″~28°7'24″N、105°55'41″~106°4'47″E,区域内海拔在340~1 207m之间,中亚热带气候,年平均气温 17.1~18.5℃、平均降水量 748.4~1 184.2mm[11-13]。参照 GB/T 21010—2007《土地利用现状分类》,研究区内主要土地利用类型为耕地、有林地、工矿仓储用地(简称“工矿用地”)、住宅用地、交通运输用地、水域及水利设施用地(简称“水域”)。本文在信息提取分类体系构建中,将住宅用地与交通运输用地归并为一类简称建设用地,为支撑工矿用地复垦利用管理工作,工矿用地作为一种单独地类进行提取实验,而未归并至建设用地类。研究区地理区位及遥感影像数据如图1所示。
2 数据选取及预处理
本研究中使用的主要数据为Landsat-8 OLI卫星遥感影像,参考数据包括:泸州市工矿废弃地现状数据、无人机航拍影像、地面实测数据、Google Earth数据。其中,Landsat-8 OLI卫星遥感影像用于土地利用信息分类提取;4类参考数据用于样点采集参考和精度评价验证。
2.1 Landsat-8 OLI卫星遥感影像
Landsat-8是Landsat系列卫星中的一员,发射于2013年,它搭载了2个主要载荷:陆地成像仪(OLI)和热红外传感器(TIRS)。OLI包含9个波段,其中多光谱波段的空间分辨率为30 m,全色波段的分辨率为15m,成像宽幅为185 km×185 km。本文选用的Landsat-8 OLI遥感数据为30 m分辨率多光谱波段数据1景,波段数为7,分别为C、B、G、R、NIR、SWIR1、SWIR2,获取日期为2016年4月3日(该时间窗口内植被与裸土可分性较好),研究区域内无云量。影像的预处理在ENVI 5.3软件平台中完成,对多光谱数据的预处理包括波段筛选(去除了Coastal波段)、辐射定标、FLAASH模块大气校正、裁剪生成研究区影像数据。
图1 研究区地理位置和3D遥感影像Fig.1 Location of study area and 3D representation of remote sensing image
2.2 参考数据
参考数据中,泸州市工矿废弃地现状数据为1∶200 000现状图,由泸州市政府于2012年编制完成;航拍影像由UV-II型无人机搭载的Pentax-645D型相机拍摄,拍摄时间为2016年11月,空间分辨率为0.2m;地面实测数据的采集在无人机航拍过程中同步开展,实测仪器采用天宝手持式GPS,水平精度优于1m(Trimble geoexplorer 2008 Series GeoXH,trimble navigation limited,USA)。
2.3 样点选取
根据泸州市工矿废弃地现状数据、地面实测数据、航拍影像的目视解译分类结果以及Google Earth影像数据,在Landsat-8 OLI影像上选取了训练与验证样点,其中训练样点706个,占比22%;验证样点2 495个,占比78%。各类地物样点数量如表1所示。
表1 各地物类型样点数量Tab.1 Numbers of samp les for each class
3 研究方法
3.1 技术方法
采用MESMA和RF相结合的方法进行土地利用信息提取分类,技术流程主要为:影像预处理;利用MESMA进行混合像元分解;利用RF方法进行影像土地利用信息提取分类;精度评价。如图2所示。
图2 技术流程Fig.2 Flow chart of research technique
具体步骤为:对Landsat-8 OLI多光谱影像进行预处理,将航拍影像与卫星影像进行配准、裁剪;基于植被、不透水面、裸土模型[14],利用MESMA方法解混生成3种组分丰度数据(植被、不透水面、裸土);结合影像的光谱、纹理信息进行特征变量的计算、选取;将组分丰度数据与各类型特征变量组合后进行 RF分类(利用网格搜索法进行参数寻优)[15-16];对分类结果进行精度评价,利用特征变量重要性估计评价各特征变量的重要程度并探讨原因;与SVM和MLC分类方法进行比较,评估随机森林分类方法的性能。
3.2 MESMA方法的混合像元分解
MESMA是在LSMA基础上发展而来的一种混合像元分解方法,该方法针对每一类地物选取多条光谱,并以此生成多个端元组合(每个端元组合由不同地物中的某一条光谱组成),并对每个像元寻找最小二乘法误差最小的端元组合,进而求出每个像元的端元比例,通常采用均方根误差(RMSE)指标来评价模型的拟合优度[17],公式为
式中 S——遥感影像波段数
λ——波段 ελ——λ的残差
3.2.1 光谱库建立和端元选取
端元光谱的选择对于生成高精度的组分丰度数据至关重要,本文基于无人机影像和地面实测数据,按照VIS建模原则,在影像上选取了植被、不透水面、裸土3种地物类型的端元,数量分别为植被端元606个、不透水面端元209个、裸土端元271个,总计1 086个,将这些端元的光谱收集并建立光谱库,利用“Viper Tools”计算影像光谱库每条光谱的端元平均均方根误差(Endmember average root mean square error,EAR)[18-19]和 最 小 平 均光 谱 角(Minimum average spectral angle,MASA)[20],选择EAR、MASA值较低的端元为最优端元。通过比选,最终从1 086条端元光谱中选取了18条作为最优端元光谱。光谱曲线如图3所示。
图3 端元光谱曲线Fig.3 Spectral curves of endmember
3.2.2 端元组合模型
文献[21]研究表明,2端元模型适合自然地物景观的模拟分解,3端元模型适合人为扰动下的地物景观模拟分解,4端元模型适合城镇建设区的模拟分解。研究区域内地形起伏、土地利用覆被状况较为复杂、人为扰动因素大,所以本文主要测试了3端元、4端元的组合模型。约束条件分别为:非阴影组分丰度范围在-0.05~1.05之间;最大允许阴影组分为0.8;最大RMSE为0.025。各端元模型的评价如表2所示。
表2 端元组合模型评价Tab.2 Assessment of combinations of endmember model
通过表2的解混比例和RMSE的比较结果可知,3端元组合模型中虽然“植被+不透水面+阴影”组合与4端元模型组合的解混比例相同为91.0%,但RMSE相对较高为0.006 9,而3端元组合模型中“不透水面+裸土+阴影”的组合模型虽然RMSE最低为0.002 2,但解混比例也最低,只有18.8%,所以相比较下4端元组合模型的解混效果更优,因此本研究选取4端元组合模型进行MESMA混合像元的分解,通过阴影归一化后生成植被、不透水面、裸土3种组分丰度图像。
3.3 特征变量计算与选取
研究基于影像的光谱、纹理信息进行特征变量的计算、选取。光谱特征变量主要包括波段变量(B、G、R、NIR、SWIR1、SWIR2),光谱指数变量包括NDVI(Normalized difference vegetation index)、BCI (Biophysical composition index)[22-23]、 EVI (Enhanced vegetation index)、MNDWI(Modified normalized difference water index)、MNLI(Modified non-linear index)、SAVI(Soil adjusted vegetation index),共12个光谱特征变量。
纹理特征变量选取时,经多次试验对比分析,选用3×3大小的移动窗口,利用灰度共生矩阵(GLCM)分别计算影像6个光谱波段变量的8种纹理特征[24]:均值(Mean)、方差(Variance)、同质性(Homogeneity)、对 比 度 (Contrast)、差 异 性(Dissimilarity)、熵 (Entropy)、二 阶矩 (Second moment)、相关性(Correlation),计算后得到48个纹理特征变量,因48个变量之间相关性较高,利用主成分变换(PCA)对其进行降维,以标准差值7为阈值正向排序择优选取了前8个主成分变量(PC1~PC8)参与影像分类,合计8个纹理特征变量。
结合前述的MESMA解混生成的植被、不透水面、裸土组分特征变量,总计23个特征变量参与RF影像分类,所有的特征变量如表3所示。
表3 特征变量统计Tab.3 Statistic of feature variables
3.4 随机森林分类算法
随机森林分类算法是由决策树组合构成的机器学习算法,该算法适用于处理高维数据且运行速度相对较快[25],其执行过程如下:首先采用随机Bootstrap方法从原始数据中有放回的抽取N组训练集,每组训练集的大小约为训练数据集的2/3,这一过程称为 Bagging;然后利用 N组训练集构建N棵决策树,在每棵树生长过程中,从全部M个特征变量中随机抽选m个(m≤M)进行内部节点划分;最后,集合N棵决策树的预测结果,采用投票的方式决定新样本的类别。在训练数据抽取过程中,约1/3的数据未被抽中,这些数据称为袋外数据(OOB),OOB可用于类别错分的误差评估和变量重要性估计,在变量选取过程中采用了Gini系数测量变量的不纯度。参数设置中通常树的默认数量(ntree)为100,变量默认数量(mtry)为影像波段总数的平方根[26-29]。
本文通过特征变量选取构建了3种不同的特征变量组合模型进行随机森林分类实验,模型1:多光谱特征模型(记为MS);模型2:多光谱、纹理特征组合模型(记为MS+TXT);模型3:多光谱、纹理、组分特征组合模型(记为MS+TXT+EM),测评各类型特征变量对影像分类的贡献度,选出最佳的分类方案。随机森林ntree和mtry的参数寻优采用了基于OOB误差值的网格搜索法,随机森林分类算法与网格搜索算法均在IDL8.5语言平台实现。
4 结果
4.1 多端元混合像元分解结果
图4 MESMA组分丰度图Fig.4 MESMA fraction maps
由MESMA方法生成的植被、不透水面、裸土组分丰度图如图4所示,组分丰度范围在 -0.05~1.05之间,丰度越高越接近该类地物。可以看出,与真彩色影像(图4a)相比较,植被(图4b)、不透水面(图4c)和裸土(图4d)的组分丰度分布边界清晰,与研究区实际情况基本一致,如图4位置①中的植被、位置②中的不透水面和位置③中的裸土等。
4.2 随机森林分类结果与精度评价
利用基于OOB误差值的网格搜索法在ntree范围1~600内对3个模型进行参数寻优,3个模型的mtry和ntree最优参数分别为(3,102)、(4,188)和 (5,126)[30-31],利用以上参数分别执行随机森林分类算法得到分类结果,3个模型分类总体精度分别为85.36%、89.48%和90.50%。由变化幅度看,多光谱特征模型在增加了纹理变量后,精度提升幅度最大为4.12%,而在加入组分特征变量后分类精度得以进一步提高。各模型分类图的局部效果如图5所示。
图5 分类结果局部效果对比Fig.5 Comparisons of local classification result
从图5视觉效果看,图5a中模型2的分类结果明显优于模型1,模型1位置①、③中错分为工矿用地的像素、位置②中错分为水域的像素,相应的在模型2中都得到了较好改善;模型1结果椒盐效果较为明显,而在模型2中增加了纹理特征变量后,椒盐效果消除显著,各地类的分布更加均匀连片。模型3与模型2结果相比较,分类精度进一步提高,如图5b所示,模型2中标记位置的错分像素点相应在模型3结果中有所改善,椒盐效果得以进一步消除,图面更加整洁美观。
3个模型中,模型3分类精度最高达90.50%,混淆矩阵见表4,其中精度在80%以下的为工矿用地和建设用地,分别为79.41%和67.97%,与林地、耕地、水域相比精度相对较低,说明实验方法在区分工矿和建设用地中还存在一定局限性,但较之模型1的 51.84%和 51.63%,分别提高 27.57%和16.34%,可知在随机森林分类方法框架下,增加了纹理变量和组分变量后,影像的分类精度提高显著。
表4 模型3精度评价Tab.4 Accuracy assessm ent ofm odel 3 %
4.3 特征变量重要性估计
如前所述,随机森林分类方法的优势之一是可以评估特征变量的重要性和贡献度。图6表示根据OOB误差得出的模型3的特征变量重要性排序,由图可知排序靠前的特征变量主要为原始光谱特征变量和光谱指数变量,其中R、SWIR2、MNDWI、B 4个特征变量重要性值均大于0.8,排序最为靠前,原因是研究区域内林地植被面积所占比重最高达55.58%,而植被在红光波段具有强吸收的特性,所以R变量在研究区域内对于大范围的植被信息提取贡献度最高;SWIR2重要性高是因为土壤在短波红外区有强反射的特性,而研究区内耕地土壤面积占比24.01%,仅次于植被林地,所以在分类过程中SWIR2对土壤信息的提取起到了重要作用;MNDWI重要性较高的原因可能是因为研究区域内包含了赤水河的一部分和若干水域,虽然面积占比不高,但分布较为集中易于识别,所以使得MNDWI重要性较高;而Landsat-8 OLI的蓝光波段在水体制图、土壤和植被之间的区分时作用较大,所以B变量的重要性排序也较为靠前。重要性值在0.5~0.8之间的特征变量为SWIR1、SAVI、NDVI、BCI、PC8、PC4,其中3个光谱指数分别适用于提取土壤(SAVI)、植被(NDVI)和不透水面(BCI),由此看出这3个光谱指数可有效增强影像类间的可分性。组分特征变量的重要性值在0.2以下,原因是组分变量是基于原始影像数据线性变换生成,与原始数据的相关性相对较高,且信息量的丰富程度上也不及原始数据,所以在排序中相对靠后,而各变量中纹理特征变量中的PC3、PC5重要性最低。以上结果说明虽然组分、纹理特征变量的融合可以提高随机森林分类方法的精度,但在变量的重要程度上,还是原始光谱特征变量与其相应光谱指数变量对分类的贡献度更高,这也与一些学者的研究结论一致。
图6 模型3特征变量重要性Fig.6 Feature variables importance value ofmodel 3
4.4 不同方法分类结果比较
为评估本文方法在众多分类方法中的表现,将模型3(记为RF_MESMA)、模型2(记为RF)的分类结果分别与基于LSMA和RF方法的分类结果、目前应用范围较广的SVM和MLC方法分类结果进行了比较。其中,LSMA与MESMA采用相同的端元进行混合像元分解,生成植被、土壤、不透水面3种组分数据,与RF方法相结合进行影像分类(记为RF_ LSMA);SVM和MLC分成2种情况,即组分特征变量参与分类和未参与分类,以相同的训练和验证样点,构建了4种模型进行实验,模型分别为:组分特征变量参与分类的SVM模型(记为SVM_MESMA),组分特征变量未参与分类的 SVM模型(记为SVM);组分特征变量参与分类的MLC模型(记为MLC_MESMA),组分特征变量未参与分类的MLC模型(记为MLC)。通过比较各方法的特征变量数、分类总体精度和Kappa系数,分析各组合、分类方法对山丘区土地利用信息分类提取的适用性,比较结果如表5所示。
表5 不同方法精度评价Tab.5 Accuracy assessment of classification result based on differentmethods
对照结果可知,RF、SVM、MLC 3种方法相比较,RF结果精度最优达89.48%。各分类方法在加入MESMA生成的组分特征变量后,分类精度都有不同程度的提高,分别提高1.02个百分点、0.06个百分点、0.63个百分点,其中RF_MESMA方法模型的分类结果精度最高为90.50%,与SVM_MESMA、MLC_MESMA相比精度分别高1.65个百分点和4.15个百分点,说明MESMA方法生成的组分信息数据作为特征变量参与分类后可在一定程度上提高影像的分类精度。
RF_MESMA与RF_LSMA方法相比较,前者精度为90.50%,后者精度为89.96%,说明MESMA方法对于提高信息分类提取精度作用更为明显。
模型3(RF_MESMA)分类结果如图7b所示,与原始影像图7a相比可看出,影像中主要地类信息都得到了有效的提取。
5 结束语
MESMA可以获得较为精确的组分丰度信息; RF分类结果优于相同特征变量下的SVM和MLC分类结果;在MESMA生成的组分信息变量参与分类后,3种方法的分类精度均有所改善,分别达到90.50%、88.85%、86.35%,其中RF的分类精度改善最为显著;MESMA与LSMA生成的组分信息变量相比,前者对于改善分类精度效果更为明显。MESMA对于提高影像分类精度起到一定积极作用,基于MESMA和RF的方法对中等空间分辨率影像山丘区土地利用信息分类提取的精度较高,利用该方法开展遥感影像解译可为大尺度的土地利用、复垦监测和管理工作提供技术支持和理论参考。
图7 影像分类图Fig.7 Classification results of image
1 林楠,姜琦刚,杨佳佳,等.基于资源一号02C高分辨率数据的农业区土地利用分类[J/OL].农业机械学报,2015,46(1): 278-284.http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?flag=1&file_no=20150139&journal_id=jcsam.DOI:10.6041/j.issn.1000-1298.2015.01.039.LIN Nan,JIANG Qigang,YANG Jiajia,et al.Classifications of agricultural land use based on high-spatial ZY1-02C remote sensing images[J/OL].Transactions of the Chinese Society for Agricultural Machinery,2015,46(1):278-284.(in Chinese)
2 张增祥,汪潇,温庆可,等.土地资源遥感应用研究进展[J].遥感学报,2016,20(5):1243-1258.ZHANG Zengxiang,WANG Xiao,WEN Qingke,et al.Research progress of remote sensing application in land resources[J].Journal of Remote Sensing,2016,20(5):1243-1258.(in Chinese)
3 FENG Quanlong,GONG Jianhua,LIU Jiantao,et al.Flood mapping based on multiple endmember spectralmixture analysis and random forest classifier—the case of Yuyao,China[J].Remote Sensing,2015,7(9):12539-12562.
4 马孟莉,朱艳,李文龙,等.基于分层多端元混合像元分解的水稻面积信息提取[J].农业工程学报,2012,28(2):154-159.MA Mengli,ZHU Yan,LIWenlong,et al.Extracting area information of paddy rice based on stratified multiple endmember spectralmixture analysis[J].Transactions of the CSAE,2012,28(2):154-159.(in Chinese)
5 王浩,吴炳方,李晓松,等.流域尺度的不透水面遥感提取[J].遥感学报,2011,15(2):388-400.WANG Hao,WU Bingfang,LIXiaosong,etal.Extraction of impervious surface in Hai Basin using remote sensing[J].Journal of Remote Sensing,2011,15(2):388-400.(in Chinese)
6 缪春华,张显峰,刘羽.基于多端元光谱分解的干旱区植被覆盖度遥感反演[J].应用生态学报,2012,23(12):3243-3249.MIU Chunhua,ZHANG Xianfeng,LIU Yu.Remote sensing retrieval of vegetation coverage in arid areas based on multiple endmember spectral unmixing[J].Chinese Journal of Applied Ecology,2012,23(12):3243-3249.(in Chinese)
7 马玥,姜琦刚,孟治国,等.基于随机森林算法的农耕区土地利用分类研究[J/OL].农业机械学报,2016,47(1):297-303.http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?flag=1&file_no=20160140&journal_id=jcsam.DOI:10.6041/ j.issn.1000-1298.2016.01.040.MA Yue,JIANG Qigang,MENG Zhiguo,et al.Classification of land use in farming area based on random forest algorithm[J/OL].Transactions of the Chinese Society for Agricultural Machinery,2016,47(1):297-303.(in Chinese)
8 郭玉宝,池天河,彭玲,等.利用随机森林的高分一号遥感数据进行城市用地分类[J].测绘通报,2016(5):73-76.
9 杨珺雯,张锦水,朱秀芳,等.随机森林在高光谱遥感数据中降维与分类的应用[J].北京师范大学学报:自然科学版,2015,51(1):82-88.YANG Junwen,ZHANG Jinshui,ZHU Xiufang,et al.Random forest applied for dimension reduction and classification in hyperspectral data[J].Journal of Beijing Normal University:Natural Science,2015,51(1):82-88.(in Chinese)
10 王书玉,张羽威,于振华.基于随机森林的洪河湿地遥感影像分类研究[J].测绘与空间地理信息,2014,37(4):83-85.WANG Shuyu,ZHANG Yuwei,YU Zhenhua.Classification of Honghe Wetland remote sensing image based on random forests[J].Geomatics&Spatial Information Technology,2014,37(4):83-85.(in Chinese)
11 张玉芳,庞艳梅,刘琰琰,等.近50年四川省水稻生产潜力变化特征分析[J].中国生态农业学报,2014,22(7):813-820.ZHANG Yufang,PANG Yanmei,LIU Yanyan,et al.Potential productivity of rice in Sichuan Province in recent five decades[J].Chinese Journal of Eco-Agriculture,2014,22(7):813-820.(in Chinese)
12 孙园园,徐富贤,孙永健,等.四川稻作区优质稻生产气候生态条件适宜性评价及空间分布[J].中国生态农业学报,2015,23(4):506-513.SUN Yuanyuan,XU Fuxian,SUN Yongjian,etal.Suitability evaluation of eco-climatic conditions for high quality rice production in Sichuan Province[J].Chinese Journal of Eco-Agriculture,2015,23(4):506-513.(in Chinese)
13 肖科.泸州市土地整理效益分析与评价[D].雅安:四川农业大学,2009.
14 刘正春,曾永年,何丽丽,等.基于光谱归一化的变组分光谱混合分析(NMESAM)方法及其应用[J].遥感技术与应用,2012,27(2):159-167.LIU Zhengchun,ZENG Yongnian,HE Lili,et al.Method of normalized multiple endmember spectralmixture analysis and its application[J].Remote Sensing Technology and Application,2012,27(2):159-167.(in Chinese)
15 MAXWELL A E,WARNER T A.Differentiating mine-reclaimed grasslands from spectrally similar land cover using terrain variables and object-basedmachine learning classification[J].International Journal of Remote Sensing,2015,36(17):4384-4410.
16 WU Chaofan,DENG Jinsong,WANG Ke,et al.Object-based classification approach for greenhouse mapping using Landsat-8 imagery[J].International Journal of Agricultural&Biological Engineering,2016,9(1):79-88.
17 丁建丽,姚远.干旱区绿洲典型地物MESMA模拟分解与验证[J].地球信息科学学报,2013,15(3):452-460.DING Jianli,YAO Yuan.Research on pixel un-mixing of typical surface features in oasis based on the MESMA model[J].Journal of Geo-information Science,2013,15(3):452-460.(in Chinese)
18 POWELL R L,ROBERTS D A,DENNISON P E,et al.Sub-pixel mapping of urban land cover using multiple endmember spectralmixture analysis:Manaus,Brazil[J].Remote Sensing of Environment,2007,106(2):253-267.
19 DENNISON P E,ROBERTS D A.Endmember selection for multiple endmember spectral mixture analysis using endmember average RMSE[J].Remote Sensing of Environment,2003,87(2):123-135.
20 DENNISON P E,HALLIGAN K Q,ROBERTS D A.A comparison of error metrics and constraints for multiple endmember spectralmixture analysis and spectral anglemapper[J].Remote Sensing of Environment,2004,93(3):359-367.
21 LIU Jiantao,FENG Quanlong,GONG Jianhua,et al.Land-cover classification of the Yellow River Delta wetland based on multiple endmember spectralmixture analysis and a random forest classifier[J].International Journal of Remote Sensing,2016,37(8):1845-1867.
22 徐涵秋,王美雅.地表不透水面信息遥感的主要方法分析[J].遥感学报,2016,20(5):1270-1289.XU Hanqiu,WANGMeiya.Remote sensing-based retrievalofground impervious surfaces[J].Journal of Remote Sensing,2016,20(5):1270-1289.(in Chinese)
23 DENG Chengbin,WU Changshan.BCI:a biophysical composition index for remote sensing of urban environments[J].Remote Sensing of Environment,2012,127(5):247-259.
24 王文静,张霞,赵银娣,等.综合多特征的Landsat 8时序遥感图像棉花分类方法[J].遥感学报,2017,21(1):115-124.WANGWenjing,ZHANG Xia,ZHAO Yindi,etal.Cotton extractionmethod of integratedmulti-features based onmulti-temporal Landsat8 images[J].Journal of Remote Sensing,2017,21(1):115-124.(in Chinese)
25 BREIMAN L.Random forest[J].Machine Learning,2001,45(1):5-32.
26 赵玉,王红,张珍珍.基于遥感光谱和空间变量随机森林的黄河三角洲刺槐林健康等级分类[J].遥感技术与应用,2016,31(2):359-367.ZHAO Yu,WANG Hong,ZHANG Zhenzhen.Forest healthy classification of Robinia pseudoacacia in the Yellow River Delta,China based on spectral and spatial remote sensing variables using random forest[J].Remote Sensing Technology and Application,2016,31(2):359-367.(in Chinese)
27 EISAVIV,HOMAYOUNIS,YAZDI A M,et al.Land cover mapping based on random forest classification ofmultitemporal spectral and thermal images[J].Environmental Monitoring and Assessment,2015,187(5):291.
28 GHOSH A,SHARMA R,JOSHIPK.Random forest classification of urban landscape using Landsat archive and ancillary data: combining seasonalmapswith decision level fusion[J].Applied Geography,2014,48(2):31-41.
29 雷震.随机森林及其在遥感影像处理中应用研究[D].上海:上海交通大学,2012.
30 王兴玲,李占斌.基于网格搜索的支持向量机核函数参数的确定[J].中国海洋大学学报,2005,35(5):859-862.WANG Xingling,LI Zhanbin.Identifying the parameters of the kernel function in support vector machines based on the gridsearchmethod[J].Periodical of Ocean University of China,2005,35(5):859-862.(in Chinese)
31 刘颖.基于机器学习的遥感影像分类方法研究[M].北京:清华大学出版社,2014.
Classification and Extraction of Land Use Information in Hilly Area Based on MESMA and RF Classifier
CHEN Yuanpeng1,2YUNWenju2ZHOU Xu2PENG Junhuan1LIShaoshuai1,2ZHOU Yan2
(1.School of Land Science and Technology,China University of Geosciences(Beijing),Beijing 100083,China 2.Land Consolidation and Rehabilitation Center,Ministry of Land and Resource,Beijing 100035,China)
Due to the factors such as sensor spatial resolution and heterogeneity of surface features,the mixed-pixels were commonly found in medium-spatial resolution remote sensing data,especially in hilly areas,strong topographic relief,diversity,breakage,mixed distribution and scattered layout of the surface features and other factors constituted the difficulties of remote-sensing image classification mapping.In order to improve the classification accuracy for land use in hilly areas and provide data support for land use monitoring,a combined approach ofmultiple endmember spectralmixture analysis (MESMA)and random forest(RF)was explored.Based on data source of Landsat-8 operational land imager(OLI)sensor data,the fractional abundance of vegetation,impervious surface and soilwas firstly extracted through MESMA.Secondly,totally 20 feature variables were figured out and three combined modelswere constructed on the basis of data image spectrum,texture and fraction variables to carry out random forest classification experiment.Through comparing between the optimal result from the experiment and SVM and MLC classification results,including the same number of variables,the results indicated that MESMA can derive accurate fraction information.The inclusion of fraction information could help to improve themapping accuracy of all classification methods(RF,SVM and MLC),which can be up to 90.50%,88.85%and 86.35%,respectively,the gain of RF classification accuracy was most significant.Comparing with LSMA,the fraction variable generated by MESMA wasmore useful for improving the accuracy.The combinedmethod ofMESMA and RF can achieve the comparatively accurate classification map in the multi-feature variables.The accuracy was better than those of SVM and MLCclassification results with the same feature variables.Therefore,the proposed method can obtain high precision in land use classification in hilly area.Based on this method,remote sensing image interpretation of large scales can provide technical support and rational reference for land reclamation monitoring.
classification of land use;medium-spatial resolution;multiple endmember spectralmixture analysis;random forest;hilly area
TP79;S127
A
1000-1298(2017)07-0136-09
2017-04-28
2017-05-18
国土资源部公益性行业科研专项(201511010-02)
陈元鹏(1988—),男,博士生,国土资源部土地整治中心工程师,主要从事遥感技术和土地复垦研究,E-mail:cyp520918@163.com
10.6041/j.issn.1000-1298.2017.07.017