基于浅层学习方法的石漠化休耕试点区作物分类*
2019-07-03董秀春李宗南
董秀春,蒋 怡,黄 平,李宗南,刘 轲
(四川省农业科学院遥感应用研究所,成都610066)
0 引言
休耕监测,是配合农业农村部休耕轮作试点开展的重要工作,通过遥感快速监测地块是否休耕或种植有保护地力的绿肥作物,为有关部门的管理及农户休耕补贴发放提供客观信息[1-3]。云南石漠化休耕区地块破碎,种植结构复杂,分辨率较粗的遥感影像难以满足休耕地块监测精度需要,已进行的休耕监测采用了RapidEye、Planet等空间分辨率优于5 m的遥感影像。随着农业监测使用的遥感影像空间分辨率、时间分辨率提高,传统分类方法存在效率和精度的不足。机器学习利用先验知识使分类器进行自我学习,可更深层次挖掘影像光谱、纹理等特征信息,根据其模型结构可分为浅层学习和深度学习。常用的浅层机器学习分类器包括决策树、支持向量机、随机森林、Softmax等[4-5];较深度学习方法,具有模型结构较简单、训练样本需求少、运算速度快等特点,在冬小麦[6-7]、大豆和玉米[8]、棉花[7]、水稻[9]等作物分类提取研究中取得较高分类精度。Softmax分类器适合于多类别的自动分类[10],其在高分辨率影像多种土地覆盖分类中有良好表现[10-11],因而拟使用Softmax分类器进行休耕区多种作物的遥感分类。文章分析基于Softmax分类器和RapidEye遥感影像提取研究区绿肥、水稻、玉米及烟草等4种作物空间分布信息的精度及误差因素,为使用浅层机器学习方法快速准确掌握休耕情况提供参考。
1 研究区与数据
1.1 研究区概况
研 究 区 地 处 云 南 省 石 林 彝 族 自 治 县 北 部,位 于 东 经 103°10′~103°41′、 北 纬24°30′~25°03′之间,见图1。该区域平均海拔约1 900 m,属低纬高原山地季风气候,年平均气温16.3℃,年平均降雨量940 mm,年平均日照2 097 h。岩溶地貌明显,岩溶面积位于昆明市第一,土地石漠化严重,面积占全县岩溶面积的28.43%[12],是云南省首批被确定为耕地休耕制度试点县之一。研究区内夏季种植作物主要包括水稻、玉米、烟草等;休耕作物为光叶紫花苕,是云南休耕地区用于养地的绿肥作物。
图1 研究区位置Fig.1 Location of the study area
1.2 卫星遥感影像
使用2017年8月2日获取的RapidEye卫星影像。RapidEye影像幅宽77 km,空间分辨率为5 m,包括蓝(440~510 nm)、绿(520~590 nm)、红(630~685 nm)、红边(690~730 nm)、近红外(760~850 nm)5个波段,其中红边波段是首颗商业卫星提供的波段,可增加地物间的可分离度,提高农作物识别精度[13]。
1.3 地面调查
结合Google Earth高清影像,在研究区内建立7个随机分布的样方,样方大小为500 m×500 m。于2017年7月17—24日到实地开展地面调查,确定样方各地块种植的作物和覆盖类型,样方调查结果作为分类的解译标志和精度验证数据。
2 研究方法
2.1 影像预处理
将获取的RapidEye影像在ENVI5.5中进行大气校正、正射校正、重投影、几何精校正等预处理。计算影像的增强型植被指数(Enhanced Vegetation Index,EVI),通过波段组合,以增加影像波段属性,提高地物可区分性[10]。
2.2 Softmax分类器
Softmax模型为Logistic回归模型在多分类问题上的扩展,属于监督学习算法,需要提供训练样本和测试样本以及相应的分类标签。基本思路为[14]:对于m个样本,为训练集及其所对应的标签为:{(x(1),y(1)),(x(2),y(2)),…,(x(m),y(m))},其中样本x(i)定义为n+1维向量,y(i)∈{1,2,…,k},则样本x(i)对应类别k的估计概率为:
式(2)中,1{y(i)=j}为示性函数,当大括号中为真时,该函数结果为1,反之为0。
2.3 Softmax分类
在ENVI5.5中使用Softmax分类器对研究区4种典型作物进行遥感识别与空间信息提取。选取RapidEye影像的第5,4,3波段,分别赋予红、绿、蓝3色进行假彩色合成,突出各类作物显示效果,便于选取训练区。根据地面调查,在研究区选取各地物的感兴趣区,包括绿肥、水稻、玉米、烟草等4种典型作物以及林地、水体、建筑物等地物。通过训练样本对Softmax分类器进行训练,使绘制的损失曲线收敛到最小,利用训练效果最优的分类器进行分类,得到研究区的分类结果。Softmax分类技术流程见图2。
图2 Softmax分类技术流程Fig.2 Process of Softmax classification
2.4 精度评价与验证
评价基于Softmax分类器的4种典型作物分类精度,并与基于极大似然法的分类结果进行比较。
3 结果与分析
使用RapidEye影像的多作物分类结果见图3,Softmax法的分类结果较极大似然法减少了“椒盐噪声”现象。根据地面样方数据验证,精度评价结果见表1。研究区内Softmax分类器对绿肥、水稻、玉米和烟草的分类总精度为85.98%,Kappa系数为0.815 7;较极大似然分类高4.59%和0.061 7,并减少了错分、漏分像元。
图3 两种方法分类结果(部分区域)Fig.3 Results of two method(Part of the study area)
比较Softmax法4类作物的分类效果,绿肥、水稻、烟草的生产者精度和用户精度均达到84%以上,玉米则低于75%。主要由于研究区内绿肥、水稻、烟草种植较为集中;而玉米种植地块的面积小且在空间上极为分散。根据表1两种方法的混淆矩阵结果可见,绿肥与烟草错分问题较明显。根据地面调查情况,认为绿肥与烟草易混淆主要原因包括两方面:一方面研究区休耕地块的肥力及管理差异大导致不同地块绿肥长势差异明显,出现“同物异谱”;另一方面则是监测期间的烟草处于采收季,部分采收后地块植被情况与绿肥接近,出现“异物同谱”。
表1 两种分类方法的混淆矩阵Table 1 Confusion matrix of two classification methods
4 结论与讨论
通过遥感手段快速准确获取休耕区内地块种植情况,监测结果对地块休耕现状判别具有重要作用。研究利用2017年8月2号获取的RapidEye影像,采用浅层机器学习Softmax分类器在云南省石林县部分休耕试点区开展夏季绿肥作物、水稻、玉米及烟草等4种典型作物的遥感分类,得出如下结论:(1)基于Softmax方法的4种典型作物分类的总体精度和Kappa系数分别为85.67%和0.811 6,极大似然为81.39%和0.754 0,Softmax方法分类精度略高于极大似然;(2)绿肥、水稻、烟草的生产者精度和用户精度远高于玉米,因研究区内地块作物种植集中程度影响分类精度;(3)“同物异谱、异物同谱”现象导致绿肥与烟草错分问题较明显。
该文研究浅层机器学习分类器在云南休耕地区夏季多作物遥感分类效果,较常用的最大似然法,分类精度有所提高。使用高精度作物空间分布信息进一步与休耕地块矢量数据结合,可去除非休耕监测区临近地物的影响,提高休耕地块的判别精度,减少地块休耕误判以及外业核查工作量。随着对农业精准监测需求的增加,越来越多高时空分辨率的多光谱、高光谱遥感数据应用于农业监测,数据量大、质量不统一等遥感大数据问题需通过整合系统、复杂的算法加以解决。浅层机器学习分类算法小样本学习和过拟合等不足将影响其进一步应用。深度学习方法使用更大规模的训练数据、构建更复杂的模型,能实现更多种类地物的精确识别与分类,降低过拟合的程度。因此,未来将根据我国遥感大数据发展,开展农作物遥感训练数据集整理、深度学习模型研究等工作。