基于U-Net的甘蔗提取方法
2019-02-09董秀春李宗南
董秀春,蒋 怡,王 思,李宗南,王 昕
(四川省农业科学院遥感应用研究所,成都610066)
0 引言
近年来,随着空间信息技术的发展和遥感平台的不断更新,不同成像方式、不同波段和分辨率的遥感数据并存,形成了多源、海量、多时相的遥感大数据[1]。为充分利用遥感大数据,需要更高的遥感影像分析、海量数据处理和信息提取能力[2-3]。传统的遥感影像处理和分析技术难以满足多源异构海量大数据的处理精度和效率需求。以支持向量机[4]、随机森林[5]、Softmax[6]等为代表的浅层机器学习方法可有效改善传统监督分类方法目标识别的准确度和分类精度,但其学习能力和泛化能力有限,难以满足海量遥感影像分类的需求。深度学习是机器学习的重要分支,是一种模拟人脑神经结构处理信息的方法,能有效地进行特征选择与特征提取,已在图像识别分类、语音识别、自然语言处理等多应用领域取得较大突破[7-8],为遥感大数据信息提取提供了新方法[9]。研究人员通过使用高分辨率真彩色影像进行图像分类[10]和目标识别[11-12],在土地覆盖分类、地籍边界线提取等方面取得较好的应用效果。
甘蔗是云南边疆地区农民脱贫致富的重要产业[13]。掌握甘蔗空间分布及时空变化可为地方政府、农业部门进行作物种植结构调整提供重要参考[14]。目前,甘蔗遥感分类提取方法包括监督分类[15]、面向对象分类[16]和决策树[17-18]等,研究人员通过EOS/MODIS、HJ卫星遥感数据,实现了甘蔗种植信息提取、面积估算以及动态监测。U-Net具有较强的语义分割功能,可对图像上的每个像素点实现语义标注,目前在高分辨率遥感影像分类中得到较好的应用[19-20]。为探索基于深度学习的甘蔗种植空间信息提取方法,文章以云南省陇川县甘蔗种植园为研究对象,采用基于U-Net的神经网络模型提取甘蔗种植空间信息,利用地面样方数据评价模型精度,为基于深度学习方法的甘蔗空间信息提取提供技术参考。
1 数据与方法
1.1 研究区概况
研究区隶属于云南省德宏州陇川县,位于云南省德宏州西南部(图1)。该区域属于南亚热带季风气候,以河谷盆地、丘陵为主,平均海拔930~1 100 m,年均气温18.4~20.3℃,年降雨量1 400~1 700 mm,年日照时间2 281~2 453 h,昼夜温差大,霜期短少,充足的气候资源和土地资源适宜甘蔗生长。
图1 研究区位置及影像示意图Fig.1 Location and Google Earth imagery of study area
1.2 数据源
1.2.1 Google Earth数据
Google Earth影像是Google公司自2005年推出的高空间分辨率RGB合成影像,用户可通过Google Earth(GE)虚拟地球软件实时浏览和下载。云南秋冬季节可获取清晰无云遥感影像,10—11月为甘蔗伸长期,是甘蔗最佳遥感监测时期。下载2018年11月28日空间分辨率为0.26 m、19级的RGB合成影像为数据源,经重采样、裁剪等预处理,形成空间分辨率为0.5 m、影像幅宽为8 km×8 km的待分类影像,覆盖区域地形分为典型的平坝和丘陵地区,如图1所示。
1.2.2 样方数据
结合农业农村部大宗作物遥感监测地面调查数据,确定甘蔗解译标志。将研究区分为甘蔗和非甘蔗两类。选取甘蔗感兴趣区建立样本数据集,其中用于训练的样本200个,用于验证的样本40个(图1)。在研究区随机建立4个大小为500 m×500 m的样方,随机分布于平坝区和丘陵区,如图1黑色方框标注范围所示,目视解译获取样方内甘蔗种植面积和空间分布,作为分类精度验证数据。
1.3 甘蔗提取
使用ENVI5.5中的深度学习模块进行甘蔗空间信息提取。该模块是基于TensorFlow深度学习框架的遥感图像分类工具,采用基于U-Net神经网络模型进行影像分类处理,该模型是典型的全卷积神经网络模型,由压缩通道和扩张通道组成。压缩通道是卷积神经网络结构,重复采用2个卷积核大小均为3×3的卷积层和1个2×2步长为2的最大池化层,逐层完成影像特征提取,在每次下采样过程中,特征通道的数量会加倍;扩展通道中每个步骤首先通过2×2的反卷积对特征图进行上采样,减半特征通道数量,然后再拼接对应压缩通道特征图,同时进行2次3×3的卷积进行特征提取,重复该步骤,在最后的输出层,通过卷积核大小为1×1的卷积层将特征图映射到1个灰度图像,其像素代表属于感兴趣特征的概率。具体步骤为:首先构建U-Net网络模型,然后加入训练样本和验证数据进行模型训练;最后使用模型进行影像分类,根据验证数据计算混淆矩阵,评价模型分类结果。
2 结果与分析
该文采用2018年11月28日空间分辨率为0.5 m的Google Earth影像数据,基于U-Net模型对云南省德宏州甘蔗种植区8 km×8 km的范围进行种植空间信息提取,结果如图2所示。U-Net模型精度验证结果表明,基于Google Earth影像的深度学习分类总精度为92.76%,Kappa系数为0.848 0,面积总精度为94.41%。根据图2,基于Google Earth开放数据的甘蔗深度学习分类效果良好,大部分甘蔗均能被较好识别。部分地物存在错分,如部分河流区域草地、操场人工草坪、湖泊错分为甘蔗,如图2中矩形和椭圆形圈出部分。与典型的平坝、丘陵区域的分类精度比较结果见表1。平坝区、丘陵区分类精度存在明显差异。其中,平坝区的分类总精度比丘陵区高约9%,Kappa系数较丘陵区域高约0.16;甘蔗的错分、漏分误差显示平坝区较低,尤其是漏分误差显著低于丘陵 区。
不同区域分类精度存在明显差异的主要原因是平坝区域地块形状规则、界线清晰,便于特征对象分割提取;平坝区域水肥条件好,大部分甘蔗长势整齐,整体纹理特征一致,有利于特征识别。丘陵区域受地形、水肥条件、管理水平等影响,甘蔗长势参差不齐,呈现出较大的纹理特征差异,部分长势较差的甘蔗漏分较多;部分地块受其他作物或植被干扰,地块界线模糊,出现错分现象,影响了整体分类结果。部分地物RGB影像特征与甘蔗相似,导致部分地物存在错分现象。
图2 基于U-Net的甘蔗提取结果Fig.2 Classification results of Sugarcane based on U-Net in study area
表1 不同区域分类精度验证结果Table 1 Classification accuracy in different regions
3 结论与讨论
U-Net网络模型具有结构清晰的优点,能够在小样本数据集下获得较好的训练效果[21],可在一定程度上解决深度学习在作物空间信息提取中受限于作物样本数据集缺乏的问题。研究以云南陇川县甘蔗种植区0.5 m的Google Earth影像进行U-Net模型训练和甘蔗分类提取,经地面样方数据验证,基于U-Net模型的甘蔗分类总体精度和Kappa系数分别为92.76%和0.848 0,结果表明该方法可行,可为基于深度学习方法的甘蔗空间信息提取提供技术参考。
研究使用Google Earth开源高分辨率影像进行基于U-Net的甘蔗深度学习分类方法探索,结合研究结果,未来仍需进一步尝试使用多光谱(尤其是带有红边波段)影像数据进行作物深度学习分类方法研究。开放的Google Earth影像数据是研究人员常用空间参考数据,被应用在农作物面积地面样方调查[22]、遥感影像分类[23-24]等多项研究中。但分类结果显示,受部分地物RGB影像特征与甘蔗相似的影响,使用Google Earth开放的RGB合成影像存在部分较明显的错分现象。相关研究表明,更广的光谱范围有利于地物识别[25],因此,需进一步研究多光谱影像作物空间信息提取方法,以减少作物错分、漏分现象,提高作物分类提取精度。