深度学习农作物分类的弱样本适用性
2022-08-11许晴张锦水张凤盖爽杨志段雅鸣
许晴,张锦水,张凤,盖爽,杨志,段雅鸣
1.北京师范大学 遥感科学国家重点实验室,北京 100875;2.北京师范大学 地理科学学部北京市陆表遥感数据产品工程技术研究中心,北京 100875;3.北京师范大学 地理科学学部遥感科学与工程研究院,北京 100875
1 引 言
准确的分类图是作物面积估算、长势动态监测和产量预测等方面有着重要的用途,也是研究全球变化、物质与能量流动的支撑数据,被广泛应用于农业管理、作物保险、供应链物流等领域(Cai等,2018)。
传统的农作物遥感分类方法,如支持向量、机SVM(Support Vector Machine)和随机森林RF(Random Forest)已经比较成熟,能够充分利用遥感影像的自身特征进行作物的识别(Belgiu 和Drăguţ,2016;Rodriguez-Galiano 等,2012;Rudiyanto等,2019),主要流程包括遥感数据预处理、获取训练样本、反演和确定分类特征、选择特定分类器和评价精度等(Lu 和Weng,2007),其中分类特征和分类器是影响分类结果的关键因素(贾坤和李强子,2013)。但在实际应用中,基于人工的训练样本选择和特征提取过程高度依赖专家经验和行业知识,缺乏灵活度,难以实现高效的自动化生产。
随着人工智能的技术迅速发展,大数据驱动的深度学习在计算机视觉、语音识别和自然语言处理等诸多领域被广泛应用,成为近十年来的研究热点(Ball 等,2017)。深度卷积神经网络DCNN(Deep Convolutional Neural Networks)是一种被广泛研究与应用的深度学习模型(Hinton 等,2006;曲景影等,2016),能克服传统分类方法的缺点,实现“端到端”自动化分类,高效地提炼出大量深层次特征,具有强大的处理复杂分类问题的能力、鲁棒性和泛化性(贾坤和李强子,2013;刘大伟等,2016;杨红卫和童小华,2012)。近年来,深度卷积神经网络已逐渐拓展到遥感影像的研究中,如针对中高分辨率卫星的目标检测(Audebert 等,2018)和语义分割(Zhang 等,2020;Zhong 等,2019)、对高光谱影像进行空间和光谱变量提取(Hu 等,2015;Kussul等,2017;Li等,2017),以及SAR影像解译(Wagner,2014)等。遥感影像分类更是得益于其特征表达的灵活性、端到端的学习和运行的高效性。
大量高精度训练标签样本是训练深度学习模型的前提。如ImageNet 图像数据集(http://www.image-net.org/[2021-03-11])目前为2 万多个场景类别提供了1400 多万幅图像。对于农作物遥感分类而言,在训练卷积神经网络时,需要依靠大量准确、全覆盖的标记训练样本进行空间特征提取,而这需要大量人力物力的投入,限制了深度学习方法在农作物遥感分类的应用。
受Kaiser 等(2017)利用OpenStreetMap 弱标签样本进行房屋和道路提取的启发:有一定误差的弱标签样本也能够训练出高精准的模型,因此我们探讨利用传统分类方法提取出的作物分布作为样本来探讨用于训练深度学习模型的适用性。这种非100%准确精度的样本视为弱样本,但这些弱样本达到一定的识别精度,包含了丰富的作物特征信息,满足大样本的数量要求(Hao 等,2020)。本研究的目标是以传统分类方法识别的结果为样本(弱样本),训练DCNN,提取辽宁省水稻和玉米的空间分布,分析弱样本的适用性,讨论弱样本误差对分类模型鲁棒性的影响,解决获取大量DCNN样本困难的问题,为利用深度学习实现大尺度作物分类提供一定的技术铺垫。
2 研究区与数据
2.1 研究区概况
本文研究区为辽宁省,总面积为148×103km2(38°43′—43°26′N,118°53′—125°46′E)(图1),属于典型的温带大陆性季风气候区,雨热同期,地处中国最大的平原——东北平原,土壤肥沃,2017年耕地总面积约为32×103km2(来自FROMGLC 2017数据集),是中国重要的粮食农作物种植区和生产基地。该地区的主要粮食作物包括水稻和玉米,这两种作物的种植总面积超过了本省粮食作物种植面积的91%(数据来源于国家统计局2018年中国统计年鉴,http://www.stats.gov.cn/tjsj/ndsj/2018/indexch.htm[2021-03-11])。因此,准确快速地识别出水稻和玉米的空间分布对政府部门制定合理农业政策,调整农业种植结构具有重大意义。水稻和玉米属于同期生长作物,全年种植一季,具体生长物候期见表1。
图1 研究区概况Fig.1 The study area
2.2 遥感影像
许多研究利用不同关键时相遥感数据,捕捉不同作物的生长过程在遥感影像上的特征变化,从而提高农作物识别精度(Jia 等,2013;Murthy 等,2003;Shao 等,2001)。其中,选择最佳分类时相遥感数据是农作物分类的基础(贾坤和李强子,2013),如王娜等(2017)主要选取了3 个作物生长时期的GF-1 影像提取苏北地区水稻和玉米分布,总体精度最高达到了0.97。基于此,本文通过分析辽宁省作物生长的物候期(表1),选择作物生长的两个时相影像进行识别:(1)作物早期生长阶段,时间为4月15日—6月30日,基本上处于作物播种和出苗初期,这个阶段能够将作物和其他植被区分开,同时稻田中含水量高,遥感影像上水体特征明显,玉米地在影像上则呈现裸地或弱植被光谱特征;(2)作物生长旺盛阶段,时间为7月15日—9月30日,两种作物在遥感影像上均表现出强植被信息,这个阶段主要是通过作物的遥感特征进行识别。因此,将这两个时期数据视为关键期影像来识别玉米和水稻。
表1 辽宁省主要农作物物候表Table 1 Main crop calendar in Liaoning Province
分析整个区域的遥感影像,云是一个不可回避的限制性因素,几乎每一景影像上都有云的存在,为保证充分数量的影像用于作物识别,只要是整景影像云覆盖占比低于70%的影像都被用来作物的识别。因此本研究选取了215 景GF-1 WFV影像数据,第一阶段126 景,第二阶段89 景。影像有蓝(0.45—0.52µm)、绿(0.52—0.59µm)、红(0.63—0.69 µm)和近红(0.77—0.89 µm)4 个波段,空间分辨率为16 m。
GF-1 WFV 原始影像通过一系列标准化预处理,包括大气校正、几何精校正、云/云阴影检测和中值合成生成晴空影像,为便于影像处理采用30 km×30 km 格网单元进行组织,数据类型为16 位整型。云/云阴影等不可避免地干扰农作物识别结果,因此利用研究组提出的深度学习方法检测云和云阴影(Duan,2020),之后以中值合成方式生成无云影像(Roy等,2014),计算公式为
式中,xi为像元值,当xi在影像上为云像元时,则为空值。为了方便高效地管理和搜索数据,以边长为30 km 的矩形格网作为处理单元裁剪影像。格网中每个像元的取值为同生长季内无云影像像元值数组的中值,最后生成研究区两个时间窗口内的无云中值合成影像(图2)。
图2 研究区两期GF-1中值合成影像Fig.2 GF-1 median fusion images of two phases in our study area
2.3 检验数据
本研究的真实地表数据包括野外样点数据集和目视解译样方数据。野外样点数据为2017年在辽宁省采集的GPS 样点数据。在辽宁省测试区内,共收集了1250 个地面点,其中水稻98 个,玉米633 个,其他类别519 个(图3)。目视解译样方为在测试区内随机选取的14 个1 km×1 km 矩形样方(编号A—N),通过人工目视解译高分辨率影像获得样方内水稻、玉米和其他类别的空间分布,作为真实地表数据,如图3所示。
图3 野外采样点和目视解译样方分布Fig.3 Distribution map of field sampling points and visual interpretation samples
3 实验流程
3.1 SVM作物分类
利用SVM 分类结果作为训练标签样本训练模型。大量的标签样本是深度学习的基础,为训练出具备高精度和强泛化能力的深度卷积网络模型,获取足够多的训练标签样本数据是基本要求之一(庄福振等,2015)。利用ENVI 5.3 软件中监督分类的SVM 分类器工具分县区对辽宁省水稻、玉米和其他地物3 种类型分类,为DCNN 训练提供弱样本。辽宁省一共有100个县区。根据分类体系,参照2017年Google Earth 高分辨率影像,结合研究区的作物物候信息,以县区为单位采用随机手工选点的方式,获取了16966个地面点作为SVM分类的训练样本点,其中水稻3475 个,玉米7595 个,其他类别5896 个。该实验过程包括了分区县SVM 分类、人工分类后处理、耕地地块掩膜等操作,采用人机交互后处理方式保证识别结果的准确性。
3.2 构建模型数据集
根据模型训练需求,SVM 分类结果作为弱样本用于模型的训练,分为训练集和测试集。图2表明,辽宁省共有220 个30 km×30 km 格网,其中有61 个格网跨在省边界上,缺少部分的标签样本,这一部分格网作为测试数据;剩余159个格网按照7∶3 比例随机划分为训练数据和测试数据,并使各个数据集在不同地形地貌景观中均有分布,保证样本的多样性,如图4和图8(a)所示。之后将测试数据裁剪成256×256像元大小的切片,重叠度为50%,最终获得26024个遥感影像分块。
图4 数据集在不同地形地貌景观中的分布Fig.4 Image distributions in various terrain landscape
3.3 模型训练与作物识别
本研究在PSPNet 模型的基础上构建农作物分类模型。Zhao 等(2017)提出PSPNet 模型能够融合多层次特征,保留地物的局部空间信息的同时实现像元级的语义分割,具有较强的表征能力,提升分类的准确率。在此基础上,农作物遥感分类的深度卷积神经网络DCNN(Deep Convolutional Neural Network)模型做了一些改进(图5),主要包括2 个核心模块:加入膨胀卷积(Holschneider等,1990)的残差模块(He 等,2016)和金字塔平均池化模块。模型采用10 个残差结构块用于挖掘影像的深层抽象特征,并对最后3个残差块增加膨胀卷积层,增大模型对像元周围语义信息的感知度,防止深层特征丢失像元之间的空间关系。之后4个不同尺度的平均池化层将深层特征的上下文信息结合起来,来提高目标像元的定位精度。此外,考虑到本研究使用了2 个时期共8 个波段的遥感影像,我们也对模型的输入模块进行相应的调整,由传统的三通道变为八通道。在训练阶段,输入数据为8个波段两时期遥感影像块和对应弱样本标签;测试阶段仅输入遥感影像块。
图5 深度卷积神经网络(DCNN)框架Fig.5 Deep Convolutional Neural Network(DCNN)framework
输入训练集对DCNN进行训练,参考Krizhevsky等(2017)在ILSVRC-2012比赛中的学习策略对超参数进行设置。为了防止训练过拟合,我们采用随机分层分组的方法,从训练集中提取1/7 数据作为模型的验证数据。采用随机梯度下降法(SGD)更新权值,学习率衰减策略为fixed,固定学习速率为1×10-10,每批次容量为16,反复进行前向—后向传播计算,迭代优化模型。此外,分别将动量和权值衰减常数设为0.9 和5×10-4,平滑每次迭代的权值更新,增强网络学习的稳定性。为了避免因训练数据量小造成模型过拟合,将在ImageNet分类数据集预训练好的模型参数作为DCNN的初始化权值(Zhang 等,2020)。最后通过最小交叉熵损失函数值Loss 找到最优权值,对测试集进行预测分类,计算公式如下:
式中,N为批次容量,即等于16;C为类别总数,本研究C=3;ai为输入影像对应到每个类别标签i的概率。
3.4 弱样本混入噪声策略
为进一步验证弱样本能够支撑DCNN 模型分类,我们进一步设计噪声实验分析弱样本标签噪声对DCNN 分类的影响。已有相关研究(Kussul 等,2017;宋德娟等,2020)表明,使用CNN 模型提取遥感影像地物时,分类结果容易在小型目标地物及地物边缘地带出现错分和漏分现象。基于此,我们设计了玉米膨胀—水稻腐蚀实验,即扩大玉米分布来侵蚀水稻的分布,如图6所示。首先,从1 倍开始依次以1 倍的增量对弱样本中的玉米分布进行4 次膨胀运算,然后再增加5—40 倍膨胀运算,每次膨胀间隔5 倍,共8 次膨胀实验,因此获得12 个新的弱样本标签。之后利用新标签样本训练DCNN模型,对测试集进行分类并精度评价,分析DCNN分类模型对噪声标签的鲁棒性。需明确的是,在预实验中,发现玉米膨胀—水稻腐蚀和水稻膨胀—玉米腐蚀过程均能反映弱样本噪声对模型分类的影响,且原理相同,故本研究只介绍玉米膨胀—水稻腐蚀实验过程和结果。
图6 玉米膨胀—水稻腐蚀实验示意图Fig.6 The schematic diagram of corn dilation-rice erosion experiment
3.5 DCNN模型性能评价
本文通过野外样点、目视解译数据和SVM 分类结果3 种不同参考数据验证基于弱样本DCNN 模型识别作物的性能。野外采样点覆盖范围广,可从整体上反映模型的分类性能;目视解译数据精细到地块级别,用于具体分析不同农业景观下的分类效果和弱样本噪声对模型分类结果中作物地块识别细节的影响;SVM 结果在农作物分类上取得了很好的效果,作为弱样本训练模型也可视为一种参照,将DCNN识别结果与之对比,更好体现DCNN的优势。
采用总体精度OA(Overall Accuracy)、用户精度UA(User Accuracy)、制图精度PA(Producer Accuracy)、F1 分数(F1 score)、一致性指数CI(Consistency Index)作为量化的评价指标,计算公式如下:
式中,i指类别,n指类别总数,Pii指被正确分类的像元数,N指参考数据像元总数,Nr指结果分为第i类的像元数,Nt指参考数据中第i类的像元数,Pii_svm指与SVM 结果分类一致的像元数,Nsvm指SVM结果总像元数。
4 结果与讨论
4.1 弱样本结果分析
采用野外样点验证SVM 分类结果,总体精度达到了0.92,其中水稻和玉米的制图精度分别为0.97、0.80,用户精度均为0.97。通过比较相关研究结果发现(Waske和Benediktsson,2007;Yang等,2011;张健康等,2012),本研究中的作物分类精度与已有研究的结果提取出的作物精度(平均总体精度约为0.90)持平。统计分类结果计算出辽宁省水稻和玉米种植面积约为6×103km2、34×103km2,水稻种植为玉米的1/5,结合分类结果图7 可以看出,两种作物集中种植在中部平原区,少数分布在东西山区丘陵地带及东南沿海平原(图1),与耕地空间分布较为一致(图1)。
图7 辽宁省SVM分类结果Fig.7 Classification results of SVM in Liaoning Province
4.2 基于弱样本DCNN作物识别结果
模型在辽宁省测试集上取得较好的农作物分类结果,如图8 和表2 所示。使用野外点对其进行精度验证,总体精度高达0.90,其中两种作物的制图精度和用户精度均大于0.70,较高的F1分数,分别为0.81、0.90。对比两种作物的识别结果发现,水稻整体提取精度比玉米偏低,存在较明显的漏分误差。由图7 中SVM 识别结果可知,水稻的种植面积远小于玉米,因此训练集存在不同类别标记样本不平衡的问题:水稻的样本数量少,玉米的样本量多,这可能影响了模型对小样本量地物的识别精度。
图8 分类结果Fig.8 The classification results
表2 作物分类精度表Table 2 Classification accuracy table for crop
4.3 农业景观对DCNN性能的影响
通过图8(b)可见,平原区、山区因地形地貌差异导致了作物种植结构的空间分布有所差异:平原区地块规整,山区地块破碎。利用弱样本训练的DCNN 模型能够准确地识别出平原S1 和山地S2子区中水稻和玉米的空间分布。
DCNN 模型表现出良好的分类性能,不受地形地貌的影响。通过计算高程和方差,将测试集格网划分成平原区和山区两种地貌类型,利用野外样点集分别对每个格网进行精度评价,并分析在每个区内误差的变化,如图9所示。从整体分布上看,平原区格网总体精度集中在0.93—1.00,而位于山区的格网总体精度分布较为离散,最小值和最大值分别为0.70 和1.00。两种类型格网OA 中值均大于0.93,且平原区略高于山区,其中75%平原区格网的总体精度高于0.95,75%山区格网的总体精度高于0.85。这表明DCNN 模型在平原和山地不同地貌类型中均表现出较好的分类效果,具有一定的鲁棒性,究其原因是PSPNet 采用多尺度特征非监督学习,既能够学习到作物的遥感语义,又能够学习到细节特征(Zhang 等,2020),只要弱样本中保留的作物可分遥感特征被PSPNet 模型学习到,就能够实现准确的作物分类。
图9 平原区和山区作物识别总体精度空间分布Fig.9 The spatial distribution of OA in plain and mountainous area
对于复杂种植结构的农业景观,该方法也表现出较好地识别作物类型。斑块形状是描述区域景观的重要指标之一。在农业景观中,耕地地块的几何形状在一定程度上影响遥感影像分类的准确性。因此,本文引入了景观形状指数LSI(Landscape Shape Index)(邬建国,2000)来表达研究区农业景观中耕地地块的形状特征:
式中,E表示景观中所有斑块边界的总长度(m),A表示景观中所有斑块的总面积(m2),0.25 为正方形校正常数。LSI≥1,景观中斑块形状越不规则或偏离正方形时,LSI 值越大。本文实验在测试集内随机选取14个1 km×1 km典型样方(A—N),如图3 所示。利用目视解译结果对DCNN 作物识别结果计算OA 并降序排列,与每个1 km 样本的LSI对比分析,见图10。随着LSI 从2.59 增加至5.81,OA 在0.82—0.99 呈现出上下波动,没有出现明显的上升或下降趋势,说明了耕地地块形状的复杂性对分类结果影响不明显,如样方I的LSI值最大,为5.81,比样方M 的LSI 值高了0.55,而前者OA值(0.92)却比后者OA 值(0.82)高0.10。因此,这说明了由地块形状的变化所引起的空间分布差异几乎没有影响DCNN模型的分类性能,在复杂种植结构的农业景观下利用所提出的方法策略进行作物分类依旧能保持一定的准确度,这是因为DCNN 模型中的金字塔池化模块能够对不同尺度的特征进行融合,解决了耕地地块形状变化的多尺度分割问题(Zhang等,2020)。
图10 14个1 km×1 km典型样方分类总体精度(OA)和景观形状指数(LSI)对比Fig.10 Comparison of OA and LSI of 14 1 km×1 km typical samples in different agricultural landscapes
4.4 DCNN和SVM识别结果的一致性分析
对SVM和DCNN模型的分类结果进行一致性检验,结果为0.90,表明两种方法在整体上识别结果达到较高的空间吻合度(图11),特别是在大面积作物种植区。本文选取了两个30 km×30 km典型格网分类结果进行对比,并分别从中提取了5 km×5 km子区放大观察局部分布。从图12中发现,同种作物大面积成片种植范围内,两种方法均能准确分类;但在种植范围小和边缘处,两种方法则出现较多差异。对于地物之间交界地带处的像元,两种方法的识别结果均出现了像元错分漏分,导致边界模糊现象,且SVM出现更多细碎的错分现象,这是因为SVM分类过程中像元与周边像元之间是相互独立的,而DCNN模型在卷积过程中考虑了空间特征。
图11 模型与SVM作物分类结果对比Fig.11 Comparison of crop mapping results of module and SVM
图12 30 km×30 km格网和5 km×5 km子区分类结果图Fig.12 Classification results of 30 km×30 km grids and 5 km×5 km subsets
4.5 弱样本误差对DCNN性能的影响
随着新训练样本噪声的不断增强,模型的分类性能呈现出明显的变化,如图13 所示。利用目视解译数据集评价实验分类精度,从OA 上看,随倍数逐步增加,精度值呈波动下降趋势,最大值为0.88,最小值为0.83,仅降低了0.05,这是由于研究区中其他类别相比水稻和玉米面积占比较大,因此即使在误差倍数逐步增大的情况下,对比其他指标的变化,总体精度值仍维持在较高水平。对于PA,水稻和玉米呈现相反的变化趋势。玉米曲线仍有较弱的上升趋势,增加了0.02,而水稻曲线则急剧下降,从0.74 直接降至0,漏分误差明显增大,表明随着样本噪声的增多,新模型对水稻出现严重的漏分现象。相应地,水稻的UA 曲线表现出波动上升状态,从第30 倍开始,之后的精度值为空,说明模型识别的水稻像元越来越少,直至为0,全部转化为玉米,因此其错分误差逐渐减小到变为空值。玉米UA 曲线呈现微弱的下降趋势,从0.97 减少至0.90。F1-score 指标将两种作物的OA 和PA 结合起来,玉米曲线对膨胀系数的增大无明显变化,而水稻曲线随着膨胀系数增大而波动下降,从第30 倍之后为空值。综上,从4 个指标曲线分布可以发现,模型对样本噪声的变化有着明显的响应,且当玉米膨胀倍数不高于5 倍时,模型预测结果的精度能保持在一定范围内上下浮动,超过5 倍之后,4 个指标值均发生剧烈变化,说明了模型分类性能在5倍样本噪声左右发生了显著的差异。
图13 误差实验分类精度评价结果Fig.13 Accuracy results of classification of error experiments
本文统计了每个新标签样本作物的空间一致性(CI)和误差面积比例(R),计算公式如下:
式中,S0指原始弱样本中各类作物面积,S1指新样本中各类作物面积。计算结果如图14 所示,膨胀倍数为0 表示原始弱样本。随着膨胀倍数增加,新样本对应原始样本中的玉米分布保持不变,空间一致性均为1,而水稻空间一致性断崖式下降至0.1 以下。误差面积比例曲线则均呈现出随倍数增大而上升状态,且变化率慢慢减小。当样本噪声为5倍时,水稻的空间一致性和误差面积比例分别变化了0.35、0.36,玉米的误差面积比例增加了0.08,空间一致性保持不变。综上,结合前面精度变化可知,当研究区内模型在5倍样本噪声内,即样本最大误差面积比例不超过0.36 时,模型具有一定的鲁棒性,识别结果总体精度维持在0.86 以上,这进一步证明了弱样本用于训练DCNN模型策略的可行性。
图14 膨胀倍数对应的作物空间一致性和误差面积比例统计结果Fig.14 Statistical results of space consistency and error area ratio of crop corresponding to the expansion ratio
图15 可视化了测试集中一个格网的分类结果,直观对比每次误差实验结果的空间分布,分析弱样本误差空间分布对DCNN 的影响。观察图15(b)、(c)和(d)可知,大片水稻分布在规整的平原耕地,当中混杂着零星的玉米地块,DCNN原始预测结果整体上能够准确识别出耕地形状和作物类别(图15(a))。随着膨胀倍数的增大,水稻和玉米之间的混分现象越严重。在膨胀系数第5倍之后,两种作物的空间分布较原始分类结果开始发生显著的剧烈变化。对比所有误差实验结果发现,产生识别误差空间范围并不是随机分布的,而是在上一次结果边界上的向外延伸区域:随着膨胀倍数增加,玉米识别结果呈现膨胀分布趋势,分布在玉米耕地周围的水稻像元越多地被错分为玉米,与对应实验中弱样本标签的空间分布规律一致。这说明了DCNN模型能够充分学习到训练样本的空间位置特征,样本中的误差空间分布在DCNN结果中的作物边缘带也得到了明显的反映。因此,弱样本的误差空间分布会影响DCNN的识别效果,弱样本的误差空间分布规律能够通过DCNN 传递到预测结果中,即预测结果误差也主要出现在地块的边缘带,进一步验证了DCNN识别遥感影像的误差空间分布规律。
图15 30 km×30 km格网误差实验结果对比Fig.15 Comparison of error experiment results in grid level
5 结 论
本文通过弱样本深度学习作物建模分类以及分析农业景观、弱样本误差对建模精度的影响,探讨了弱样本对深度学习作物遥感分类模型的适用性,说明了基于传统分类方法得到的作物分类结果作为标签样本(弱样本)训练深度学习模型能够取得较高的作物识别精度,且在不同地形地貌、复杂种植结构的农业景观下都表现出良好的鲁棒性,证明了采用传统分类结果作为弱样本用于深度学习建模的可行性理论;通过噪声实验说明了弱样本只要保证一定的标识精度就可用于训练DCNN建模,建立了弱样本精度与深度学习模型精度之间的定量关系,降低了深度学习建模标记样本的获取门槛。综上,该方法一定程度上弥补了深度学习模型对大量人工标记样本高度依赖的局限,并且在不同作物类型、不同地形地貌、不同种植结构等情形下均具有普适性。同时,考虑到弱样本获取的便捷性,一般重大的科研计划或项目中已形成大量作物分类结果,如美国CDL(Cropland Data Layer),作为标记样本用于训练DCNN 模型,可解决标记样本获取困难的问题。本研究成果为两种大尺度分类策略打下实验基础,其一是在空间尺度上,在一个局部区域获取弱样本后训练模型,空间上进一步推广到更广泛区域;其二是在时间尺度上,训练某一年份的弱样本模型后,可以在来年甚至多年中推广应用,这两种分类策略都能解决传统作物分类方法“逐区域、逐年份”的不足,提高大尺度作物分类的效率。
在弱样本适用深度学习作物分类建模的理论基础上,今后将开展系列研究工作:(1)延伸研究对象和研究范围,针对不同作物类型(大豆、春小麦、冬小麦、棉花等)、不同农业景观(华北平原、长江中下游平原等)进一步定量分析弱样本误差与深度学习作物建模精度的关系,细化弱样本精度的适用区间范围,为采用历史样本进行大尺度作物深度学习分类建模打下理论基础;(2)训练样本存在作物类型样本不平衡问题,后续研究可尝试采用按比例分层抽样、数据增强等方法,提高弱样本的应用能力。