基于Softmax分类器的小春作物种植空间信息提取
2019-10-08董秀春李宗南邱金春
蒋 怡,黄 平,董秀春,李宗南*,王 昕,魏 来,邱金春
(1. 四川省农业科学院遥感应用研究所,四川 成都 610066;2.金堂县农业农村局,四川 金堂 610400)
【研究意义】随着成都地区社会经济的快速发展,农业种植结构发生明显变化,及时获取准确的作物种植空间信息对农业部门的生产管理有重要作用。【前人研究进展】遥感法是提取作物空间分布信息的主要手段,具体方法包括目视解译、监督分类、面向对象分类、机器学习分类方法等。在不同的应用中,方法的选择受效率、精度、影像分辨率等需求和条件决定。随着遥感卫星产业的发展,对地观测获取的遥感数据剧增,如何快速处理不同种类、多时空分辨率、不同质量遥感影像构成的大数据获取作物空间分布信息成为农作物遥感监测的难点。机器学习分类方法以高效、准确、智能等优点,成为目前作物遥感分类研究的热点[1]。机器学习分类法以统计数学为基础,利用先验知识使分类器进行自我学习,从而提高分类性能和精度。从训练的角度可分为监督学习、非监督学习和半监督学习;从模型的层数结构的角度可分为浅层学习和深度学习,常见的浅层学习有:决策树(DT)、支持向量机(SVM)、随机森林(RF)和分类回归决策树(CART)等[2-5]。已有较多研究分析多种机器学习算法应用于作物分类的效果,认为机器学习方法在农业遥感上具有业务应用的潜力[1, 6-8]。比较RF法与常用分类方法研究结果表明,RF法可以有效集成光谱和植被指数等多维向量的优势[9-10];DT和SVM法相对于传统最大似然法能更有效识别主要作物[11-16]。【本研究切入点】Softmax函数在分类应用中,输出的是每一个分类的概率,其优点是在分类时计算量小,速度快,可和多种浅层、深层神经网络结合,得到广泛应用。目前,已有学者[17-18]对超高分辨率影像利用Softmax分类器进行分类并评价精度,但鲜有对中高分辨率影像分类精度的研究。【拟解决的关键问题】研究基于Softmax方法和10~30 m分辨率多光谱影像提取小春作物种植空间信息的技术及精度,并分析影像分辨率对精度的影响,为使用机器学习分类法和遥感大数据快速准确提取作物空间信息提供参考。
1 材料与方法
1.1 研究区概况
研究区位于成都平原西部,北纬30°17′~30°28′、东经103°35′~103°47′之间,邛崃、大邑、新津、彭山、蒲江5市县交界处,区位示意见图1。境内地貌山区、浅丘、平坝兼有,平坝主要集中在中部及北部,地形平坦、开阔,略有起伏,土壤肥沃。该区属属中亚热带湿润季风气候区,具有春早、夏热、秋凉、冬暖的气候特点,年平均气温16 ℃,年降雨量1000 mm左右。该区域传统的小春作物主要包括油菜、小麦。
1.2 数据来源
1.2.1 遥感影像 Sentinel-2A MSI多光谱影像,可见光到近红外波段空间分辨率为10 m,红边、短波红外波段空间分辨率为20 m的13波段Sentinel-2A MSI多光谱影像。研究区2018年3月8日有优质无云的Sentinel2A多光谱影像覆盖,该时期研究区内油菜处于开花期,小麦处于拔节期-孕穗期,在光谱影像中易于识别。遥感影像假彩色图及解译标志见图2(封三),RGB分别对应B8,B12,B3波段。
1.2.2 验证数据 结合Google Earth高清影像和地面调查,建立8个随机分布的样方,对研究区内的油菜、小麦进行分类精度验证,样方分布见图1。
1.3 研究方法
1.3.1 影像预处理 预处理主要是数据融合、影像裁剪及降尺度。采用NNDiffuse算法进行数据融合,融合结果对于色彩、纹理和光谱信息,均能得到很好保留。将融合后空间分辨率为10 m的9波段Sentinel-2A图像进行裁剪,得到覆盖研究区域的图像数据,用于小春作物种植空间信息提取。将10 m空间分辨率的融合图像进行尺度转换,得到空间分辨率分别为15、20和30 m的Sentinel-2A融合图像。
图1 研究区位示意及样方分布Fig.1 Research location and sample distribution
图3 Softmax分类技术流程Fig.3 The softmax classification technology
1.3.2 小春作物分类 对Sentinel-2A 融合影像采用B8,B12,B3波段数据进行 RGB假彩色显示,选取油菜、小麦、林地、居民地、水体和其他作物等地物的感兴趣区,采用最大似然法和Softmax分类器对油菜、小麦的种植空间信息进行提取。
Softmax分类:本研究使用ENVI5.5软件提供的Softmax分类器,该分类器为浅层结构的机器学习分类器。通过训练样本对Softmax分类器进行训练,然后检查损失曲线收敛是否满足要求;最后利用训练好的分类器对地物进行分类。
精度评价:对分类结果进行处理,将小春作物以外的林地、居民地、水体和其他作物进行类别组合,形成油菜、小麦和其他3类,然后使用地面样方数据验证分类精度。具体的,通过ArcGIS创建渔网工具将地面样方矢量数据重采样至与影像一致的分辨率,并与影像配置至误差小于1个像元,然后计算误差混淆矩阵,得到小春作物分类精度表。
2 结果与分析
基于Softmax分类器和Sentinel 2A 10 m分辨率多光谱数据的小春作物分类结果见图4;不同分辨率影像的Softmax分类器的精度见表1,作为参照的最大似然法的精度见表2。根据表1,Softmax分类器和10 m分辨率影像的典型地物分类总体精度为90.02 %,Kappa系数为0.8344;与最大似然法比较,Softmax法总精度及Kappa系数略低,而油菜、小麦的多项生产者精度和用户精度更高。综合不同分辨率影像的总精度、Kappa系数以及油菜和小麦的生产者精度和用户精度等多项指标的情况,认为Softmax分类器在中高分辨率影像小春作物分类中具备较高的精度,可作为常规方法应用于业务化的作物监测工作。
与10 m分类结果的精度比较,15、20、30 m分辨率影像的小春作物分类总精度依次减少9.80 %,12.04 %和13.04 %,Kappa系数依次减少0.1538、0.1873和0.2088,影像空间分辨率降低会导致Softmax分类器的精度下降。主要原因是研究区存在较多的破碎地块,随着空间分辨率的降低和混合像元的增多,小春作物漏分和错分像元增加。
根据Softmax分类器的精度表,10~30 m分辨率影像油菜分类的生产者精度分别为93.14 %、79.30 %、77.89 %和75.18 %,用户精度分别为91.42 %、78.65 %、76.85 %、74.00 %;小麦分类的生产者精度分别为87.93 %、81.74 %、78.95 %和80.23 %,用户精度分别为98.09 %、90.23 %、89.42 %、86.80 %。总体而言,油菜的精度较小麦的低,其主要原因是不同品种油菜的开花期不同,易与部分蔬菜混淆;且油菜更耐旱,农民在很多破碎地块、狭小区域种植;而小麦对机械化程度要求高,常种植于大块连片平坝区域。
3 讨 论
该研究结果表明具备更高分类效率的Softmax浅层机器学习分类方法可准确提取10~30 m分辨率多光谱影像中的小春作物空间分布信息。浅层机器学习分类法具有小样本学习、收敛速度快、高精度和推广性好的优点[16, 19-21],适应目前多种10~30 m分辨率遥感影像的作物快速识别与分类,可满足业务化运行的工作要求。随着遥感大数据时空分辨率提高,机器学习在遥感影像识别与分类将使用更大规模的训练数据、构建更复杂的模型,通过深度学习算法和模型实现更多种类地物的精确识别与分类,降低过拟合的程度[22]。根据实地调研,除油菜、小麦外,成都平原种植的其他小春作物如豌豆、胡豆、小春蔬菜等作物,且种植面积有增加的趋势。该研究仅遥感获取大宗粮油作物空间信息,同时获取3种以上的小春作物种植空间信息的方法需进一步研究。
图4 Sentinel 2A的小春作物分类结果(局部)Fig.4 Classification results of spring crop based on Sentinel 2A (partial)
表1 基于Softmax方法的分类精度
续表1 Continued table 1
遥感分类地面真实像元(个)油菜小麦其他合计(个)漏分(%)错分(%)生产者精度(%)用户精度(%)总体精度(%)Kappa系数小麦1102434178272221.0510.5878.9589.42其他1675241098178924.0138.6275.9961.38合计125330831445578130 m油菜423767457724.8226.0075.1874.0076.980.6256小麦551177124135619.7713.2080.2386.80其他8621449979928.4137.5571.5962.45合计56814676972732
表2 基于最大似然法的分类精度
4 结 论
通过对研究区2018年3月8日的Sentinel 2A MSI多光谱影像进行预处理,然后使用最大似然法和Softmax法提取油菜、小麦等小春作物的种植空间信息,使用地面样方调查数据验证,结果表明:Softmax法和Sentinel 2A 10 m分辨率融合影像的小春作物分类总体精度为90.02 %,Kappa系数为0.8344,其中油菜生产者精度为93.14 %,用户精度为91.42 %,小麦的生产者精度为87.93 %、用户精度为98.09 %。Softmax方法提取小春作物的精度随影像空间分辨率的下降而降低,15、20、30 m分辨率影像的分类精度较10 m的分别下降9.80 %,12.04 %和13.04 %;Kappa系数依次减少0.1538,0.1873和0.2088。15、20、30 m分辨率影像的油菜分类精度较小麦的低,影响因素为油菜花期和种植地块破碎分散。浅层结构的Softmax分类法在10~30 m中高分辨率影像小春作物分类中具备较高的精度,可作为常规方法应用于业务化的作物监测工作。