高分六号卫星WFV 新增谱段对农作物识别精度的改善
2020-02-04姚保民王利民王铎刘佳季富华
文 | 姚保民 王利民 王铎 刘佳 季富华
中国农业科学院农业资源与农业区划研究所
一、前言
遥感技术是获取农作物种植面积最为有效的途径之一,增加敏感谱段能够有效提高农作物种植面积的精度,相关学者在这些方面开展了较多的研究。如红边谱段农作物光谱反射率差异的研究,红边谱段提升农作物类型识别能力的研究,以红边谱段为主的特征指数设计的研究等等。随着光学传感器光谱分辨率设计能力的快速提升,更多的谱段作用被不断挖掘,在各行业的应用范围也在逐渐拓展,能力也在不断提高。
高分六号(GF-6)卫星于2018年6月2日成功发射,其上携带一台宽幅相机,有16m 空间分辨率的8 谱段多光谱(WFV)图像产品,新增了海岸蓝、黄、红边谱段,为国产高分卫星数据在农作物种植面积识别中发挥更大的作用提供了契机。本文以河北中部、山东北部地区玉米、花生种植面积提取为例,以GF-6 WFV 数据与GF-1 WFV 数据重叠谱段作为基线,对新增谱段的识别能力进行了初步分析。
二、高分六号WFV 谱段特征及测试数据处理
GF-6 WFV 数据共计有海岸蓝谱段(C)、蓝谱段(B)、绿谱段(G)、黄谱段(Y)、红谱段(R)、红边谱段1(RE 1)、红边谱段2(RE 2)、近红外谱段(NIR)8 个谱段,其谱段编号、名称、中心波长及谱段范围如表1 所示。该数据可以从中国资源卫星应用中心网站(http://www.cresda.com/CN/)注册下载。数据幅宽≥860km,实际提供时是3 小景方式,3 小景的穿轨×沿轨范围分别为238km×285km、385km×285km 和238km×285km左右。
表1 测试区GF-6 WFV 数据谱段编号及波长范围
本文研究选择的数据是2019年8月28日,产品号为1119916442 的WFV 数据,影像覆盖范围区为河北中部、山东北部及天津中南部,该时期此范围内的大宗农作物主要是玉米,经济作物有花生、红薯、棉花、蔬菜等,园地有苹果园、梨园,以及其他的观赏苗木圃等。
对该景影像预处理步骤主要包括辐射定标、大气校正和正射校正。辐射定标系数和光谱响应函数从中国资源卫星应用中心网站下载,并采用6S 模型进行了大气校正,基于区域网平差的方法进行了几何精校正。预处理后的影像谱段排列方式是按照中心波长由小到大的顺序重新进行了排列。图1 给出预处理后的影像范围,图中影像合成方式为NIR/G/B假彩色合成。
图1 测试区GF-6 WFV 数据及覆盖范围和训练样方(NIR/G/B 合成)
三、新增谱段识别效果的研究思路与方法
以GF-6 WFV 影像为数据源,对比GF-6 WFV 较GF-1 WFV 卫星新增的海岸蓝、黄、红边1、红边2 谱段的分类作用。使用基准谱段近红外谱段、红谱段、绿谱段和蓝谱段,依次增加新增谱段进行分类和精度验证,不同谱段组合的测试方案如表2 所示。
根据测试范围内农作物类型特征,以及农作物遥感监测业务中的实际需求,本文的分类体系划分为玉米类作物、花生类作物以及其他地物类型3 类;玉米类作物是指红边谱段反射率相对较低的作物类型,花生类作物是指红边谱段反射率相对较高的作物类型,其他地物类型包括园地、裸地、城镇和村庄、水体等。
分类方法选择随机森林方法(RF),训练及分类样本是根据影像的颜色、纹理、形状等特征,结合地面调查的实际经验以目视的方法进行选择,共形成128 个面状玉米类、24 个面状花生类和174个面状其他类训练样本。以总体精度和Kappa 系数两个参数综合考虑正确率和错误率,本文采用两个参数作为精度评价,也就是新增谱段识别能力分析的依据。
表2 基于GF-6 WFV 新增谱段测试方案表
四、新增谱段的分类结果分析
根据上述6 种谱段组合方案,依次使用随机森林分类方法进行分类。以GF-6 WFV 影像的4 谱段分类结果作为基准,对比其他5 种分类结果的精度。图2 给出了总体精度和Kappa 系数的结果。
由图2 可见,方案1、2、3、4、5、6 方案的总体精度分别为87.3%、88.1%、88.9%、93.2%、95.8%、95.9%,Kappa 系 数 分 别 为0.68、0.70、0.73、0.84、0.91、0.91。
精度最低的为方案1,即基准谱段组合,总体精度为87.3%;精度最高方案6,即加入两个红边谱段组合方案,总体精度为95.9%;这两个方案实际上是GF-6 新增谱段参与分类方案精度最优能力对比,精度提高了8.6%以上。
图2 测试区6 种方案总体精度与Kappa 系数结果
6 个方案的精度结果可以划分为两类,即无红边的方案1、2、3 为一类,总体精度平均为88.1%,最小和最大值分别为87.3%和88.9%;有红边的方案4、5、6 为一类,总体精度平均为95.0%,最小和最大值分别为93.2%和98.6%。
将方案分为有红边谱段和无红边谱段两大类,则有红边的方案比无红边的方案总体高6.9%以上;两大类各自相比,提升能力都相对较低,无红边的精度提升1.3%左右,有红边的精度提升2.7%左右;对比方案4、5、6,方案5 的精度比方案4 的精度更接近方案6,仅差0.1%,也就是说红边谱段2 比红边谱段1 更为有效,更接近近红外谱段的识别能力。
图3 为测试区作物面积提取及6 种谱段组合方案的分类效果对比图。从图3 结果也可以看出,方案2 分类结果与方案1 的变化不大,方案3 玉米面积开始增加,如图中橙色小框所示,玉米、花生与背景地物的可分性开始增大,如图中黄色小框所示,方案4、5、6 因为红边谱段1 、红边谱段 2 加入分类,不仅玉米、花生与背景地物差异明显,同时两者之间可分性也增大,如图中橙、黄小框所示,使得分类结果精度进一步得到提高。
图3 测试区作物面积提取及6 种谱段组合方案的分类效果对比图
五、结论
通过GF-6 新增的谱段数据对玉米、大豆等夏季作物的识别研究可以发现,新增谱段对作物识别精度都有一定提升作用。从谱段设置上来看,红边谱段的提升作用更为明显,并且红边谱段2 的效果最好,提高了8.6%。表明该谱段能更好反映作物识别信息,有进一步深入研究的必要。从谱段设置上看,谱段位置的设置比谱段数量的设置更为优先。
从当前的研究结果可以进一步推测,在可见光-红边-近红外谱段范围内,越接近近红外谱段,对农作物的识别能力可能越高。此外,谱段范围对农作物识别精度可能也会有较大影响,限于数据原因,没有作深入分析。上述推测与不足,将在后续的研究中验证与完善。