APP下载

面向三江保护区植被类型识别的最佳波段组合研究

2022-03-26马永康刘浩栋

林业科学研究 2022年1期
关键词:信息量波段植被

姜 怡,刘 华,赵 峰,马永康,刘浩栋

(1.中国林业科学研究院资源信息研究所,国家林业和草原局林业遥感与信息技术重点实验室,北京 100091)

随着遥感技术的发展和广泛应用,其在退耕还林(草)[1-3]、退耕还湿[4-5]等生态恢复工程的监测中也发挥了重要作用。除了工程进展和实施效果外,植被类型识别也是工程监测的主要内容。现有的植被类型识别方法多采用不同分类器进行监督分类[6-7],其中样本选择是监督分类的必要步骤。通过研究最佳波段组合方式,增强影像信息的可判读性,从而实现分类样本的快速获取。

最佳波段组合一直是卫星数据研究的热点问题。对于拥有多波段光谱信息的传感器来说,应用最佳波段组合可细致分析卫星原始数据各波段信息特征以及在各个领域的应用价值[8-9]。如郭力娜等[10]采用最佳指数因子与不同土地利用类型光谱曲线相结合的方法,选取了适用于Landsat8 OLI 在土地利用类型提取的最佳波段组合为1-5-7;王平平等[11]在研究WorldView2 原始波段最佳波段组合的基础上,增加了不同光谱指数,增强岩性信息提取;和晓风等[12]针对湿地类型,从信息量、信息熵、最佳指数3 个定量指标出发,确定了GF1 影像最佳波段组合为4-3-2。此外,最佳波段组合也是一种数据选择方法,许多学者采用最佳波段组合方式来减少冗余信息与噪声[13-15],进一步提高分类精度。

高分六号卫星是我国首颗精准农业观测卫星,其新增的红边波段能够有效反映植被的光谱信息,可为退耕还湿工程监测,特别是在区分湿地保护区内农作物与湿地植被方面提供有力的数据支持。但目前,利用高分六号数据针对湿地保护区植被信息识别上的研究较少。本研究以三江国家级自然保护区为对象,基于高分六号数据,从制图中的视觉评估角度,开展保护区植被类型识别中的最佳波段组合研究,并对结果进行定量评估。以期为高分六号数据在湿地资源监测中的进一步应用提供参考。

1 研究区与数据源

1.1 研究区概况

三江国家级自然保护区位于黑龙江省佳木斯市抚远市和同江市境内,面积198 089 hm2,是以沼泽湿地为主要保护对象的自然保护区。2000 年被国务院批准为国家级自然保护区,2002 年被列入《国际重要湿地名录》。保护区内有丰富的湿地资源,土壤肥沃、湿地植被茂密且类型复杂多样。由于历史上多次大规模人口迁入及开荒,原有的大部分湿地被农田侵占,原始湿地资源遭到破坏。为恢复保护区内湿地生态系统功能,保护野生动物与鸟类正常繁衍栖息,自2016 年起,保护区开始实施“退耕还湿”工程。为方便区划和管理,当地政府将三江自然保护区分为黑龙江流域保护区(面积106 552 hm2);乌苏里江流域保护区(面积91 537 hm2)。本研究选择黑龙江流域保护区作为研究区域(图1)。

图1 研究区高分六号影像(RGB=3,2,1)Fig.1 Image of GF6 in the study area(RGB=3,2,1)

1.2 数据源

“高分六号”卫星搭载了8 谱段CMOS 探测器,首次增加了能够有效反映植被特有光谱特性的“红边”波段(具体参数见表1)。本实验所用数据下载于陆地观测卫星数据(http://36.112.130.153:7777/#/home),2019 年9 月12 号获取,数据经过辐射定标、大气校正以及正射校正最终形成后续研究的遥感数据。此外,样本数据为2020 年8 月底到9 月初实地采集,由于研究区部分地区自然条件复杂,导致某些区域难以进入,故采用无人机进行数据采集作为补充。同时,结合实地考察经验与google earth 影像选取足够数量的样本点,作为后续实验的基础数据。

表1 高分六号WFV 数据Table 1 GF6/WFV

2 研究方法

从影像信息特征与不同植被类型间可分性两个方面出发,选取标准偏差、信息熵、相关系数以及衍生的波段指数来反映影像信息特征,从整体角度缩小最佳波段组合选取范围;再针对保护区植被类型的光谱特征,利用J-M 距离方法计算不同植被类型间的可分性,最终确定研究区植被类型识别的最佳波段组合。

2.1 影像信息特征

2.1.1 影像信息量 标准偏差和信息熵是衡量波段信息量的常用方法。标准偏差可以反映图像像元值与总体均值之间的离散程度,而信息熵表达的是图像灰度分布的聚集特征所包含的信息量。标准偏差与信息熵越大,则信息量就越丰富。统计研究区WFV 传感器8 个波段的标准偏差、信息熵,最大最小值、均值结果如表2 所示。

表2 波段统计信息Table 2 Statistics of spectral information

2.1.2 影像波段相关性 相关系数是用以反映变量之间相关关系密切程度的统计指标。对于遥感影像来说,相关系数表达的是波段间的信息重合度。相关系数越大,则两个波段间相关性越大,二者间的冗余度越大,信息重复度越高。统计研究区各波段间的相关系数并绘制相关系数矩阵图(图2),图中由蓝到红相关性依次增加。考虑到GF6/WFV 数据原始波段设置并未按照波长长度排列,不利于相关性分析,故图2 坐标按照中心波长长度重新排序,这样更能表达GF6/WFV 数据的各波段之间的相关性。

图2 相关系数矩阵Fig.2 Image of correlation coefficient matrix

2.2 最佳指数因子分析

本研究选择应用较为广泛的OIF指数[16]方法。OIF指数不以单个波段为目标寻找最佳波段组合,而是综合了波段组合内部方差与相关系数,从组合角度评价图像信息量。OIF指数越大,则波段组合信息量越大。其计算公式如下:

其中:Si为波段i的标准差,rij为波段i与波段j之间的相关系数。

从GF6/WFV 数据的8 个波段中任意选取3 个波段组合,共计56 种组合方式,计算各波段组合的OIF指数,并按照OIF数值从大到小排序,结果如表3 所示。

表3 最佳波段指数OIF 值Table 3 The value of OIF

3 三江保护区植被类型识别的最佳波段组合

3.1 研究区影像信息特征分析

由表2 可知,从不同波段的中心波长来说,按照波长从短到长依次是b7>b1>b2>b8>b3>b5>b6>b4,标准偏差从小到大顺序为b7>b1>b8>b2>b3>b5>b6>b4,信息熵差从小到大顺序为b7>b1>b3>b8>b2>b5>b6>b4,中心波长长度几乎与信息量呈正相关。信息量总趋势是随中心波长增长而增大,即波长越长,图像反差越大,所含信息量越丰富。其次,由图2 可知,波段间相关系数出现分块现象,即:b1、b2、b3、b5、b7、b8(简称:一组)以及b4、b6(简称:二组)。这两组波段组间相关性相对较低,信息重叠程度小,但组内部各波段相关性较高,信息重叠度较大。在最佳波段选择原则中我们认为,最终结果应尽可能选择波段间相关性小的3 个波段。因此,最佳波段组合不宜以组内部波段组成。

由表3 可知,OIF指数排名前6 名波段组合均存在b4 与b6。通过前文信息特征分析可知,b4 和b6 所含信息量虽大,但二者的相关性极高,不宜同时选取。考虑到波段组合的独立性以及信息量,研究决定从所有段组合中选择含有b4 或b6(不同时存在)且同时OIF数值排名位于前20 的波段组合作为选择范围,用于进一步分析,即OIF指数排名第7~26 的波段组合。

3.2 研究区植被类型光谱特征分析

研究区植被类型丰富,是三江平原原始沼泽的核心和缩影。但由于历史上大规模开荒活动,三江国家级自然保护区内存在大量耕地,占地面积较大,作物类型单一。研究区耕地类型以玉米和水稻为主,沼泽湿地以沼泽化草甸为主。根据研究区植被类型特点,本研究选择沼泽化草甸、玉米、水稻、林地以及草地5 种植被类型作为研究对象,以前期外业调查数据和谷歌影像作为参考,每种植被类型选择30 个样本,计算每种植被类型在8 个波段上的响应值,并绘制不同植被类型的光谱特征曲线,如图3 所示。

图3 5 种植被类型的光谱特征曲线Fig.3 5 Spectral characteristic curve of planting quilt type

根据图3 可知,5 种植被类型的光谱响应值的总体走势相近,在单波段区分程度各不相同。其中,红边波段b5、b6 在植被类型识别中表现优异,尤其是波段5 对各植被类型区分的综合能力位于前列;b4 和b6 波段的玉米、水稻比其他植被类型辐射值更高,有利于区分耕地与其他植被类型;可见光波段(b1、b2、b3、b7、b8)的林地辐射值最低而水稻最高,但是b7 波段对植被类型区分能力极差,为进一步缩小最佳波段选择范围,故最佳波段组合中不考虑第7 波段。此外,综合考虑到波段间信息量,故最佳波段组合中应包含b4,不包含b6 与b7。

3.3 植被类型可分性分析

J-M 距离是度量不同类别可分性较为有效的方法,公式如下:

式中:p(X/ωi)为条件概率密度,即第i个像元属于第ωi个类别的几率。Jij取值在0~2 之间,其中,Jij位于0.0~1.0 之间时,则样本间不具有光谱可分性;Jij位于1.0~1.9 之间时,样本间具有一定的光谱可分性,但存在较大程度的重叠;Jij位于1.9~2.0 之间时,样本间具有很好的光谱可分性。

通过前期基于OIF指数的信息量以及植被类型光谱特征的综合分析,从OIF指数法筛选出的20 组波段组合中,排除包含波段6、7 的波段组合,共选出10 组波段组合,依次计算不同地物类型间的J-M 距离(结果保留2 位小数)。结果如表4 所示。

表4 J-M 距离Table 4 Jeffreys-Matusita Distance

基于J-M 距离评估植被类型的可分性结果可知,从56 个波段组合中初选出的10 个波段组合在植被类型识别方面均表现优异,仅在区分沼泽化草甸与草地效果不佳,但在其他植被类型间J-M 距离均大于1.83,且绝大多数J-M 距离大于1.9,验证了筛选结果的可靠性。其中,在不同波段组合中林地、水稻、玉米和草地4 种植被类型间的JM 距离均大于1.94,表明该10 个组合在这4 种植被类型具有较强区分能力。此外,沼泽化草甸与其他植被类型间J-M 距离相对较低,不宜区分,尤其是沼泽化草甸与草地,J-M 距离最大为1.76(波段组合1-4-8),最小仅为0.90,表明沼泽化草甸与草地的光谱信息十分相近,容易混淆不易区分。

3.4 基于三江保护区植被类型识别的最佳波段组合

由于J-M 距离方法仅能衡量两种地物类型间的可分性,本研究采用两种方法相结合的综合评估法,进一步确定三江保护区植被类型识别的最佳波段组合。方法一:将各植被类型间的J-M 距离按大小排序,累加排名次序,统计总排名作为最终分数,总分越小则说明该波段综合排名越高,植被类型识别能力越强(表5)。方法二:累加不同植被类型两两间J-M 距离,记为总分,并按总分大小排序,总分越高则表明波段组合综合识别能力越强。综合两种方法结果如表6 所示。

表5 方法一排名Table 5 Rank of method 1

综合两种方法进行评估的优势在于,如果仅采用方法一进行评估,会产生拉平效应。例如表4 中的沼泽化草甸与草地,波段组合1-3-4 的J-M 距离为1.74,波段组合1-4-5 为1.75,数值相差0.01,排名相差1。同样在沼泽化草甸与草地中,波段组合2-4-5 的J-M 距离为1.50,波段组合1-3-4 为1.74,数值相差0.24,但排名仍相差1。如果仅采用方法二进行评估,则又会出现因为某两种植被类型的J-M 距离数值过小和过大而过分影响该波段的综合排名现象。故在两种评估方法中同时表现优异的波段组合,才应是我们优选的植被类型识别最佳波段组合。

根据表6 可知,综合排名第一的波段组合为1-4-5。本研究根据最佳波段选择原则,在研究区地物光谱特征分析基础上,结合OIF值排序以及地物类型最大差异的分析,最终确定1-4-5 波段为研究区植被类型识别的最佳波段组合。

表6 波段组合综合排名Table 6 Comprehensive rank of band combinations

3.5 最佳波段组合验证

为了更加科学地判定波段1-4-5 为最佳波段组合,本研究选取综合排名第二的波段组合1-4-8 作为对比数据,以验证最佳波段组合的优越性;并将常用于植被识别的波段组合2-3-4 作为另一组对比数据。采用在小样本条件下表现较好支持向量机方法对3 种波段组合分别进行监督分类,获取研究区植被类型分布图。分类结果如图4 所示。分类精度验证结果如表7 所示。

由表7 可知,波段组合1-4-5 在各植被类型识别精度均表现优异,总体精度和Kappa 系数最高,故进一步证明波段波段组合1-4-5 为本研究的最佳波段组合。此外,适合的RGB 组合方式也是选择最佳波段组合的关键步骤,通过对比发现,R-4、G-5、B-1 为RGB 最佳组合色彩显示(图4)。

表7 3 种波段组合分类结果评价Table 7 Classification accurary of 3 kinds of band combination

图4 波段组合分类结果Fig.4 Classification results of band combination

4 结论

基于GF6/WFV 影像,从影像特征和类间可分性角度出发,对标准偏差、信息熵和相关系数等指标进行分析,通过最佳指数因子方法确定各个波段组合的信息量;再结合典型植被类型光谱特征曲线、J-M 距离等确定了研究区典型植被类型识别的最佳波段组合,并得到如下结论:

(1)对于GF6/WFV 数据,从可见光到近红外各波段信息量总体为上升趋势,其中b4 波段信息熵与标准偏差最大,b7 最小,说明b4 包含信息量最多而b7 最少;依据波段间相关性可分为两组:b1、b2、b3、b7、b8(一组)和b4、b6(二组)。两组波段组内相关性高,信息冗余度高,组间相关性低,冗余程度低。对于影像特征分析可知,在后续研究中,只有从两组中分别选取适当波段进行组合,才能保证最终波段组合的独立性。

(2)单一的波段选择方法具有一定局限性,综合方法可以实现方法间优势互补。OIF指数可评估波段组合整体信息含量,初步筛选信息丰富的波段组合;光谱特征曲线从单波段角度评估各类型的可分性;J-M 距离从组合角度评价不同波段组合对植被类型的区分能力。综合以上3 个角度可获得最终的最佳波段组合。

(3)经过多指标的综合评估,在56 个波段组合中,波段组合4(R)-5(G)-1(B)是三江保护区植被类型识别的最佳波段组合。其中林地、水稻、玉米、草地4 种植被类型类间具有较强的可分性,但沼泽化草甸与其他植被类型间J-M 距离相对较低,尤其与草地间存在部分混淆情况。

本研究基于GF6/WFV 影像对识别三江保护区植被类型的最佳波段组合进行了研究,研究结果中最佳波段组合1-4-5 中包含近红与红边两个波段,前人研究表明,该两个波段在植被生物量[17]、健康评估[18]和树种[19-22]、农作物识别[23-24]中发挥了巨大的作用,有助于提高植被信息的提取精度。故本研究提出的最佳波段组合在植被相关的目视解译和分类等方面具有可靠性,对于三江平原的植被类型快速识别具有参考价值。GF6 号卫星作为我国自主研发的传感器,其新增加的波段包含紫波段、黄波段以及两个红边波段4 个特殊波段,本研究从原始波段组合角度分析了植被类型识别方面的最佳波段组合,在今后的研究中可以从指数进一步挖掘新增波段在植被方面的应用。

猜你喜欢

信息量波段植被
基于高分遥感影像的路域植被生物量计算
最佳波段组合的典型地物信息提取
新型X波段多功能EPR谱仪的设计与性能
鲁棒多特征谱聚类的高光谱影像波段选择
重磅!广东省发文,全面放开放宽落户限制、加大住房供应……信息量巨大!
基于Landsat-8影像数据的北京植被覆盖度时空特征与地形因子的关系
基于最佳邻域重构指数的水下高光谱目标检测
追踪盗猎者
第一节 主要植被与自然环境 教学设计
走出初中思想品德课的困扰探讨