基于GF-3与Sentinel-2A图像融合的高精度水体提取算法
2021-08-11童莹萍全英汇倪卓娅邢孟道
童莹萍,冯 伟*,全英汇,倪卓娅,邢孟道
(1.西安电子科技大学 电子工程学院,陕西 西安 710071;2.国家卫星气象中心,北京 100081;3.西安电子科技大学 前沿交叉研究院,陕西 西安 710071)
0 引言
应用遥感技术提取城市水体是一项重要课题,准确地提取水体能直接提高港口城市的船舶识别精度[1-4]。合成孔径雷达(SAR)数据具有全天时全天候采集的能力,空间覆盖范围广。其中,高分三号数据(GF-3)是一种新型C波段全极化SAR图像[5],引起人们的广泛关注。但是,GF-3数据仅具有一个频带,只提供部分对象信息,而且这种数据很容易受到斑点噪声的影响[6]。此外,多光谱数据可以提供丰富的信息,普遍应用于陆地监测、土地覆盖等任务中。哨兵二号(Sentinel-2)是欧洲航天局(ESA)的多光谱成像卫星。Sentinel-2图像相对于SAR图像数据空间分辨率相对较低[7],因此融合SAR图像和多光谱图像以提高目标提取的准确性是一项有效途径。
融合算法能够提高图像的质量[8-10],有利于提升水体提取的精度。目前虽然已有很多图像融合算法,但是针对GF-3与多光谱图像的融合研究还很少。因此,改进融合算法,使之适用于GF-3与多光谱图像的融合是一个非常有意义的研究方向。此外,由于随机森林是一种强大的集成方法,可用于从融合图像中准确提取水体[11-12]。本文提出了一种基于GF-3与Sentinel-2A图像融合的水体提取算法。该方法采用Gram-Schmidt融合算法,将GF-3丰富的结构信息与Sentinel-2A的光谱信息内部融合。该算法可以有效提高遥感图像中水体提取的精度。
1 基于图像融合的水体提取算法
本文提出的水体提取算法包括3个主要步骤:数据预处理、图像融合和水体提取。算法流程如图1所示。
图1 本文算法流程Fig.1 Flow chart of the algorithm
1.1 数据预处理
首先对GF-3和Sentinel-2A图像进行预处理。由于SAR图像中随机分布了大量斑点噪声,导致SAR图像空间分辨率降低。本文采用了多视处理[13]和Frost滤波算法(窗口大小设置为3)用于降低GF-3图像中斑点噪声的影响。同时,为了更好地配准GF-3图像和Sentinel-2A图像,采用基于数字高程模型的地理编码来减少GF-3成像模式引起的几何变形。对于Sentinel-2A图像,在预处理过程中进行几何校正和大气校正[14]。
1.2 图像融合
采用了Gram-Schmidt(GS)变换来融合GF-3和Sentinel-2A图像。这种融合方法不仅可以提高多光谱图像的空间分辨率,而且可以保证频谱信息的高保真[15-16]。该方法首先从低空间分辨率的多光谱图像获得组合的模拟单波段全色图像,并将获得的模拟图像(记为GS1)用作低分辨率Sentinel-2A图像的第一波段,并作为Gram-Schmidt模型的输入。
GS波段是由以下公式组成:
式中,T为已转换波段的编号;B为原始波段;μT为T波段的平均值;φ(BT,GSl)为高分辨率全色波段的协方差;
式中,C表示图像的总列数;R表示图像的总行数;
通过计算其平均值μT、方差σT和协方差φ来调整高分辨率图像:
最后,通过使用Gram-Schmidt的逆变换生成具有高空间分辨率和更多波段的融合图像:
1.3 基于随机森林的水体提取
集成算法是一类功能强大的方法,已成功应用于遥感分类领域。随机森林是一种流行的集成方法[17-19],在本文中用于水体提取。该方法生成多个随机决策树,每棵树都是使用子集特征和带有替换的随机采样生成的。训练样本被分为具有最佳分割属性的左子树和右子树,分割属性是从原始属性中选择的,具有一定的分割标准。训练数据集不断分裂和划分,直到达到停止条件为止。通过所有树预测的表决机制获得测试实例的预测标签。
2 实验验证
2.1 数据集
实验数据包括GF-3雷达图像和Sentinel-2A多光谱图像。GF-3雷达数据的空间分辨率为1 m,获取日期为2018年5月15日。Sentinel-2A多光谱图像具有13个光谱带,成像日期是2018年5月14日。测试地点位于中国江苏省。
2.2 实验结果
图2显示了经预处理后的GF-3图像、Sentinel-2A图像以及通过Gram-Schmidt变换获得GF-3与Sentinel-2A的融合结果。融合前后图像之间的对比可以证明融合算法的有效性。融合后的图像不仅具有1 m分辨率,而且包含13个波段,光谱信息丰富。融合后的图像中湖泊和道路的边缘和形状相对清晰,不同对象间的光谱差异大,与原始图像中的对象相比更利于识别。
(a)预处理后的GF-3图像
进而研究基于GF-3和Sentinel-2A的融合图像在水体提取中的有效性。采用相同的训练样本对Sentinel-2A图像和融合图像进行随机森林分类。表1给出了每张图像上随机森林的准确性评估。与仅使用分辨率相对较低的多光谱数据相比,Gram-Schmidt融合后的图像分类效果更好。其中,Sentinel-2A图像的分类总体准确性为84.00%,Kappa值为0.718 3,而融合图像的分类总体准确性为87.82%,Kappa值为0.791 8。本文提出的算法分类精度提高了约4%。
表1 Sentinel-2A和融合图像上使用随机森林获得总体准确性和Kappa值Tab.1 Overall accuracy and Kappa value based on random forest on Sentinel-2A and fusion image
基于不同图像提取水体如图3和图4所示。
图3 Sentinel-2A图像水体提取结果Fig.3 Water extraction result of Sentinel-2A image
图4 融合图像水体提取结果Fig.4 Water extraction result of fusion image
对比提取出的水体图像可以发现,由于原始的Sentinel-2A图像空间分辨率低,提取结果包含大量的噪声,且边缘粗糙。而融合后的图像保持了GF-3的高空间分辨率并获取了GF-3的结构信息,提取出的水域边缘清晰且连续,噪声较少。实验结果表明,本文所提出的算法对于水体提取有着明显的改进。
3 结束语
为提高遥感图像的水体提取精度,提出了一种基于GF-3和Sentinel-2A图像融合的高精度水体提取方法。该方法利用Gram-Schmidt变换获得高空间分辨率和丰富光谱信息的融合图像,并采用随机森林算法提取水体。实验结果证明了该方法的有效性,融合图像的总体准确性与原始Sentinel-2A图像相比有了显著提高。使用本文算法提取的水体具有清晰的边缘且精度高。