APP下载

遥感图像语义分割方法探析

2020-11-11郑建文

科技与创新 2020年21期
关键词:语义卷积像素

吕 华,郑建文

(1.江西理工大学 建筑与测绘工程学院,江西 赣州340000;2.浙江省国土勘测规划有限公司,浙江 杭州310030)

1 遥感图像语义分割方法研究进展

遥感图像语义分割(Remote Sensing Image Semantic Segmentation,RSISS)方法是常见RSIS 方法的扩展。通过使用类别(即目标的语义标签)标记图像的每个像素,可以同时完成图像像素分类和图像目标分割两个过程。RSISS 的主要方法有两种,一种是基于区域的RSISS 方法,另一种是基于深度学习的RSISS 方法。

1.1 基于区域的RSISS 方法

在深度学习未广泛得到应用时,基于候选区域的语义分割方法在RSISS 中最典型。

基于区域的RSISS 方法先使用RSIS 技术划分多个区域进行分类,常用的是基于数学理论的RSIS 方法和基于区域的RSIS 方法,如基于马尔可夫模型、分水岭模型等。然后,提取RSI 区域的特征。RSI 中不同地物的组成成分、表面形态和内部结构不同,所包含的光谱信息也不同,如归一化植被指数。在RSI 中呈现出的纹理粗糙度和方向不同。最后,为各区域设定类别。利用提取的区域特征将基于区域的RSIS 转换为基于像素的RSIS,构造分类器,并使用机器学习方法,如利用随机森林方法等方法来获得基于区域的RSISS 的最终结果。

1.2 基于深度学习的RSISS 方法

近年来,随着高分辨率RSI 的不断发展,“同谱异物”和“同物异谱”的现象变得越来越严重,使得传统的基于区域的RSISS 方法的分割准确度和精度较差。因此,以深度学习的最新进展为基础的RSISS 开始迅速发展。其中,基于卷积神经网络(CNN)的RSISS 方法是目前主要体现。CNN方法是使用大量具有像素注释的像素作为训练样本、训练分类器,并对图像进行逐像素分类。在卷积层和池化层之后,CNN 将连接到完全连接的层以进行分类。全连接层将RSI在卷积和池化层中获得的特征图映射到固定长度的特征向量。特征向量表示RSI 属于每个类别的概率,而概率最高的类别表示为RSI 的类别。很多综述文章中比较并分析了主流语义分割竞争、数据集和网络结构。以下是近年来基于深度学习的语义分割方法的概述。

LONG 等人(2015 年)[1]提出了基于全卷积网络(FCN)的图像语义分割模型,该模型实现了像素到像素的图像语义分割。关键是将CNN 结构中的完全连接层转换为卷积层,通过反卷积操作将其上采样,尺寸升至原始RSI 大小,并结合中间池化层信息以生成RSIS 预测分割图。此外,BADRINARAYANAN 等人(2017 年)[2]提出了一种SegNet深度卷积网络模型,SegNet RSISS 模型的过程如图1 所示。该结构的关键在于,编码器将在合并时保留最大合并的索引值,并在解码阶段使用此数值,还原目标的边缘位置,进而提高RSISS 的准确性。

图1 SegNet 语义分割过程

但是,基于FCN 模型和基于SegNet 模型的RSISS 方法都只使用了一部分RSI 详细信息,获得的RSISS 结果较为粗糙且过于平滑。因此,基于DeepLab 系列框架的深度学习RSISS 模型被提出,使用卷积代替FCN 池化操作,从而减少了计算量,并确保特征图像的尺寸大小不变,保留了RSI中的空间结构信息,从而使输出结果更加准确。

2 RSISS 方法的优缺点

与传统的RSIS 方法相比,RSI 的语义分割方法显示出较为理想的分割效果。基于深度学习的RSISS 方法可以更好地学习高空间分辨率RSI 的数据特征,提高RSI 特征识别的准确性,并且工作效率更高。目前通常使用基于CNN 优化方法来改进常见RSI 的语义分割方法,例如VGG、GoogleNet、ResNet 方法等。但是,仍旧面临以下几个方面的挑战。

如何保持分割结果与语义分割目标的一致性,提高基于CNN 的深度学习RSISS 方法的分割精度。针对这个问题,学者们进行了许多相关研究。如在FCN 中,添加了反卷积融合结构,并融合了浅层详细信息和深层语义信息。引入了空间上下文信息,以更好地定位边界并提高RSISS 的准确性[3]。

在充分利用RSI 丰富的详细信息和上下文信息的同时,如何平衡算法分割效果和时间复杂度之间的关系。根据先前的研究,CHEN 等人(2018 年)[4]使用DeepLab 作为网络的前端,并与Inception 结构结合提出了一种改进的网络。该方法在不降低特征提取能力的情况下,通过减少网络参数的数量和网络操作的复杂度,有效地提高网络的训练速度。在RSI 数据集上进行语义分割实验表明,改进后的网络具有更高的训练速度和准确性。

大多数RSISS 方法都是基于训练样本进行标记的,需要大量的时间和精力来预先标记样本,而手动标记具有主观性和不确定性。因此,越来越多的研究者将注意力转向弱监督、半监督和无监督条件下的RSI 语义分割。不需要昂贵的像素级信息即可获得与现有方法效果相当的语义分割精度。

由于RSI 语义分割的数据集很少,因此很难直接训练出理想的语义分割模型。现有研究通常在语义分割模型中使用RSI 和普通图像在纹理、颜色和其他特征上的相似性,在训练过程中对参数进行进一步的微调,以提高训练效率和语义分割模型的分割效果。

由于高分辨率RSI 类型和特征复杂,有必要获取不同尺度的RSI 特征执行基于深度学习的RSISS。为了获得RSI 中不同尺度的特征,张静等人(2019 年)[5]提出了基于融合多尺度特征的编码器,使用不同大小的卷积核来提取不同尺度的特征。可获得足够的语义信息。徐昭洪等人(2019 年)[6]使用强大的VGG16 网络作为U-net 模型的编码器,改进的U-net 模型对RSI 中建筑物的分割和提取具有更高的精度。

3 结束语

与传统的RSIS 方法相比,RSISS 方法能得到更加精确的结果,目前在学术界得到了广泛的研究。但由于RSI 本身的诸多特性(光谱、形状及纹理特征丰富等),对RSISS仍需进行更加深入的研究。RSISS 在土地利用规划、地理测绘、农业和数字空间建模等方面的应用将会更加广泛。

猜你喜欢

语义卷积像素
基于全卷积神经网络的猪背膘厚快速准确测定
真实场景水下语义分割方法及数据集
像素前线之“幻影”2000
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
“像素”仙人掌
“吃+NP”的语义生成机制研究
高像素不是全部
汉语依凭介词的语义范畴