APP下载

基于深度学习和遥感影像的海岸线提取方法研究与实验

2022-07-08程海燕

电子技术与软件工程 2022年2期
关键词:海岸线卷积特征

程海燕

(广西壮族自治区海洋研究院 广西壮族自治区南宁市 530023)

1 前言

海岸线的概念在各个领域没有统一的定义。在海洋管理中,海岸线定义为多为平均大潮高潮时水陆分界的痕迹线,是海洋和陆地行政管理的行权边界线。在海洋测绘中,需要通过海岸地形、平均潮位等计算海岸线的位置。在海洋遥感中,海岸线主要是指卫星或无人机等遥感设备扫过时刻的海陆分割线。按照有关调查规程,海岸线总体分为自然岸线、人工岸线和其他岸线等,其中自然岸线又划分为基岩岸线、砂质岸线、泥质岸线和生物岸线。海岸线作为一种特殊的自然资源,是海洋管理中重点关注的对象。传统的提取方式包括现场测量和影像数据提取。现场测量即采用GPS定位技术进行现场踏勘和测量获取岸线拐点坐标连接成海岸线,通常存在耗时长、外业工作量大、淤泥滩涂和基岩岸段测量困难的情况。影像数据提取指以各类卫星携带的传感器设备获取影像数据为基础进行人工目视解译或机器自动解译的方式提取。但因海岸线具有狭长、连续、多样性等特征,计算机自动解译有基于边缘检测、基于超像素和基于机器学习的图像处理等算法,这些算法是通过对图像进行纹理分析或边缘检测对海岸线进行提取,但受图像噪声、海陆复杂散射及岸线类型多样性的影响,均需要人为设置相关参数或选取特征,各种处理算法离不开人工判读。海岸线两侧地物类型和开发利用现状复杂,在遥感影像中反演出来的地理环境要素和光谱特征差异明显,通过常规的人工目视解译、人机交互或机器自动解译等方法使得海岸线提取过程复杂、提取效率和提取精度较低。随着遥感技术的不断发展和遥感手段的多样化,遥感图像的质量和分辨率越来越高,图像中的背景和细节也变得十分丰富,传统的依赖于人工设计特征的地物边界提取方法不仅难以选取最佳特征对象,还容易丢失很多有用的特征信息。

近年来,随着计算机技术的快速发展,基于机器学习的各种方法和图像处理算法等技术日益成熟并逐渐应用,其中深度学习方法能充分利用样本数据自主学习对象的特征规律,建立对应的识别模型,从而得到更好的自适应分割效果。本文尝试通过DeepLab v3+模型进行海岸线的提取和场景分割实验,为海岸线自动提取提供一种新思路。

2 研究方法

2.1 海岸线自动提取方法

结合海岸带地区地物特征进行海岸线自动提取主要有基于阈值分割、基于连通区域合并、基于边缘检测和基于机器学习等方法。基于阈值分割的方法利用影像中海洋和陆地明显的亮度差异特征快速的找到海陆分界线,原理简单,程序实现方便,但对于光照不均、背景复杂的遥感影像处理效果并不理想。基于连通区域合并的方法是根据海域图像水体的连通性,进行连通区域检测,以及对小的连通区域进行合并,从而检测出目标较大连通区域。其原理是随机给定一个种子像素点,然后按一定方向向周边逐个方向检测像素点灰度值,根据选取的阈值,判断其是否与当前点连通,若连通则添加到当前点的连通区域集合中,与当前点的连通区域合并;若不连通,则创新新的连通域点集合,标记为一个新的连通域;最后得到所有提取的连通域目标,根据海岸线的特征进行海岸线的判别和提取。基于边缘检测的方法原理是利用海陆分界处图像像素点的灰度跳变特征进行海岸线的检测和提取,该方法主要是提取各类目标的轮廓边缘,对海岸线的检测效果较好。

基于机器学习的方法具有较强的抗噪能力以及对不同场景的自适应能力,最常用的对象检测方法有BP神经网络、支持向量机、Adaboost以及近两年出现的深度学习方法。这些方法能够自主学习海岸线的特征规律,建立对应的智能识别模型,从而得到更好的自适应分割效果。其中基于深度学习的方法,无需人工预处理特征信息,算法可以自动从大量图像中自动提取关键信息,大大减少了人工干预,增强了算法的稳定性。

基于机器学习的遥感解译可总结为基于像素分割和基于对象检测两种方法。基于像素分割的遥感图像解译方法,是对图像中每个像素进行标记,然后以像素点为单元进行图像分类,总体对于提取物体详细边界效果比较好。但像素标记工作量大,会丢失图像纹理、变化梯度等衔接信息。基于对象检测的方法是将待检测目标作为一个整体,利用特征提取算法提取对象特征,然后通过机器学习的方法自动学习对象与非对象图像之间的特征规律,建立对象分类的数学模型,比传统的非深度学习方法具有显著优势和潜力,且整体分类效果较好。

2.2 图像语义分割技术

基于深度学习的对象提取方法总体包括两种:基于对象检测和基于图像语义分割的方法。基于对象检测的方法适用于对象特征比较明显、常规尺寸的目标检测,目前已常应用于智能交通、智能安防等方面;基于图像语义分割的对象检测方法具有很强的复杂多对象的边界提取能力,通过算法将图像中的每个像元分配到一个类别,按照类别进行图像中的多目标分割和提取,是人工智能研究领域的重要部分,可以应用在自然资源监管中进行地物提取、进行土地利用现状分析以及自动驾驶场景的街景对象分割等。

遥感影像地块分割旨在对遥感影像进行像素级内容解析,对影像中需要研究的的特定类别进行提取和分类,可以理解为利用图像分割提取出图像中特定的地物,比如房屋建筑,水域水面,农田林地等类型,在自然资源管理、城乡规划、地质灾害预警监测等方面发挥着实用价值。目前实现图像语义分割的研究模型中效果较好的是谷歌发布的DeepLab v3+。本文研究中将尝试利用DeepLab v3+模型进行海岸线的提取和场景分割。

语义分割任务是对图像做密集的像素分割,将每个像素分割到指定的对象集合中。传统的语义分割算法由于使用连续的池化降维,导致空间分辨率大幅下降,使得最终的语义分割精度不够,如深度卷积神经网络(DCNNs)。针对这个问题,DeepLab采用atrous(带孔)算法扩展感受野,以获取更多的感受野。DeepLab算法经历了DeepLabv1、DeepLabv2、DeepLabv3的发展,目前已经发展到了DeepLabv3+。

其中,DeepLabv1算法是结合了深度卷积神经网络和概率图模型(DenseCRFs)两种算法的优势,并采用完全连接的条件随机场提高模型捕获细节的能力。该算法首次在原VGG网络中引入了空洞卷积,代替了后两个池化层中的普通卷积层,以增强模型获取更多特征的能力。虽然DeepLabv1引入了空洞卷积以增强算法的特征获取能力,但是在处理过程中特征分辨率降低、物体多尺度、DNCC的平移不变性等问题依然存在。因此,DeepLabv2在DeepLabv1的基础上作了进一步改进。首先是在最后几个max pooling层中用空洞卷积取代下采样,提高采样密度,以减轻特征分辨率降低的问题;其次,DeepLabv2提出一个类似于Spatial Pyramid Pooling (SPP)的结构,以不同采样率的空洞卷积对输入图像进行并行采样,相当于以不同比例去提取图像的上下文特征,称为ASPP (atrous spatial pyramid pooling)模块;然后采用全连接的条件随机场(CRF)提升模型捕捉细节的能力。DeepLabv2在耗时上与DeepLabv1差异不大,但是分割性能有较大提升。DeepLabv3进一步在空洞卷积上做优化,采用不同采样率的空洞卷积并行架构或空洞卷积级联的方式来解决多尺度下的图像分割问题,实现了调整滤波器视野、控制卷积神经网络计算的特征响应分辨率的功能。但DeepLabv3也有个明显的缺点,当DeepLabv3处理大分辨率图像时非常耗时,因此为了进一步改进,DeepLabv3+在DeepLabv系列算法的基础上加入了编码器,以优化图像分割结果,尤其是沿着目标边界将深度可分离卷积应用于ASPP和解码器模块,从而产生用于语义分割的更快和更强的编码器-解码器网络。DeepLabV3+的完整网络结构如图1所示。

图1:DeepLabV3+网络结构图

示意图的上半部分是编码器,即DeepLabv3网络结构。为降低低层级的比重,选取低层级的特征图用1*1的卷积进行通道压缩。DeepLabv3+网络模型中因编码器得到的特征图具有更丰富的信息,因此其比重更大。下半部分是新引入的解码器,直接将编码器的输出上采样4倍,使其分辨率和低层级的特征图一致。

DeepLabv3+的网络结构和处理步骤主要包括:

(1)数据集预处理,输入网络标签,确定取值范围。

(2)resnet18网络提取特征图片特征,得到特征图。

(3)aspp网络利用五个分支同时特征图进行各自卷积提取操作,得到新的特征图并拼接,再经过两次卷积得到特征图。

(4)对前步骤的特征图进行采样,得到输出特征图并通过函数计算特征图和标签的交叉熵损失。

3 研究过程与实验

在实践工具选取方面,本文将基于百度的PaddleX开发库和VisualDL可视化工具进行算法实验。PaddleX工具能够实现深度学习开发全流程从数据准备、模型训练与优化到多端部署端到端打通,提供统一任务接口和遥感方面图形化开发界面。VisualDL可视化分析工具能够通过丰富的图表呈现训练参数变化趋势、模型结构、数据样本、高维数据分布等,可以更清晰直观地理解深度学习模型训练过程及模型结构,进而实现高效的模型优化。实验对象方面选取常见的人工海岸和北部湾海域广泛分布的生物红树林海岸。

3.1 前期准备

(1)分别完成PaddleX开发库和VisualDL可视化工具的安装和数据准备。针对数据集标注5类物体,分别是背景(标记为0)、植被(标记为1)、建筑(标记为2)、水体(标记为3)、道路(标记为4)。本实验将前4张图片划分入训练集,第5张图片作为验证集。为增加训练时的批量大小,以滑动窗口为(1024,1024)、步长为(512,512)对前4张图片进行切分,加上原本的4张大尺寸图片,训练集一共有600张图片。在训练过程中直接对大图片进行验证会导致显存不足,为避免此类问题的出现,针对验证集以滑动窗口为(769,769)、步长为(769,769)对第5张图片进行切分,得到40张子图片。

(2)训练配置,在配置文件中设置数据集、增强策略、网络结构等参数。

(3)通过VisualDL-Image查看数据增强的过程,以可视化的方式查看是否达到预期的增强效果。经过数据增强后,图像的局部信息被放大,这样可以减小显存的消耗。

3.2 模型训练

3.2.1 初始化模型并进行训练

在DeepLabv3+网络结构train 函数的参数中设置使用VisualDL功能,完成日志保存和结果保存路径设置。其中train_batch_size 表示每次训练抓取的样本数,它决定了训练的速度和梯度下降的方向,设置不宜过大,会导致显存资源不足。learning_rate 表示学习率,它决定了训练收敛的速度,开始训练时设置在0.01~0.001之间,轮数过后动态调整减小学习率,以免引起振荡,最后接近收敛时学习速率的衰减应该在100倍以上。如果训练过程中报错显存溢出,就需要调小batch_size,并同比例调小learning_rate,一般是以2的幂次倍调整。

3.2.2 查看训练指标

如图2所示,利用VisualDL-Scalar观察loss曲线,得到最优的学习率提升模型效果。通过VisualDL-Scalar查看训练过程中的标量数据,以图表的的形式实时展示训练过程中的loss、acc等值的变化趋势,这样可以更直观的了解训练过程,并对模型参数进行优化调整。本次实验训练过程中loss稳定下降较快,整体收敛效果好。如果loss曲线在训练过程中开始上扬,说明学习率设置过大,可以调小学习率重新训练并观察曲线变化。

图2:训练过程中的loss曲线

3.3 实验结果

加载训练好的模型参数,对测试数据集进行图像分割实验。利用训练得到的网络模型,对测试数据集进行图像分割处理后,将分割结果进行着色后进行显示,如图3、图4所示(a是原图,b是图像分割结果图)。

图3

图4

由图4可以看出,该方法自动可以快速有效地进行图像切割,在影像数据中提取海岸线信息,上述两副图像分割整体效果较好。相比较人工岸线受影像精度和图像纹理等图像质量影响,出现了岸线走向断点和空缺;生物红树林岸线连续性好,岸线走向和位置与红树林植被地物特征整体吻合。实验结果与训练过程图像数据集质量、图像内容的复杂度、网络结构设置以及模型训练次数等都有关系。

4 结论与建议

本文以遥感影像数据为基础,开展了基于深度学习的图像语义分割技术海岸线提取方法研究,以人工岸线和生物红树林岸线为例,运用DeepLab v3+模型进行图像提取和场景分割实验,得出如下结论与建议:

(1)基于深度学习的图像语义分割技术海岸线提取方法可以快速有效地在影像数据中提取海岸线信息,图像分割整体效果较好,可为政府管理部门和技术部门提供一种新的海岸线提取思路。

(2)实验结果与图像数据集质量、图像内容的复杂度、网络结构设置以及模型训练次数等有关系。通过提高数据集质量、目标图像选取特征明显和增大试验规模、优化模型参数可以提升实验效果。

(3)以遥感数据为基础的海岸线识别和提取工作获取到的均为遥感设备扫过时刻的瞬时水边线,今后可结合近岸潮位数据校正和DEM数据进行平均大潮高潮位的回归验证和提取。

(4)本文通过人工岸线和生物红树林岸线进行探索实验,今后通过选取多种岸线类型进行数据集收集和模型训练,可以得到较为完整的岸线类型识别结果,为海岸线调查监测和精细化管理提供充足的技术保障。

猜你喜欢

海岸线卷积特征
基于3D-Winograd的快速卷积算法设计及FPGA实现
如何表达“特征”
从滤波器理解卷积
不忠诚的四个特征
基于傅里叶域卷积表示的目标跟踪算法
徒步拍摄英国海岸线
徒步拍摄英国海岸线
徒步拍摄英国海岸线
抓住特征巧观察
徒步拍摄英国海岸线