APP下载

基于改进U-Net模型的近海水产养殖池塘信息提取

2023-10-30陈宇杨陈博伟邱玉宝

现代计算机 2023年16期
关键词:养殖区池塘卷积

陈宇杨,张 丽,陈博伟,邱玉宝

(1.桂林电子科技大学信息与通信学院,桂林 541004;2.中国科学院空天信息创新研究院,中国科学院数字地球重点实验室,北京 100094;3.中国-东盟地球大数据区域创新中心,南宁 530022;4.可持续发展大数据国际研究中心,北京 100094)

0 引言

据联合国粮食及农业组织(FAO)统计数据显示,全球水产养殖业为超过33 亿人提供了人均动物蛋白摄入量的20%。2018 年,全球捕捞渔业产量达到创记录的9640 万吨,比前三年的平均值增加5.4%[1]。因此,水产养殖作为人类所需蛋白质的重要来源之一,在世界粮食安全中发挥着关键作用。从20 世纪中叶开始,中国沿海水产养殖区迅速扩张,导致周围土地利用竞争激烈,在产生巨大经济效益的同时也对沿岸生态环境造成了一定的破坏,如近岸湿地的萎缩或消失、自然栖息地的破坏、生物多样性的丧失以及海岸带地区生态修复能力衰退[2-4]。因此,准确、快速地了解近岸地区养殖池塘的空间分布,对水产养殖的空间布局优化、自然资源的科学管理以及生态环境的保护至关重要。

卫星遥感技术的快速发展,为实现近岸养殖池塘准确、高效的提取提供了可靠的数据支持。它能够克服传统野外调查的不足,是监测和研究海岸带生态环境的重要手段[5-6]。目前,基于遥感影像提取水产养殖区的方法主要有基于像素、面向对象的图像分析、机器学习算法以及深度学习算法。其中,基于传统的基于像素、面向对象的图像分析,在某一特定区域中表现出了良好的识别能力,如马艳娟等[7]构建水体指数和波段运算函数用于近海水产养殖区的提取;吕巷艳等[8]采用归一化差异水体指数结合阈值的方法提取金沙县养殖水体信息;裴亮等[9]将归一化差异池塘指数与面向对象方法相结合,对天津海岸养殖区进行提取。但在面对复杂水域,出现“同谱异物”现象时,仅依靠光谱特征差异性容易导致错分,且其存在无法克服的“椒盐”噪声[10]。而面向对象的分类方法,虽然可以有效抑制“椒盐”噪声,但它的分割参数选取往往取决于研究人员的经验知识且需要反复实验[11]。

机器学习算法虽然已被研究人员广泛应用于遥感图像识别与分类领域并取得不错的成效,但其存在特征选择上需要研究人员具备专业知识、算法结构较浅难以提高分类精度、自动化程度难以满足需求等问题[12]。近年来,深度学习技术在计算机视觉领域取得了巨大成功,相关遥感学者也开始将其应用于遥感图像语义分割领域,为实现近海水产养殖区识别开辟了另一条途径。如Cheng 等[13]通过扩大感受野来增强网络模型学习高层特征的能力,提高了笼式养殖区和筏式养殖区的提取精度;Fu 等[14]采用层次级联结构并引入注意力机制来优化特征空间,对不同种类的海水养殖区进行区分;苟杰松等[15]基于Deeplabv3+构建水产养殖水体语义分割模型;Sui 等[16]采用 ASPP 结构,能够有效捕捉到海上筏式养殖区的多尺度信息,提高浮筏养殖区的提取精度。此类方法能够克服传统方法出现的“同谱异物”现象,改善了水产养殖区提取的边缘模糊问题。

基于深度学习方法提取水产养殖区具有准确、高效等特点。然而,上述的研究中大多是对海上的浮筏养殖区进行提取,相对于养殖池塘的自然地理环境背景更为单一,浅层的卷积神经网络模型在复杂背景情况下提取养殖池塘容易产生冗余信息,网络模型的泛化能力和鲁棒性表现不足。为提升遥感语义分割模型对养殖池塘的识别率,本文提出了一种基于U-Net改进的近岸养殖池塘自动提取模型,并与FCN[17]、E-Net[18]和 U-Net[19]等经典语义分割模型进行比较,验证改进U-Net模型的有效性,以期为该领域相关研究的进一步发展提供参考价值。

1 研究区和数据源

本文的研究区为广西北部湾的官寨海和安铺港两个典型的规模化集聚型养殖区。如图1所示,地理坐标范围为 109°49'~109°56'E,21°25'~21°30'N。研究区内养殖池塘主要位于海涂等低洼地区,一般是封闭的水体,形状近似矩形。研究区域内河流、水田、建设用地等多种不同的地物类型广泛分布,对养殖池塘提取任务造成一定挑战。

图1 研究区

数据源采用欧空局提供的Sentinel-2 多光谱扫描成像(multispectral scan imaging)遥感数据。Sentinel-2任务包含了2A、2B两颗同时运作的相同卫星,重访周期为5 天,扫描幅宽为290 km,空间分辨率为10 m。首先在Google Earth Engine平台上完成影像的数据预处理工作,得到覆盖研究区域2020年6月的Sentinel-2 MSI(Level-2A)影像数据,包含红、绿、蓝、近红外4 个波段,像素大小为7696×7059。然后利用ArcGIS 软件对经过预处理的影像进行养殖池塘的标注,将其Id字段值设置为255。为防止计算机内存溢出,采用随机裁剪方法对影像进行裁剪,最终得到2100张像素大小为256×256的图像,按照8∶2比例制作为训练集和验证集。

2 研究方法

由于遥感图像的复杂环境背景干扰,目前的一些算法难以对养殖池塘进行准确的分割,因此本文对U-Net模型进行改进,得到更加适用于养殖塘分割的新算法。

2.1 改进UU--NNeett模型

U-Net 是一种基于FCN 的改进型模型。如图2 所示,它是一个对称的网络结构,包含了左侧编码器、右侧解码器以及中间的跳跃连接。其中,编码部分用于图像的特征提取,解码部分则逐步将编码得到的特征图恢复到原始图像大小。因此,整个网络的性能直接受编码端的特征提取能力和解码端的图像恢复能力的影响。在本研究中,U-Net 模型是一个重要的结构和关键技术,它能够有效地进行图像语义分割任务,提高图像处理的准确性和效率。

图2 U-Net模型

本文提出的改进U-Net 模型主要是在U-Net模型基础上进行改进,将提出的DC 结构代替U-Net 的传统卷积层,使模型具有更强的特征提取能力。改进U-Net 模型包括编码部分、解码部分以及跳跃连接,采用的操作包括卷积操作(DC 结构)、上采样(Up-Sampling)、最大池化(Max-Pooling)、跳跃连接(skip connection),其结构如图3所示。

图3 改进U-Net模型

原始U-Net 网络的编码部分:编码部分可划分为5级,每级都是由2个3×3卷积、1 个ReLU 激活函数、1 个最大池化层组成。而改进U-Net 模型中,编码部分也分为5 级,每级均由DC 结构组成。DC 结构主要是由Inception 模块、空洞残差结构以及跳跃连接构成,它使得模型能够更好地对图像特征进行多尺度提取,保证网络模型对特征的稳定表达。并且,在每一个卷积层后面用ReLU 层加快模型的收敛速度以及使用BN 层缓解网络的梯度消失问题。最后,在DC结构的后面通过最大池化操作进行降采样。

原始U-Net网络的解码部分:解码部分也可划分为5级,前4级都是由上采样、3×3卷积组成,第5级为输出层。在改进U-Net模型中,解码部分全部使用DC结构代替原来的卷积层,同时,与原来的U-Net网络一样,仍然使用1×1卷积将最后一层的输出特征向量映射为一个类标签。

2.2 DDCC结构

为了更准确地识别遥感影像中大小不同的养殖池塘,本文提出了一种多尺度特征提取结构(DC 结构)。该结构由Inception[20]模块、空洞残差模块和跳跃连接组成,其结构如图4 所示。DC 结构能够有效提取养殖池塘的特征信息,加强特征表达能力,提升遥感影像中养殖池塘部分的识别精度和效率。

图4 DC结构

如图4 所示,首先,输入特征经过Inception模块的四个分支,每个分支分别进行1×1 卷积、3×3 卷积、5×5 卷积、7×7 卷积,捕捉到不同尺度的图像特征,然后通过Concatenate 拼接操作进行特征融合并输入到空洞率为3的空洞残差模块中,进一步对融合后的信息进行提取,最后通过一个长跳跃连接将输入和输出进行融合。DC 结构能够提取不同尺度的特征信息,增强了模型对特征的复用和表达的准确性,降低模型训练过拟合风险,有效地提升了识别精度。

3 实验与分析

3.1 实验设置

该实验使用的仿真平台为PyCharm,使用keras 及其 TensorFlow 端口,运用 Python 语言编程。计算机配置为Intel(R)CoreTM i7-10700F CPU@2.90 GHz,64.0 GB 内存,NVIDIA GeForce GTX 3060,采用 64 位操作系统Windows10,Python3.6。为了客观地分析本文中养殖池塘提取模型的性能,实验中模型统一使用了Adam 优化器、初始学习率为0.0001、批量大小设置为8、迭代周期为80次。

3.2 评价指标

为综合评估改进U-Net 模型的有效性,实验使用了四种精度评估指标,包括精确率(Precision)、召回率(Recall)、交并比(Intersectionover-Union,IoU)和 F1 分数(F1-Score)。其中,精确率表示模型预测为正例的样本中,实际为正例的样本所占的比例;Recall表示实际为正例的样本中,模型正确预测为正例的样本所占的比例;IoU 表示模型预测的边界框与真实边界框的重叠程度;F1-score 是精确率和召回率的调和平均数,用于综合评估模型的性能。以上评价指标的计算公式如式(1)~(4)所示。

其中,真正例(TP)表示模型预测结果和实际情况都为正例;假正例(FP)表示实际情况为反例,但是预测结果为正例;假反例(FN)表示实际情况为正例,但是预测结果为反例;真反例(TN)表示实际情况和预测结果都为反例。

3.3 消融实验

为了评估本文提出的改进后的U-Net模型的优越性,并验证该模型中每个模块的有效性,本文进行了消融实验。该实验都在同一台机器上进行,使用相同的数据集进行训练和验证,并采用相同的参数设置,以确保消融实验的结果可靠。其中,①U-Net:是没有任何改进的原始U-Net模型;②U-Net_1:在U-Net基础上加入空洞残差模块;③U-Net_2:在U-Net 基础上加入Inception 模块;④U-Net_3:本文所提出的改进U-Net模型,它加入了本文所提出的DC结构。消融实验结果和精度对比如图5和表1所示。

表1 消融实验精度对比

图5 消融实验结果

在消融实验中,U-Net_1 模型采用了空洞残差模块,相比原始的U-Net 模型,它在精确率、召回率、交并比以及F1 分数上分别提高了3.4、3.43、3.78和2.31个百分点。这是因为空洞残差模块可以增加模型的感受野,从而捕捉更大范围内的特征信息。U-Net_2 模型采用了Inception模块,它比U-Net模型的精确率、召回率和交并比以及F1 分数上分别提高了3.06、3.38、5.69和3.65 个百分点,这是因为Inception 模块能够增加模型的宽度,有效提取到养殖池塘的多尺度特征信息。因此,采用空洞残差模块的U-Net_1 模型和采用 Inception 模块的 U-Net_2 模型获得更高的精度。

与U-Net_1 模型和U-Net_2 模型相比,具有DC 结构的U-Net_3 模型在精确率、召回率以及交并比上得到了进一步的提升,说明了DC 结构结合Inception 模块的多分支结构以及空洞残差模块,既能增加网络模型的宽度,又能增大卷积提取的感受野,同时两者的结合减少了空洞卷积在卷积过程中带来的稀疏性。所以,DC 结构能够提取到更多有效的不同尺度的特征信息,从而更好地辨别养殖池塘的轮廓。

3.4 不同方法的实验比较

上述的消融实验结果表明,改进U-Net模型在养殖池塘信息的提取上优于原始U-Net 模型。为了进一步验证改进U-Net模型的分割性能,将改进U-Net 模型与 FCN、E-Net、U-Net 模型进行实验对比。其不同模型的分割结果和精度对比分别如图6和表2所示。

表2 不同模型的提取结果精度对比

图6 不同模型的养殖池塘提取结果

从图6 的分割结果中可以看出,采用FCN模型的分割结果明显差于其他几种模型,分割结果噪声较多,并不能清晰地识别出养殖池塘,这是因为FCN 模型在特征提取过程中采用了连续下采样操作,通过不断降低特征图的分辨率来扩大感受野。然而,这种下采样操作会导致分辨率的下降,从而造成一定的信息损失。同时FCN 模型在上采样造成的锯齿状边缘也会影响分割结果的质量。因此,在分割结果中可能会出现一些细节缺失。E-Net 模型在大型堤防上的分割性能有所提升,是因为其采用了多尺度特征提取的方法,通过引入不同大小的卷积核和不同步长的卷积操作,对输入图像进行多尺度的特征提取,从而提高了模型对图像的感知能力和分割效果,但是仍然存在部分细小堤防与养殖池塘直接相连的问题。相比之下,U-Net模型能够有效消除堤防的影响,提取的养殖池塘边缘更加清晰,这得益于U-Net模型在上采样部分与跳跃连接相结合,逐层融合高层特征和低层特征,填充了一些局部细节,但在复杂场景下,与养殖池塘光谱特征相似的海水、湖泊、水库、河流等仍被错误归类,这是因为养殖池塘的形状和大小不一,而且存在大量的细节信息。U-Net 模型在处理这些复杂目标时会出现过度拟合或欠拟合的问题,导致分割精度下降。而本文所提出的改进U-Net模型结合了DC结构,降低模型训练中的过拟合风险,充分考虑了养殖池塘的多尺度信息,能够更好地捕捉图像中的细节特征,增强了图像有用信息的表达。从表2 也能明显地看到,改进U-Net 模型的精确率、召回率、交并比和F1 分数分别为91.73%、90.47%、91.12%和89.91%,要明显优于FCN、E-Net、U-Net 三种模型。综上,本文的方法能够解决其他三种模型在提取养殖池塘过程中存在的问题,实现养殖池塘快速、准确的提取。

4 结语

本文基于U-Net模型改进提出了一个近海水产养殖池塘自动提取模型,并用本文提出的新DC 结构替代了U-Net 模型的卷积层,它能够增强模型对图像特征的表达能力,降低冗余信息的干扰。实验结果表明,改进U-Net模型在精确率、召回率、交并比和F1 分数上都优于FCN、E-Net、U-Net 这三个模型,其中,精确率、召回率、交并比都达到90%以上,并且改进U-Net模型提取的养殖池塘边缘更为清晰。因此,本文的方法能够有效提高养殖池塘提取精度,为遥感图像自动分割提供了参考意义。

今后,我们将在以下两个重要方向继续开展研究:①将探索该模型在光谱信息极弱的遥感图像上对养殖池塘的提取效果;②利用不同来源、不同分辨率的遥感数据集,研究模型对不同数据集的有效性。

猜你喜欢

养殖区池塘卷积
广西北部湾近岸养殖区表层沉积物和养殖生物体重金属污染状况及生态风险评价*
基于3D-Winograd的快速卷积算法设计及FPGA实现
江苏近海紫菜养殖区的空间扩张模式研究
热闹的池塘
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
池塘
夏天的池塘
养殖活动对超微型浮游生物分布影响的研究*
一种基于卷积神经网络的性别识别方法