基于深度神经网络的河流遥感图像分割方法研究
2024-12-31李宗斌
摘要:
为解决河流遥感图像分割效果较差且交并比较低的问题,提出了基于深度神经网络的河流遥感图像分割方法。通过对高空间分辨率的河流遥感图像数据集的分析,预处理河流遥感图像,解决数据集中存在的弱标签问题;采用卷积编码-解码网络构建深度神经网络的特征提取模型,并运用KNN算法实现河流遥感图像的高精度分割;最后以重庆市嘉陵江2022年河流遥感图像为例进行验证。实验结果表明:所提方法能够保留分割后的图像细节特征,且图像分割交并比较高,为0.94。所提方法能够对河流遥感图像进行高精度分割,可为水资源管理和环境保护等方面提供技术支持。
关" 键" 词:
河流遥感图像; 图像分割; 特征提取; 残差连接; 深度神经网络; 嘉陵江
中图法分类号: TP391
文献标志码: A
DOI:10.16232/j.cnki.1001-4179.2024.07.010
收稿日期:
2023-10-17;接受日期:
2024-03-12
基金项目:
国家自然科学基金区域创新发展联合基金项目(U22A20102)
作者简介:
李宗斌,男,高级工程师,硕士,研究方向为信息系统、大数据、人工智能和机器学习技术等。E-mail:yongpo09957446@163.com
Editorial Office of Yangtze River. This is an open access article under the CC BY-NC-ND 4.0 license.
文章编号:1001-4179(2024) 07-0073-06
引用本文:
李宗斌.
基于深度神经网络的河流遥感图像分割方法研究
[J].人民长江,2024,55(7):73-78,97.
0" 引 言
遥感技术以其宏观、动态、实时的优势,在地理信息获取中发挥着越来越重要的作用。河流作为地球表面最活跃的要素之一,其遥感图像的分割对于水文监测[1]、生态保护[2]、洪水预警[3]等领域具有重要意义。早期的研究主要采用传统图像处理方法,但由于河流遥感图像复杂的背景、多变的河流水面反射、阴影遮挡等,使传统图像分割方法在河流遥感图像上效果不佳[4-5]。在前期研究中,部分学者尝试将数学应用到河流遥感图像分割中。例如刘炜等[6]提出了一种基于面向对象分类的细小河流水体提取方法,该方法利用数学运算对初始全域水体信息提取结果进行二值图像分类。实验结果表明,该方法在复杂的河流遥感图像中表现良好,但该方法对于水面反射和阴影的处理仍有待提高。吴一全等[7]提出了一种倒数交叉熵和改进图割结合的河流目标检测方法,该方法考虑了倒数交叉熵阈值选取准则,利用高斯混合模型对种子点区域进行建模,使用连通域检测方法去除小的连通域得到最终结果图像,提高了分割准确性;但该方法计算复杂度较高,难以处理大规模遥感图像数据。吴诗婳等[8]提出了一种基于Tsallis交叉熵快速迭代的河流遥感图像分割方法,该方法利用二维Tsallis交叉熵阈值对图像进行特征提取,通过邻域平均灰度级直方图进行分类;但该方法对于不同光照、季节和拍摄角度下的遥感图像泛化能力有限。
随着大数据技术的兴起,越来越多的研究者开始尝试将区域信息融合、图像熵、图像分割技术、边缘检测等方法应用到河流遥感图像分割中。例如韩斌等[9]利用区域信息融合混合活动轮廓模型对河流遥感图像进行分割,该方法通过计算轮廓曲线内外区域像素灰度的方差和交叉熵,指导曲线逼近目标边缘,引入曲线内外区域像素灰度的类内绝对差,完成河流遥感图像分割;但该方法容易受到噪声、光照变化等因素影响,导致分割结果不稳定。王宇等[10]构建面向遥感图像水域分割的图像熵主动轮廓模型,在CV模型中引入零水平集内外图像熵,构建全局图像熵主动轮廓模型,改进水平集函数进化过程中对灰度信息的依赖,提高遥感图像中水域分割准确度;但该方法河流遥感图像的数据标注成本较高。王碧晴等[11]对遥感图像分割下的青藏高原湖泊进行图像提取,利用NDWI水体指数法提取高原湖泊信息,将多尺度分割和光谱差异分割方法结合提取完整湖泊图像;但该方法现有数据集规模较小,容易影响模型训练效果。王小鹏等[12]将数学与图像处理技术结合,提出基于形态学边缘检测和区域生长相结合的遥感图像水体分割方法,该方法运用多结构元素形态学重构边缘检测,利用灰度直方图自动选取种子点,确定水体区域灰度范围,实现对水体区域的分割;但该方法在复杂背景和光照变化较大的情况下,无法有效区分河流与周围干扰物。
随着图像技术的不断发展和算法的持续优化,冯朝晖等[13]提出了一种改进分水岭方法的遥感图像水体提取方法,提取目标水体的光谱信息分量,将膨胀后的水体对象作为背景图,利用前景图与背景图叠加生成标记图,根据标记图通过分水岭变换对原图像进行分割;但是,不同光照条件和水质的变化,会导致水体光谱分布的差异,降低方法对水面反射和阴影的处理效果。沈瑜等[14]提出了一种基于深度学习的寒旱区遥感影像河流提取方法,将密集空间金字塔池化与R-Linknet网络相结合,扩大遥感影像河流连贯性,将Dice系数损失函数与二分类交叉熵函数相结合,完成寒旱区遥感影像河流提取;但该方法遥感图像分割效率较低。屈艳红[15]提出了一种基于聚类改进的河流水体遥感图像处理算法,采用烟花算法求解K-Means聚类的初始聚类中心,获得遥感图像的初步分割结果,再借助Bayesian公式完成图像二次分割;但当水体存在明显波浪、涡流等形状变化时,该方法的适应性有待提高。
因此,本文提出一种基于深度神经网络的河流遥感图像分割方法,即针对河流遥感图像的特殊性,利用深度神经网络的非线性映射能力,提高对复杂背景的适应能力,从而提升河流遥感图像分割的准确性。首先根据河流遥感图像的分辨率和光谱,标注像素RGB值,降低数据标注成本,扩大数据集规模,完成河流遥感图像预处理;其次利用卷积层和softmax层构建深度神经网络特征提取模型,根据河流遥感图像特征信息对河流遥感图像参数进行训练,提升模型泛化能力;最后通过KNN算法比较待分类像素点与邻近像素点之间的距离,实现河流遥感图像精确分割。研究成果以期为大规模遥感图像数据的应用提供可能。
1" 基于深度神经网络的河流遥感图像分割方法设计
1.1" 河流遥感图像预处理
由于遥感图像的采样距离较大,为了加强对地表目标物的辨识度,河流遥感图像的分辨率通常达到了亚米级。同时,在图像获取过程中,无人机航空拍摄的视角和尺度具有多样性,导致图像背景过于复杂,从而大大降低图像分割的准确性。为了解决这一问题,根据河流遥感图像的分辨率和光谱,对图像的每个区域设置相应的标签,并保证标签图像的可视化[16]。依托于图像内显示的可见光波段,将河流遥感图像不同区域的像素值分别进行标注,并在标签内标注像素RGB值,作为后续分割处理的参考。考虑到高分辨率河流遥感图像在分割过程中图像尺寸不一或数据集过小,均会造成图像分割结果出现较大误差,本文在图像预处理过程中,随机选取一个像素点作为坐标原点,以原点为中心进行遥感图像的抽样式截取,将所有图像切割为尺寸相同的子图,标注每个子图。
此外,为了避免数据集过小导致的图像分割精度下降,首先,以河流遥感图像的Y轴为中心,进行不同度数的旋转翻转,生成多个新的河流遥感图像;再通过调整原图光照、调整图像模糊度,形成多个河流遥感图像,达到图像数据集扩充的效果,完成遥感图像预处理。
1.2" 深度神经网络特征提取模型构建
在河流遥感图像处理的基础上,进行特征提取,此过程是图像分割的主要环节。现有研究主要是从深度神经网络中选取卷积编码-解码网络,建立多尺度特征提取模型[17]。以卷积编码-解码网络为核心的特征提取模型,主要由编码器、解码器构成。同时为了加强特征提取精度,本研究设计编码器内的卷积层和池化层数量分别为13个和5个。解码器的主要组成结构与之相同,但额外增加了1个卷积层和1个softmax层。构建的深度神经网络特征提取模型如图1所示。
为了提升河流遥感图像特征提取结果的准确性,文中采用残差连接的方式,连接编码器的不同计算阶段,并提取出编码器内所有卷积层包含的特征信息[18]。
河流的纹理和形状特征可能受到光照条件、水体水平波动、河流弯曲程度等各种因素的影响,具有一定的多样性和复杂性。将Convl和Conv2的特征融合应用于河流遥感图像处理,获取更全面、更丰富的纹理和形状特征信息,从而提高河流图像的分割精度。特征金字塔提取模式能够确保对河流遥感图像的特征提取具有多尺度性。河流的纹理和形状特征在不同尺度上可能呈现出不同的表现,依托特征金字塔模块可以同时获得图像内部不同尺度上包含的高级特征,从而使特征提取结果在多个尺度上更加全面和细致。特征金字塔模块具体如图2所示。
根据图2,应用卷积核提取不同尺度的河流纹理和形状特征输入信息,提高特征的表示能力和分割效果。整合相邻尺度上下文特征,通过像素相乘的方式融合全局池化信息,增强特征区域一致性,进一步提升河流遥感图像分割的性能。
为了解决梯度消失引起的特征提取误差问题,本文设置短距离残差模块,分别添加到深度神经网络特征提取模型的每个卷积层内,保证每两个相邻的卷积层都可以进行连接。残差模块的组成结构包括两层,其中第一层为输入特征,通过加权计算和激活处理得到期望输出结果[19]。与原始模型相比,在深度神经网络中添加残差模块,实现了从输入层网络结构到输出层网络结构的跳跃连接,加强了模型内深度神经网络的单元通信能力。每一个跳跃连接都可以表示一次恒等映射,即:
f(xφ)=0,y=xφ
(1)
式中:φ表示残差模块网络层;x表示输入特征;y表示期望输出;f(x)表示映射函数。经过映射处理后,深度神经网络所输出的结果即为残差值:
f(xφ)=y-xφ(2)
通过公式的形式将残差模块表示为
xφ+1=xφ+δ(xφ,wφ)(3)
式中:w表示权重值;δ表示递归函数。基于公式(3)可以将任意层残差网络的特征表示为
xθ=xφ+θg=1δ(xg,wg)(4)
式中:θ表示任意层;g表示神经网络层。
除此之外,深度神经网络特征提取模型训练过程中,还包含反向传播阶段,利用链式法可得出网络训练的损失函数:
Exg=Exθ·xθxg=Exθ·1+1xgθg=1δ(xg,wg)(5)
式中:E表示损失函数。
在计算过程中,根据损失函数计算结果弥补梯度下降计算过程中梯度消失引起的特征提取误差。同时,在残差模块作用下,融合图像多尺度特征信息,与初始化提取的特征信息相结合,输出融合处理后的河流遥感图像特征提取结果。
1.3" 河流遥感图像参数训练
深度神经网络特征提取模型应用过程中,河流遥感图像特征信息的传递具有逐层传输的特点[20]。因此,模型训练时低层网络权值的变化,直接导致输出特征提取数据的改变。这也是深度神经网络特征提取模型应用需要注意的最大问题,文中利用批量规范化技术,在网络训练样本输入之前,对图像特征信息进行规范化处理,达到降低网络训练难度的目的。实际操作过程中,将所有模型训练样本设置为
D=d1,d2,…,dη(6)
式中:D表示深度神经网络特征提取模型训练样本集;
d表示训练样本;
η表示集合内样本总数。
河流遥感图像特征提取前,规范化处理所有的样本,得到:
d=d-W(D)Var(d)
(7)
式中:d表示规范化处理后的样本;
W表示均值;Var表示方差。
通过规范化处理,确保深度神经网络特征提取过程中所有训练样本都具有统一性。需要注意深度神经网络训练过程中,样本均值和样本方差的计算,需要耗费大量精力。首先,在批量规范处理样本的基础上,得到批次样本的均值、均差;其次,根据特征提取模型的样本容量,得到容量均值和容量方差值;最后,通过尺度变换处理,计算得到特征提取模型学习训练所需参数。
由于在卷积层的计算过程中,需要通过大量的计算获取均值和样本方差,而批量规范化技术是自动获取训练样本的总体均值、方差、均值和均差的计算过程[21]。所以,可以将批量规范化技术应用在本研究的过程中。首先,获取当前批次训练样本容量,计算样本容量均值和方差,并进行规范化处理;其次,通过尺度变换确定特征提取模型学习训练过程中所需参数。模型训练参数计算需要重构信号,具体步骤如下所示:
Od=Oψ·
Oζ2=-12·Od-τ·ζ2+λ-23
Oτ=Od·-1ζ2+λ
Od=Od·-1ζ2+λ+2Oζ2+Oτ·1mO=Oψ·d
O=Oψ
(8)
式中:O表示输出损失值;
、分别表示需要学习的河流纹理特征和形状特征;
ψ表示尺度变换结果;
ζ表示方差;
τ表示均值;
m表示容量;
λ表示小数值正常数。
通过上述处理,得到模型训练参数,将其应用于深度神经网络特征提取模型,获取准确的遥感图像特征信息提取结果。
1.4" 河流遥感图像精确分割实现
在得到特征提取结果的基础上,本研究以KNN算法为核心实现河流遥感图像精确分割。主要是模拟先验知识的惰性,在提升异常值容错率的基础上,完成遥感图像分割技术的设计。研究应用欧氏距离作为衡量测度,判断图像像素所包含的特征信息的相关性,实现遥感图像分割,欧氏距离计算公式为
G(i,j)=Tt=1(it-jt)2
(9)
式中:G表示欧氏距离;
i表示训练样本集;
j表示测试样本集;
t表示样本类型;
T表示空间维数。
河流遥感图像分割过程中,利用主成分分析方法降低河流遥感图像的数据维度,并对数据空间特征进行强化处理。将所有的遥感图像划分为训练样本集、测试样本集,输入到KNN算法中,根据公式(9)计算结果判断训练样本距离。同时结合河流遥感图像显示的光谱信息与空间信息,实现多种类特征信息的高精度分割。KNN算法实现遥感图像分割的原理如图3所示。
如图3所示,将河流遥感图像内距离较近的特征像素点划分为相同类别的样本,即在图像分割过程中,将整体划分为相同区域,进而完成河流遥感图像的精准分割。
2" 实验分析
本文以重庆地区的嘉陵江作为研究对象,获取不同方法的河流遥感图像分割结果。嘉陵江蜿蜒曲折,形成多个拐弯和弯曲的河段,这种弯曲程度使河流在遥感图像中呈现复杂的纹理和形状,且大部分区域具有不同程度的弯曲。在嘉陵江上游,河道较窄,流速较快;在嘉陵江中下游,河道变宽,流速较缓。这种宽度变化使河流在遥感图像中展现出不同宽度的水体区域,对应着不同的河岸线和堤坝。嘉陵江由于河道曲折,使河水流经时产生一定程度的水平波动,这种水平波动表现为从上游到下游逐渐减小的涟漪效应,或者由河流中的岩石和其他阻挡物引起细小尺度的波浪。在遥感图像中,这种水平波动可能导致河流的纹理和形状产生细微变化。因此,本文以嘉陵江为研究对象,应用所建立的河流遥感图像分割方法,对嘉陵江河流纹理、形状特征进行分析,提高图像分割效果。
2.1" 实验参数设置
本次实验采用64位计算机系统,再配备256 GB内存、4 TB硬盘等硬件,搭建实验环境。考虑到文中提出的分割方法需要进行模型训练,应用Caffe平台进行深度学习,在实验平台上预先训练深度神经网络特征提取模型,得到初始化模型参数。在随机梯度下降算法的作用下,得出表1所列的网络训练基本参数。
在深度神经网络特征提取模型训练过程中,针对反向传播过程的权值进行实时更新,并保证交叉熵函数与损失函数相同,计算公式为
Loss(a,v)=1SSu=1Ac=1-β(c)
(10)
式中:Loss表示损失函数;
a表示真实标签;
v表示输出概率;
S表示批量图像内像素点数量;
A表示类别总数;
u表示像素点;
c表示像素类别;
β表示符号函数。
按照上述计算方法,得到图4所示的网络实际训练误差图。
根据图4中的深度神经网络训练误差结果可知,在训练次数达到65次以后,误差逐渐趋近于0。由此可知,在图像分割实验过程中,将网络训练迭代次数设置为65,可以提升河流遥感图像分割精度。
2.2" 数据集设置
数据集的来源包括卫星遥感影像、航空摄影或其他遥感数据采集平台,以此确保遥感图像质量和代表性。同时,为了确保数据集的准确性和一致性,基于河流的季节变化、气候条件和数据可获得性等因素,采集时段为2022年1月1日至12月31日,数据集包含了春季、夏季、秋季和冬季的河流遥感图像。
河流遥感图像分割测试所需数据集由红、绿、蓝3个波段构成,提供不同颜色和光谱范围的信息,有助于反映河流图像中的纹理、形状和其他特征。数据集中的图像包含河流弯曲程度、宽度、水平波动等。为了进行训练和测试,数据集被划分为训练集和测试集两部分。训练集用于训练深度神经网络模型,测试集用于评估模型在新数据上的性能和泛化能力。为了进行监督学习,手动标注数据集中部分图像,标记河流边界。这些标注数据用于训练和验证阶段,帮助模型逐步学习到河流的分割标准。在深度神经网络训练过程中,将所有河流遥感图像尺寸均设置为256×256,通过两阶段方法完成数据集扩增。步骤如下:
(1) 针对尺寸为256×256的图像,设置一个步长为128的滑动窗口,随机截取标记河流遥感图像的某一部分,作为新增数据样本。
(2) 面向数据集内所有的河流遥感图像样本,分别旋转90°,180°以及270°,生成新的样本图像。
(3) 重复上述数据集扩增操作,最终得到包含1 500 张河流遥感图像的训练集,以及包含500张河流遥感图像的测试集。
2.3" 河流遥感图像分割结果
为了更加直观地表现出本文提出的图像分割方法的应用优势,选择文献[7-8]的方法进行对比。3种方法得出的河流遥感图像分割结果如图5所示。
从图5可以看出,与原始图像对比,所提方法的应用效果中图像细节特征得到了良好保留,图像分割结果与原始图像中包含的信息基本一致;而文献[7]和文献[8]方法应用后,部分区域图像细节较为模糊,且与原始图像相比产生较大误差。综上所述,本文提出的方法在实际应用中具有较好的分割效果。
2.4" 图像分割方法性能结果
本次实验采用交并比IOU作为标准度量,评价不同图像分割方法的分割性能,交并比具体计算公式为
IOU(P1,P0)=P1∩P0P1∪P0
(11)
式中:IOU表示交并比,
P1表示真实标记河流遥感图像的像素集,
P0表示分割后图像像素集,
∩表示交集操作,
∪表示并集操作,
·表示该组中的像素数量。
基于公式(11)进行计算,得到不同分割方法的交并比对比结果:本文所提方法IOU=0.94,文献[7]方法IOU=0.81,文献[8]方法IOU=0.73。
根据IOU对比结果可知,本文所提方法相比文献[7]和文献[8]方法,图像分割交并比提高了13%和21%。结合图像分割实验结果可知,所提方法可以更加准确地完成河流遥感图像分割,有利于后续图像的分析和应用。
3" 结 论
本研究针对遥感图像中河流的分割问题,提出了一种基于深度神经网络的分割方法。借助卷积编码-解码网络,精准提取河流遥感图像中包含的特征信息,有效捕捉河流图像的纹理和形状等特征。通过引入KNN算法,确定河流边界,实现高精度图像分割。实验验证结果表明:所提方法在处理河流遥感图像时能够满足预期的分割要求,并取得了较好的分割效果。
尽管本研究在基于深度神经网络的河流遥感图像分割方法方面取得了一定的成果,但仍存在可以进一步改进和探索的方向。在特征金字塔模块中,可以引入更高级的语义信息,例如目标物的语义标签或先验知识,以提高分割的鲁棒性;同时,可采用模型压缩技术提高分割速度,以此优化算法,减少计算复杂度。
参考文献:
[1]" 成硕,李艳忠,星寅聪,等.遥感降水产品对黄河源区水文干旱特征的模拟性能分析[J].干旱区地理,2023,46(7):1063-1072.
[2]" 尘福艳,杨创,徐凯磊,等.基于Landsat遥感影像的杨伙盘矿区生态环境动态监测与评价研究[J].环境工程,2023,41(增1):497-500.
[3]" 刘勇,郝新宇,赵晨,等.结合分类和语义分割的遥感影像洪涝灾害检测方法[J].黑龙江大学工程学报,2023,14(1):76-82.
[4]" 姜浩,冯敏,肖桐,等.基于线状特征增强的TM遥感影像细小河流提取方法[J].测绘学报,2014,43(7):705-710.
[5]" 叶雨阳,吕献林,罗锴澍,等.基于Landsat-8数据的洞庭湖区地表水体提取方法评价 [J].水利水电快报,2023,44(8):17-24.
[6]" 刘炜,王聪华,赵尔平,等.基于面向对象分类的细小河流水体提取方法研究[J].农业机械学报,2014,45(7):237-244.
[7]" 吴一全,宋昱.倒数交叉熵和改进图割结合的河流目标检测[J].哈尔滨工程大学学报,2015,36(6):836-840.
[8]" 吴诗婳,吴一全,周建江.基于Tsallis交叉熵快速迭代的河流遥感图像分割[J].信号处理,2016,32(5):598-607.
[9]" 韩斌,吴一全,宋昱.利用区域信息融合混合活动轮廓模型的河流遥感图像分割[J].中国图象图形学报,2017,22(2):212-224.
[10]王宇,王宝山,王田,等.面向遥感图像水域分割的图像熵主动轮廓模型[J].光学精密工程,2018,26(3):698-707.
[11]王碧晴,王珂,廖伟逸.遥感图像分割下的青藏高原湖泊提取[J].遥感信息,2018,33(1):117-122.
[12]王小鹏,文昊天,王伟,等.形态学边缘检测和区域生长相结合的遥感图像水体分割[J].测绘科学技术学报,2019,36(2):149-154,160.
[13]冯朝晖,李芹,韩留生,等.改进分水岭方法下的遥感图像水体提取[J].测绘通报,2019(6):11-15.
[14]沈瑜,苑玉彬,彭静,等.基于深度学习的寒旱区遥感影像河流提取[J].农业机械学报,2020,51(7):192-201.
[15]屈艳红.基于聚类改进的河流水体遥感图像处理算法[J].人民长江,2022,53(3):196-201.
[16]顾勇翔,蓝鑫,伏博毅,等.基于几何适应与全局感知的遥感图像目标检测算法[J].计算机应用,2023,43(3):916-922.
[17]袁玉珠.改进分数阶达尔文粒子群的多Renyi熵图像分割算法[J].测绘通报,2019(6):34-40.
[18]许玥,冯梦如,皮家甜,等.基于深度学习模型的遥感图像分割方法[J].计算机应用,2019,39(10):2905-2914.
[19]秦娜,董方营,成文举,等.基于GIS加权叠加的南四湖流域地质环境质量评价[J].人民长江,2022,53(1):104-109.
[20]韦春桃,赵平,肖博林,等.结合双树复小波纹理特征和MRF模型的遥感图像分割[J].测绘通报,2019(10):40-45.
[21]李晓慧,汪西莉.结合目标局部和全局特征的CV遥感图像分割模型[J].图学学报,2020,41(6):905-916.
(编辑:谢玲娴)
Research on river remote sensing image segmentation method based on deep neural network
LI Zongbin
(Chongqing University of Arts and Sciences,Chongqing 402160,China)
Abstract:
To solve the problem of poor segmentation effects and low intersection and union ratio of river remote sensing images,a river remote sensing image segmentation method based on the deep neural network was proposed.By analyzing the river remote sensing image data set with high spatial resolution,the river remote sensing image was preprocessed to solve the weak label problem in the data set;the convolutional coding-decoding network was used to construct a feature extraction model of deep neural network,and the KNN algorithm was used to realize the high-precision segmentation of river remote sensing images;finally,the remote sensing images of the Jialing River in Chongqing City in 2022 was taken as an example for verification.The experimental results showed that the proposed method can preserve the detailed features of the segmented image,and the intersection and union ratio of image segmentation was high,which was 0.94.The proposed method can achieve high-precision segmentation of river remote sensing images,providing technical support for water resource management and environmental protection.
Key words:
remote sensing images of rivers; image segmentation; feature extraction; residual connection; deep neural networks; Jialing River