APP下载

基于U-Net 的海洋锋智能检测模型*

2024-01-21任诗鹤韩焱红李竞时赵亚明匡晓迪吴湘玉杨晓峰

空间科学学报 2023年6期
关键词:锋面中心线梯度

任诗鹤 韩焱红 李竞时 赵亚明 匡晓迪 吴湘玉 杨晓峰

1(国家海洋环境预报中心 自然资源部海洋灾害预报技术重点实验室 北京 100081)

2(中国气象局公共气象服务中心 北京 100081)

3(北京市5111 信箱 北京 100094)

4(中国科学院空天信息创新研究院 遥感科学国家重点实验室 北京 100101)

0 引言

海洋锋是海洋中两种不同性质的水体之间的边界,在锋面处对应的水文要素(例如温度、叶绿素浓度、盐度、密度等)急剧变化,形成对应水文要素的高梯度区域[1-2]。海洋锋对渔业、军事和海洋环境保护等许多领域有重要影响,目前也成为海洋交叉学科研究中的一个重要课题。由锋面引起的辐聚等动力过程为鱼类提供了丰富的饵料[3],使得锋面区域成为渔业活动的热点[4]。锋区的辐聚作用还能将浮游碎屑、油污、微塑料等物质聚集在锋面附近。锋面对于海洋军事领域也有重要的影响,锋面两侧的声波的传播过程具有明显差异特征,所以水下作战和通信、舰艇操作和海上搜救都需要准确及时的锋面分析预报数据[5]。锋区附近的动量、热量的交换十分活跃,在海气相互作用过程中,对天气和气候的影响很大,不仅成为海上风暴的易发区,也对局地海雾的形成有着重要影响。

海洋锋的自动提取识别工作是海洋锋分析预报的基础,卫星遥感技术的快速发展,使得分析识别海洋锋变得更简单可行。目前广泛应用的海洋锋诊断方法可以分为以下几类:梯度法、边缘检测法和直方图分析法[6],梯度法和边缘检测法都是基于锋区内具有高梯度的性质,直方图法是基于水团分类的定义。梯度法主要通过设置适当的水平温度梯度阈值来进行海洋锋的诊断识别,梯度法原理直观,计算方便,是海洋学研究中诊断锋区位置最常用的方法[7,8]。其基本原理是首先遍历计算各像素点的水平温度梯度,并根据经验选取合适的梯度作为锋面阈值,然后将温度梯度大于锋面阈值的点设为锋面像素点。锋面往往是不同水团之间的分界面,其温度有比较明显的变化,直方图法直接利用此定义通过设计一系列统计算法来划分两个水团,从而实现锋面的检测。锋面在温度直方图中表现为两个尖峰,该方法相比梯度法更适用于弱锋面检测[9,10]。边缘检测法最早用于图像处理和计算机视觉识别等问题。Canny 边缘检测算法通过高斯滤波降低图像中的噪声影响,也具有很高的边缘检测准确性,是抗噪声与精确定位之间较好的折中方案[11,12],Canny 锋面检测方法已被广泛应用在海洋锋识别诊断中。海洋锋面的快速准确识别不仅对于理解和预测气候、海洋循环和生态系统具有重要的科学意义,对提高渔业资源和渔场预测水平、服务军事等也具有十分重要的实际应用价值[10]。

传统的海洋锋检测和时空演化分析方法都是基于前人的文献或根据经验得到的,而海洋锋是动态变化的,对于不同季节不同区域的海洋锋面识别和诊断都需要寻找合适的阈值,主观性较大并难以保证较高的准确性,不能很好地实现自动化检测[13,14]。另外目前基于梯度法和边缘检测法的海洋锋面的识别方法,其识别精度没有统一标准[15]。基于直方图的检测算法尽管对梯度不敏感,但在锋面精细化检测方面也存在两点限制:一是较大的检测窗口对于近岸和云层覆盖区域难以准确识别锋面;二是多个重叠窗口的独立检测会导致锋面检测出现不连续和重复。随着深度学习在海洋数据重构、分类识别和预测等领域不断发展,国内外学者利用深度学习方法从海量海洋遥感影像中自动学习海洋锋全局特征并实现诊断识别,实现了从像素级的分类到对象级的检测。目前已有相关研究将深度学习模型与海洋锋物理机理相结合, 调整目标检测模型相关参数并进行训练, 可以避免阈值选取的主观性, 大大提高了锋面检测速度和准确度[16]。基于深度学习的海洋锋智能识别诊断技术已成为中尺度海洋锋提取和诊断的有力工具,随着当前各个行业对于准确快速的海洋预报需求日益迫切,精细化中尺度过程的快速准确的诊断预报能够为海洋渔业、国防安全提供预报保障服务,基于深度学习技术进一步研发中尺度智能预报数据对于未来海洋预报的智能化、轻量化都具有重要意义。

Lima 等[17,18]基于卷积神经网络(Convolutional Neural Networks)提出了一种用于海洋锋自动识别的深度学习方法,通过迁移学习的方式克服了海洋锋小样本训练的问题,实验结果表明,该模型可以产生准确的识别结果。Sun 等[14]在海洋锋检测分类模型的基础上对之前算法做了进一步改进,对不同尺度的SST 图像进行锋面识别,实现了海洋锋的像素级自动化检测和定位。针对传统的边缘检测算法并不能很好地检测到海洋锋的弱边缘信息这一问题,Li 等[19]收集了相关的海洋温度梯度图像,找到相关专家对海洋锋数据进行校准以获得海洋锋的基准值,并提出了一种用于海洋锋检测的弱边缘识别网络。曹维东等[20]基于Mask R-CNN 模型得到了海洋锋像素级智能识别模型,并统计每一类锋特有的梯度分布,对锋面模型进行精细化调整,提高了模型的可靠性。Xie 等[13]建立了基于编码-解码器的端到端海洋锋面精细化弱边缘识别模型,该方法网络结构简单,能够从不同尺度提取海洋锋,实现了中国近海的多条主要海洋锋面的自动识别,并能够输出位置、类别、形状、走势等锋面参数信息。Li 等[21]采用U-Net 框架基于遥感SST灰度图像建立了一个海洋锋提取和识别模型,该模型不但能够提取锋面的整体特征,也能够连接许多细小的锋面结构。

现有方法大多都是针对海洋锋区的智能识别和提取研究,而针对海洋锋中心线的提取方法则很少提及,这些研究中的锋面样本集很多时候都需要采用主观方法进行标注。本文利用Ren 等[8]提出的一种融合梯度法和边缘检测法的锋面自动提取算法进行样本集制作,该方法能更好地适用于目前高分辨率的遥感和数值模拟结果,既保证了锋面诊断的准确性,又提高了锋面的连续性。将深度学习图像分割网络与提取锋面特征的方法相结合,利用基于U-Net 架构的实例分割模型,分别建立海洋锋区和锋面中心线的智能检测模型,同时在编解码过程中采用残差学习单元对模型特征提取网络进行改进,经过实验验证,与以往研究结果对比,该模型在一定程度上提高了锋面检测精度,为海洋锋的自动识别提供了新思路。

1 研究方法

1.1 模型选取

U-Net 网络作为语义分割领域的一个重要架构,前半部分就是特征提取,后半部分是上采样,也叫做编码器-解码器结构,由于网络的整体结构是一个大写的英文字母U,所以叫做U-Net。通过嵌入残差学习单元对U-Net 进行改进,模型结构如图1 所示,模型将上一个残差块的特征信息加入下一个残差单元中,有效地避免了网络过深引起的性能退化和特征信息丢失问题。模型使用了3 阶的全32 位过滤器架构,采用了典型的“编码器-解码器”网络架构,编码器路径具有3 个阶段,每个阶段的残差单元模块主要包括两组批归一化处理层(Batch Normalization,BN)、ReLU 激活函数层和3×3 卷积层,进行残差连接后,通过2×2 最大池化层(Max Pooling)进行下采样。其中3×3 卷积层主要用于提取SST 场的特征信息,在每个最大池化层之前和每个转置卷积层之前添加Dropout 层(Dropout=0.5),提高了检验损失的性能并且优化了过拟合问题。解码器路径同样具有3 个阶段,每个阶段首先对上采样(Up Sampling)特征图与对应层级的编码器卷积层进行拼接,以返回到图像原始分辨率,之后再进行相应的特征提取工作。

图1 基于U-Net 的锋面检测模型Fig. 1 Front detection model based on U-Net structure

1.2 损失函数

对于深度学习中图像分割的二分类问题,一般采用分类交叉熵或Dice 系数作为损失函数进行训练,基于U-Net 的EddyNet 中尺度涡智能提取模型采用了基于Dice 系数的损失函数,获得了更好的分类效果[22]。因此本模型同样使用基于Dice 系数(Dice coefficient)实现的Dice Loss 作为损失函数。Dice 系数是一种集合相似度度量函数,通常用于计算两个样本的相似度,取值范围在[0,1]之间,即图像分割效果好则倾向于1,分割效果差则倾向于0。Dice 系数对正负样本严重不平衡的场景具有较好的性能,训练过程中更侧重对前景区域的挖掘,因此更适合于海洋锋检测这类场景。Dice 系数计算公式如下:

其中,P为预测区域,G为真实区域,|P|+|G|表示两个区域中元素的总和,Dice 系数值D为P与G区域交集与区域总和之比的两倍,直观解释可以理解为锋面预测正确的结果与真实结果+预测结果比值的两倍。

海洋锋图像分割模型的分类为锋面像素及背景像素,且数据集存在样本严重不均衡的问题。对于锋面检测这类样本量严重不平衡的场景来说,加权Dice 系数比分类准确率更适合作为判断模型好坏的标准。本文在建立模型之前,分别对锋区检测模型和锋面中心线检测模型计算每类样本的权重,根据每类样本的占比倒数确定Dice 系数的权重,加权Dice 系数与损失函数计算公式如下:

其中,Dfront和Dbg分别为类别属于锋面区域和背景区域的Dice 系数,α和β分别为二者的权重,Dweighted为数据总体加权Dice 系数,L为模型计算得出的损失函数值。通过2008—2017 年10 年的数据统计分析得出,锋区检测模型的α和β分别为0.88 和0.12,锋面中心线检测模型的α和β分别为0.97 和0.03。

2 结果与分析

2.1 实验环境与参数

实验环境基于python 3.9 搭建,GPU 为NVIDIA GeForce RTX 3090,CUDA 版本为11.5,Keras 版本为2.6.0,Tensorflow-gpu 版本为2.6.0。实验选择Dice Loss 作为损失函数,采用计算高效、善于处理非平稳模型的Adam 优化器来优化模型。实验训练时按照9∶1 划分训练集和测试集,为避免过拟合问题,实验设置早停机制,patience 设置为100 epoch,监听参数fitness 设置为评估损失val_loss。实验中选择分类准确率(Categorical Accuracy)和加权Dice 系数(Weighted Dice Coefficient)两种评价指标为模型进行评估。

2.2 样本集制作

实验数据来自哥白尼海洋环境监测中心(Copernicus Marine Environment Monitoring Service,CMEMS)提供的高分辨率的全球融合卫星观测数据OSTIA(Operational Sea Surface Temperature and Sea Ice Analysis)[23],该数据是由GHRSST-PP 计划提供的一套结合了多种观测得到的SST 融合数据集,空间分辨率为0.05°。实验选择2008 年1 月1 日至2017 年12 月31 日共10 年的日平均数据,范围为南海北部海域(10°—25°N,105°—121°E),水平格点数为300 ×320。

样本集制作方法采用Ren 等[8]提出的一种融合梯度法和边缘检测法的锋面自动提取算法,其中锋面阈值为自适应设置方案,高低阈值分别设置为梯度值大于当天图像中90%和80%像素点的温度梯度值。处理流程如图2 所示。

2.3 结果分析

为了验证本文锋面模型的可靠性和有效性,采用2008—2016 年锋面样本集分别将样本集中的锋区和锋面中心线数据作为标签数据进行模型训练,在2017年测试集上进行测试。设置4 组模型,将SST 和SST 梯度分别作为输入数据进行训练,以测试其在锋区检测模型和锋面中心线检测模型中的检测效果。图3 给出了4 种模型训练过程中训练集的损失率及测试集加权Dice 系数的变化情况。从图3(a)可以看出对于锋区检测模型来说,采用SST 梯度作为输入数据训练收敛速度比采用SST 训练更快,大约25 次训练之后,二者基本持平,均收敛至0.1 附近。对于锋面中心线检测模型,采用温度梯度训练的结果要明显好于采用SST 训练的模型,其收敛速度更快且损失率更低。测试集Dice 系数曲线也证明了这一点,采用温度梯度训练的模型的Dice 系数也略高于采用SST 训练的结果。表1 给出了4 种模型测试集的分类准确率和加权Dice 系数,4 种模型的分类准确率均超过了0.98。

表1 4 种模型测试集的评价指标Table 1 Evaluation metrics of four models in the test set

图3 4 种模型训练集损失率(a)与测试集加权Dice 系数(b)的变化Fig. 3 Variation of loss rate in the training set (a) and Dice coefficients in the test set (b) of four models

图4 给出了前述4 种模型的预测结果与测试集中2017 年第139 天的锋面中心线和锋区真值的对比图,图4(a)(b) 为日平均的SST 和SST 梯度分布,图4(c)~(e)和图4(f)~(h)分别为锋区检测模型和锋面中心线检测模型的结果,图4(c)(f)为测试集真值,图4(d)(g) 为采用SST 训练的模型结果,图4(e)(h)为采用SSTgrad 训练的模型结果。可以看出,锋面中心线和锋区模型均表现了较好的准确性和鲁棒性,但也出现了一些漏检的情况,如在越南东侧沿岸的梯度较弱的锋面没有检出,而且检测模型的结果连续性还有待增强。考虑到这一情况,尝试降低样本数据集锋面检测的阈值,设置为长度大于50 km,梯度阈值大于0.01℃·km-1,这一阈值标准基本上是南海海表温度阈值的最下限。用新制作的样本集重新训练了4 组模型,将该实验命名为exp_base,前述自适应阈值的实验命名为ctrl,并测试其在锋区检测模型和锋面中心线检测模型中的检测效果。图5 给出的是exp_base试验的4 种模型训练过程中训练集的损失率及测试集加权Dice 系数的变化情况,对于锋区和锋面中心线检测模型,采用SST 梯度作为输入数据训练的收敛速度、损失率和加权Dice 系数全部优于采用SST 训练的结果。通过表2 也可以看出,与ctrl 试验相比,exp_base 试验中降低了样本阈值之后,Dice 系数提高明显,其中锋区训练模型由原来的0.92 左右提高至约0.97,锋面中心线训练模型由原来的0.88 提高至0.92。

表2 exp_bases 实验中4 种模型测试集的评价指标Table 2 Evaluation metrics of four models in the test set of exp_base

图4 (a)(b)测试集2017 年第139 天的SST 及其梯度分布。(c)~(e)为锋区检测模型结果(0 表示背景,1 表示锋面),(f)~(h)为锋面中心线检测模型结果(0 表示背景,1 表示锋面)Fig. 4 (a) (b) SST in Day 139 in 2017 and SST gradient. (c)~(e) are frontal area model results (0 expresses backgroud, 1 expresses front); (f)~(h) are frontal line model results (0 expresses backgroud, 1 expresses front)

图5 exp_base 试验中4 种模型训练集损失率(a)与测试集加权Dice 系数(b)的变化情况Fig. 5 Variation of loss rate in the training set (a) and dice coefficients in the test set (b)of four models in the experiment of exp_base

图6 给出了exp_base 试验下2017 年第139 天的锋面中心线和锋区真值的对比图,图6(a)~(c)和(d)~(f)分别为锋区检测模型和锋面中心线检测模型的结果,图6(a)(d)为测试集真值,图6(b)(e)为采用SST 训练的模型结果,图6(c)(f) 为采用SSTgrad 训练的模型结果。可以看出无论是锋区模型还是锋面中心线模型,和ctrl 试验相比,均有了显著的提升,没有存在明显的误检和漏检情况。在锋面阈值降低的情况下,由于其刻画出了更多的锋面细节,对于南海北部近岸区的较强的锋面,高阈值的影响不大,但对于南海海盆内部的中尺度锋面,由于其瞬变性较强,降低阈值之后扩充了锋面样本数量,经过充分的训练之后,模型能够更好地拟合锋面的精细结构。与以往研究结果锋区检测准确率比较,本文基于U-net 方法的准确率有了一定的提升。

图6 exp_base 实验中测试集锋区检测模型和锋面中心线检测模型结果对比 (0 表示背景,1 表示锋面)Fig. 6 Comparison of frontal area model and frontal line model in the test set of experiment exp_base (0 expresses backgroud, 1 expresses front)

尽管降低阈值能够提高锋面检测模型的精度,但在实际的海洋锋分析预报业务中,阈值过低会造成锋面的过量检出,对海洋锋监测和预报数据的解释应用带来困扰。所以在后续的研究工作中,仍然需要从海洋锋的动力机理出发,开展基于深度学习的海洋信息挖掘和对象级目标检测,利用多源海洋数据将相应的深度学习模型与海洋中尺度过程的物理机理进行结合,在预处理和后处理环节与传统检测方法的机理结合,以提升锋面检测模型的精度。

3 结论

将深度学习图像分割网络与提取锋面特征的方法相结合,基于U-Net 架构的实例分割模型,分别建立海洋锋区和锋面中心线的智能检测模型,同时在编解码过程中采用残差学习单元对模型特征提取网络进行改进。实验结果表明,基于U-Net 的锋面智能检测模型能够准确提取锋区和锋面中心线特征,达到了很好的检测效果。通过比较不同阈值制作的样本数据模型训练结果,发现无论是锋区模型还是锋面中心线模型,在降低样本集阈值之后模型精度均有了显著的提升。在实际海洋监测预报业务中,还需要进一步从海洋锋的动力机理出发,将相应的深度学习模型与海洋中尺度过程的物理机理进行结合,例如将传统方法对于锋面的预处理和后处理流程加入智能算法中,以进一步改进锋面检测模型的整体性能。

随着当前各个行业对于准确快速的海洋预报需求的日益迫切,精细化中尺度过程的快速准确的诊断预报能够为海洋渔业、国防安全提供预报保障服务,基于海洋再分析数据开展的海洋锋智能诊断算法同样可适用于海洋预报数据的解释应用。快速机动的中尺度智能预报数据制作和发布,对于未来海洋预报的智能化、轻量化都具有重要意义。

猜你喜欢

锋面中心线梯度
热声耦合燃烧振荡中火焰锋面识别分析
一个改进的WYL型三项共轭梯度法
2019年夏季长江口及邻近海域锋面控制下叶绿素a的分布特征及其环境影响因素分析
一种自适应Dai-Liao共轭梯度法
基于核心素养的高中地理“问题式教学”——以“锋面气旋”为例
一类扭积形式的梯度近Ricci孤立子
第十讲 几何公差代号标注示例10
——目镜套筒
X线摄影中中心线对DR摄影质量的重要性
基于Meanshift和Hough变换的秧苗行中心线提取
基于曲率计算血管中心线特征点的提取方法