基于SAR 卫星观测的北极冰涡时空分布特征*
2024-01-21刘桂红杜延磊赵亚明杨晓峰
房 超 汪 胜 刘桂红 杜延磊 赵亚明 于 䁑 杨晓峰
1(中国科学院空天信息创新研究院 遥感科学国家重点实验室 北京 100101)
2(中国科学院大学 北京 100049)
3(澳门大学科技学院 澳门 999078)
4(北京市5111 信箱 北京 100094)
0 引言
北极地区常年被冰雪覆盖,是地球大气的主要冷源之一,其中北冰洋占据了其2/3 的面积。来自大西洋和太平洋的暖流造成了北冰洋复杂的海洋动力和热力环境,导致大洋内部出现斜压和正压不稳定[1-6],从而形成了海洋涡旋。边缘冰区(Marginal Ice Zone,MIZ)上层浮冰在海洋涡旋的驱动下表现出显著的螺旋特性和涡旋运动特点。本文将海表浮冰与海洋涡旋构成的冰水混合模式称为冰涡。
一般情况下,冬季的冰层较厚且表面粗糙,抑制了近地表斜压不稳定性的发展,从而阻断了表层横向混合的涡旋驱动机制。随着夏季的到来,海冰变得薄且光滑,近地表层斜压不稳定性逐渐增强,导致涡旋活动变得十分活跃[7]。涡旋的垂直热量传输加速了极地海冰的消融,从而导致斜压不稳定性持续增强,涡旋活动因此变得更加活跃。极地海冰和涡旋相互作用[8],影响了边缘冰区的演化,间接调节着全球气候。此外,和大多数中低纬度海洋涡旋一样,冰涡对于海洋的温盐、碳和生物化学物质运输也有着重要的影响[9-14]。
冰涡数据的获取主要依赖于现场观测仪器和卫星传感器。一般情况下,现场观测数据具有高质量和高可靠性的优势,目前的现场观测手段包括系泊观测[8,15-18](mooring)、冰系剖面仪[19](ice-tethered profilers)以及冰下滑翔机(under-ice gliders)。然而,受制于高昂的观测成本和恶劣的天气条件,现场观测数据的数量和覆盖范围难以支撑实验需求。卫星所搭载的传感器,通过全球范围的高空间分辨率和大幅宽观测,理论上可以获取大量数据以支持冰涡现象的检测和特征分析任务。然而,由于海冰的存在,导致基于现有的北极卫星观测资料难以推断出海洋表面的特征,例如海面高度、温度和盐度[20]。此外,卫星测高显示了海洋中分辨率为O (100 km)的中尺度涡旋场[21],北极涡旋的尺寸相对于中低纬度涡旋要小数倍,因此即使在无冰覆盖的地区,卫星测高也只能识别少数涡旋[20]。尽管可见光和红外波段的中高分辨率卫星能够直接获得北冰洋涡旋场的空间信息,但是由于北冰洋常常被密集的云层覆盖,所获取的可用数据并不足以支撑大范围的冰涡观测。
相比之下,具有全天时、全天候观测特点的高空间分辨率星载合成孔径雷达(SAR)更适合观测北极中尺度和亚中尺度上层海洋过程[20]。当海冰从邻近的边缘冰区被卷吸到涡旋场中时,上层浮冰可以完全模拟该区域的流场,由此形成了明显的螺旋特征。此外,由于波流相互作用、漂流浮冰以及海洋锋面上近地面风的变化对短尺度表面粗糙度模式的调制,使得涡旋特征在星载SAR 图像中易于识别[22,23]。在这种情况下,较薄的冰(如新形成或融化的冰)在SAR 图像中会被视为暗模式(低后向散射),而较厚的冰会被视为亮模式(高后向散射)[24]。
Kozlov 等[20]通过对北冰洋边缘冰区的SAR 影像进行目视解译,分析了北冰洋西部边缘冰区的涡旋空间分布特征。这些涡旋的直径范围介于0.5~100 km 之间,多分布在大陆架和大陆斜坡地区,较少分布在加拿大海盆深处和楚科奇高原。此外,气旋型涡旋的出现次数大约是反气旋型涡旋的两倍。Kozlov 和Atadzhanova[24]采用了目视解译方法,对弗拉姆海峡和斯瓦尔巴群岛边缘冰区的涡旋进行了研究。研究结果表明,在该区域,中尺度和亚中尺度的涡旋占据主导地位,气旋型涡旋的发生频率约为反气旋型涡旋的两倍,这与之前的研究结论一致。这些涡旋的直径范围在1~68 km,其平均直径在浅水和深水中分别为6 和12 km。在边缘冰区内,涡旋的平均尺寸随着海冰密集度的增加而增加,但是涡旋主要发生在边缘冰区以及海冰浓度低于20%的地方。值得注意的是,气旋型冰涡的海冰占比为53%,稍高于反气旋型冰涡的48%。每个涡旋平均捕获的海冰面积约为40 km2,而由涡旋引发的冰融化所导致的冰边缘平均水平后退速率约为0.2~0.5 km·d-1,标准偏差为±0.02 km·d-1。
目前,在基于SAR 的冰涡检测研究中,主要采用人工目视解译方法。然而,在进行目视解译之前,需要对海量的遥感影像进行筛选,以确定存在冰涡特征的影像。由于冰涡上层的堆积浮冰呈现不规则分布的特点,传统的涡旋检测算法并不适用,只能依赖人工筛选的方式。因此,尽管卫星数据几乎覆盖了整个北极地区,但由于冰涡的人工筛选工作量巨大,目前缺少对整个北极地区的冰涡时空分布的全面统计分析。
随着深度学习算法的不断发展,一系列目标检测模型被广泛应用于海洋现象检测研究中。例如,Li等[25]充分考虑海洋遥感领域的数据特性,利用改进后的深度学习模型开展了一系列海洋现象检测和分析,结果表明深度学习方法在海洋遥感领域具有显著的应用潜力。
在各种目标检测算法中,YOLO(You Only Look Once)模型凭借极快的训练速度和较高的检测识别精度被广泛使用。相较于其他优秀的目标检测模型-SSD 和Faster-RCNN,YOLO 模型具有以下优势:首先,该模型采用更加轻量化的网络结构,在保证准确率的前提下,实现了更快的检测速度;其次,由于每个网络预测目标窗口时使用的是全图信息,很好地避免了背景错误,使得假阳性(False Positive)检测结果的比例大幅降低;最后,YOLO 模型经过数代更迭已经十分成熟,能够兼顾精度和速度优势,其部署、训练以及二次开发更为便捷。Bhavya 等[26]在2021 年的一项研究表明:如果在COCO 数据集上比较SSD 和YOLOv3,在输入分辨率为320×320 的情况下实现几乎相同(28%)的全类平均精度(mean Average Precision, mAP),YOLOv3 的运行速度大约是SSD 的3 倍。随着YOLO 系列不断更新,其精度和速度都得到了进一步改善。YOLOv7 于2022 年7 月发表,当时,在5 FPS 到160 FPS 的范围内,其在速度和精度上优于所有已知的目标检测器[27]。
YOLO 模型的在遥感领域中也得到了广泛应用,Wang 等[28]针对高度计数据,采用增加注意力机制的YOLO 模型有效地学习了中尺度涡旋的特征,并对南海区域的涡旋进行检测识别,结果表明YOLO 模型在单灰度海平面异常(SLA)数据上的表现要优于两阶段检测技术Faster R-CNN。Cao 等[29]将改进的YOLO 模型应用于SLA 数据,对1993—2021 年南海的中尺度涡进行了探测和识别。与传统的识别方法相比,该模型具有更好的识别效果(准确率达91%),不仅避免了主观设定阈值所带来的偏差,还在一定程度上提高了中尺度涡旋的探测和识别速度。此外,Khachatrian 等[30]收集了弗拉姆海峡区域的冰涡SAR 影像,微调预训练的YOLOv5 模型,检测结果表明了YOLOv5 模型在边缘冰区涡旋检测任务中的有效性和鲁棒性。
本文基于欧洲航天局(European Space Agency,ESA)哨兵一号卫星的SAR 数据,对北极冰涡的检测、识别与特征分析进行了研究。在数据构建阶段,采用了欧洲航天局官方提供的2024 幅SAR 影像制作了样本集;在冰涡检测任务中,运用了YOLOv7 算法进行了模型训练,并结合模型结果进行了目视解译;在特征分析任务中,对2022 年北极边缘冰区的冰涡时空分布信息进行了统计,并从冰涡直径、冰涡类型(气旋/反气旋)、海冰占比三个方面对冰涡特征进行了统计分析。
1 数据与方法
1.1 数据
研究使用的哨兵一号A 星SAR 影像数据由欧洲航天局提供,该卫星于2014 年4 月3 日发射,其上搭载的C 波段合成孔径雷达具有4 种观测模式:干涉宽幅(IW),超宽幅(EW),波模式(WV)和条带模式(SM),具体信息详见表1。
表1 哨兵一号卫星成像模式及参数Table 1 Sentinel-1 imaging modalities and parameters
欧洲航天局在其官方网站** https://scihub.copernicus.eu/** https://usicecenter.gov/上提供了四种不同级别的数据,分别为Level-0 级原始数据、Level-1 级单视复数数据(Single Look Complex,SLC)、Level-1 级地距多视数据(Ground Range Detected,GRD)和Level-2 级数据。本文选用了EW 和IW 模式下的Level-1 级GRD 数据进行研究,并且使用了欧洲航天局发布的专业软件SNAP 对GRD 数据进行了一系列处理,包括轨道校正、辐射定标、重采样以及Refined-lee 滤波。为了后续制作样本切片,这里暂时未进行地理编码。
此外,为了最大程度地筛选出北极边缘冰区的冰涡影像,本文还使用了美国国家冰中心*** https://scihub.copernicus.eu/** https://usicecenter.gov/提供的北极月度海冰变化趋势图来判断边缘冰区的位置,该趋势图显示了整个北极地区的海冰消退和扩张。本文结合北极冰情图目视收集了2024 幅含有潜在冰涡特征的北极边缘冰区哨兵一号卫星SAR 数据,其时间分布和空间分布如表2 和图1 所示。
图1 北极边缘冰区实验数据分布Fig. 1 Distribution of experimental data in the Arctic marginal ice area
表2 北极冰涡检测SAR 数据统计(哨兵一号卫星)Table 2 SAR data statistics for Arctic ice eddy detection (Sentinel-1)
1.2 YOLO 模型原理
YOLO[31]算法通过端到端的回归来获取监测目标的具体位置和分类信息,在保证精度损失最小的情况下大幅提高模型检测速度。具体工作原理如图2所示,将输入图像划分为S×S个网格,每个网格要预测B个边界框,每个边界框的预测由五个值组成:Pc,Bx,By,Bh,Bw,其中Pc代表边界框的置信度分数,反映了模型对方框内包含物体的置信度以及方框的精确程度。Bx和By表示方框相对于网格单元的中心位置,Bh和Bw为方框相对于整个图像的高度和宽度。模型的输出是一个大小为X的张量,可以选择用非极大值抑制(NMS)来去除重复的检测结果。其中
图2 YOLO 目标检测Fig. 2 YOLO target detection
SAR 影像中冰涡的特点是具有旋转特征和强烈的明暗对比,与自然图像相比更加简单,特征更加明显。基于YOLOv7 目标检测模型和已构建的样本数据集开展研究,在预训练模型的基础上进行训练,学习冰涡特征。YOLOv7 使用了多个卷积层和池化层来逐步提取图像的特征,在YOLOv4,YOLOv5,YOLOv6 基础上进行了以下改进:首先,模型扩展了高效的聚合网络,在不破坏原始梯度路径的情况下增强网络的学习;其次,YOLOv7 提出了一种新的基于串联模型的缩放策略,其中块的深度和宽度以相同的比例进行缩放,以保持模型的最佳结构;此外,该模型引入了卷积重参数化(RepConv)并进行了改进;最后,引入了辅助训练模块coarse-to-fine (由粗到细),用于引导标签分配策略[32]。这些改进使得模型训练速度和检测精度有了显著提升,与YOLOv4 相比,YOLOv7 实现了参数减少75%,计算量减少36%,同时平均精度(AP)提高了1.5%[27]。
1.3 冰涡特征计算
在YOLOv7 模型检测的结果上进行切片处理,得到冰涡子图像,并在此图像的基础上进行目视解译,剔除非冰涡子图。从冰涡直径、冰涡类型(气旋/反气旋)和海冰占比三个方面计算冰涡特征。首先,计算冰涡的直径,在先前冰涡目视解译的研究中,将穿过冰涡中心的两个准垂直截面的平均值作为冰涡直径[20,33]。本文简化了这一步骤,采用检测框的边长的均值作为冰涡直径,提高了解译效率。其次,基于堆积浮冰勾勒出涡旋边界,通过目视解译来确定旋转方向(气旋型/反气旋型)。最后采用阈值法对冰涡影像进行预处理,并根据冰涡直径拟合椭圆,将椭圆内海冰像素占比记为海冰占比。冰涡旋转方向的确定和阈值法提取海冰占比的示例如图3 所示。
图3 冰涡类型判别和阈值法Fig. 3 Ice eddy type discrimination and threshold method
2 结果与分析
2.1 模型训练与测试结果
选用2024 幅哨兵一号卫星SAR 影像制作数据集,其中2022 年的1701 幅影像用于模型训练,余下的2014 年的323 幅影像用于模型精度测试。经过预处理后的SAR 影像被降采样到100 m 分辨率,最大程度保留了冰涡细节特征。然而,在这一分辨率下的影像尺寸较大,将整幅影像作为输入会导致显存超标,也会降低样本利用率,影响训练效果。为了解决这一问题,本文将影像裁剪成2048×2048 大小的子图像,并进行旋转和镜像翻转处理,扩充样本用于模型训练。此外,考虑到圆形海冰和弯曲海岸线会在一定程度上导致模型误判,所以在实验中引入了一定比例的负样本。最终,扩充后的训练集样本数量为26696 个,其中包含2000 个负样本,测试集样本数量为488 个。
调整模型的训练参数,设置epochs 为200,batch size 为16,image size 为512,num worker 为4。经过25 h 的训练后,对模型进行测试,通过精准度p和召回率r来评价实验结果,具体计算方法如下:
其中,N表示样本量; 下标TP(True Positive)表示真阳性,定义为样本的真实类别是正例,并且模型预测的结果也是正例,预测正确;FP(False Positive)表示假阳性定义为样本的真实类别是负例,但是模型将其预测成为正例,预测错误;FN(False Negative)表示假阴性,定义为样本的真实类别是正例,但是模型将其预测成为负例,预测错误。在训练阶段,该模型精准度达到了87%,召回率为88%。应用于测试集,其精准度为67%,召回率为67%。考虑到小尺度冰涡极其复杂的形态特征,模型在测试集上的表现尚可被接受。边缘冰区圆形浮冰对于模型检测依旧存在一定干扰,影响检测精度。同时,由于冰涡形态复杂,其目视判别缺少系统标准,使得样本集存在一定主观差异,导致模型测试精度受限。然而,本文的研究重点在于冰涡特征分析,模型的改进以及精度的提升有待进一步研究。此外,训练的模型旨在目标检测初筛阶段减少主观因素介入,并非完全替代人工目视解译。该模型对于较为明显的冰涡特征识别较好,可以满足初筛冰涡特征的需求,虽然会遗漏部分存在潜在冰涡特征的复杂小目标,但是这些目标占少数,并且即使通过目视解译也存在一定争议。
2.2 北极冰涡时空分布统计
结合YOLOv7 模型和目视解译方法,对2022 年参与训练的1701 幅影像数据进行检测,统计分析了北极边缘冰区的冰涡时空分布。经过目视解译后,共计识别出5097 个冰涡,遍布在北极的不同区域。具体如图4 所示,其中每个网格的大小为经度3°,纬度1°。在格陵兰岛东部沿岸和格陵兰海中北部,冰涡分布最为密集,其中包括了气旋型和反气旋型冰涡的高值。此外,喀拉海、巴伦支海北部、巴芬岛东西部沿岸以及维多利亚岛附近也是常见的冰涡形成区域。时间分布如图5(b)所示,北极冰涡全年都存在,其中10 月份呈现出峰值,整体而言,7—11 月是冰涡频发的时段,2022 年冰涡的月平均数量为424.75 个。
图4 冰涡空间分布。(a)气旋型冰涡,(b)反气旋型冰涡Fig. 4 Spatial distribution of ice eddies. (a) Cyclonic ice eddy, (b) anticyclonic ice eddy
图5 冰涡分布统计直方图。(a)冰涡直径数量分布,(b)冰涡月度数量分布,(c)冰涡海冰占比数量分布Fig. 5 Histogram of ice eddy distribution statistics.(a) Ice eddy diameter number distribution, (b) ice eddy monthly number distribution, (c) ice eddy sea ice percentage number distribution
北极冰涡的形成是动力和热力共同作用的结果[34]。从空间上看,冰涡高发的区域往往和北极洋流密不可分,东格陵兰寒流沿格陵兰岛东岸流动,巴芬岛周围也伴随着巴芬岛寒流,北大西洋暖流穿过巴伦支海。从时间上看,随着北极夏季极昼的出现,海温升高,冰川融化引起边缘冰区扩张,导致冰涡高发。而10 月份的冰涡高值则与冰图反映的情况吻合,2022 年北极月度冰区趋势图显示10 月初北极海冰覆盖迅速减小到达最低值,随后冰区开始迅速扩张,因此,10 月份北极的热力学因素更为复杂,有利于冰涡形成。
2.3 冰涡形态特征分析
冰涡形态特征的分析始于对气旋型和反气旋型冰涡的探讨。本文从这两种类型的冰涡出发,对2022 年北极冰涡的直径、海冰占比等数量特征进行统计分析。进一步探究不同月份冰涡直径与海冰占比的特征,研究海冰占比与冰涡直径之间的关系。
解译结果显示,在北极边缘冰区共检测出3615 个气旋型冰涡和1482 个反气旋型冰涡,其中气旋型冰涡数量是反气旋型的2.44 倍,占据主导地位,这与Kozlov 等[20,24]的研究结果基本一致。气旋型冰涡数量更多,这可能与反气旋型冰涡的产生机制和二者的相互作用有关,反气旋水平切变在产生小型亚中尺度气旋时比气旋切变在产生小型反气旋时更有效[35]。
根据图5(a)的冰涡直径分布,可以观察到北极冰涡的尺寸主要集中在中尺度和亚中尺度区间,99%的冰涡直径在60 km 以下,分布范围介于3.85~114.9 km 之间,平均直径为21.2 km。与之相比,反气旋型冰涡的平均直径为24.78 km,超过气旋型冰涡的平均直径19.73 km。需要特别注意的是,直径超过60 km 的反气旋型冰涡要多于气旋型冰涡,其分布情况如图6 所示。这些大型冰涡主要分布在格陵兰岛东侧和巴芬海地区。在格陵兰岛东南侧,出现了两个直径超过100 km 的气旋型冰涡以及一个反气旋型冰涡。另外,巴芬岛北部沿岸也出现了一个直径超过100 km 的反气旋型冰涡。从图5(c)的分析结果可以得知,97%冰涡的海冰覆盖占比分布在20%~70%之间,平均海冰覆盖占比约为41.76%。在具体的类型分析中,气旋型冰涡的平均海冰覆盖占比为42.32%,而反气旋型冰涡则略低,为40.42%。
图6 冰涡空间分布(直径>60 km)Fig. 6 Spatial distribution of ice eddies(diameter > 60 km)
在过去的几十年里,北极夏季边缘冰区的宽度增加了约40%[36]。随着边缘冰区的扩大,浮冰也随之增加,相关研究[37]指出,海冰主要被困在具有强烈汇合驱动的汇合表面流的气旋型细丝内,以及摩擦埃克曼泵产生汇合的气旋型涡旋内。相反,反气旋冰涡则排斥海冰。这使得两者的尺寸和海冰占比出现差异,反气旋型冰涡的排斥作用导致其边缘区域存在浮冰积聚,而气旋型冰涡则将边缘冰卷入内部,从而在SAR 影像上整体显示出反气旋型冰涡较气旋型更大的现象。同时,这也造成了气旋型冰涡中海冰的比例更高。
进一步探讨2022 年北极冰涡的发生月份、直径以及海冰占比之间的关系,结果如图7 所示。其中散点代表各个冰涡的半径/海冰占比,折线则代表每个月份对应的冰涡最大半径/最大海冰占比。图7(a)给出了冰涡直径在不同月份的分布趋势,研究发现较大直径的气旋型冰涡主要出现在5—7 月份,而对应的反气旋型冰涡则多出现在3 月和10 月。总体来看,2022 年整年,较大尺寸的反气旋型冰涡占据了主导地位。图7(b)则给出了冰涡海冰占比随时间变化的情况。在大部分月份里,气旋型冰涡的海冰占比略高于反气旋型。气旋型冰涡的海冰占比在3 月份达到高峰,而反气旋型冰涡在4 月和5 月呈现明显的低值。此外,本文还探究了冰涡直径与海冰占比之间的关系,如图7(c)所示。研究发现,较小直径的冰涡对应的海冰占比波动范围较大,随着直径的增加,海冰占比稳定在30%~70%的范围内。
图7 冰涡分布统计散点图。(a)冰涡月度直径分布,(b)冰涡月度海冰占比分布,(c)冰涡海冰占比与直径分布Fig. 7 Scatterplot of ice eddy distribution. (a) Monthly diameter distribution of ice eddies, (b) distribution of monthly sea-ice share of ice eddies, (c) distribution of sea-ice share of ice eddies with diameter
3 结论与展望
基于哨兵一号卫星SAR 数据构建了一套北极冰涡遥感数据集,并在此基础上开展YOLOv7 目标检测训练,得到冰涡识别预筛选模型。将该模型辅助于目视解译,对2022 年北极边缘冰区的SAR 影像进行统计分析,识别出5097 个冰涡。这些冰涡主要分布在7—11 月期间,且在空间上主要聚集在格陵兰岛东侧沿岸以及格陵兰海中北部。气旋型冰涡的数量更多,海冰占比更高,而反气旋型冰涡的直径更大。
提出了深度学习YOLO 模型辅助目视解译的冰涡检测方案,该方案提高了冰涡目视解译效率,为后续冰涡的自动化检测提供了参考。此外,对2022 年北极边缘冰区冰涡的时空统计和形态特征分析为极地冰涡研究提供了观测数据支撑。
深度学习目标检测模型应用于边缘冰区冰涡检测尚属于初步研究阶段,还需要进一步对比验证更多的目标检测模型的应用效果。另外,鉴于哨兵一号卫星SAR 数据的幅宽和重访周期限制,其对北极地区的覆盖范围有限,无法充分反映冰涡的真实发生频率。因此在未来的研究中计划结合多源SAR 卫星数据,更全面地探究冰涡长时间序列的年际变化。最后,边缘冰区冰涡的时空分布背后的成因以及其对全球气候、洋流和物质循环的影响也将成为后续研究的重点。