基于深度卷积嵌入式聚类(DCEC)的海洋环境特征提取对渔情预报模型的改进研究-以西南印度洋大眼金枪鱼为例
2021-09-01张天蛟廖章泽宋博袁红春宋利明张闪闪
张天蛟,廖章泽,宋博,袁红春,宋利明,张闪闪
( 1.上海海洋大学 信息学院,上海 201306;2.上海海洋大学 海洋科学学院,上海 201306;3.上海海事大学 中国(上海)自贸区供应链研究院,上海 200135)
1 引言
大眼金枪鱼是我国远洋金枪鱼延绳钓渔业的主要捕捞对象[1],如何更精准地进行渔情预报是当前研究的热点。近年来,印度洋金枪鱼委员会(Indian Ocean Tuna Commission,IOTC)针对大眼金枪鱼渔业数据进行了系统的收集整理,形成了空间分辨率为1°×1°的详细数据集[2]。根据IOTC最新的资源评估结果可知,目前西南印度洋大眼金枪鱼资源状态良好,逐渐成为多个远洋金枪鱼延绳钓船队竞争目标之一[3]。因此,及时掌握和预测其资源分布状况,对我国今后管理和发展远洋金枪鱼延绳钓渔业具有重要的参考价值。
现有大眼金枪鱼渔情预报模型主要包括统计学模型、机理/过程模型和机器学习类模型。其中,统计学模型如沈智宾等[4]运用一元非线性回归方法建立了基于表温和海面高度的东太平洋大眼金枪鱼栖息地指数综合模型;机理/过程模型如Lehodey等[5]利用种群动力学模型预测印尼地区及邻近海域的大眼金枪鱼空间分布动态;机器学习类模型如Dunn和Curnick[6]采用广义加性模型(Generalized Additive Model,GAM)分析了印度洋大眼金枪鱼时空变动及与表温、盐度及海流之间的非线性关系。Brodie等[7]对比分析了机器学习类模型如增强回归树(Boosted Regression Tree,BRT)、半参数模型如广义加性模型、时空混合效应模型如向量自回归时空模型(Vector Autoregressive Spatiotemporal Model,VAST)等,指出时空与环境特征因子的提取对3种模型的预测精度均有较大影响。然而,目前大部分渔情预报模型使用渔区内的海洋环境因子月平均值,无法反映海洋环境时空动态性和复杂性,难以准确解析大眼金枪鱼的时空动态栖息环境。研究表明[8-9],基于机器学习的方法,可以从高时空分辨率遥感图像数据中提取海表动态特征值,有利于提高模型预测精度。查铖等[8]采用了人工神经网络卷积层对海表温度(Sea Surface Temperature,SST)矩阵进行局部特征提取;Guo等[9]提出了深度卷积嵌入式聚类模型(Deep Convolutional Embedded Clustering,DCEC),在深度嵌入式聚类(Deep Embedded Clustering,DEC)原有网络的基础上,加入了卷积自编码,在特征空间保留了数据的局部特征,提高了模型预测精度。本文以西南印度洋大眼金枪鱼为研究对象,基于DCEC模型提取海洋环境特征,并分析该方法对于渔情预报GAM模型的改进效果。
2 材料与方法
基于以往研究结论,SST是影响海洋鱼类活动最重要的海洋环境特征之一[10-12],且完整SST日数据较易获取,本文选择基于DCEC模型对SST进行特征提取。本文选取 2018 年 1-12 月 0.041 6°×0.041 6°的MODIS-Aqua和MODIS-Terra海表温度三级反演图像数据(以日为单位)构建DCEC模型,并基于Davies-Bouldin指 数 (Davies-Bouldin index,DBI)[13]确 定DCEC模型的最佳聚类数,在此基础上提取SST月特征值;为避免模型因子单一造成的欠拟合问题,本文借鉴杨胜龙等[14]采用SST和海表面叶绿素a(Chla)浓度遥感数据进行渔场预测的方法,选择了美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)网站 1°×1°的 Chla浓度月平均值作为辅助环境特征因子;选取IOTC 2018年1-12月1°×1°的西南印度洋大眼金枪鱼延绳钓渔业数据,用于计算单位捕捞努力量渔获量(Catch Per Unit Effort,CPUE);将基于DCEC提取的SST月特征值、Chla浓度月平均值与CPUE数据进行时空匹配,构建改进GAM模型;同时,采用SST月平均值、Chla浓度月平均值与CPUE数据构建基础GAM模型;采用联合假设检验(F检验)验证模型解释变量对响应变量的影响;采用赤池信息准则(Akaike Information Criterion,AIC)、均方误差(Mean Squared Error,MSE)绘制实测值和预测值的散点图并计算相关系数r,对比分析基础模型与改进模型的预测能力。
2.1 数据来源
渔业数据来自IOTC 2018年1-12月西南印度洋大眼金枪鱼延绳钓渔业统计数据,时间分辨率为月,空间分辨率为 1°×1°,研究区域为(15°~40°S,20°~60°E),如图1 所示。
图1 IOTC 2018 年 1-12 月 1°×1° 西南印度洋大眼金枪鱼延绳钓统计数据分布点Fig.1 The distribution of the longline bigeye tuna fishery data in the Southwest Indian Ocean in 1°×1° from January to December,2018 downloaded from IOTC
SST数据来源于MODIS-Aqua和MODIS-Terra传感器海表面温度三级反演产品图像,通过NASA GSFC 水色数据网(https://oceancolor.gsfc.nasa.gov/)下载得到,时间为2018年1-12月,以日为单位,初始空间分辨率为 0.041 6°×0.041 6°。
Chla浓度月平均值数据来自NOAA网站(https://oceanwatch.pifsc.noaa.gov/),时间为 2018年 1-12月,以月为单位,空间分辨率为 1°×1°。
2.2 数据预处理
2.2.1 CPUE计算
大眼金枪鱼CPUE(单位:尾/千钩)的计算公式为
式中, C PUE(i,j)、F(i,j)、H(i,j)分别是地理坐标为 (i,j)的月平均单位捕捞努力量渔获量、月总渔获尾数、月总投钩数。
2.2.2 海表温度图像预处理
2018年覆盖研究区域的MODIS-Aqua和MODISTerra的SST日图像数据共730幅(NetCDF格式,各365幅),采用MATLAB软件进行归一化处理,公式为
式中,P(x,y)表示位于 (x,y)处的归一化后的温度值;MAX 表示研究区域内全年SST的最大值; M IN表示研究区域内全年SST的最小值; S ST(x,y)表示位于(x,y)处的原始SST值。
归一化处理后,从每一幅图像中裁剪出CPUE对应的1°×1°渔区每日SST子图,每幅子图的大小为24×24 像素(每个像素点表示 0.04 16°×0.041 6°大小的区域),共得到子图133 590幅。MODIS-Aqua单张子图能够完整覆盖单位渔区的,仅保留MODIS-Aqua子图数据;MODIS-Aqua单张子图不能完整覆盖单位渔区的,将MODIS-Aqua和MODIS-Terra两张子图进行融合,具体处理如公式(3)所示(以MODIS-Aqua的数据为基准):
式中,P(x,y)表示为融合后的图像温度值;PA(x,y)表示MODIS-Aqua图像温度值;PT(x,y)表示MODIS-Terra图像温度值。融合后共得到66 795幅子图,再对得到的子图进行筛选,将无效像素(P(x,y)=0)占比大于50%的子图剔除,最终得到48 029张子图,每张子图覆盖范围为 1°×1°。
2.3 基于DCEC的海表温度特征提取
2.3.1 DCEC模型原理
DCEC是一种深度聚类算法,其基于深度学习与自编码器进行无监督学习,提取图像的聚类特征,进而将图像数据集样本划分为若干类簇,使相似度高的样本位于同一类簇,相似度低的样本处在不同类簇[9]。深度聚类的自编码器分为两个部分:编码器和解码器,自编码器的任务是将输入转化成一个低维表示,而解码器的任务是从低维表示重构输入。算法通过自编码器对数据进行降维后,使用损失函数对聚类结果进行微调,在最大限度保证不扭曲嵌入空间的前提下,完成模型优化并实现聚类。DCEC深度嵌入式聚类结构如图2所示。
图2中,x表示输入图像数据,本文中为48 029张SST图像数据;编码层和解码层各有3层卷积,数据首先输入编码器部分,经过3层步幅为2的卷积层后,被拉平为一维的特征向量;编码器部分的输出特征被解码器和聚类层接收后,基于损失函数不断对聚类结果进行微调,直至满足收敛性判定准则时停止。最终结果x′表示x基于编码器提取特征后,经过解码器还原后的输出图像;q表示x由聚类层生成的最优聚类结果。本文中使用的DCEC模型来自https://github.com/XifengGuo/DCEC。
图2 深度卷积嵌入式聚类模型结构Fig.2 DCEC model structure
2.3.2 DCEC模型聚类个数设定
在DCEC模型训练过程中,聚类个数的设定较为关键,聚类个数较小时,会使提取的SST特征过于单一;聚类个数过大,会导致提取的特征信息冗余且增大计算量。本文基于聚类算法常用的评价指标DBI[13]确定最佳聚类个数。DBI是用于衡量类间离散度与类内离散度的一种聚类准则,DBI越小,样本集中类内样本点相似程度与类间差异程度越高,聚类效果越好,计算公式为
式中,c表示聚类个数;si,sj表示第i个和第j个聚类中样本点与同一聚类簇中所有样本xk(1 ≤k≤ni)的平均值的标准误差;ni表示第i个聚类中样本点的个数;Pij表示si和sj的距离,即为
2.3.3 基于DCEC的海表温度特征提取
将48 029张SST图像按月分组,2018年每个月为一组,共12组;按照DCEC模型的最佳聚类个数对每组图像进行标注,每组中的第k张图像类别被标注为ck,公式为
式中,predict()表示DCEC模型的分类函数。
提取每组ck集合的众数,作为第M月SST的FM类别特征值,公式为
以上特征提取过程基于Python3.7实现。
2.4 GAM构建
GAM使用关联函数连接响应变量的期望和各个解释变量,基于平滑函数对每个解释变量单独进行拟合[15],GAM可以单独分析每一个解释变量对响应变量的非线性影响,是非参数化的数据驱动模型,具有很高的灵活性,在渔业研究方面的应用十分广泛[16-17]。本文基于控制变量法构建了两类GAM:基础GAM和基于DCEC特征提取的改进GAM。
两类模型所使用的响应变量均为ln(CPUE)(CPUE大于0),经过正态Q-Q图检验,ln(CPUE)的概率分布符合正态分布,如图3所示。
图3 ln(CPUE) 的正态Q-Q图检验Fig.3 Normal Q-Q chart of ln(CPUE)
基础GAM表达式为
式中,CPUE表示月单位捕捞努力量渔获量; C hla表示叶绿素a浓度月平均值;SST表示海表温度月平均值;s()函数表示自然立方样条平滑函数;模型的误差分布假设为高斯分布,连接函数为单位连接。
改进GAM表达式为
式中,CPUE表示月单位捕捞努力量渔获量; C hla表示叶绿素a浓度月平均值;FM表示基于DCEC提取的月海表温度类别特征值;s()表示自然立方样条平滑函数;模型的误差分布假设为高斯分布,连接函数为单位连接。
在构建两类模型时,采用十折交叉验证拆分训练集S和测试集T,训练集S用于拟合GAM并记录解释变量的各项评估参数,测试集T用于计算GAM的预测误差。
2.5 模型验证
2.5.1 模型解释变量验证
基于联合假设检验(F检验)来验证GAM模型中的解释变量对响应变量的影响。经过F检验后,解释变量的p值小于0.05,说明解释变量对响应变量影响显著,在此基础上,对比分析各变量解释率。
2.5.2 模型评估
采用AIC衡量模型的拟合优良性,AIC值越小,说明模型的拟合优良性越高;计算实测值和预测值的MSE,在相同的测试集上,均方误差越小表示模型的预测精度越好。MSE的计算公式为
同时,通过绘制实测值和模型预测值的散点图,并计算Pearson相关系数r,进一步评价模型的预测效果。Pearson相关系数r的计算公式为
3 结果与分析
3.1 基于DCEC模型的海表温度特征提取结果
绘制DBI随聚类个数变化的关系曲线,如图4所示。总体上,DBI随着聚类个数增加呈现下降趋势,直到当聚类个数n不小于30时,DBI呈现波动,不再显著下降。因此,本文将DCEC模型的最佳聚类个数确定为30。
图4 DCEC模型聚类个数对应的DBI曲线Fig.4 The curve of DBI corresponding to the number of clusters in the DCEC model
为体现48 029张SST图像的30个聚类结果特征,本文从每一类中随机选择了20张图像,如图5所示。
图5中,每一类图像的温度分布模式均具有明显的内部规律。例如,类别1和类别2的温度空间分布较为均匀,但类别2的平均温度比类别1更高;类别3、类别10、类别12、类别21等体现了不同方向的暖流与冷流交汇的温度分布模式,如类别3体现了暖流南下的趋势、类别10体现了暖流从西北方向与冷流交汇、类别12体现了暖流从东北方向与冷流交汇、类别21体现了暖流从东南方向与冷流交汇;类别4、类别8、类别9、类别19、类别24等则体现了更加复杂的暖冷流相互交汇与包围的模式。
图5 基于DCEC模型的SST图像聚类结果(每一类随机选取20张图片)Fig.5 The clustering results of SST images based on the DCEC model (20 images are randomly selected for each category)
按照DCEC模型的聚类结果对2018年1-12月各月的SST日图像集合取类别众数,得到各月SST类别特征值FM,与月SST平均值图像叠加,结果如图6所示。
如图6所示,西南印度洋整体范围内,各月SST平均值呈现了自南向北逐渐降低的变化过程,而与渔场CPUE对应的SST类别特征值FM随着季节的变化呈现了更复杂的规律。在南半球夏季(12月至翌年 2 月),马达加斯加岛东岸 18~25ºS,47~62ºE 之间的渔场数据分布较为集中,FM以类别3为主,SST主要呈现暖流南下的分布模式;秋季(3-5月),渔场分布范围更加分散,FM自北向南由类别3向类别10过渡,暖流从西北方向与冷流交汇;冬季(6-8月),渔场分布进一步扩散到了南非东南沿岸直到厄加勒斯角,整体渔场FM随着时间推移由类别10为主转变为以类别2为主,即呈现了温度较均匀的分布模式;春季(9-11月),渔场分布范围又重新缩小到马达加斯加岛东岸,且随着时间推移,FM由类别2为主转为以类别10为主的分布模式。
图6 2018年1-12月各月渔场CPUE对应的月SST类别特征值 F M与月SST平均值Fig.6 SST category feature F M corresponding to the fishery CPUE in each month and monthly average SST from January to December,2018
3.2 模型解释变量与CPUE的关系
基础GAM及改进GAM中的各因子解释率及p值如表1所示。结果表明,无论是模型中单独采用月SST类别特征值FM,还是将FM与Chla因子联合使用,改进GAM的综合因子解释率始终高于基础模型的综合因子解释率,说明本文中基于DCEC模型提取的月SST类别特征值FM对大眼金枪鱼CPUE影响更为显著。
表1 基础GAM、改进GAM中变量解释率与显著性水平Table 1 Variable interpretation rate and significance level in basic GAM and improved GAM
基础GAM的SST平均值、改进GAM的月SST类别特征值与大眼金枪鱼CPUE的关系曲线如图7所示。
图7 基础GAM的SST平均值(a)、改进GAM的月SST类别特征值FM(b)与CPUE的关系曲线Fig.7 The relationship curve between the monthly average SST and CPUE in the basic GAM (a),and the SST category feature F M and CPUE in the improved GAM (b)
SST平均值与大眼金枪鱼CPUE呈现非线性关系,总体变化趋势不明显,CPUE高值在温度为20.5~29.8℃之间时均有分布。改进模型中,月SST类别特征值FM在类别为2、10、24时,对CPUE值影响较为显著。
3.3 模型评估结果
根据基础GAM及改进GAM的残差图(图8)可知,两类模型的残差均近似符合正态分布,说明两类模型的预测结果均符合GAM的正态分布假设。
图8 基础 GAM(a)与改进 GAM(b)残差图Fig.8 Residual diagram of the basic GAM (a) and the improved GAM (b)
绘制 ln(CPUE)实测值与两类模型 ln(CPUE)预测值的散点图,如图9所示,能够看出基础GAM的ln(CPUE)预测值与实测值的相关性并不明显,而改进GAM的ln(CPUE)预测值与实测值的相关性更强。
图9 ln(CPUE)实测值与基础模型 ln(CPUE)预测值散点图(a)、ln(CPUE)实测值与改进模型 ln(CPUE)预测值散点图(b)Fig.9 The scatter plot of ln (CPUE) predicted by the improved GAM with the measured ln (CPUE) (a),and the scatter plot of ln (CPUE)predicted by the basic GAM with the measured ln (CPUE) (b)
基础GAM与改进GAM的AIC、MSE及两个模型CPUE预测值与实测值相关系数r如表2所示。
由表2计算得出,改进GAM相比基础GAM的AIC值降低了9.17%;预测误差MSE降低了26.7%;改进GAM预测值与实测值的相关系数r提升到0.60,体现了更显著的相关性。
表2 基础GAM、改进GAM的AIC、MSE、r值Table 2 AIC,MSE and r of the basic GAM and the improved GAM
综上,基于月SST类别特征值FM构建的改进GAM,其拟合与预测精度略优于基于月SST平均值构建的基础GAM。
4 讨论
4.1 DCEC模型在海洋特征提取方面的有效性
改进GAM的拟合与预测精度均优于基础GAM,总结其主要原因在于:
(1)基于DCEC模型对高分辨率的SST日图像进行非监督聚类,聚类结果能够较好地反映海表温度的时空动态特征与规律。DCEC模型采用深度栈式自编码器,能够把数据非线性映射到隐空间,并采用最小化Kullback-Leibler(KL)散度的方式来实现数据的聚类,已被证实在遥感影像分类、数据降维和图片降噪等方面取得了显著效果,提取的高层特征相比于传统的特征提取方法具有更好的幅度和相位信息[18-20]。本文中,DCEC模型同时对整个西南印度洋区域1-12月的48 029张SST日数据进行特征学习和聚类,在获取SST日温度图片的显著信息基础上自动提取图像特征,学习到的特征在时间、空间上具备可比性,鲁棒性较好。在本文得到的30个分类结果中,每一类图像均具有独特的温度分布模式规律,在此基础上按月提取分类结果的众数作为月SST类别特征值,能够充分体现每个月内小范围(1°× 1°)的海洋环境温度变化动态,避免了使用SST月平均值时对小范围特殊海洋环境的平滑作用。
(2)基于DCEC模型提取的SST特征体现了温度模式的时空变化规律,与西南印度洋的气候条件、季风状况和水文特征等相互耦合。南印度洋上常年都存在1个副热带高压单体,夏季(2月)偏东偏南,冬季(8月)偏西偏北,略接近南非-马达加斯加,冬季强度比夏季要强[21],在副热带高压控制下,本文中冬季渔区的SST特征(以类别2为主)也因此表现出稳定、均匀的分布模式;在25~35ºS 的南印度洋洋面上,常常可受到温带气旋边缘的影响,出现6~7级的大风,从多年平均来看,西南印度洋上每年12月至翌年4月生成的热带风暴占全球总数的12.4%[22],受此影响,本文中夏、秋季渔区SST特征呈现了冷暖流交汇的复杂分布模式(例如,12月至翌年2月CPUE对应的FM以类别3为主,秋季(3-5月),渔场分布范围更加分散,CPUE对应的FM自北向南由类别3向类别10过渡,暖流从西北方向与冷流交汇)。此外,西南印度洋的温跃层厚度也与本文中SST特征的季节变化具有一定的相关性。本文中1-3月渔区FM呈现出较为一致的冷暖交汇模式,而此区域的温跃层1-3月在受到海表温度、海面风应力和海表净热通量的季节变化控制下厚度达到最大值;8-9月FM对应的海表温度呈现稳定、均匀的分布模式,而此区域的温跃层也在这一时间段减少到最小值[23]。大眼金枪鱼作为高度洄游的大洋性鱼类,其洄游受气候条件、季风状况和水文特征等多种因素综合影响,本文基于DCEC模型提取的FM特征间接反映了这些因素的变化。而单独使用SST平均数据则会掩盖掉这些大范围因素对大眼金枪鱼栖息环境的重要作用。
4.2 西南印度洋大眼金枪鱼延绳钓渔获率与SST特征的关系
本研究发现,基于DCEC模型提取的月SST类别特征值FM对西南印度洋大眼金枪鱼渔场具有显著性影响。FM与西南印度洋大眼金枪鱼CPUE的关系曲线显示,高渔获率集中在FM类别为2、10、24的暖流南下或暖冷流交汇区域。印度洋10ºS以南的洋流是一个反时针旋转的南赤道环流圈,其西南分支形成了强大且稳定的马达加斯加暖流,平均流速为0.5~0.8 m/s,表层水温为22~28 ℃[24],在暖流南下的情况下,大眼金枪鱼在马达加斯加东岸形成了较为密集的分布。马达加斯加暖流沿马达加斯加岛东岸向南流动,后与马达加斯加岛西侧的莫桑比克暖流汇入厄加勒斯暖流[25],这又使得莫桑比克沿岸以南区域形成了一定的渔场。研究表明,海流对鱼类生长发育、摄食、洄游等均产生直接或间接的影响,海流会影响鱼类的正常游泳,使得浮游生物分布发生变化[26];冷暖洋流交汇处,各自密度不同,产生海水的垂直混合,底部的海水含有生物生长的氮、磷、钾等必需元素,这些含有氮磷钾等必需元素的海水来到海面,成为海洋浮游植物的物质来源,进而改变大眼金枪鱼饵料的栖息水层,影响其摄食[27]。宋利明等[28]指出,吉尔伯特海域大眼金枪鱼对海流的变化比较敏感,在较浅的水层,大眼金枪鱼的分布受到海流(尤其是水平海流)的制约。本文基于DCEC模型提取的月SST类别特征值FM初步判定了海流对渔获率的影响。
4.3 不足与展望
改进GAM的拟合与预测精度虽均优于基础GAM,但改进效果不是非常明显,总结主要不足及需要改进的工作包括以下几点:
(1)MODIS传感器数据的缺失对DCEC模型的特征提取产生了一定影响。实验中采用的MODIS传感器数据由于卫星原因存在部分缺失,因此对于部分区域采用MODIS-Aqua和MODIS-Terra两张子图进行融合,在数据预处理中舍弃了无效像素大于50%的图像数据,这在一定程度上破坏了SST图像数据的时间相关性,缩小了原始数据空间,对DCEC模型的特征提取过程带来精度损失,并会进一步对改进GAM的拟合、预测精度产生影响。下一步可以结合其他传感器数据,研究不同传感器之间SST数据的差异,得到多源数据融合方法,计算得出更为完整的SST图像数据,减小实验误差。
(2)IOTC的渔业数据是多个国家、地区共同采集的,数据质量的不一致性会影响GAM预测精度。IOTC提供的西南印度洋大眼金枪鱼延绳钓公开数据集主要来自韩国、中国台湾及日本等地,捕捞时间、地点、效率、设备等均有差异。本文仅计算了名义CPUE作为GAM的响应变量,会影响模型连续稳定的预测能力。下一步可以采用年、季度、经纬度、采样国家地区等非海洋环境特征因子先对CPUE进行标准化,然后针对标准化CPUE进行预测。
(3)大眼金枪鱼延绳钓渔业是一个复杂的系统,其影响因素也是多种多样,例如溶解氧、温跃层、海流等。本文仅采用DCEC模型对海表温度进行了特征提取,对GAM的改进效果十分有限,在今后的研究中应综合多方面因素,提取更多海洋环境的时空动态特征,在此基础上进行综合分析,为生产作业提供理论指导。
5 结论
本研究提出了一种基于DCEC模型的海洋环境特征提取方法,结合GAM对西南印度洋大眼金枪鱼延绳钓渔场进行预报。研究采用2018年1-12月0.041 6°×0.041 6°的 MODIS-Aqua和 MODIS-Terra海表面温度三级反演图像数据(以日为单位)构建DCEC模型,并基于DBI确定最佳聚类数,在此基础上提取海表温度的月SST类别特征值FM;采用FM、Chla浓度月平均值与CPUE数据进行时空匹配,构建改进GAM;采用SST月平均值、Chla浓度月平均值与CPUE数据构建基础GAM。两类模型对比结果表明:(1)基于DCEC模型提取的FM类别能够较好地反映西南印度洋海表温度的时空动态特征与规律,并与西南印度洋的气候条件、季风状况和水文特征等相互耦合;(2)FM相比SST平均值的因子解释率更高,对大眼金枪鱼CPUE影响更为显著,高渔获率集中在FM类别为2、10、24等暖冷流交汇区域;(3)改进GAM相比基础GAM的AIC值降低了9.17%;预测误差MSE降低了26.7%;预测值与实测值的相关系数r提升到0.60。本研究证明了DCEC卷积神经网络在海洋特征提取方面的有效性,后序研究可以参考本方法结合其他传感器数据,针对标准化CPUE并综合多方面海洋环境因素进行渔情预报。