APP下载

基于全卷积网络的南太平洋长鳍金枪鱼渔场预报模型

2020-05-27袁红春陈冠奇张天蛟宋利明

江苏农业学报 2020年2期

袁红春 陈冠奇 张天蛟 宋利明

摘要:长鳍金枪鱼(Thunnus alalunga)为南太平洋延绳钓的主要目标鱼种之一,精确预报其渔场对于提高捕捞效率和优化渔业资源管理具有重要意义。本研究依据2000-2015年南太平洋长鳍金枪鱼的延绳钓数据、渔场时空数据以及海表温度、叶绿素a浓度和海面高度3种环境因子,采用全卷积网络构建了一种以月为单位、空间分辨率为5°×5°的渔场预报模型。本研究提出三维独热编码技术将各月环境数据映射到三维矩阵的不同层上,并设计2种卷积结构和3种全卷积网络模型,利用2015年数据对研究模型进行验证,最佳模型总精准率达到72.0%。结果表明,全卷积网络在一定程度上解决了传统渔场预报方法在处理高维复杂海洋数据时准确率偏低的问题,为渔场预报提供了一种新方法。

关键词:全卷积网络;三维独热编码;渔场预报;长鳍金枪鱼

中图分类号:S934文献标识码:A文章编号:1000-4440(2020)02-0423-07

Abstract:Thunnus alalunga is one of main objects of longline fishing in the South Pacific. Accurate prediction of albacore tuna fisheries is of great significance for improving fishing efficiency and optimizing the management of fishery resources. Based on the historical catching data of albacore tuna, spatio-temporal data and three environmental data including sea surface temperature (SST), sea surface height (SSH) and chlorophyll-a concentration (Chla) form 2000 to 2015 in the South Pacific, a fishing ground prediction model with a monthly unit and spatial resolution of 5°×5° in the South Pacific was established using fully convolutional networks. This model mapped the environmental data to 3D array using 3D one-hot encoding, and designed two types of convolution kernel and three types of convolution network models. The prediction accuracy reached 72.0% based on the environmental data in 2015. The results show that the fully convolutional network solves the problem of low accuracy of the traditional prediction methods in processing high-dimensional complex ocean data to a certain extent, and provides a new idea for fishing ground prediction.

Key words:fully convolutional networks;3D one-hot encoding;fishing ground forecasting;albacore tuna

长鳍金枪鱼(Thunnus alalunga)作为高度洄游的大洋性鱼类,广泛分布于三大洋,具有较高的经济价值和丰富的资源量。通过分析区域渔业管理组织的渔获量和努力量数据库发现,长鳍金枪鱼的种群主要分布于太平洋,并且近二十年来在南太平洋海域长鳍金枪鱼产量呈增长趋势。目前长鳍金枪鱼已经成为南太平洋金枪鱼延绳钓渔业的主要捕捞对象之一[1],准确预报南太平洋长鳍金枪鱼渔场,对于合理安排渔业生产,提高捕捞效益具有重要意义。

目前国内外学者将渔场预报看作是一种分类问题或者回归问题,通过统计学方法和GIS技术对渔场进行分析和预测。但是,由于海洋数据的复杂性和多变性,预测过程中需要人为对数据进行预处理和样本组织,整个过程较为复杂,且特征的筛选和预处理会直接影响模型的预测准确率,预测结果受人为因素影响较大。近年来国内外有研究者构建多种模型进行渔场预报,如Zagaglia等 [2-3]使用广义加性模型(GAM)和广义线性模型(GLM)对长鳍金枪鱼渔场进行回归预测。崔雪森等[4] 使用朴素贝叶斯方法对西北太平洋柔鱼渔场建立预报模型,在高产区取得了69.9%的预报准确率。宋利明等[5]使用支持向量机对不同水层的环境因子進行分析,得到了库克群岛海域长鳍金枪鱼栖息环境综合指数。

随着技术水平的提高,渔业数据规模变得更加巨大,而传统的线性模型在对高维度数据进行分析时,数据量较大往往导致模型准确率降低[6] ,所以现有渔场预报模型多基于小范围海域或者短期数据进行预测。深度神经网络在复杂动态场景中可以挖掘出重要的语义特征,对大规模数据有较好的拟合效果,其中深度CNN模型可以通过卷积和池化操作将不同环境因子进行交互运算,分析渔场等级。目前基于独热编码的神经网络模型已经在多个领域应用并取得了较好的结果[7-9] 。基于上述方法,本研究通过独热编码技术将环境数据映射到三维矩阵,构建全卷积网络的预测模型对南太平洋长鳍金枪鱼进行渔场预报,以提高南太平洋长鳍金枪鱼渔场预报的精度。

1材料与方法

1.1数据来源

根据南太平洋长鳍金枪鱼的作业范围,选取135° W~110° E,5° S~40° S为研究海域,采用2000-2015年的数据进行分析研究。

本研究的渔业作业数据来源于中西太平洋渔业委员会(Western and central pacific fisheries commission, WCPFC)的南太平洋延绳钓数据。该数据包括作业时间、作业空间坐标位置、钓钩数、捕获量(吨数和尾数)。该捕捞数据以月为时间分辨率进行记录,将产量以5°×5°空间分辨率进行汇总。

长鳍金枪鱼分布受海表温度、叶绿素a浓度、盐度、涡动能和海流等多种因子影响[10-12] ,因此本研究选取即时性较强、获取方便的环境遥感数据作为解释因子,包括海表温度(SST)、叶绿素a浓度(Chla)、海面高度(SSH)。其中海表温度、叶绿素a浓度数据来源于美国国家海洋和大气管理局(Nation oceanic and atmospheric administration, NOAA)环境数据库。海面高度数据来源于哥白尼海洋环境监测服务中心(Copernicus marine environment monitoring service,CMEMS)。该环境数据以月为时间分辨率,空间分辨率为1°×1°。由于作业数据和实际环境因子数据的空间分辨率不一致,本研究将环境因子取在渔区网格的中心点上,归并为5°×5°的空间分辨率。

1.2数据预处理

1.2.1单位捕捞努力量渔获量(CPUE)的计算在渔业作业生产中通常采用单位捕捞努力量渔获量来表示渔业资源的丰度水平[13] 。本研究在5°×5°的空间网格内对CPUE进行计算,公式如下:

1.2.2渔场等级划分研究中常使用三分位数将渔区按照CPUE的大小划分成若干个类别,从而将CPUE有效进行离散化[14],适用于分类模型。由于渔业作业中各月产量差异较大,仅以历史CPUE的三分位点进行分级并不能有效地表示各月渔场的实际丰度水平,甚至会导致某些月份不存在高产区或者高产区较少,不利于指导渔业作业。因此借鉴文献[15] 的分类方法,将渔区以各月CPUE的三分位数分位点66.7%和33.3%划分为高产区、中产区和低产区3类。

1.3基于三维独热编码的全卷积网络方法

1.3.1三维独热编码本研究基于独热编码技术提出一种三维独热编码方法,将2000年至2015年空间因子与环境因子数据映射为n×d×m大小的三维矩阵,其中n=5,为空间因子和环境因子(经度、纬度、海表温度、叶绿素a浓度、海面高度)数目,m=12,为总月数,d=320,表示通过独热编码将每种环境因子由大到小映射到320个等级。三维独热编码技术通过将不同月份的空间因子和环境因子映射到三维矩阵不同的层上,建立一个12层的三维矩阵,实现特征属性离散化。对于每一条数据的特征值使用独热编码进行转换,即建立一个320维的零向量ei,将特征值i的所有值由小到大划分为320个等级,若某条记录的特征值i处于第j个等级,则令向量ei的第j个分量为 1,其他值仍为0。将多个特征按顺序组合为二维矩阵N= [e1,e2,…,en],其中n为该条记录的空间因子和环境因子数目,本研究中n为5。若此条数据为m月,则令该三维矩阵的m-1层为N,其他11层为零。具体操作如图1。

1.4算法步骤

基于全卷积网络的渔情预测算法的步骤如下:

输入:  训练集(D)为2000-2014年环境因子数据和CPUE。

测试集T为2015年环境因子数据和CPUE。

输出:  测试集(T)的等级分类

Step1:对训练集和测试集进行数据预处理,并归一化到0~1。将各条数据按月CPUE三分位点将渔场划分为高、中、低3个等级,并生成D和T的标签集L1、L2。

Step2:对各条数据使用方法1.3的方法进行编码,将环境因子数据映射到三维矩阵。由训练集(D)构建三维矩阵集(D1),由测试集T构建三维矩阵集(T1)。

Step3:训练模型。将step2构造好的训练集(D1)输入到网络模型中作为输入数据,将标签集(L1)使用独热编码转换为输出向量,训练全卷积网络得到分类器(F)。

Step4:将测试集(T1)输入分类器(F)得到渔场预报结果R。将R与标签集(L2)进行对比得到模型的预报准确率。

1.5试验设计

本试验工作站显卡型号为NVIDIA GTX 1080Ti,CPU型号为AMD Ryzen Threadripper 1950X,操作系统为Windows10,并搭建了基于Python3.6的TensorFlow 1.3框架与Keras 2.0.8框架。

试验数据集为南太平洋海域2000年到2015年空间因子、环境因子和长鳍金枪鱼渔业作业数据。其中2000-2014年共有数据9 860条,将其按照85%和15%的比例划分为训练集和验证集,另外选择2015年743条数据作為测试集。

由于进行三维独热编码后数据维度较高但信息较为稀疏,所以设置初始学习率lr=0.000 5,并采用学习率动态调整,当进行了10次迭代循环后,验证集损失值仍不下降时,将学习率减半,衰减率(decay)=1.0×e-6,动量参数(momentum)=0.9。训练停止方式采取早停策略(Early stopping)防止过拟合[19] ,即15次迭代循环后验证集损失值仍不下降时结束训练,并将最大迭代次数设置为500。

本研究设计2组试验分别研究卷积核大小与网络结构对模型准确率的影响,为了评估模型性能,除了使用方法1.3.4的预报精度检验方法作为主要评估标准外,选择所有渔场的精准率(Precision)和F1分数作为综合评估参考。

1.5.1卷积核尺度对模型性能的影响本研究分别使用3×1的一维卷积核和3×3卷积核进行模型构建。特别强调在测试不同卷积核的效果时,网络结构与超参数设置均相同。

1.5.2网络结构对模型性能的影响对于网络卷积层数选择,本研究分别尝试了2到5层卷积层,并构建滤波器数目为64/128/256、128/256/512和256/256/256 3种不同结构的网络模型。

2结果与分析

2.1卷积核尺度对模型性能的影响

表1为使用不同卷积核时,在测试集上的对比结果。由表1可知,3×1的一维卷积核模型将大量中产区误分为其他产区,无法对各等级渔场进行明确划分,这是由于本研究的矩阵与传统的特征矩阵相比更为稀疏,不利于一维矩阵的特征提取。而3×3卷积核由于具有更大的感受野,有利于提取特征,因此本研究采用3×3卷积核构建模型进行训练。

2.2网络结构对模型性能的影响

通过观察损失值曲线发现,当网络层数增加到4层时,模型在50次迭代循环后就发生了严重的过拟合现象,因此模型最终设置3层卷积层。本研究数据经过三维独热编码后矩阵的尺度为5×320×12,矩阵高度较小,所以不进行高度降维,仅用步长为1×2和1×3的卷积层替代池化层(其中1×3大小的步长是对上一卷积层的全部输出特征值进行卷积运算的最大步长),行与行之间通过卷积核交互运算。通过分析表1,本研究将卷积核的大小设为3×3,激活函数使用ReLU函数。本试验一共设置3种不同结构的全卷积网络模型,每个模型都为3个卷积层和2个全连接层,整个模型采取全卷积结构,不使用池化层,具体结构见表2。

由表3可以看出,在选择不同过滤器数目时,全卷积网络模型均取得了较高准确率,但是随着卷积层滤波器层数的增加,由于深层网络节点数过多,网络发生过拟合现象,导致中产区被误分为其他产区,整体准确率下降。由于本研究网络模型采用全卷积结构,不存在池化层造成的信息损失,所以在各层可以采取相同的节点数。模型3将各卷积层均设置为256个滤波器,在增加模型参数量的同时保持了与模型1相同的深层网络节点数,不易发生过拟合现象,并且明显提高了准确率。因此本研究选用表现最好的模型3结构作为全卷积网络最终结构并将其命名为F-ACN。

2.3模型拟合分析

由于本研究样本数目庞大,传统渔场预报方法由于参数数目等原因预测结果并不理想,而F-ACN模型由于卷积神经网络的多层非线性结构和庞大可训练参数可以充分拟合多参数间的非线性关系,在大规模数据集上能取得更好的结果。如图2所示,在训练过程中训练集与验证集的准确率曲线和损失值曲线基本重合,F-ACN在验证集和测试集上的准确率仅略低于训练集,该模型表现出良好的泛化性。F-ACN模型在训练初期学习缓慢,这是由于本研究数据集划分没有明确的边界,模型在训练初期无法判明类别,梯度方向不断变化,当进行了约10次迭代后,损失值开始快速下降。

2.4不同模型预测结果

虽然国内外进行了大量漁场预报模型研究,但传统渔场预报方法多针对小型数据集,为了验证F-ACN模型准确率,本研究使用朴素贝叶斯方法、BP神经网络和深度神经网络(DNN)构建南太平洋长鳍金枪鱼预报模型与该模型进行对比。其中朴素贝叶斯模型采用文献[4] 的基于FastICA方法进行独立成分分析的朴素贝叶斯方法。BP神经网络采用5-512-3结构。DNN神经网络模型采取与CNN完全相同的节点数。

由表4可以看出,相比于其他模型本研究算法总体准确率最高,在高产区和低产区的预测准确率上有明显优势。实际作业受捕捞效率影响,渔业作业位置一般依赖于高产区预测结果,而F-ACN模型在高产区和低产区预测准确率较高,对于作业渔船寻找最佳渔场有较好的指导意义。由于渔情预报方法的渔场等级划分界限并不明确,只按照月CPUE的三分位点进行划分,而受实际天气、政策等因素的影响,渔场的实际水平可能高于或低于等级标签,所以处在2个等级边界部分渔场容易被误分,出现了中产区预报准确率明显低于高产区和低产区的现象。

3讨论

本研究针对传统渔情预报方法难以拟合海洋大数据的缺陷,提出了一种基于三维独热编码的全卷积网络南太平洋长鳍金枪鱼渔场预报模型F-ACN。本研究发现,F-ACN可以对大规模海洋数据进行特征提取,同时与传统渔情预报方法相比准确率明显提升,在一定程度上解决了传统渔情预报方法在处理高维复杂海洋数据时准确率下降的问题,为渔场预报提供了一种新思路。

F-ACN模型由多层卷积神经网络和DNN构成,比传统渔场预报模型具有更多的可训练参数,且非线性更强。同时F-ACN模型采用全卷积网络结构,使用步长为2的卷积层代替了池化操作,模型在卷积层的计算量比普通卷积神经网络减少了1/2,并且省去了所有的池化操作,极大地加速了运算速度。面对海洋数据大规模、多源化和异构性的特点,此模型可以更好地拟合复杂数据形式,自动获取海量高维数据中存在的复杂关联,精准预报渔场。

与回归模型相比,F-ACN模型得到的预报结果是一个离散值,即渔场等级,不存在一个连续的概率预测值,因此可以更加明确直观地表示渔场水平。同为分类模型的朴素贝叶斯方法要求各输入变量相互独立,模型进行训练前要对多种参数进行独立成分分析,这不仅增加了模型的复杂度还造成了数据信息量损失。而F-ACN模型是一种“黑盒”模型,并不要求渔业数据满足任何假设,只需要简单的对数据进行三维独热编码,原理和实现更为简单,不用考虑环境因子间的相互影响,因此该模型使用方便。同时F-ACN模型具有很好的可扩展性,在环境因子种类增加时,只需增加训练集三维矩阵的维度就可以在原模型进行训练,不需要进行其他预处理操作。但F-ACN模型只考虑到了渔场与环境因子的关系,独立地对渔场进行预报,而长鳍金枪鱼作为一种高度洄游的大洋性鱼类,各个渔区在连续时间内存在一定的空间关系,下一步需要将渔场的时间序列因素和空间相关性加入到模型中,提高渔场预报准确率。

参考文献:

[1]NIKOLIC N, MORANDEAU G, HOARAU L, et al. Review of albacore tuna, Thunnus alalunga, biology, fisheries and management[J]. Reviews in Fish Biology and Fisheries, 2017, 27(4): 775-810.

[2]ZAGAGLIA C R, LORENZZETTI J A, STECH J L. Remote sensing data and longline catches of yellowfin tuna (Thunnus albacares) in the equatorial Atlantic[J]. Remote Sensing of Environment, 2004, 93(1/2):267-281.

[3]ZAINUDDIN M, SAITOH K, SAITOH S E I I. Albacore (Thunnus alalunga) fishing ground in relation to oceanographic conditions in the western North Pacific Ocean using remotely sensed satellite data[J]. Fisheries Oceanography, 2008, 17(2): 61-73.

[4]崔雪森,唐峰华,张衡,等.基于朴素贝叶斯的西北太平洋柔鱼渔场预报模型的建立[J].中国海洋大学学报(自然科学版),2015,45(2):37-43.

[5]宋利明,周建坤,沈智宾,等.基于支持向量机的库克群岛海域长鳍金枪鱼栖息环境综合指数[J].海洋通报,2017,36(2):195-208.

[6]HARRELL F E, LEE K L, MARK D B. Tutorial in biostatistics multivariable prognostic models: issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors[J]. Statistics in Medicine,1996,1(15):361-387.

[7]李思琴,林磊,孙承杰.基于卷积神经网络的搜索广告点击率预测[J].智能计算机与应用,2015,5(5):22-25,28.

[8]LIU Q, YU F, WU S, et al. A convolutional click prediction model[C]//Association for Computing Machinery. Proceedings of the 24th ACM international on conference on information and knowledge management. New York, USA: ACM, 2015: 1743-1746.

[9]WANG P, XU B, XU J, et al. Semantic expansion using word embedding clustering and convolutional neural network for improving short text classification [J]. Neurocomputing, 2016,174: 806-814.

[10]毛江美,陳新军,余景.基于神经网络的南太平洋长鳍金枪鱼渔场预报[J].海洋学报,2016,38(10):34-43.

[11]宋利明,谢凯,赵海龙,等.库克群岛海域海洋环境因子对长鳍金枪鱼渔获率的影响[J].海洋通报,2017,36(1):96-106.

[12]范永超,戴小杰,朱江峰,等.南太平洋长鳍金枪鱼延绳钓渔业CPUE标准化[J].海洋湖沼通报,2017(1):122-132.

[13]ZAINUDDIN M, SAITOH S, SAIROH K. Detection of potential fishing ground for albacore tuna using synoptic measurements of ocean color and thermal remote sensing in the northwestern North Pacific[J]. Geophysical Research Letters, 2004, 31(20):183-213.

[14]ISMAIL A I, MORRISION E C, BURT B A, et al. Natural history of periodontal disease in adults: findings from the tecumseh periodontal disease study[J]. Journal of Dental Research, 1990, 69(2): 430-435.

[15]陈雪忠,樊伟,崔雪森,等.基于随机森林的印度洋长鳍金枪鱼渔场预报[J].海洋学报,2013,35(1):158-164.

[16]KRIZHEVSKY A,SUTSKEVER I,HINTON G E. Imagenet classification with deep convolutional neural networks[C]//NIPS. Advances in neural information processing systems. USA: Curran Associates Inc,2012: 1097-1105.

[17]SPTINGENBERG J T, DOSOVITSKIY A, BROX T, et al. Striving for simplicity: The all convolutional net[EB/OL].(2015-4-13)[2019-7-15]. https://arxiv.org/abs/1412.6806.pdf.

[18]张衡,崔雪森,樊伟.基于遥感数据的智利竹筴鱼渔场预报系统[J].农业工程学报,2012,28(15):140-144.

[19]PRECHELT L. Automatic early stopping using cross validation: quantifying the criteria[J]. Neural Networks, 1998, 11(4): 761-767.

(责任编辑:陈海霞)