中国近海捕捞机动渔船航次特征数据挖掘
2021-03-13高明远张胜茂汤先峰樊伟范秀梅伍玉梅朱文斌
高明远,张胜茂,汤先峰,樊伟,范秀梅,伍玉梅,朱文斌
(1.上海海洋大学 海洋科学学院,上海 201306;2.中国水产科学研究院东海水产研究所 农业农村部东海渔业资源开发利用重点实验室,上海 200090; 3.浙江省海洋水产研究所 浙江省海洋渔业资源可持续利用技术研究重点实验室,浙江 舟山 316021)
海洋捕捞机动渔船的航次是指渔船从某港口出海,在海上经过一段时间的捕捞作业后返回到港口(与出海港口不一定相同)的过程,是渔船出海捕捞作业的一个完整周期。航次频率、离岸距离等特征数据能反映渔船的作业习惯,有助于辅助渔船的进出港管理。在生产过程中,航次常用于制定渔船捕捞计划、设计作业航线、计算捕捞效益、记录渔获来源等[1]。少量航次通过人工记录完成,如渔船调查中通过记录的航次区分调查样本,渔业公司通过船长报告航次计算经济效益等。但人工记录航次方式耗时费力,难以适合大规模的渔船航次记录。目前,中国沿海地区射频识别(Radio frequency identification,RFID)技术的应用范围、建设规模等均已取得初步成效[2],实现了渔船进出港基本信息的实时采集[3]。另外,港口视频监控[4]、监视雷达也是获取渔船进港信息的重要手段[5]。这些方式是以监测港口渔船进出港状况为主,并不能监测渔船出港到进港的时间段内的作业信息,难以追溯渔船作业的完整航次。
为加强渔船进出港管理和捕捞渔获物监管,中国农业农村部发布了《农业农村部关于施行渔船进出渔港报告制度的通告》[6],在渔船进出渔港前,通过“进出渔港报告系统”向拟进出渔港管理部门报告,这种主动上报的方式具有较大的灵活性,但存在不报告、报告虚假信息等问题。目前,约6万艘中国海洋捕捞机动渔船(以下简称渔船)已安装了基于北斗卫星导航系统的北斗船载终端[7],占渔船总量的36%。北斗船位数据信息主要包括卡号、时间、位置、航速、航向等,数据记录的时间分辨率为3 min,空间分辨率为10 m。通过北斗数据挖掘技术提取渔船航次[8]、网次[9]、捕捞强度[10]等信息,并制作专题图[11],可为渔船进出渔港提供客观的数据参考。本研究中,利用渔船的北斗船位轨迹与海岸线空间拓扑关系,提取出渔船作业航次,并分析了中国各省(自治区)近海渔船捕捞的航次周期、特征、数量等信息,本研究方法和结果可为渔船进出港管理,以及正在开展的渔获物“定点上岸”工作提供科学参考。
1 渔船航次特征提取方法
北斗船位数据来源于北斗民用分理服务商,2018年船位数据质量较好的渔船有2.5万余艘,其数量约占近海捕捞机动渔船总量的18%。其中,浙江省和山东省均在5 000艘以上,分别占该省渔船总数的38.9%和27.5%;海南省和辽宁省均在3 000艘以上,分别占该省渔船总数的16.0%和18.3%;广西壮族自治区和江苏省在2 000艘左右,分别占该省(自治区)渔船总数的24.1%和27.7%;广东省1 000艘以上,占该省渔船总数的3.5%;上海、天津、河北等省市均较少,分别占该省(市)渔船总数的65.7%、8.5%、3.1%。本研究中对2018年12.87亿条船位数据进行航次提取,获取到航次数据39.98万个。
1.1 渔船进出港判断
港口格网是沿着海岸线划分出的多个0.1°×0.1°格网;海岸线点是沿海岸线按0.1°×0.1°格网切割海岸线而获得的切割线中点(图1)。图1中A~E处圆点是海岸线点,渔船出海作业过程中,其出海的每个航次由一系列时间序列船位点组成,虚线分别代表渔船的两个航次。
图1 渔船轨迹与港口格网空间叠加关系 Fig.1 Superposition relationship between fishing vessel trips and port grids
渔船在港口格网内至少有两个点才能计算渔船的进港与出港,港口格网间的空间关系有4种,如图2所示,(a)为独立的一个港口格网,(b)为两个港口格网相邻,(c)为两个港口格网中间间隔多个非港口的格网,(d)为两个港口格网间间隔一个非港口格网。获取渔船进入同一个港口格网的第一个点(P1)和离开港口格网的最后一个点(P2),如果这两个点的时间差大于指定的一个时间,即设定为渔船进港与出港的位置。
1.2 渔船航次特征计算
图1中有两个航次,分别是航次1和航次2。
图2 港口格网与渔船进出港关系Fig.2 Relationship between port grids and fishing vessels departing and entering
航次1从港口格网A出发,经过海上捕捞作业,在港口格网C返港;航次2从港口格网D出发,经过海上捕捞作业,在港口格网D返港。渔船出海的每个航次由一系列时间序列船位点组成,航程是各船位点间距离的和,前后两个位置点间的距离,通过球面上两点间距离的公式计算获得,航程(s)计算公式为
sinβisinβi+1]。
(1)
其中:i为一个航次的n个船位点;αi和αi-1为相邻两点的经度角(°);βi和βi-1为相邻两点的纬度角(°);R为地球半径(6 371.393 km)。
渔船的每个航次由多个点组成,每个点到岸线点的最短距离为航次中点的离岸距离,一个航次中筛选出的船位点离岸距离的和为累加离岸距离,累加离岸距离除以筛选点数据量为平均离岸距离。设海岸线点有k个,第i个岸线点经度角为αi,纬度角为βi,一个航次有n个船位点,第j个船位点的经度角为αj,纬度角为βj,则第j个船位点的离岸距离(dij)为
dij=R×arccos[cosβicosβjcos(αi-αj)+
sinβisinβj],i=0,…,k;
j=0,…,n。
(2)
航次的累加离岸距离为
(3)
以航次1的船位点a和b,以及航次2的船位点c为例(图1),航次1中船位点a的离岸距离为aA,船位点b的离岸距离为bB,航次2中船位点c的离岸距离为cE。
渔船出海记录位置点的时间间隔约3 min,通常一个航次记录的船位点较多,实际应用中为了减少数据量,当渔船航速低时设置的时间间隔长,当渔船航速高时设置的时间间隔短,因此,各时间段的船位点数量存在差别,影响离岸距离计算的准确性。离岸距离是特征数据,以小时为单位,选择1 h内的平均距离、最小距离,或接近某个时刻最近的点,本研究中,第ih内各船位点,最接近i时刻点的距离作为ih的离岸距离或离港距离,即
j=0,1,…,n。
(4)
筛选航次中的船位点,根据航程、离岸距离、计算方法输出数据,内容包括出港时间、经度、纬度,进港时间、经度、纬度,航次点数、航次里程、航次时长、离岸筛选的点数、离岸累计距离。
1.3 渔船航次特征提取
在渔船航次特征统计中,以各港口所在的省级行政区划为统计范围,对各省(自治区)港口总的进出港次数、平均离岸距离、平均离港距离等进行统计分析。
渔船航次特征提取流程如图3所示。本研究中首先利用ArcGIS Desktop软件处理近海岸线矢量数据,制作港口格网和海岸线点,然后导入到数据库中,渔船轨迹数据按照船名命名文件,存储成CSV格式;其次,读取船位轨迹数据,去掉其中重复的点,并按照时间排序;再次循环处理渔船的每条船位数据记录,判断船位点是否在港口格网内,如在格网内则确定是出港还是进港,找到一对出港和进港状态后,获取该时间的完整航次;然后计算航次的各船位点到海岸线点的距离,船位前后两点的航程,遍历完船位点后计算平均离岸距离、累计航程;最后,根据时间、行政区划统计航次的数据特征。渔船航次特征数据提取采用Visual Studio 2015 C#编程,使用SQL Server 2008数据库存储。本研究中通过计算机编程开发了航次提取软件,在联想system X3650 M5 服务器上提取航次耗时约6 h。航次提取完成后,利用ArcGIS Desktop软件把提取的出港点和返港点全部加载到地图中,并加载海岸线图层,比较渔船出港点(返港点)与海岸线关系,确保全部点均在海线附近的港口内。
2 中国近海捕捞机动渔船航次特征
2.1 渔船航次来源及去向港口
渔船航次一般从某港口出海作业,之后到另一港口[12],但渔船到其他港口补给、维修或者卸载渔获[13-14],本文中也会计算为航次,其航次时长一般在12 h内,为了减少这些非出港捕捞航次的影响,设置时长在6 h以上。各省(自治区)港口的航次统计显示,浙江省最高,其次是山东和辽宁(表1)。大部分渔船由本省港口出海作业后,再返回本省的港口,其航次比例约占95%,少量航次由本省港口出海作业后,返回相邻省航次比例约占4%,返回较远省航次比例约占1%。其中,辽东半岛与山东半岛相隔约90 km的渤海海峡,因此,辽宁省与山东省之间的航次较多,两省间约有3.7%的航次往来。
图3 渔船航次特征提取流程Fig.3 Feature extraction process of fishing vessel trips
2.2 渔船进出港时间
2.2.1 渔船进出港时刻 航次统计中,把6~720 h(30 d)以内的航次作为有效航次,2018年从全国港口共提取到39.98万个航次。根据每天的时刻统计(表2),渔船出港航次数的一个峰值在8:00—17:59时,占年总出港次数的56%;进港时间的两个峰值在5:00—10:59和13:00—18:59,分别占年总进港次数的33%、30%。
渔船出港、进港的时间与涨潮、落潮时间关系较大[15],渔船出港大部分选择落潮时段,进港选择涨潮时段,渔船随涨落潮进出港,航行速度快,能够节省燃油。渔获销售集中在早晨也是决定渔船进港时间的重要因素之一,一般渔船于6:00进港,经过3~6 h的搬运,完成渔获卸载。
2.2.2 渔船进出港农历日 按照农历日期统计(表3),2018年渔船出港次数有两个峰值和两个谷值,出港次数的两个峰值分别在每月的6—13日
表1 各省(自治区)港口渔船航次的来源港口与去向港口
表2 渔船航次进出港频数随时间的变化
和21—28日,分别占每月总出港次数的28%、30%,两个谷值,一个在每月的29日到下月的5日,另一个在每月的14—20日,分别占总出港次数的20%、21%;进港次数的一个峰值在每月的11—20日,占年总进港次数的37%。
分析渔船出港航次的两个峰值,可能是因为使用被动式捕捞网具的作业渔船(如张网)主要依靠潮水使渔获进入网具[16],一般在大潮(农历三十或十五)的前后几天作业,这个时间在朔望日前后;而使用灯光诱捕方式的渔船依靠灯光捕捞渔获[17],由于望日(十五)月光较强,影响灯光诱捕效率,因此,一般在朔日(农历初一)前后作业,受朔望日影响,渔船出港时间选择在符合作业时间的前几天出海。
2.3 渔船航次特征的变化
航次所用时间(航次时长)精确到小时(图5A),航次时长主要集中在120 h以内,约占全部航次数量的69%;航次频数(航次数量)随航次时长呈现指数递减,其趋势拟合式为y=2 485.8e-0.007x(R2=0.960 9),趋势线拟合程度较高。
表3 渔船航次进出港频数随农历日的变化
航次的平均速度在0~30 d可以划分为5段(图5B),分别为1 d以内、1~10 d、11~15 d、16~21 d、22~30 d;航次时长在1 d以内的平均航速为0.9~1.3 m/s;航次时长为1~10 d的平均航速为1.0~1.3 m/s,呈下降趋势;航次时长为16~21 d的平均航速为0.79~1.26 m/s,呈上升趋势;航次时长为22~30 d的平均航速为0.40~1.15 m/s,呈下降趋势。
航次的平均航程划分为2段(图5C),航次时长为0~21 d时,平均航程逐渐增加,趋势拟合式为y=82.811x+91.991(R2=0.956 8),趋势线拟合程度较高;航次时间为22~30 d时,平均航程增加减慢,趋势拟合式为y=9.896x+1 649.6。
航次的平均离岸距离划分为4段(图5D),包括0~10 d、11~15 d、16~21 d、22~30 d;航次时长为0~10 d时,平均离岸距离由18 km增加到144 km,呈线性增长,趋势拟合式为y=11.196x+15.445(R2=0.968 9),趋势线拟合程度较高;航次时长为11~15 d时,平均离岸距离为101~160 km,呈下降趋势;航次时长为22~30 d时,平均离岸距离为84~199 km。
图5 渔船航次指标随航次时长的变化Fig.5 Variation of trip index for fishing vessel with trip duration
航次特征数据中,航次频数、平均航速、平均航程和平均离岸距离等随时间变化的曲线中叠加了周期为24 h的波动。航次频数随时间变化的24 h周期波动是因为渔船进出港受选择时间的影响。而平均航程、航速和离岸距离的24 h周期波动,则是因为不同捕捞类型渔船的作业特点存在差别,如灯光围网白日寻找渔场,晚上捕捞;拖网全天可以作业[18];刺网多数在白日下网和收网。多种捕捞类型的叠加导致航次各指标出现周期性波动。
目前,中国海洋捕捞机动渔船以小型为主,44.1 kW以下有10.9万艘,44.1~441 kW有5.4万艘,441 kW以上仅2.6万艘[19]。小型渔船主要在近岸渔场作业,航程和离岸距离短;较大的渔船作业航程、离岸距离长。小型渔船航次周期短,相同时间内航次的频次高,因此,航次频数随航次时长呈现指数递减。
不同捕捞类型的渔船作业时,离岸距离、作业航速差别较大,因此,多种渔船航次特征数据变化明显。1~10 d航次的平均航速随航次时长变化较小,平均离岸距离随航次时长呈线性增加,拟合系数达到 0.968 9,这段平均航速较大,可能以小型拖网渔船为主;11~15 d的航次平均离岸距离在140 km左右,呈下降趋势,平均航速也呈下降趋势,可能以刺网捕捞渔船为主;16~21 d的航次,平均离岸距离在150 km左右,平均航速呈上升趋势,航速较低,可能以张网捕捞渔船为主。
3 渔船航次特征的统计分析
渔船的航次时长为右偏斜分布(图6A),其中,江苏的航次时长范围变化最大,辽宁最小;江苏航次时长平均值高达6 d,其次为浙江、山东、广东,航次平均时长在4 d左右,海南、广西在3 d左右,辽宁平均航次时长低至1.9 d。
航次的航程也为右偏斜分布(图6B),山东、江苏、浙江、广东航次的航程范围变化较大,辽宁、海南、广西变化较小;山东、江苏、浙江平均航程最大,为400 km左右,海南、广西平均航程为260 km左右,辽宁平均航程最小(152.3 km)。
航次的平均离岸距离为右偏斜分布(图6C),山东、江苏、浙江、广东航次的平均离岸距离范围变化较大,山东、浙江平均离岸距离为70 km以上,山东、广东平均航程在50 km左右,辽宁、海南、广西平均航程为30 km 左右。
渔船航次的平均航速接近对称分布(图6D),主要分布在1 m/s左右,其中,山东省最高,为1.31 m/s,其次是辽宁,为1.2 m/s,浙江、广东、广西相同,均为1.1 m/s,海南最低,为0.8 m/s。
图6 渔船航次指标的箱体图Fig.6 Box diagram of vessel trip index
渔船的航次时长、航程和离岸距离等,均由江苏向北、向南降低,且均向右偏斜。江苏近海水深较浅,多辐射状沙脊[20],渔场资源量相对较低,渔船需航行到较远的大沙渔场、连青石渔场等作业。辽宁、广东、广西和海南的航次时长、航程、离岸距离相对其他省市分布值较小,这是因为这些省份的渔船大部分在较近的渔场作业,如辽宁近海的辽东湾渔场,广东近海的珠江口渔场,广西近海的北部湾北部渔场,海南省近海的4个渔场。
广西、山东、江苏、浙江航次的平均离岸距离在5—9月休渔期均有所下降,广东在休渔期与其他月份相比明显升高,海南和辽宁平均离岸距离均较小,全年变化不大(表4)。
表4 各省(自治区)港口航次的平均离岸距离月变化Tab.4 Monthly variation in average offshore distance in various province (autonomous regions) ports km
广东航次的平均航程比较大,5月份达最大值;广西、山东、江苏航次的平均航程在休渔期明显下降,浙江下降较少,海南和辽宁航次的平均航程较小,全年变化不大(表5)。
表5 各省(自治区)港口航次的平均航程月变化Tab.5 Monthly variation in average trip in various province (autonomous regions) ports km
中国近海受伏季休渔期影响[21],渔船的平均离岸距离与平均航程月变化较大。其值在广西、山东、江苏和浙江的休渔期较低,其他时间较高;在海南和辽宁月变化较小;在广东休渔期较高,其他时间较低。由于休渔期有钓具渔船生产,而且主要在渔场离岸较近的海域作业,可能还有一些调查船作业,故有少量航次。在休渔期间,广东一些渔船到离岸较远的北纬12°以南的南沙海域作业,因此,渔船休渔期平均离岸距离和平均航程均较大。
4 结论
本研究中把海岸线用0.1°×0.1°格网划分成港口格网,格网中海岸线上选一个居中的点作为海岸线点,通过渔船轨迹点与港口格网相交分析获取进出港的航次点,提取航次,通过计算渔船轨迹点与海岸线点的球面距离,并取其平均值作为平均离岸距离。编程实现后,该方法在2018年近13亿条数据中,提取39.98万个航次数据,耗时约6 h,通过对提取航次进行分析后得出如下结论:
1) 按照每天的时刻统计,出港航次数的一个峰值在8:00—17:59,占年总出港次数的56%;进港的两个峰值分别在5:00—10:59和13:00—18:59,占年总进港次数的33%、30%。
2) 按照农历日期统计,出港航次数有两个峰值和两个谷值,出港的两个峰值分别在每月的6—13日和21—28日,分别占年总出港次数的28%、30%;两个谷值,一个在每月的29日到下月的5日,另一个在每月的14—20日,分别占年总出港次数的20%、21%;进港的一个峰值在11—20日,占年总进港次数的37%。
3) 航次特征数据存在明显的24 h周期波动,且航次特征数据受大小潮、朔望日等影响较大,可划分为1~10 d、11~15 d、16~21 d和22~30 d等航次时长段。
北斗船位数据提取航次具有速度快、实时性强的特点,基于北斗数据挖掘的服务将成为渔业管理的重要信息来源之一。