APP下载

一种基于数据挖掘的锚泊半径模式提取方法

2017-08-09唐皇尹勇

船海工程 2017年4期
关键词:锚泊航次船长

唐皇,尹勇

(大连海事大学 航海动态仿真和控制实验室,辽宁 大连 116026)



一种基于数据挖掘的锚泊半径模式提取方法

唐皇,尹勇

(大连海事大学 航海动态仿真和控制实验室,辽宁 大连 116026)

为了使VTS中心关于走锚半径的设置更加准确,通过对AIS数据的处理,采用聚类方法提取出船舶锚泊时的航次数据,使用关联规则算法对提取的锚泊航次数据进行数据挖掘,建立船舶锚泊半径模式提取规则。将挖掘所得结果与国内外规范计算值进行对比分析,相对误差在可接受范围内。

数据挖掘;锚泊半径;模式提取;关联规则

VTS(vessel traffic service)中心是保障船舶航行安全的重要部门,但是在考察国内VTS中心值班过程的基础上,发现VTS值班员在设置走锚自动报警的阈值方面存在很大的随意性,VTS操作员大多凭借经验设置走锚半径,VTS设备不能根据具体船型及辖区水域情况给出指导性建议[1-2]。

远洋船舶主要锚泊方式通常采用单锚泊,船舶在锚泊过程中,围绕抛锚点做圆周运动,圆形区域的半径即为锚泊半径。船舶在锚泊期间,走锚是影响锚泊安全的隐患。通常情况下,锚泊半径的影响因素较多,如船型尺寸、锚泊水域环境影响以及船舶出链长度因素等[3-4]。目前,关于锚泊半径的计算主要采用经验公式[5],见表1。

表1 锚泊半径的相关规范

注:R为单锚泊水域锚泊半径(m);L为设计船长(m);H为锚地水深(m)。

然而采用经验公式计算锚泊半径具有一定的模糊性,因为不同船种、船型及船舶装载状态对锚泊半径的影响是不同的。国内也有学者采用回归分析得到锚泊半径的计算公式[6-7],虽然考虑了水域环境等影响因素,但其用于回归的船舶数据过少,无法回归出锚泊半径的一般性规律。

考虑到港口水域内获取的AIS(automatic identification system)历史数据可有效描述船舶运行状态,且融合了环境信息等影响因素,为了更有针对性计算锚泊半径,采用数据挖掘的方式对港口内的AIS历史数据进行挖掘处理,从而分析各影响因素对锚泊半径的具体影响,建立锚泊半径模式提取规则[8-10]。所挖掘的知识对于VTS中心关于船舶走锚半径的设定具有指导作用。数据挖掘模型流程见图1。

图1 锚泊半径模式挖掘流程

1 数据预处理

1.1 AIS数据清洗

船舶AIS发布的信息分为静态信息、动态信息和航次信息。由于船舶发送的AIS数据内容众多,需要从中筛选出船舶的锚泊数据,以及与之相关的船舶尺度和船舶类型数据,去除冗余数据。天津港一年的AIS历史数据筛选步骤如下。

1)查询数据库,将船舶动态信息中航行状态为1(锚泊船的航行状态参数为1)的数据提取出来并存入表1。

2)利用表1中的船舶MMSI编号,查询该船舶的船型、吃水等信息,并存入表2。

3)将表2中的数据进行整理,具有相同MMSI编号的船舶存入同一集合中。

4)去除数据集中船舶位置数据以及船型数据为0的数据记录。

经数据清洗,共筛选出321 916条数据记录,这些数据分别隶属于3 914条不同船舶。

1.2 基于AIS数据的船舶锚泊半径聚类

按照时间序列进行排序,将同一船舶的锚泊数据聚类形成锚泊航次数据。分析发现,船舶锚泊时,AIS发送间隔并不是要求的3 min。在同一个锚泊航次中,AIS发送间隔在10 000 s左右,并且当船舶离开锚泊状态时,AIS发送间隔会突变为几百秒。为解决这一问题,将同一船舶时间间隔在2 000~5 000 s之间,且前后2点距离小于800 m的数据作为一个锚泊航次。经过处理,聚类了11 159个锚泊航次。锚泊航次示意见图2。

图2 锚泊航次示意

获得锚泊航次数据之后,计算每个锚泊航次的锚泊半径,具体方法为:将接收的某船第一条锚泊数据作为该船的抛锚点,然后依次计算其余各点到抛锚点距离,取最大值。

(1)

2 船舶锚泊半径模式挖掘

2.1 数据离散化

在对比各离散化方法性能的基础上[7],综合考虑划分区间的个数及每个区间的元组个数,对数据属性值进行离散化。

2.1.1 船舶吃水离散化

将船舶吃水离散化为11个等级,具体离散化等级见表2。

表2 船舶吃水离散化等级

2.1.2 船长、船宽离散化

根据船型分布情况,将船长离散化为6个等级,见表3。同时将船宽离散化为9个等级,见表4。

2.1.3 锚泊半径离散化

为尽可能多的获得锚泊半径挖掘规则,本文将锚泊半径在300 m内的数据按间隔50 m离散化,剩余数据按间隔100 m离散化,见表5。

表3 船长离散化等级

表4 船宽离散化等级

表5 锚泊半径离散化等级

2.2 基于Apirori关联规则的锚泊半径模式挖掘

关联规则[12]挖掘最典型的例子是购物篮分析,通过发现购物篮中不同商品之间的联系,分析顾客的消费习惯。借鉴购物篮问题研究思想,将本文研究内容与购物篮中商品数据进行类比。基于类比规则,建立锚泊半径挖掘模型,如图3。根据挖掘规则挖掘船舶各属性值分别对锚泊半径的影响,同时挖掘联合属性与锚泊半径的关系。采用Python语言编程,基于Apriori挖掘规则建立锚泊半径挖掘模型,为了挖掘到更多的锚泊半径相关知识,其中最小支持度minsupp=0.0 001,最小可信度minconf=0.7。

图3 锚泊半径挖掘模型

3 数据挖掘结果分析

将数据预处理后获得的11 159条锚泊航次记录离散化,利用Apriori关联规则算法对数据进行挖掘,最终获得4 115条规则知识,部分知识表示见表6。在所获得的挖掘知识中,包括了本文所需的规则知识,同时也含有冗余数据。按照本文3.2.2所述挖掘模式进行筛选,共筛选出115条满足要求的规则知识,见表7。

表6 数据挖掘知识库

表7 锚泊半径模式挖掘知识

3.1 数据挖掘规则解释

基于锚泊半径模式挖掘知识库,选取部分知识规则进行解释。其中,dx,lx,wx,tx分别为船舶的吃水、船长、船宽及船舶种类;ax为船舶的锚泊半径,采用前述属性值离散化标准。其中:tx为船舶类型,需查表获得。

规则1解释。d3_l0_t90—a0,表明吃水在5~6 m范围内,船长在0~100 m范围内的高速船舶,其锚泊半径在0~100m范围内的可能性为100%,数据库中有0.045%的元组支持此规则。

规则2解释。d7_l3_w4—a3,表明吃水在10~12 m范围内,船长在200~300 m范围内并且船宽在25~30 m范围内的船舶,其锚泊半径在200~250 m的可能性为100%,数据库中有0.03%的元组支持此规则。

规则3解释。l1_t71_w2—a1,表明船长在100~150 m范围内,船宽在15~20 m范围内的货船,其锚泊半径在100~150 m范围内的可能性为100%,数据库中支持次规则的元组为0.02%。

规则4解释。d4_t80_w4—a2,表明吃水在6~7 m范围内,船宽在25~30 m范围内的油船,其锚泊半径在150~200 m范围内的可能性为100%,数据库中有0.02%的元组支持此规则。

3.2 锚泊半径挖掘结果对比分析

基于数据挖掘结果的知识整理见表8。

表8 锚泊半径模式知识整理结果

分析表8数据可知,锚泊半径随船长、船宽的增加而增加,每一个船长、船宽的取值对应了锚泊半径的一个取值范围;同时,锚泊半径随船舶吃水的增大而增大,但当船舶吃水增大到一定程度时,锚泊半径反而随吃水的增加而减小;不同种类的船舶,锚泊半径的取值范围也不同,通常情况下,杂货船及油船的锚泊半径大于渔船、拖轮等小型船舶。所述数据挖掘方法挖掘出了船长、船宽、吃水以及船舶种类对船舶锚泊半径的具体影响,通过给定船舶的船型参数、船舶种类以及吃水情况,可以判断其锚泊半径的大致范围。

以吃水10 m为例,计算不同船长对锚泊半径的影响,对比本文挖掘结果与国内外规范计算结果,并计算相应误差,见表9。

表9 锚泊半径挖掘结果与规范计算值相对误差

经分析,误差产生原因如下。

①国内外锚泊半径规范基于整体设计,未考虑船舶局部因素影响;

②采用的AIS历史数据只能反映船舶总体运动趋势,无法具体分析风、流等环境因素;

③为了安全起见,通常规范设计的安全阈值往往大于船舶实际产生的锚泊半径,本文采用的数据挖掘方式是基于船舶真实的运动数据,会与国内外规范计算所得锚泊半径产生一定误差。

4 结论

所提出的基于数据挖掘的锚泊半径模式提取方法可以较好的挖掘各影响因素与锚泊半径的对应关系。通过给定船舶各参数,算法可实时计算其锚泊半径。此算法对于VTS中心关于走锚半径的设定具有实际意义。同时,所提出的算法也存在缺陷与不足,不能充分考虑锚地内实时的风、流等环境因素。算法不能提取出所有的锚泊半径模式,为了获取更多的模式知识,还需要对大量的AIS历史数据进行处理。下一步的研究方向是将获取的锚泊半径模式知识用于机器学习,为实现智能VTS系统准备条件。

[1] 戚群,于涛.船舶交通管理系统(VTS)发展概况[J].中国无线电,2013(4):36-38.

[2] 陈厚忠.基于VTS系统监控的水上交通安全评估与效能分析[D].武汉:武汉理工大学,2002.

[3] 邓斌.基于蒙特卡洛算法的锚泊容量研究[D].大连海事大学,2012.

[4] 吴卫兵,尹建川.准确判断船舶走锚方法[J].中国航海,2012,35(4):124-127.

[5] 中华人民共和国交通运输部.海港总体设计规范JTS 165—2013[S].北京:中华人民共和国交通运输部,2013.

[6] 宋扬.基于AIS数据的大型船舶锚泊半径及船间距的研究[D].大连:大连海事大学,2010.

[7] 陈昌源.基于回归分析的锚泊半径[J].水运工程,2015(10):9-12.

[8] 朱飞祥,张英俊,高宗江.基于数据挖掘的船舶行为研究[J].中国航海,2012,35(2):50-54.

[9] SHELMERDINE R L. Teasing out the detail: how our understanding of marine AIS data can better inform industries, developments, and planning [J]. marine policy, 2015,54:17-25.

[10] PALLOTTA G, VESPE M, BRYAN K. Vessel pattern knowledge discovery from AIS data: a framework for anomaly detection and route prediction [J]. Entropy, 2013,15(6):2218-2245.

[11] 元昌安,邓松,李文敬,等.数据挖掘原理与SPSS Clementine应用[M].北京:电子工业出版社,2009.

A Method of Anchor Radius Pattern Recognition Based on Data Mining

TANG Huang, YIN Yong

(Laboratory of Marine Simulation and Control, Dalian Maritime University, Dalian Liaoning 116026, China)

In order to make the anchor radius setting more accurate in the vessel traffic service (VTS), the clustering and Apriori association rules was used to mine the automatic identification system (AIS) data. The rules of anchor radius pattern recognition were set up. Compared with the result calculated by standard formula, the result showed that it is acceptable to set the radius of anchor by the proposed method in the VTS.

data mining; anchor radius; pattern recognition; association rules

10.3963/j.issn.1671-7953.2017.04.047

2016-11-15

863课题(2015AA016404);中央高校基本科研业务费(3132016310)

唐皇(1991—),男,博士生

研究方向:航海动态仿真、交通系统虚拟现实技术等

U675.79

A

1671-7953(2017)04-0206-04

修回日期:2016-11-22

猜你喜欢

锚泊航次船长
维修型半潜船推进器辅助锚泊定位能力分析
小型系留气球锚泊车结构总体设计
“船长”失格
半潜式平台在外载荷下的位移计算与仿真
三一重工研发成功军民两用锚泊车
我国集装箱航运企业实施作业成本管理法面临的困难及解决方案
丢失
蚂蚁小船长