APP下载

基于信息熵的船舶航行与区域监控方法

2020-06-05崔威威张秉致曹德建

雷达与对抗 2020年1期
关键词:信息熵航向格子

崔威威,刘 硕,张秉致,曹德建

(中国船舶集团有限公司第八研究院,南京 211153)

0 引 言

随着国民经济快速持续发展,长江和沿海黄金水道的水面交通迅猛发展。海事监管部门不断完善船舶自动识别系统、水面交通雷达等监管设施,力图提高船舶活动监管能力。[1]船舶活动感知能力建设极大充实了目标活动数据库。如何充分利用AIS为代表的船舶活动信息,保障水上交通安全,提高水面交通规律认知与监管服务能力,积极应对潜在经济损失和环境破坏风险,是一个值得研究的问题。

作为准实时、更新快的信息源,船舶AIS信息是提高水面交通监管能力的重要依赖。[2-3]目前,针对AIS信息处理形成了一些结合局部区域地理信息的数据处理手段[4-7],侧重基于密度、流量的区域统计分析,以及船舶进出港、靠泊条件下的速度分析,能够提供目标碰撞概率、区域热点分析等数据应用。[8-13]终端设备使用与信息采集管理体制决定了AIS信息存在大量重复、抖动、缺失、甚至篡改伪装。如何在低质量数据场景下实现区域监控、船舶航行状态判别,并提供针对重要船舶与敏感区域的风险评估分析与预警告,尚未见到相应的报道。

1 主要研究内容

船舶AIS信息由静态部分和动态部分组成。静态信息包括移动服务识别码(MMSI)、国际船舶组织识别码(IMO)、船舶呼号、船名、船长、船宽、船舶类别等。动态信息包括船舶位置、船速、航向、艏向、转向率、航行状态、更新时间等。由于AIS设备是大型船舶必须配备的,理论上具有单一性、精度高、更新快、准实时的特点,是船舶身份识别、行为监控、规律统计的重要信息源。[14]为此,开展数据清洗、目标编批、航行状态评估与区域监控技术研究,形成面向船舶个体与区域的精细行为监控能力。

1.1 数据清洗

由于AIS工作原理、设备使用、传输机制存在的客观限制,船长可以关闭终端设备或者编辑静态信息。管理部门信息系统内的转发、记录、管理机制容易造成大量信息重复、错误和缺失等数据质量问题,必须进行数据清洗治理,提高数据处理的速度和质量,降低计算存储资源消耗。AIS数据清洗基本原则是:依据更新时间、位置、MMSI清洗重复数据,在无法获得精确航路、河道等地理信息时给定船舶活动的大致区域范围并删除野值信息。

1.2 船舶身份识别和AIS数据编批

由于静态信息存在被修改的可能,在实际中存在大量重复的MMSI、船名,无法基于MMSI、船名、船长、船宽等用静态信息准确区分船舶身份。同时,考虑到AIS更新存在的船舶动态信息存在错误的可能。为此,提出基于船舶呼号、时间和位置实现目标身份识别编批的基本思路,并进而修正船舶AIS的航速、航向等动态数据。

首先按照时间对MMSI相同的AIS数据进行排序,其次计算相邻AIS的时间差、距离和速度。指定船舶目标最高速度为30 m/s。如果前后两个AIS之间的速度大于阈值,则认为出现了两个目标。同时,考虑到AIS数据抖动,计算e(1)到s(1)+1、s(2)、s(2)+1之间的速度并修正编批结果。船舶AIS目标身份识别基本原理和编批流程见图1和图2所示。

图 1 AIS初步编批原理

为快速计算船舶AIS数据之间的距离,简单采用标准球体作为理想地球模型,从而降低计算复杂度。理论分析和实际处理表明,这样简化处理不影响低速船舶目标的速度计算经度,以及身份识别和编批结果。

图 2 船舶AIS目标识别和编批过程

假设两个A、B坐标分别是(Lat1,Lon1)和(Lat2,Lon2),其中A为中心点。按照下式计算B相对于A的距离dis:

Lati=90-Lati,i=1,2

c=sin(Lat1)*sin(Lat2)*cos(Lon1-Lon2)+

cos(Lat1)*cos(Lat2)

dis=R*acos(c)

其中,R=(6 378.14+5 253.755)/2≈6 316 km,是地球半径的近似值。最终得到目标由A到B的航向cour与航速velo:

cos(c)=cos(90-Lat2)*cos(90-Lat1)+sin(90-Lat2)*sin(90-Lat1)*cos(Lon2-Lon1)

sin(c)=sqrt(1-(cos(c))2)

cour=arcsin(sin(90-Lat2)*sin(Lon2-lon1)/sin(c))

velo=dis/Δt

需要注意的是,如果B点在A的第1象限则不对角度cour进行修正,如果在第2象限则cour=360+cour,如果在第3、4象限则cour=180-cour。

1.3 基于信息熵的目标运动状态评估

在理想条件的运动中,目标的航速、航向不会发生较为频繁或者剧烈的变化。船舶目标一旦出现剧烈、连续的运动状态变化,可能是航行条件变化、船舶状况异常、主观意图造成船舶操纵驾驶非线性变化。这种变化往往意味着潜在监管风险。处于异常状态的大型客货运船舶目标是特别需要管理部门相关人员重点关注的。本文借助信息熵方法评估在最近的一段时间内(或者全部航程)目标的航速、航向运动状态变化情况。

信息熵在计算过程首先对数据序列x={x1,x2,…,xn}进行去量纲,并可根据数据的不同属性提供成本型、效益型和适中型去量纲公式:

为了实现实时化的航行状态评估,可记录每个目标最近5 min内的目标速度和航行,进而得到此5 min内的速度、航向差分,以完成航行状态评估。在离线情况下,可以对AIS目标的全部数据进行处理。为防止xi=0,对上述xi公式进行修正处理,并在此基础上进行计算得到熵值e:

其中,k=1/(lnN),N是数组的x长度。

1.4 基于格子的船舶活动监控与目标伴随识别

按照网格进行区域划分、统计是实现热点区域监控的重要手段。为降低计算资源消耗,基于AIS信息动态生成统计网格。仍然取R=6 316 km作为地球标准球体模型的半径,并选取500 m作为格子的延伸,从而换算得到纬度延伸ExtLat=0.0045°。记在不同纬度的经度延伸、格子坐标分别是ExtLat、IdxLat、IdxLon,其计算公式如下:

IdxLat=floor(lati/ExtLat),i=1,2,3,…,n
ExtLon=500/(R*cos(IdxLat*ExtLat)*2*Pi/360)
IdxLon=floor(loni/ExtLon)

根据航迹的AIS信息计算得到所在的格子后可以动态统计格子内目标的进入和驶出时间、平均航速和航向,以及航速航向产生的熵值,从而完成格子内目标数量统计、运动情况评估和船舶伴随识别。此处认为,如果两个目标在同一个网格内出现时间差不超过5 min且在不少于10个格子出现,则认为两船存在伴随情况。在完成伴随目标处理后,进一步实现船舶编队航行判断,数据处理流程如图3所示。伴随是传递的,即如[Obja,Objb]、[Objb,Objc]是伴随目标对,则[Obja,Objb,Objc]是一个伴随群。

图3 格子生成与目标伴随识别

2 仿 真

此针对南京海事局辖区长江段2018年6月29日一天的离线AIS数据进行分析验证,提供如表1所示几类分析结果。

表1 分析结果

通过预处理、编批处理,一共获得9 592个目标,其空间分布与编批目标数随时间变化如图4所示。

图4 船舶AIS信息分布空间及编批目标数随小时变化

由图4可知,每小时存在的目标数不小于2 300个。如果不进行对目标的行为特征进行精细化处理和分析,就难以实现船舶与区域的风险监控。

在获得目标编批信息后,采用信息熵方法评估由目标航向、航速变化产生的熵值。图5给出熵值最大的2个目标的轨迹图及其速度、航向变化。

由图5可知,2个目标在运动中存在大量机动变向,而这些机动目标正是需要管理者重点关注的。

根据网格划分结果,统计活动目标最多的9个船舶密集区域,如图6所示。

图5 基于信息熵方法识别得到的高机动目标轨迹及其速度、航向变化

图6 船舶目标密集区域与航行风险区

最后借助网格统计获得伴随最长的1对目标。该伴随编队在早上8点钟左右出现在长江海事局辖区西部,下午5点钟驶出长江海事局辖区,如图7所示。

图7 一对伴随船舶目标轨迹图

3 结束语

本文提到的方法可以实现船舶AIS目标编批处理,利用信息熵方法识别高机动目标,并结合划分网格划分结果得到目标密集区和高风险区统计结果,可以提高伴随目标、机动目标和高风险区域的精细管理。不足之处在于,网格化分是按照大约500 m的距离根据AIS信息到中心点的位置计算得到的。这种网格化分方法没有考虑航道、港口等地理信息,存在网格划分不严谨的情况,其统计结果和对AIS地理空间分布特征的直观认知有一定的区别。因此,需要进一步完善网格化分和数据统计处理方法。

猜你喜欢

信息熵航向格子
数独小游戏
数独小游戏
基于事件触发的船舶航向逻辑切换自适应控制
风浪干扰条件下舰船航向保持非线性控制系统
基于信息熵可信度的测试点选择方法研究
无人救捞艇的航向控制器设计*
用“国家使命”导引航向——大学之大,重在推进产学研深度融合和科技成果转化
填出格子里的数
近似边界精度信息熵的属性约简
格子间