远洋船舶数据监控模型设计与实现
2024-06-27邓梓昭
邓梓昭
摘要:综合船舶报文到报情况、气象观测要素质量,以船舶报文到报率、气象要素实有率及正确率作为评估指标,形成一套基于加乘混合法的多指标评价模型,对船舶进行量化评估,及时反馈问题,从而完善对远洋船舶数据的日常监视。模型的设计与实现,从单一数据到报率监控考核转变为针对气象要素有效性的监视,同时实现自动化监视和评估,解决了以往业务中人工考核繁琐、时效性差、数据质量监控力度不足等问题,实现了远洋船舶数据精细化运维监控。
关键词:数据监控;远洋船舶;气象要素;监控评估
一、前言
2009年,为了弥补我国海上气象信息观测工作基础薄弱、海上气象信息不足的状况,提高海上天气预报准确率及气象服务能力,在中国气象局相关职能部门协调下,国家气象信息中心与相关航运部门开展了海上船舶气象观测资料收集传输工作[1]。目前远洋船舶数据的监视考核仍停留在定期手工汇总整理、人工干预的阶段,考核繁琐、时效性差等不足因素导致对船舶数据的监控频次不足,不能很好满足业务需要。与此同时,船舶观测资料以人工观测、人工发报为常见形式,往往受人为因素、网络故障、船舶靠岸等不可预测情况影响[2],出现由于缺测、手工录入错误数据以及探测设备故障等因素导致的数据质量问题,而传统的针对单一完整率、及时率的考核监控模式并不能保证这些数据质量问题及时被监控、发现并反馈,进而导致数据无法使用。
二、船舶数据监控模型构建
监控模型在综合船舶报文到报情况、气象观测要素质量的基础上,基于海洋气象要素质量控制方法及质控码信息,以报文到报率、要素实有率、要素正确率为评估指标,形成一套基于加乘混合法的多指标评价模型,对船舶数据进行量化评估,从而对船舶数据进行监控,及时反馈问题船舶。监控模型详见图1。
(一)完整性监控
通过梳理船舶报文业务时次、应到船舶数量信息,将远洋船舶监控纳入目前信息中心业务化运行的“天镜”综合气象监控系统[3]中,按照船舶呼号及到报时间对考核船舶进行实时监视,并设置合理告警阈值,及时反馈到报情况并跟进。
(二)数据质量评估
监控模型对船舶探测要素的质量控制码以月为周期进行统计,在此基础上对船舶数据进行评估。模型主要针对报文到报率、气象要素综合实有率以及综合正确率进行评估,并基于加乘混合法得到船舶综合考核结果,以此作为判定船舶质量情况的重要依据。
1.指标选取及构建
船舶观测要素包括10种,分别是天气情况、海平面气压、干球温度、湿球温度、风速、海水温度、能见度、云状、云量及浪高观测。涉及的质量控制结果均依据现有信息中心业务化使用的气象要素质量控制方法和质控信息[4-5]。质控码信息详见表1。
参照相关研究及数据集研制所采用的评估方法[6-8],模型对每月考核船舶所观测气象要素的质控码信息进行统计,涉及船舶应观测数据量、实有观测数据量、正确观测数据量。其中,应观测数据量包含每艘船舶所有的探测数据数量;实有观测数据量为气象观测数据中对应质控码信息为非“8”的数量;正确观测数据量为气象观测数据中对应质控码信息为“0”的数量。
实有率和正确率计算方法如下:
(1)
(2)
(1)-(2)式中,
i表示第i艘船舶;
j表示日期,j=M1,M1+1,M1+2,……M2,M1为起始日期,M2为截止日期。
模型选取报文到报率、船舶综合实有率、船舶综合正确率3个一级指标,干湿球温度、天气情况、海平面气压、风速、浪高、海水温度、能见度、云状云量的实有率、正确率等20个二级指标。船舶评估指标体系详见表2。
2.评价方法及结果
依据相关综合评价理论,在多指标综合评价中,评估结果是通过将多个指标对事物不同方面的评价值综合在一起,得到一个整体性的评价。用于合成的数学方法较多,根据相关研究方法[9],大致分为加权线性和法、乘法合成法、加乘混合法等综合评价方法。本文在现有指标参数及体系基础上,基于加乘混合法对远洋船舶进行综合评价分析。
由于加乘混和法需要明确各计算要素之间的相关性强弱,本文首先分析了参与评价的各数据指标之间的相关关系。
(1)指标相关性分析
利用Pearson相关系数法来分析综合评价体系中涉及的指标之间相关性。Pearson相关系数分析法主要用于研究客观事物之间相互关联的数量特征,使用相关系数对相关关系的存在性给出判断,同时对相关关系的强度给出度量和分析[10]。
首先将船舶探测各气象要素正确率以及实有率进行等权重计算,得到每艘船舶综合正确率以及实有率评估指标,然后计算其对应报文到报率、综合实有率以及综合正确率之间的相关性系数。
(2)加乘混合评价方法
根据相关性分析,报文到报率与综合实有率之间相关性较强,而报文到报率与综合正确率、综合实有率与正确率之间呈现弱相关性,按照加乘混合评价模型相关性较强指标相乘、差异较大指标相加原则,本文将船舶报文到报率与综合实有率相乘,再与综合正确率相加,最终得到船舶综合评估数值。
具体公式如下:
(3)
(4)
Uj表示第i艘船舶第j个要素的实有率;
Vj表示第i艘船舶第j个要素的正确率;
Yi表示第i艘船舶的要素综合实有率;
Zi表示第i艘船舶的要素综合正确率;
n为船舶探测要素个数。
(5)
Ai表示第i艘船舶的综合评估值;
Xi表示第i艘船舶的报文到报率。
(3)评估结果
经过评估计算,最终得到每月远洋船舶综合评价数值及排序情况,依据评判数值选取综合评估值域的后10%进行重点关注。评价体系中涉及各指标的评价值均在[0,1]范围内,经过加乘混合评价后,综合评估值的值域在[0,2]范围内。
每月动态对考核船舶进行评估,评估值较低的船舶需要与数据提供方协商沟通,考虑是否存在船舶数据传输中断、数据缺报或者仪器设备故障等因素,进而判断是否需要替换船舶。
三、 船舶监控模型实现
(一)功能设计
系统应用架构由数据接入层、功能层和展示层组成。数据接入层包含数据接入和数据存储模块,确保船舶监控模型从数据库中采集实时业务数据。功能层包括船舶完整性、要素质控情况统计及评估功能模块。展示层主要对功能层评估数据做进一步展示,主要为数据图表、地图轨迹可视化等功能模块。模型系统架构详见图2。
系统模型流程设计方面,监控评估流程包括业务库实时数据接入、数据完整性监控、质控信息统计与评估、船舶轨迹可视化。系统模型流程详见图3。
(二)完整性监控
获取实时业务数据后,通过与考核船舶清单进行对比,监控模型及时统计当日船舶到报情况。
(三)质量评估
基于观测要素质控结果,以月为考核周期,对船舶传输及质量情况进行综合评估。船舶评估结果详见表3。
通过评估结果,可以看出船舶呼号为VRDQ5、SVCL9的评估数值为0,在[0,0.2]区间,属于存在问题船舶,需进一步核查数据缺收、观测要素质量问题,及时与数据提供方进行反馈,判断是否存在船舶退租或其他观测设备问题。
四、结语
本文以国家气象信息中心实时传输的远洋船舶气象数据作为研究对象,通过构建监控模型,对其数据传输的完整性以及质量情况进行更为及时、有效的运维监控工作,验证模型可行性。系统模型通过对船舶数据的监控、评估结果表明,文中的监控和评估模式简明且适用,可以对船舶报文传输及所探测的气象数据质量情况进行及时、有效的运维监控,确保数据有效应用。
参考文献
[1]张钛仁,宋溱,陈松军,等.海洋船舶气象观测信息有关情况调研报告[J].气象软科学,2008(04):83-87.
[2]彭垣.影响船舶测报资料质量因素的初步分析[J].海洋通报,1997,16(04):72-77.
[3]孙超,气象综合业务实时监控系统(天镜).北京市,国家气象信息中心,2022-08-29.
[4]张冬斌,全球海表观测资料质量控制方案.北京市,国家气象信息中心,2020-09-27.
[5]张冬斌,海表观测资料质量评估方案.北京市,国家气象信息中心,2020-09-27.
[6]高静,刘一鸣,任芝花,等.中国主要作物生长发育长序列产品的研制及应用[J].气象科技进展,2018,8(01):189-196.
[7]张强,赵煜飞,范邵华.中国国家级气象台站小时降水数据集研制[J].暴雨灾害,2016,35(02):182-186.
[8]侯灵,杨玉红,陈晓庆.广东省区域自动站数据的质量分析与评估[J].广东气象,2019,41(05):51-53.
[9]邱东.多指标综合评价中合成方法的系统分析[J].财经问题研究,1991(06):39-42.
[10]黄毅,聂文志.Pearson相关系数分析法在西太平洋副高特征量分析中的应用[C]//第30届中国气象学会年会.中国气象学会,2013.
作者单位:国家气象信息中心
■ 责任编辑:王颖振、杨惠娟