APP下载

基于大数据挖掘的船舶通信系统关键设备状态分析

2023-05-04吴松丽

舰船科学技术 2023年5期
关键词:关键设备数据挖掘区间

杨 青,吴松丽

(1.河南师范大学 计算机科学与技术系,河南 新乡 453007;2.驻马店职业技术学院,河南 驻马店 463000)

0 引 言

船舶通信系统内设备种类较多,包含有线、无线等多种通信设备,其在航行过程中的信息流通量较大。船舶通信系统内各种设备共享通信结构[1-2],使船舶通信高度自动化,保障信息传输安全可靠、联络通畅。但受船舶通信系统设备之间的兼容性以及航行过程中不可控因素影响,船舶通信系统内关键设备一旦出现问题,会导致船舶与地面站连接中断,接收不到地面指令,同时影响其雷达导航、避障等多个功能,为船舶航行带来潜在威胁,因此分析船舶通信系统关键设备状态意义重大。现在也有很多学者致力于分析船舶通信系统关键设备状态,如蓝志威等[3]使用大数据挖掘技术,从入侵监测角度分析船舶通信系统关键设备运行状态,该方法通过采集船舶通信系统关键设备运行异常时的信息后,将其转换成频域信号,在分析该频域信号特征,使用聚类算法实现其设备运行状态监测。但该方法受聚类算法参数选择存在主观性影响,导致其分析结果不够准确,因此应用效果不佳。王瑞涵等[4]以机器学习算法为基础,使用流形学习方式获取船舶通信系统关键设备运行时的有效数据特征后,将其输入到机器学习算法内,通过训练构建检测器,实现船舶通信系统关键设备状态分析。但该方法在提取数据有效特征时,受数据维度影响提取结果不佳,影响其应用效果。在信息时代,大数据挖掘技术是从海量信息内,挖掘出信息之间存在的关联关系,通过用户容易理解的方式呈现出来[5],用于监测、识别、预警等。本文以大数据挖掘技术为基础,研究基于大数据挖掘的船舶通信系统关键设备状态分析方法,为提升船舶通信系统通信质量提供技术支持。

1 船舶通信系统关键设备状态分析方法

1.1 船舶通信系统关键设备运行状态信息采集

采集船舶通信系统关键设备运行信息过程为:用户通过PC 端登录船舶通信系统关键设备运行信息采集控制中心,将北向接口和设备直连协议封装到协议栈内,通过协议栈向船舶通信系统关键设备发出连接请求,判断当前关键设备是否为北向接口,若是则连接北向设备接口,反之则直接连接设备;然后判断设备是否连接成功,若是,则向采集控制中心返回关键设备运行信息采集结果,反之则重新判断是否为北向接口,重新连接设备。

1.2 关键设备状态时间序列变化过程挖掘

利用运行状态信息构建数据集X=[x1,x2,···,xn],n表示数据集内状态信息总数,使用大数据挖掘算法中的自组织映射神经网络(SOM)挖掘船舶通信系统关键设备运行信息的时间序列变化过程,得到其运行状态变化规律,详细过程如下:

将X=[x1,x2,···,xn]输入到自组织映射神经网络后,神经网络将该信息映射成神经元,然后使用一阶转移概率P描述神经元之间的关系。Qt表示经过该神经网络量化后的船舶通信系统关键设备运行状态信息时间序列,t为时刻,则第n个自组织神经网络模型AR(n)内,神经元之间的一阶转移概率可由P[qt+1|qt,···,表示qt∈Qt。时间序列[Q1,Q2,···,Qt]的取值为[1,2,···,N],则在t时刻,qt取值为Qi的概率计算式如下:

式中:QI为时间序列[Q1,Q2,···,Qt]内的第I个时间状态;i(xt)表示第i个船舶通信系统关键设备运行信息单量时间状态。

计算i(xt)的概率密度,表达公式如下:

式中:Qj为[Q1,Q2,···,QN]内任意时间状态;||·||为欧式距离。

状态信息x和时间状态q均为一维数组,且状态信息满足正态分布规律[5],则可用正态分布函数简化公式(2),其变更如下:

当I数值分别等于1 和等于N时,则式(3)变更为:

自组织映射神经网络迭代过程具备平稳性,在其内部距离较近的神经元之间转移概率较大,因此其神经元二阶概率分布函数表达公式如下:

以式(5)结果为基础,船舶通信系统关键设备运行状态信息的二阶正态密度分布函数为:

自组织映射神经网络对船舶通信系统关键设备运行状态信息进行拟合,得到神经网络模型参数,再将船舶通信系统关键设备运行状态信息输入到训练好的模型内,依据式(6)二阶正态密度分布函数对船舶通信系统关键设备运行状态信息进行量化,输出船舶通信系统关键设备运行状态信息随着时间变化的向量序列

1.3 基于区间集聚类分析的关键设备状态分析方法

步骤1建立X′的区间集,δ=[r,w]。

步骤2使用长度为m的滑动窗口,将X′等长划分成为H个子序列,其中第k个子序列由={xp,xp+1,···,xp+m-1}表示,p和p+m-1分别为子序列起点和终点。

步骤3建立第k个子序列区间集,δk=[rk,wk]。

步骤4任意选择2 个子序列和,计算它们相似度,具体为

式中:Sδij为子序列和之间的相似度;δi,δj分别为子序列和的区间。

步骤5计算多个子序列的相似度。选择s个任意连续滑动的子序列区间集,将该s个连续滑动子序列区间集看作一个整体,计算该整体与另一个s个连续滑动子序列区间集的相似度,前者标记为i,后者标记为j,该2 个子序列区间集相似度计算式如下:

式中,Sij为第i个和第j个具备s个连续滑动子序列区间集相似度。

步骤6计算上一步中第i个子序列和不包含第i个子序列公共元素其他子序列之间的最大相似度,该最大相似度被称为第i个子序列的相似度评分,其表达式如下:

式中,ηi为第i个子序列的相似度评分。

步骤7计算序列异常值评分,则第i个序列异常值评分表达式如下:

式中,Fi为第i个序列异常值评分。

步骤8经过上述步骤得到船舶通信系统关键设备运行状态信息时间序列所有子区间异常值评分,筛选出异常值评分大于0.55 的子区间,在该自区间内的船舶通信系统关键设备运行状态信息即为该设备运行异常分析结果。

2 仿真实验

以某船上的通信系统关键设备作为实验对象,该船通信系统包含维修通信船站、AIS 船舶自动识别设备、GPS 电子海图仪、中高频接收机、气象传真机、卫星接收发送设备、电视卫星天线、SSB 电话通信设备、WHF 设备以及不同功率接收机等。该船舶执行远洋航行任务,运行环境较为复杂,因此会出现某些关键通信设备失灵情况。将本文方法应用在该船通信系统关键设备状态分析过程中,检验本文方法应用效果。

2.1 关键设备状态信息采集测试

以该船通信系统内某信号接收机作为实验对象,通过本文方法采集该信号接收机运行时的信号频宽信息,采集结果如图1 所示。分析可知,该通信系统信号接收机呈现运行状态,其通信信号频宽呈现不断变化趋势,而本文方法可采集到其信号频宽随着时间变化曲线信息,说明本文方法可有效采集船舶通信系统关键设备运行信息,为后续分析其运行状态打下良好的基础。

图1 通信系统关键设备运行信息采集结果Fig.1 Operation information collection results of key equipment of communication system

2.2 关键设备状态时间序列挖掘测试

以该船舶系统某关键设备作为实验对象,该设备24 h 不间断运行,设备自身温度呈现不断变化趋势,使用本文方法采集该设备运行温度信息,挖掘其随时间变化规律,并以向量的方式呈现,结果如图2 所示。由图可知,该设备运行时,温度随着时间呈现波动变化趋势,波动区间为25℃~30℃之间。而本文方法对该船舶通信系统关键设备温度序列进行挖掘后,可将其温度序列量化到1.5~4.5 量化值区间内,且在量化区间内的温度序列曲线分布状态与其时间序列曲线分布状态极其吻合。上述结果说明:本文方法可有效量化船舶通信系统关键设备运行状态信息,其挖掘船舶通信系统关键设备运行状态随时间变化规律能力较好,也从侧面说明本文方法分析船舶通信系统关键设备运行状态能力较好。

图2 关键设备状态时间序列挖掘测试结果Fig.2 Test results of mining time series of key equipment status

2.3 应用性测试

以该船通信系统内的中高频接收机作为实验对象,在不同时刻时中断中高频接收机信号接收器连接线,测试在不同实验次数情况下,本文方法分析该中高频接收机运行状态结果如表1 所示。分析可知,在10 次中高频接收机运行状态分析过程中,本文方法分析结果与实际运行状态结果均完全相同,说明本文方法分析船舶通信系统关键设备状态较为准确,可应用在船舶通信系统关键设备状态分析过程中。

表1 中高频接收机运行状态分析结果Tab.1 Analysis results of operation status of medium and high frequency receiver

3 结 语

本文研究基于大数据挖掘的船舶通信系统关键设备状态分析方法,在其中应用到了大数据挖掘技术中的自组织映射神经网络和区间集聚类分析方法,分别得到船舶通信系统关键设备运行信息时间序列和状态分析结果。经过实际验证,本文方法可有效采集船舶通信系统关键设备运行状态信息,分析关键设备状态精度较高,应用效果较佳。

猜你喜欢

关键设备数据挖掘区间
解两类含参数的复合不等式有解与恒成立问题
你学会“区间测速”了吗
探讨人工智能与数据挖掘发展趋势
关键设备在线监测技术的应用
ETC关键设备准入标准及运行保障体系构建
基于并行计算的大数据挖掘在电网中的应用
机电关键设备运行状态巡检系统的开发与应用
河南省高速公路ETC关键设备邻道干扰研究
区间对象族的可镇定性分析
一种基于Hadoop的大数据挖掘云服务及应用