APP下载

基于数据挖掘的船舶通信网络失效节点自动识别方法

2022-11-26陈文庆

舰船科学技术 2022年19期
关键词:自动识别聚类数据挖掘

陈文庆

(1.江苏师范大学 计算机科学与技术学院,江苏 徐州 221000;2.中国劳动关系学院 应用技术学院,北京 100048)

0 引言

船舶通信网络数据异常会导致信息传输故障、数据处理失误和系统任务失效等问题,因此,加强通信网络失效节点异常数据检测识别技术越发重要。

文献[1]以船舶通信网络拓扑结构为基础构建数据模型,计算各个节点综合数值判断是否存在异常。但该方法计算量过大且操作复杂,误差率较高。文献[2]通过建立多层通信网络结构模型,根据探测策略对节点信息进行检测。但该方法自动化程度较低,工作难度较高。

针对传统方法存在的不足,本文提出一种基于数据挖掘的船舶通信网络失效节点自动识别方法。通过聚类算法对船舶通信网络中的数据进行识别检测和特征提取,构建自动检测目标函数判断异常数据信息节点,采用离散序列算法对失效节点进行数据挖掘,具有良好的灵活性和精准性。

1 船舶通信网络失效节点自动识别方法具体设计

1.1 节点特征提取

基于数据挖掘技术中的聚类算法对船舶通信网络失效节点进行自动识别,首先需要检测提取通信网络中的信息数据,将所有特征数据按照既定序列整合到数据处理系统中形成样本合集,设定为系统需要进行识别检测的数据点集合[3–4]。根据系统设定的船舶通信节点异常数据阈值,对数据属性和特征密度进行分类提取,通过聚类运算得到不同特征数据集[5–6]。为了进一步提高通信网络数据特征聚类结果,本文选取高阶统计量算法对特征提取进行优化。设目标数据集为M={m1,m2,···,mm},单个数据特征提取最优解集合为Um={um1,um2,···umm},整体最优解集合为Ua={ua1,ua2,···,uam},则异常数据特征识别提取方法如下:

其中:ei为检测数据集中第i个节点的失效异常数据;α,β分别为不同特征序列的特征提取加速优化系数;r1,r2为随机参数。

经过优化后的特征提取结果具有更好的相关性,更能够突出网络数据的特征值,有利于进一步实现聚类分析运算[7–8]。

1.2 节点分类检测

特征提取后的异常节点数据传输到分类检测程序,采用聚类算法对样本数据属性进行检测处理。设定优化后的数据集为M′,异常数据权值为K,则将异常数据聚类到对应聚类中心可表示为:

式中:L(1)为异常数据聚类集合;µij为异常数据样本映射到聚类中心的模糊隶属度;Li,Lj为异常数据对应聚类数 值[9–10]。

设定存在多维度异常数据特征集合,选取不同特征点数据集重复上述计算过程,多次进行聚类运算,得到多项异常数据特征检测分类结果。为了进一步提高聚类效果,可引入数据密度系数进行检验:

其中:Xi为i节点数据聚类结果优化数值;δ为聚类数据集密度系数;rb为数据特征密度指标半径。

聚类后的通信网络节点如图1 所示。

图1 聚类后的通信网络节点Fig.1 Communication network nodes after clustering

根据图1 可对特征阈值进行分选,所得比值结果越小,说明聚类效果越好。

2 船舶通信网络失效节点数据挖掘

船舶通信网络失效节点数据挖掘流程如图2 所示。

图2 船舶通信网络失效节点数据挖掘流程Fig.2 The data mining process of the failure node of the ship communication network

2.1 失效节点自动识别函数

基于上述数据特征识别提取和优化分类,对船舶通信网络失效节点数据进行挖掘。由于导致通信网络失效的原因各不相同,不能采用单一的方差和平方差运算方式进行识别,容易造成较大误差。选用基于熵目标函数的数据检测方法构建目标函数,由于船舶通信网络失效节点存在较强的随机性,需要引入熵值对异常数据不确定性进行描述。将待检测的数据按照聚类结果依次导入目标函数识别系统,设定t时刻异常数据特征为x(t),第i个样本的特征属性为xi(t),则构建的目标函数为:

式中:S为引入的熵值;S2为熵的样本平方差;γ,λ为目标函数的权重系数,该函数即为失效节点异常数据自动检测识别的目标函数。

将经过聚类运算整合后的初始数据集按照时间序列载入函数运算程序,算法自动检索半径为R,表示运算数据覆盖范围,根据特征聚类结果,设定异常信息数据特征阈值Y和运算迭代次数i,则适用于检索半径的适应目标函数为:

其中:ϕ为设定的目标值;e为随机样本失效节点数值。

导入检索半径后代入样本数值,进行多次迭代运算,通过多次迭代后能够得到趋近于最优解的数据识别结果。所有特征集合数据按照上述步骤依次在运算程序中循环迭代,输出后的结果进入自动检测循环。输出的数据需要与设定标准数值值域进行比较,不满足任意值域条件的数据,则判断为对应问题所在的异常数据。若满足值域要求,则重复上述计算步骤再次检验数据是否存在异常,若检测判定数据为异常数据,则结束循环,判定该数据为失效节点产生的异常数据。

3 实验结果与分析

为了验证基于数据挖掘的船舶通信网络失效节点自动识别方法的实际应用效果,设定对比实验,选用传统的基于智能定位的船舶通信网络失效节点自动识别方法、船舶无线通信网络故障节点自动定位方法进行实验对比。通信网络原始节点分布状态如图3 所示。

图3 通信网络原始节点分布状态Fig.3 Distribution of original nodes of communication network

同时选用3 种方法,对通信网络内部的节点进行分类,得到的分类结果如图4 所示。可知,传统的基于智能定位的船通信网络失效节点自动识别方法对失效节点识别的准确率较低,无法准确区分出失效节点,船舶无线通信网络故障节点自动定位方法对正常节点的识别准确率较低,本文提出的识别方法能够精准地检测出异常失效节点,实现自动识别。

图4 通信网络原始节点识别结果Fig.4 Identification results of original nodes of communication network

根据图4 分类结果,得到不同的识别方法的识别准确率实验结果如表1 所示。由表1 可知,本文提出的基于数据挖掘的船舶通信网络失效节点自动识别方法的识别准确率在99%以上,基于智能定位的识别方法准确率低于72.69%,基于自动定位的识别方法准确率低于86.02%,识别能力较低。

表1 识别准确率实验结果Tab.1 Experimental results of recognition accuracy

识别耗时实验结果如图5 所示。可知,本文提出的基于数据挖掘的船舶通信网络失效节点自动识别方法的耗时时间低于4 s,能够在短时间内实现节点识别。

图5 识别耗时实验结果Fig.5 Recognition time-consuming experiment results

4 结语

本文提出基于数据挖掘的船舶通信网络失效节点自动识别方法,得出以下结论:

1)通过聚类算法对船舶通信网络中的海量数据进行识别提取,根据时间序列划分数据节点,引入优化系数提高特征提取的相关性,再通过聚类运算对节点特征数据进行分类检测,多次迭代和密度系数检验也有利于进一步提高聚类分析的效果。

2)以聚类结果为初始数据构建熵目标函数,在自动检索半径内对异常数据进行自动识别检测,具有良好的灵活性。

3)采用离散序列算法对通信网络失效节点进行数据挖掘,能够提高数据处理效率和精准度。

综上所述,本文研究方法具有良好的应用效果,能够有效提高失效节点自动检测的效率。后续:因数据干扰因素较多,应加强对数据识别和提取过程中干扰因素的筛除,减少数据的复杂性,从而进一步提高数据检测精准度。

猜你喜欢

自动识别聚类数据挖掘
一种傅里叶域海量数据高速谱聚类方法
改进支持向量机在特征数据挖掘中的智能应用
基于数据挖掘的船舶航迹自动识别系统
基于VR技术的X射线图像安检危险品自动识别
一种改进K-means聚类的近邻传播最大最小距离算法
AR-Grams:一种应用于网络舆情热点发现的文本聚类方法
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
船舶自动识别系统对船舶救助的影响
一种基于卷积神经网络的人脸表情自动识别方法