APP下载

高性能互连网络运维过程中网络端口阻塞故障的随机森林检测技术

2022-03-17严萍

电子测试 2022年4期
关键词:端口准确率样本

严萍

(河北医科大学第四医院,河北石家庄,050000)

0 引言

高性能互联网络是高性能计算机的全局性基础设施,将网络系统中的各部分节点进行连接,其主要组成部分有高性能网卡,高阶交换机和高速链路[1],随着互联网络系统规模的不断扩大,其系统的故障率也会不断攀升,传统的运维方式无法满足现阶段的网络运维工作的需求,优化运维工作方式迫在眉睫。随机森林检测技术,是近些年在集成学习算法中应用范围较广的一种检测模型,其具有普适性较强,灵活性较高等特点,能够对高维的数据进行快速处理,对数据集的特征没有明确指向,连续性或离散型数据,都能够进行高质量的处理。

1 检测实验过程

1.1 检测模型

本次实验是为了对网络端口阻塞故障进行解决,对互联网络相关数据进行采集,生成数据集后,将分类模型进行构建,在此基础上对实时数据进行分类。本次检测模型的设计思路是数据采集采用高性能互联网络KPI技术;将采集到的数据进行标记,打乱;以随机森林算法进行离线学习;最后对模型进行优化,以交叉验证和在线检测的方式。

1.2 数据采集处理

在数据采集中,需要将采集时间间隔进行科学设定,以保障观测数据的稳定性。以32位宽的寄存器位端口流量信息为例,数据报文大小为192bit,在14G速率下,高速互联网卡的宽带,最大理论值应为56Gbps,其观测数据的最小翻转时间在14.72s,因此本次研究以10s作为采样间隔时间。

对采集数据进行标记,主要是通过运维日志信息,将设备端口和运维事件进行配对的方式,对相关数据进行标记。网络节点出现输出变慢的情况时,可以根据节点向上寻找到相应的网络端口[2],由于现阶段涉及到的网络端口数量较多,为了保障网络的相对稳定,不需做任何处置,直到网络出现崩盘情况时,测试程序能够对查询到出现问题的端口,对其进行复位操作,整个网络系统即可恢复正常运作。

在有监督学习中,数据标记是重要的组成部分,为机器学习提供数据集,因此数据标记的质量与检测结果的质量息息相关。在高性能互连网络运维过程中网络端口阻塞故障是一项逐步加深的过程,因此本次研究对将数据集分为0,1,2三个类别,0代表正常状态,1代表潜在异常状态,2代表网络阻塞状态。

1.3 随机森林

在随机森林算法中参数只有2个,在面对较为嘈杂的特征时,检测模型敏感度较低,不容易陷入到过拟合状态,其抗噪声能力也具有一定优势。RF算法中两个随机因子,一个是训练集样本集合(Di),一个候选属性样本集合(Ti)。训练集样本的选取是从原始数据中进行随礼抽取,每次抽取之前都将上抽取的样本在放回到原始样本集当中;候选属性样本集合,设原始数据共有属性M个,将S作为制定属性数,从M中抽取S个作为候选属性。将训练样本和属性进行确定之后,进行决策树的构建,从而得到预测结果(Y),n个样本得到预测模型n个,对样本进行模型测算,则1个样本能得到n个结果,最终测算结果以多数投票决定。其分类模型如下所示:

其中,单个决策树为hi(Si),I为示性函数。

RF训练模型如图1所示。

图1 RF训练模型

1.4 模型参数优化

在检测的过程中,为了将模型检测的准确率进行进一步的提升,RF模型在对数据集进行训练时,需要将间隔函数与泛化误差进行考虑。在RF中,其间隔函数mg(x,y)如下所示:

其中,x为样本向量属性,y为样本标签,当mg(x,y)大于0时,表明正确分类样本数量较多,其数值越大,表示准确率越高。RF的泛化误差PE计算公式如下:

其中ρ为RF分类器之间的相关度。

1.5 模型评估与检测

对RF模型进行评估时,其评价标准以准确率和召回率为主:准确率是最终提取的正确信息的数量;召回率是正确信息数量与样本信息数量的比值,数值越接近1,表明其模型效果越好。

模型检测主要是将数据检测结果与最佳结果进行对比,对模型进行动态调整,根据结果对模型中存在的问题进行分析,并提出一定的解决方案,将模型进行优化。

2 检测实验结果

2.1 实验平台

本次实验主要采用HPC系统,结构采用两级胖树拓扑结构,在本次系统结构中,叶交换机18台,每个各有24个上行端口;根交换机12台,每个各有36个端口。每个叶交换机的2个上行端口与同一个根交换机的端口进行连接。为了更好地对实际情况进行模拟,对RF模型进行检测,在实验的过程中,采用衰减光纤对网络系统进行注入故障,将其数据进行收集,形成实验KPI数据集。

2.2 算法对比

本次实验中同时采用了SVM算法和朴素贝叶斯,将其效果与RF进行对比。

其次朴素贝叶斯算法分类原则是对于给出的待分类项,将该分类向会出现在每个类别中的概率进行计算,其中概率最大的便是该分类项的所属类别。使用该种算法进行检测,其特征需要相对独立,且具有较为鲜明的特点,但是在实际的检测过程中,数据的特征和属性具有较强的关联性,因此该种算法的应用程度具有一定的局限性。

2.3 特征与参数选择

本次实验中,KPI数据的特征共有21个,将滑动窗口大小进行固定,其中窗口期内信用分布情况由特征1-10表示,握手情况由特征11表示,重传均值由特征12表示,虚通道收发流量均值由特征13-21表示。在实验的过程中,采用特征逐步递增的方式,对不相关和冗余特征与模型之间的关系进行探究。

当特征数量为0时,其模型准确率为0.12;当特征数量增加到2时,其模型准确率为0.51;当特征数量增加到5时,其模型准确率为0.67;当特征数量增加到15时,其模型准确率为0.95;当特征数量增加到18和21时,其模型准确率分别为0.96和0.95。模型的准确率随着特征数量的增加,不断提高,当特征数量增加到10以上,其对于模型准确率的影响变得较为微弱。

将本次实验的数据集分为两个部分,一部分作为训练集,一部分作为测试集,利用上文提及到的公式,对模型的参数进行优化。通过参数优化调整,模型的准确率,召回率都得到了一定的提升。调参之前,0数据状态准确率为0.94,召回率为0.81,调参之后,准确率为0.99,召回率为0.96;1数据状态准确率为0.92,召回率为0.94,调参之后,准确率为0.92,召回率为0.96;2数据状态准确率为0.71,召回率为0.91,调参之后,准确率为0.89,召回率为0.94。

2.4 实验结果

在离线模式下,将RF,SVM以及朴素贝叶斯算法检测结果进行比较。模型在实际应用的过程中,主要以准确率和召回率作为主要的评价指标。因此在此次算法比较的过程中,将比较重点放在召回率与准确率的比较之上。将上述文章中,提到过KPI数据特征,在实验过程中,将影响因素较大的数据特征内容,导入到数据模型之中,通过实际训练,可以将3种算法的准确率、召回率以及F1数值进行计算,其具体数据分析结果如表1所示。

表1 算法数据对比分析表

通过表1数据可以得出,在不同数据的数据集状态下,RF算法的准确率和召回率,都要高于SVM算法以及朴素贝叶斯算法,同时F1的数值也是要高于前两者的算法检测结果。由此可见,在对网络端口阻塞故障检测过程中,使用RF算法,能够将检测结果的准确率进行有效地提升,同时能够检测工作的效率,相较于其他算法具备一定的优势。

猜你喜欢

端口准确率样本
华为交换机端口Hybrid 模式的应用
一种有源二端口网络参数计算方法
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
一种端口故障的解决方案
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
规划·样本
人大专题询问之“方城样本”
随机微分方程的样本Lyapunov二次型估计