APP下载

云计算网络入侵跳频数据关联规则挖掘方法

2021-11-17程显生

计算机仿真 2021年3期
关键词:准确率关联规则

程显生,杨 珍,王 俊

(内蒙古农业大学计算机技术与信息学院,内蒙古 呼和浩特 010000)

1 引言

采用云计算技术进行网络传输控制,能提高网络输出的带宽和容量。然而在云计算网络中,由于网络节点的随机分布性和自组网性,会导致云计算网络容易受到入侵威胁,需要结合云计算网络的入侵检测和入侵数据的关联规则分析,对云计算网络进行入侵检测[1]。挖掘云计算网络的入侵跳频数据特征量,从而实现网络的云安全管理和信息存储,提高云计算网络的安全性。研究云计算网络的入侵跳频数据关联规则挖掘方法,在确保云计算网络的安全方面具有重要意义[2]。

文献[3]中提出基于差分隐私的多源数据关联规则挖掘方法,采用拉普拉斯机制和指数机制保护用户数据,并运用差分隐私方法进行关联规则挖掘。实验结果验证了该方法的精确性能够控制在可接受的范围内,但是当网络中干扰信噪比较大时,其挖掘效果不佳。文献[4]中提出基于粗糙加权平均单依赖估计的入侵检测算法。该方法使用加权平均单依赖估计方法对网络入侵跳频数据进行分类,完成对网络数据的入侵检测,但该方法的抗干扰性较差,并且挖掘准确性不高。除上述方法外,还有相关研究者提出了基于人工蜂群优化的密度聚类异常入侵检测算法。在初始化蜜源阶段采用不同的编码方法分别对入侵跳频数据和特征值进行编码,在邻域搜索阶段利用两种搜索策略分别对其进行搜索,并在新的适应值函数中加入误报率影响因子。但该方法进行云计算网络入侵跳频数据关联规则挖掘的准确率较低,入侵检测效果不好。

针对上述问题,本文提出基于主成分分析与Apriori算法的云计算网络入侵跳频数据关联规则挖掘方法。该方法运用Apriori算法检索入侵跳频数据库中的频繁项集,并结合主成分分析算法对频繁项集中的最小信任度进行构建,从而降低了不同信噪比对关联规则挖掘的影响。同时,该方法通过计算最小信任度的判决统计量,为关联规则的挖掘提供判决依据,从而保障了挖掘结果的精确性。仿真结果展示了所提方法在提高云计算网络入侵跳频数据关联规则挖掘能力方面的优越性能。

2 入侵跳频数据的统计特征监测和提取

2.1 构建统计特征监测模型

为了实现云计算网络入侵跳频数据关联规则挖掘,采用分组统计监测方法构建云计算网络入侵跳频数据的统计特征监测模型,提取云计算网络入侵跳频数据的统计特征量[5,6]。采用一个无向图模型G=(V,E)表示入侵跳频数据监测的传感组网结构模型,在传输链路模型中,v为云计算网络的根节点,在输出链路层进行云计算网络入侵跳频数据的在线监测,对任一节点满足v∈V。三维空间散射簇中,监测节点的Sink链路集为e,散射簇网络拓扑边结构满足e∈E。假设接收端天线和发送端天线的传输链路数据集为X={x1,x2,…,xn},构建云计算网络入侵环境下的入侵监测统计分析模型,用有向图模型G(A)、G(B)描述。对于入侵下的统计特征点用A、B描述,构建云计算入侵跳频数据的统计特征监测模型,其表达式为

(1)

(2)

其中,x1(k)和x2(k)分别是X1(k),X2(k)前N/2+1项组成的入侵跳频数据。

根据上述分析,得到入侵跳频数据的统计特征监测模型如图1所示。

图1 入侵跳频数据的统计特征监测模型

2.2 提取入侵跳频数据的统计特征量

根据入侵跳频数据的统计特征监测模型可知,入侵跳频数据的不同特征通常具有不同的取值区间范围,各个区间范围的数值差异较大,因此提取云计算网络入侵跳频数据的统计特征量之前,需要根据统计特征监测模型对其进行标准化处理[7]

(3)

将其进行转换得到

x(t)=As(t)+n(t)×X1(k)X2(k)

(4)

其中

(5)

(6)

依据大数据采样离散特征值,采用子载波调制方法描述入侵节点分布特性,得到网络入侵调频数据的主成分特征信息

(7)

其中,C4S表示云计算网络入侵跳频数据在汇聚链路层中的信息强度

C4S=diag[c4s1,c4s2,…,c4sL]

(8)

设a(t)≥|s(t)|表示入侵数据在节点si处的能量谱密度,入侵跳频数据的最大包络幅值为|s(t)|,选取入侵数据的一阶统计量为a(t)的曲线,构造如下的4P×4P矩阵表示提取的云计算网络入侵跳频数据的统计特征量

(9)

(10)

结合特征提取结果进行信息融合处理,能够提高入侵跳频数据的统计特征分析能力[9]。

3 入侵数据关联规则挖掘

3.1 频繁项集数据检索

在上述提取云计算网络入侵跳频数据统计特征量的基础上,进行数据挖掘设计,结合Apriori算法构建云计算网络入侵跳频数据的大数据分布模型[10]。Apriori算法的实现原理为先检索出入侵跳频数据库中的所有频繁项集,然后根据频繁项集构造出的最小信任度实现入侵跳频数据关联规则挖掘。

云计算网络中的关联规则挖掘转发控制协议,用如下形式表示

(11)

其中,γth表示转发流优先级,Pr表示可靠概率要求,G表示拥塞度信息,hi表示收发速率比。

(12)

其中,ai∈{0,1},0≤k<2s。

假设,a1,a2∈V,b1,b2∈V′,对于云计算网络入侵跳频数据分布的Sink节点EHs(j)和EHt(k),采用Apriori算法构建网络入侵跳频数据的大数据分布模型[12],其表达式为

(13)

W(p)=Tl1GTp2-Cp+αT

(14)

其中,W(p)表示云计算网络入侵跳频数据频繁项集p的二次函数,GT表示入侵跳频数据生成速率,α表示入侵跳频数据的到达率。

3.2 入侵跳频数据关联规则挖掘

μ(n)=

(15)

设置云计算网络入侵跳频数据关联规则挖掘的成功概率,给出各变量集合的转发控制协议,根据改进的主成分分析算法进行自适应迭代,直到满足收敛准则,根据覆盖范围实现云计算网络入侵跳频数据关联规则的挖掘。

4 仿真与结果分析

为了验证所提方法在实现云计算网络入侵跳频数据关联规则挖掘中的应用性能,进行仿真。将基于差分隐私的多源数据关联规则挖掘方法(方法1)、基于粗糙加权平均单依赖估计的入侵检测算法(方法2)、基于人工蜂群优化的密度聚类异常入侵检测算法(方法3)作为对比方法,进行对比验证。

4.1 实验环境与数据来源

在本实验中所使用的数据均来自于KDD CUP-99数据集。该数据集主要用于入侵检测评估,其中包括由各种不同用户类型、不同网络和攻击手段生成的真实数据集。该数据集具有约500万条数据,数据异常类型主要被分为4大类,共计22种攻击行为。本文选取的网络入侵类型为DoS、Probe和ipsweep三种入侵方式,入侵跳频数据采集的基频频率为20KHz,入侵数据的调制频率在[240Hz-1200Hz]之间发生变化,实验设计采用Matlab软件进行。

4.2 实验结果与分析

采用分组统计监测方法构建云计算网络入侵跳频数据的统计特征量,得到原始的网络入侵跳频数据时域分布如图2所示。

图2 云计算网络入侵跳频数据时域分布

以图2中的数据为输入,提取云计算网络入侵跳频数据的关联规则特征量,采用主成分分析与Apriori算法对云计算网络入侵跳频数据的挖掘过程进行自适应寻优,得到关联规则挖掘结果如图3所示。

图3 入侵数据的关联规则挖掘结果

分析图3得知,采用所提方法进行云计算网络入侵跳频数据关联规则挖掘时,能够有效在入侵跳频数据时域分布中挖掘出关联规则项。这是由于该方法通过统计特征监测模型提取了统计特征量,有利于入侵跳频数据关联规则的挖掘。

由于在挖掘过程中会受到外在条件的干扰,因此,在干扰信噪比不同的条件下进行网络入侵跳频数据的关联规则挖掘,测试基于差分隐私的多源数据关联规则挖掘方法、基于粗糙加权平均单依赖估计的入侵检测算法、基于人工蜂群优化的密度聚类异常入侵检测算法与所提方法的抗干扰系数,测试结果如图4所示。

图4 不同方法抗干扰系数对比

分析图4可知,在干扰信噪比不同的条件下,虽然方法1的抗干扰系数最高值最高,但是所提方法的抗干扰系数整体上优于现有方法,其抗干扰系数始终保持在0.8以上,说明所提方法能够抵御干扰因素的影响,实现入侵跳频数据关联规则的有效挖掘。这是由于该方法能够通过Apriori算法检索出入侵跳频数据库中的频繁项集,在此基础上采用主成分分析算法对频繁项集中的最小信任度进行构建,为实现关联规则挖掘提供了有力保障。

为了验证所提方法的全面性,测试不同方法进行云计算网络入侵跳频数据关联规则挖掘的准确率,得到对比结果如图5所示。

图5 关联规则挖掘准确率对比

分析图5得知,随着输入信噪比的增大,不同方法的入侵跳频数据关联规则挖掘的准确率呈现出不断变化的趋势,其中,所提方法的挖掘准确率高于现有方法,其挖掘结果准确率最高值约为87%,说明采用所提方法进行云计算网络入侵跳频数据关联规则挖掘的准确率较高,入侵检测效果较好。这是由于该方法在关联规则挖掘过程中能够有效获取入侵跳频数据库中的所有频繁项集及其最小信任度,并得到了最小信任度的判决统计量,为关联规则的挖掘提供判决依据,从而提升了关联规则挖掘结果的准确率。

5 结语

在云计算网络中,由于网络节点的随机分布性和自组网性,导致云计算网络容易受到入侵,需要对云计算网络进行入侵检测,提出基于主成分分析与Apriori算法的云计算网络入侵跳频数据关联规则挖掘方法。下面对研究成果进行分析:

1)通过无向图模型表示入侵跳频数据监测的传感组网结构模型,构建特征统计模型,结合两个模型实现特征量的提取。

2)根据特征量提取结果,建立非线性特征序列分布集,并将主成分分析算法和Apriori算法应用于关联规则挖掘中,实现关联规则的准确挖掘。

3)根据实验结果得出,所提方法挖掘结果准确率最高值为87%,并且抗干扰系数能够维持在0.8以上。表明运用所提方法进行云计算网络入侵跳频数据关联规则挖掘的抗干扰性能较好、准确率较高,适用于云计算网络入侵跳频数据关联规则挖掘工作。

虽然所提方法有效改善了现有方法存在的抗干扰性能不佳和挖掘结果准确率不高的问题,但是在目前数据库更新速度较快的背景下,要想实现入侵跳频数据关联规则挖掘,必须考虑时效性,进一步提升该方法的应用性能。

猜你喜欢

准确率关联规则
撑竿跳规则的制定
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
“一带一路”递进,关联民生更紧
奥斯卡的规则变了!
奇趣搭配
让规则不规则
智趣