大数据挖掘的无线传感网络节点入侵风险检测方法
2024-12-31卜浏
摘要:针对无线传感网络节点入侵检测方法难以准确识别,导致风险检测率低的问题,文章提出了基于大数据挖掘的检测方法。该方法通过节点分类、异常特征提取结合AdaBoost算法,实现入侵数据的精准分类;利用簇化网络结构融合数据,经特征选择和归一化处理后,建立基于数据约减和逻辑回归的检测模型;通过处理约减后的数据并计算特征权重,构建判断矩阵,实现准确高效的入侵风险检测。实验结果表明,该方法有效应对网络复杂性,显著提升风险检测率;所提方法能够高效准确地检测入侵风险,为无线传感网络安全稳定运行提供坚实保障。
关键词:大数据挖掘;无线传感网络;网络节点;节点入侵;入侵风险检测
中图分类号:TP393" 文献标志码:A
作者简介:卜浏(1984— ),男,副教授,硕士;研究方向:网络工程,物联网。
0" 引言
随着网络规模的扩大和复杂性的增加,网络安全问题也日益凸显,特别是节点入侵风险,已经成为限制无线传感网络技术进一步应用的重要瓶颈。近年来,无线传感网络节点入侵风险检测作为保障网络安全的重要手段,一直是研究者们关注的焦点。在已有的研究中,程卓[1]提出了一种基于特征学习的无线传感网络入侵行为检测方法,通过提取网络流量的特征信息,利用机器学习算法对特征进行学习和分类,从而实现对入侵行为的检测。周浩[2]提出了一种基于区块链的复杂网络近邻入侵风险检测算法,利用区块链技术的去中心化、不可篡改等特点,构建一个安全可靠的入侵检测机制,通过对网络节点的近邻关系进行分析和监测,算法能够及时发现潜在的入侵风险并采取相应的防御措施。由于无线传感网络具有多样性和动态性,不同的网络环境和场景可能需要不同的检测策略和方法。为此,文章提出了基于大数据挖掘的无线传感网络节点入侵风险检测方法。
1" 无线传感网络节点分类
对异常节点中的入侵数据进行分类,将无线传感网络节点传输的样本数据CY表示为特征差异矩阵C和类别标识Y的组合,类别标识Y用于指示数据的正常或异常状态,具体分为常规数据0和4种(1—4)不同的入侵数据类别[3]。为了精确地处理这些数据,本文对节点进行权值的初始化,将训练样本赋予一个初始权值q0,表示为:
q0(j)=1q(1)
其中,j表示第j个入侵数据,q表示节点传输信息权重。利用AdaBoost算法对j进行弱分类,得到入侵数据的分类误差,公式如下:
wj=∑Mmgt;1q0(j)(2)
其中,M表示被错分的入侵样本数据条数,m表示特征数量。基于误差分类公式,计算每个分类器的入侵数据分类误差并比较它们的大小,选择分类误差最小的分类器,对入侵数据进行分类,表示为:
l=12ln1-wjwmin+Chwj(3)
其中,wmin表示分类误差最小的分类器,h表示判决函数,l表示无线传感网络节点入侵数据的类别[4]。
2" 基于大数据挖掘处理节点入侵数据
本文将无线传感网络节点进行分类后,利用大数据挖掘技术处理节点入侵数据,引入簇化网络结构。假设整个网络被划分为N个独立的簇,每个簇内都包含若干个传感节点。在每个簇中,簇头管理和协调簇内传感节点的活动,融合来自这些节点的数据。完成数据融合后,簇头节点将处理后的数据转发至中心服务器,融合过程如图1所示。
设第a个簇内传感节点i的数据为xia,簇头融合后的数据为yi。融合过程可以表示为:
yi=f(xi1,xi12,…,xia)(4)
其中,f表示数据融合函数。
由于融合后的无线传感网络节点入侵数据具有多样性,直接对这些数据进行处理不仅计算复杂度高,而且难以从中提取出有效的信息。因此,本文通过计算每个特征与入侵行为之间的信息增益,评估每个特征对于识别入侵行为的重要性,根据信息增益的大小,筛选出与入侵行为最相关的特征子集,从而实现数据特征的提取[5]。假设特征集合表示为F=(f1,f2,…,fm),计算融合后的数据集的信息熵S为:
S=-∑ki=1p(ri)log2priyi(5)
其中,r表示无线传感网络节点入侵行为,k表示入侵行为类别r的不同取值数量,priyi表示融合样本yi属于类别ri的概率。计算每个特征的信息增益z为:
z=S-∑v∈Vj|Svj|sS(fi=v)(6)
其中,Vj表示特征fj的所有可能取值,|Svj|表示特征fj取值为v的样本集合,s表示样本总数,S(fi=v)表示在特征fj取值为v的条件下入侵行为r的信息熵。根据计算出的每个特征的信息增益,选择信息增益最大的前k个特征,从而得到提取的特征子集zk。
3" 建立入侵风险检测模型实现风险检测
将约减处理后的数据整合到机器学习的入侵检测过程中,从而建立入侵风险检测模型,过程如下。
(1)根据独立分布的样本数据,利用式(7)分析任意2个数据之间的属性集关系。公式如下:
ot[i][j]=
minot[i-1][j]+1,删除操作
ot[i][j-1]+1,插入操作
ot[i-1][j-1]+(s1[i-1]≠s2[j-1]),替换操作(7)
其中,ot表示二维数组,s1、s2表示2个字符串。
假设ζ为经验阈值,用于判断2个属性集之间的关联程度。若ot[i][j]gt;ζ,则代表2个属性集之间不存在关联关系。若ot[i][j]lt;ζ,则代表2个属性集之间存在关联关系。若ot[i][j]的计算结果越大,则说明2个集合属性越不相似[6]。
(2)提取属性特征,整合全部特征,得到最终关系特征集。
(3)基于编辑距离和特征权重,构建一个判断矩阵,评估节点间的风险水平。计算公式如下:
mij=Qi×Qjot[i][j](8)
若相似的节点在判断矩阵中具有较大的值,则表示具有较高的风险水平。
(4)使用机器学习算法中的逻辑回归算法,基于判断矩阵构建风险检测模型。
pij=11+e-(β0+β1mij)(9)
其中,β0和β1表示逻辑回归模型的参数。
设定一个决策阈值。若模型的输出概率超过设定的阈值,则认为该节点存在入侵风险;否则,认为该节点是正常的。系统将风险检测的结果输出,并对存在入侵风险的节点进行报警或采取相应的安全措施[7-8]。
通过上述步骤,可以实现无线传感网络节点入侵风险检测,并对存在风险的节点进行及时报警和处理,有助于提高网络的安全性和可靠性,减少潜在的安全风险。至此,完成了无线传感网络节点入侵风险检测方法设计。
4" 实验
为了验证文章方法的有效性,本文设计了一系列实验来评估该方法在实际无线传感网络环境中的入侵风险检测能力。本文选用NS-3作为仿真平台搭建实验环境,模拟复杂的无线传感网络环境;设定50个网络节点,分散在模拟区域内,进行数据的采集与传输;设定通信范围为250 m,传输速率为250 kbps,数据采集周期为5 min。
为了模拟真实环境中的大数据量,本文准备了大小为10 GB的数据集,其中包含各种网络活动和潜在的入侵行为。将本文所提方法与程卓[1]和周浩[2]的方法进行对比,获取入侵检测率的统计结果如表1所示。
根据实验结果可以看出,在各种数据类型入侵下,文章所提方法均表现出较高的入侵检测率,能够更有效地识别和应对无线传感网络中的入侵风险,提升网络的安全性和稳定性。
5" 结语
本文对大数据挖掘技术在无线传感网络节点入侵风险检测中的应用进行了深入研究,通过充分利用大数据技术的优势,对海量的网络流量数据进行深入挖掘和分析,有效识别和应对了无线传感网络中的入侵风险。随着无线传感网络技术的不断发展和应用领域的不断扩展,入侵风险检测仍面临着诸多挑战。未来,课题组将继续深入研究大数据挖掘技术在无线传感网络入侵风险检测中的应用,探索更加高效、准确的检测方法,为无线传感网络的安全防护提供更加坚实的支撑。
参考文献
[1]程卓.基于特征学习的无线传感网络入侵行为检测方法[J].现代传输,2024(1):76-79.
[2]周浩.基于区块链的复杂网络近邻入侵风险检测算法[J].成都工业学院学报,2023(5):60-64.
[3]买欣蕾.基于时间戳马尔可夫模型的无线传感网络入侵检测方法[J].长江信息通信,2023(9):52-54.
[4]莫丽娟.基于深度学习的无线传感网络入侵检测方法[J].长江信息通信,2023(7):118-120.
[5]李秋月,晁绪耀.基于隐马尔可夫模型的无线传感网络入侵检测系统[J].信息与电脑(理论版),2023(3):204-206.
[6]许宁.基于改进Adaboost算法的无线传感网络入侵检测方法[J].信息与电脑(理论版),2023(1):232-234.
[7]程超,武静凯,陈梅.一种基于RBM-SVM算法的无线传感网络入侵检测算法[J].计算机应用与软件,2022(5):325-329.
[8]董天宇,黄云.基于大数据技术的网络入侵检测应用研究[J].电子技术与软件工程,2021(24):238-239.
(编辑" 沈" 强)
Intrusion risk detection method of wireless sensor network nodes for big data mining
BU" Liu
(Jiangsu Union Technical Institute, Nanjing 210000, China)
Abstract: It is difficult to accurately identify the intrusion detection method of wireless sensor network nodes, which leads to the problem of low risk detection rate. A detection method based on big data mining is proposed. Through node classification, abnormal feature extraction and AdaBoost algorithm, the accurate classification of intrusion data is realized. Using the cluster network structure fusion data, after feature selection and normalization processing, a detection model is built based on data reduction and logistic regression. By processing the reduced data and calculating the feature weights, the judgment matrix is constructed to realize accurate and efficient intrusion risk detection. The experimental results show that the proposed method effectively handles the network complexity and significantly improves the risk detection rate. The experiment proves that it can efficiently and accurately detect the intrusion risk,and provides a solid guarantee for the safe and stable operation of the wireless sensor network.
Key words: big data mining; wireless sensor network; network node; node invasion; intrusion risk detection