大数据技术在通信网络安全检测中的应用研究

2024-05-23高艺博

通信电源技术 2024年7期

高艺博

（郑州工业应用技术学院，河南郑州 451100）

0 引言

随着信息技术的不断发展和通信网络的应用普及，网络安全问题日益凸显。通信网络作为信息传输的重要载体，其安全性直接关系个人隐私、国家安全以及经济发展[1-2]。然而，随着网络规模的不断扩大和网络攻击手段的日益复杂化，传统的网络安全检测手段已经显得力不从心[3-4]。在这种背景下，大数据技术的兴起为通信网络安全带来了新的解决方法。

大数据技术以其强大的数据处理能力和智能化分析方法，在各个领域展现出广泛的应用前景[5-6]。在通信网络安全领域，利用大数据技术构建高效的安全监测系统，对于及时发现网络异常行为、快速响应网络攻击具有重要意义。同时，结合机器学习等技术，可以实现对海量通信数据的智能化分析和挖掘，为网络安全决策提供更加精准的支持。然而，目前国内外对于大数据技术在通信网络安全检测方面的研究尚处于起步阶段，尤其是在实际应用层面的探索较为有限。国外学者主要集中在大数据技术的理论研究和模型构建上，缺乏对于实际通信网络场景下的应用研究。而国内研究虽然逐渐增多，但整体水平仍有待提高。

文章旨在深入研究该领域，针对通信网络安全领域的实际需求，结合大数据技术和机器学习方法，提出一种基于大数据的通信网络安全监测系统，并探讨基于支持向量机（Support Vector Machine，SVM）的通信大数据安全监测方法[7-8]。文章以AWID 数据集为基础，测试和验证所提方法，旨在为通信网络安全领域的研究和实践提供一定的参考和借鉴，推动大数据技术在网络安全领域的应用和发展[9-10]。

1 基于大数据的通信网络安全监测系统

文章研究的基于大数据的通信网络安全监测系统架构包括数据采集、数据预处理、特征提取、安全分析及结果展示等主要模块。第一，数据采集模块负责从通信网络中收集原始数据，包括网络流量数据和日志数据等。第二，数据预处理模块对采集到的数据进行清洗、去噪及格式化处理，以保证数据的质量和一致性。第三，特征提取模块从预处理后的数据中提取出与网络安全相关的特征，如流量统计特征和协议分布特征等。第四，安全分析模块利用机器学习、数据挖掘等技术对提取的特征进行分析和建模，识别出网络中的异常行为和潜在威胁。第五，结果展示模块将分析结果以可视化的形式展示给安全管理员，帮助其及时发现和应对网络安全事件。通信网络安全监测系统架构如图1 所示。

图1 通信网络安全监测系统架构

2 基于改进型SVM 的通信安全检测

SVM 是一种经典的机器学习方法，广泛应用于分类和回归问题的解决。其基本原理是通过构建一个高维特征空间，将输入数据映射到该空间，并在该空间中找到一个最优的超平面来实现数据的分类或回归。在分类问题中，SVM 的目标是找到一个能够将不同类别的数据样本分隔开的最优超平面，使得各类样本到超平面的距离最大化，从而达到最好的分类效果。在回归问题中，SVM 的目标是找到一个能够使得训练样本与超平面之间的间隔最大化的超平面，从而实现对未知数据的回归预测。支持向量机具有优秀的泛化能力和对高维数据的处理能力，其核心思想是通过寻找最优的间隔来实现数据的分类或回归，而不依赖于数据的分布形式。在通信网络安全监测中，支持向量机方法能够利用其在高维空间中的优化性质，有效地分类网络数据，并检测网络数据中的异常数据，从而快速响应和准确识别网络安全事件。因此，文章选择支持向量机方法作为通信网络安全监测的核心分析工具。

文章采用的是一种自适应支持向量机（Adaptive Support Vector Machine，ASVM）方法，旨在进一步提升其在通信大数据中的性能。该方法通过引入自适应参数调整机制，动态调整支持向量机的参数，以适应不同的数据特征和分布情况，从而提高其分类准确率和泛化能力。

首先，定义支持向量机的目标函数O为

式中：w为超平面的法向量；b为超平面的截距；ξ为松弛变量；C为正则化参数，控制模型的复杂度和分类错误的惩罚程度。

其次，引入自适应参数γ，动态调整正则化参数C

式中：iγ为样本i的自适应参数，根据样本的特征和分布情况进行动态调整。

再次，定义自适应参数 iγ的更新规则为

式中：dij为样本i和样本j之间的距离，可以是欧氏距离或其他度量方法计算得到。利用更新后的自适应参数 iγ计算新的正则化参数C。

最后，将更新后的正则化参数C带入支持向量机的目标函数中，重新优化模型参数w和b，以获得最优的分类超平面。

通过引入自适应参数调整机制，ASVM 方法能够根据数据的特征和分布情况动态调整支持向量机的参数，增强模型的适应性和泛化能力，从而进一步提高其在通信大数据中的性能表现。

3 实验与分析

文章在实验部分使用AWID 数据集来测试提出的自适应支持向量机方法。AWID 数据集是一种常用的通信网络数据集，用于评估网络安全检测方法的性能。该数据集包含大量的Wi-Fi 信号数据和相关的网络流量信息。其中，Wi-Fi 信号数据涵盖多种不同的网络活动，包括正常的用户活动和潜在的攻击行为，涵盖多种不同的网络通信协议和应用场景。AWID 数据集的特点是具有较高的复杂性和真实性，能够充分反映实际通信网络中的各种情况和异常行为。因此，该数据集被广泛应用于通信网络安全领域的研究和实践，有助于评估和对比不同安全检测方法的性能和效果。

采用的实验方法如下：第一，数据集准备，从AWID 数据集中获取所需的Wi-Fi 信号数据和相关的网络流量信息；第二，数据预处理，对从AWID 数据集中获取的数据进行预处理，包括数据清洗、去噪及格式化处理，确保数据的质量和一致性；第三，特征提取，从预处理后的数据中提取与通信网络安全相关的特征，包括流量统计特征和协议分布特征等，用于描述数据的特性和行为；第四，实验设置，基于MATLAB 构建自适应支持向量机，并将数据集划分为训练集和测试集；第五，模型训练，使用AWID 数据集中的训练集数据，利用自适应支持向量机方法进行模型训练；第六，模型评估，使用AWID 数据集中的测试集数据，评估训练好的自适应支持向量机模型，通过计算分类准确率、召回率、精确率等指标来评价模型的性能。实验结果如表1 所示。

表1 实验结果

由表1可知，首先，模型在不同实验条件下的分类准确率均在92%～96%，表现稳定且数值较高，表明文章提出的自适应支持向量机方法在识别和分类通信网络数据时具有较高的准确性和可靠性。其次，模型在不同实验条件下的召回率均在90%～94%，表现出较好的正例识别能力。最后，从精确率的角度来看，模型在不同实验条件下的精确率均在93%～97%，表现出较高的正例识别准确性。这意味着文章提出的方法在识别出的异常行为中，能够有效地减少误报率，提高网络安全检测的精度和可信度。

实验结果充分证明文章提出的自适应支持向量机方法在通信网络安全检测中的有效性和可行性，具有较高的分类准确率、召回率及精确率，为提高网络安全防护水平提供有力支持。

4 结论

文章以大数据技术为基础，针对通信网络安全监测的需求，提出一种自适应支持向量机方法，旨在提高通信网络安全检测的效率和准确性。通过构建基于大数据的监测系统架构，并研究ASVM 方法的数学原理，系统地探讨了该方法的设计与实现。实验结果验证了ASVM 方法在AWID 数据集上的有效性，表现出较高的分类准确率、召回率及精确率，证明了其在通信网络安全领域的潜力和应用前景。ASVM 方法为通信网络安全监测提供一种有效的解决方案，为网络安全的研究和实践贡献重要的理论和实践经验。