数据挖掘技术在网络安全中的应用探析
2020-12-09陈杰
◆陈杰
(新疆疏勒县69018部队新疆 842200)
在网络信息技术不断进步的趋势下,人们的工作、生活、娱乐等方面都离不开网络。虽然网络为人们带来了极大的便捷,但同时也引发了一定的网络安全问题,甚至因为信息安全问题而导致的信息泄露、篡改、窃取以及财产损失事件等。因此,非常有必要加强网络安全防御力度,本文将围绕数据挖掘技术在网络安全中的应用策略进行探讨,以期望能够提升网络安全防御的整体水平。
1 数据挖掘技术的概念
数据挖掘技术指的是将一定范围之中所涉及的相关数据进行分类、归集,并识别以及检测数据之间的内在关系以及数据规律。数据挖掘技术具体包括数据准备、数据规律(探索数据的规律)以及数据表达三个基本部分[1]。具体来讲,设计数据挖掘模式以及设置挖掘引擎,使引擎能够按照预期的要求,对数据进行归集以及分类,并对其中的规律进行挖掘,从而探索数据之间的潜在关系,可为后续的数据分析奠定坚实的基础。大数据时代背景下,数据挖掘技术虽然具有一定的优势,但是整个操作流程相对比较复杂,所涉及的步骤相对比较多,需要基于实际需求做好规划与准备。数据挖掘技术的重点在于对数据进行预处理,因此,预处理阶段就是整个数据挖掘技术进行应用的基础阶段,其质量也直接关系到最终成效,数据挖掘技术流程结构(如图1所示):
图1 数据挖掘技术流程结构
2 数据挖掘技术在网络安全中的应用
2.1 数据挖掘技术在网络安全中的应用流程分析
从本质上来讲,任何网络安全问题其实都有迹可循,特别是网络病毒。数据挖掘技术主要是利用相应的手段,将用户的数据进行合理分类、归集以及评估,从而对整个系统数据进行动态扫描。在防御网络安全问题的过程中,需要注意的是数据挖掘技术应用流程比较复杂,通常需要涉及大量的数据,因此,要清晰地掌握不同环节的特征,并合理规划成多个模块,从而对模块进行深入分析,数据挖掘技术在网络安全中的应用流程(如图2所示):
图2 数据挖掘技术在网络安全中的应用流程
2.2 具体模块概述
具体的模块有:(1)数据源模块,该模块的主要作用是对网络传输发送以及接收的数据包进行截获、重发、转存以及编辑等。数据源模块对原始数据包进行处理以及传输之后,再让数据结构到预处理模块之中并进行发送。(2)预处理模块,该模块包含多个数据处理工具,可对多种类型的数据进行预处理,因此是数据挖掘技术的关键。具体来讲,预处理模块包括特征标准化、原始数据最小最大规范化、变化数值映射规范化等步骤,可将数据挖掘时间最大限度缩小,有利于降低挖掘成本[2]。(3)数据挖掘模块,该模块借助决策树、遗传算法、模糊集、事例推理以及统计方法等信息处理方法,对数据仓库之中的信息进行处理与分析,再到决策模块之中对信息进行发送。(4)规则库模块,该模块能够对网络安全问题的相关特征进行记录,例如,网络病毒、恶意攻击、异常入侵等特征进行记录,并对其进行总结与分类,为网络安全防御提供必要的理论支持。(5)决策模块,该模块主要作用是对数据挖掘模块与规则库模块之中的数据进行匹配,也就是说两个模块中的某些数据如果匹配度比较高,那么就意味着有网络安全隐患,例如数据包当中可能存在网络病毒,需要采取对应的防御措施。
2.3 数据挖掘技术在网络安全中的应用机制分析
(1)关于数据收集的使用
数据挖掘技术在网络安全中的应用过程中,与计算机技术有着非常密切的关系,以计算机技术为基础而实现数据挖掘。信息化时代背景下,数据信息呈爆炸式增长,尤其是社会交流会涉及很多隐私,因此,在网络安全中保护个人隐私非常重要。因此,借助数据挖掘技术通过数据信息对网络安全隐患进行快速寻找,以病毒为例,可以快速寻找病毒代码的程序,可及时明确网络病毒之中的不安全信息,例如,异常入侵、恶意攻击等等。
网络病毒通常以代码方式渗透计算机系统,在破坏系统的过程中,计算机程序则成为网络病毒最大的支持。因此,要通过数据挖掘技术对代码程序进行深入分析,这样可明确问题所在并及时进行防御。通常来讲,病毒程序代码与计算机的软件具有一定的共性,会随着用户使用软件的过程中而侵入到系统之中,而数据挖掘技术可通过分模块对网络病毒代码程序进行收集、归集以及分类,进而为网络安全的措施制定与应用提供有价值的参考依据[3]。
(2)关于数据处理的使用
在网络安全防御过程中,通过数据挖掘技术可有效挖掘以及分析数据信息,并在关键信息的支持下明确网络安全问题的根源。对于网络安全问题来讲,并不是通过文字方式对计算机系统进行攻击,主要依靠的是程序代码。因此,如果要提升网络安全的防御力度,那么就要对网络程序代码进行有效的转换以及破解,简单来说就是使其能够朝着可识别模式转化,这样就可以将其程序代码进行破解并及时进行防御。数据挖掘技术中的数据处理模块能够对网络安全问题进行识别与转化,具体包括数据源位置与信息、IP位置等数据内容,并实施深层次挖掘能够对IP目标进行准确定位,从而找到网络病毒问题的根源,然后将其传播途径进行快速封锁,可避免病毒继续扩散以及传播。同时,借助数据挖掘技术对数据信息终端进行处理,目的是对信息进行归类、分析以及整理,这样就能够减少分析以及破解网络安全问题的时间,不仅有利于提升数据挖掘技术的使用效率,而且能够保障信息使用过程中的安全性。
(3)关于数据库的使用
关联数据库可以为数据挖掘技术提供聚类分析的功能,可根据网络安全问题的特征进行深入识别,例如,当有恶意行为对计算机终端系统进行攻击时,关联数据库能够对其运行的轨迹、执行程序、基本特征等进行全面记录并汇总集合。整个过程中,聚类分析算法具有非常重要的作用,可以充分利用攻击规则对网络病毒的特征进行识别,能够强化计算机防御系统的识别效果[4]。
(4)关于决策机制的使用
数据挖掘技术在网络安全的应用过程中发挥着极为重要的作用,将针对数据挖掘模块与规则库模块之中的数据进行匹配,如果匹配度比较高,那么意味着存在网络安全隐患。现阶段,在计算机使用过程中普遍会安装360防火墙,基于360软件的功能,能够为使用者提供极大的便利。但是,从实际情况来看,360防火墙的精度响度比较低,可能会导致错误判断网络病毒的属性,这是因为决策模块的功能还不够完善,以至于降低了规则运算条件的约束力。以勒索病毒为例,针对全新的勒索病毒实现加密法库,并将脚本文件 http请求可得到实现,针对远程服务器文件的特征进行读取,可有效提升防御网络病毒的效率。这里需要注意的是,数据挖掘技术虽然可以结合数据规律特征对病毒特征进行归纳,但是也必须要有对应的决策模块,才能有针对性解决网络安全问题。反之,系统将可能出现误判,导致数据类型不匹配,为病毒留下漏洞,使其入侵系统盗取重要信息。
(5)关于数据预处理的方案
对于数据预处理方案来讲,具体是以决策条件以及病毒特征信息为基础,从而对结果进行不断完善,使其成为分析归类的最终审核,例如,端口信息、归纳目标IP地址等等。在网络安全防御过程中,借助数据预处理方案能够对网络安全问题的相关信息进行验证,进而为防御系统提供有价值的数据参量以及验证指标。因此,在数据挖掘技术应用过程中,通过数据预处理方案开展判断,可对网络安全问题的原始特征进行精准描述,例如,病毒类型、异常入侵、系统漏洞、恶意攻击行为等等,可充分提升系统的防御能力[5]。
3 结语
综上所述,网络已经与人们的生活、工作、娱乐等方面不可分割,网络虽然为人们带来了极大的便利,同时也带来了一定的安全问题,个人隐私、企业信息、机关单位重要文件等均可能因为网络安全问题而出现被泄露、篡改、损坏等情况。因此,需要加强网络安全的防御力度。大数据时代背景下,数据挖掘技术具有一定的优势,将其用于网络安全防御之中,能够充分提升安全水平,尤其是在防御网络病毒这方面有着巨大的优势,因此,建议对数据挖掘技术进行加强推广,使其能够发挥更大的作用。