APP下载

基于数据挖掘的移动互联网数据包安全检测

2017-12-01周佩1朱娴睿1何汉1张毅2

数码世界 2017年10期
关键词:决策树数据包数据挖掘

周佩1 朱娴睿1 何汉1 张毅2

1黑龙江省财政信息中心 2哈尔滨市信息化建设项目管理中心

基于数据挖掘的移动互联网数据包安全检测

周佩1 朱娴睿1 何汉1 张毅2

1黑龙江省财政信息中心 2哈尔滨市信息化建设项目管理中心

本文主要对移动互联网数据包安全检测的主要方法进行研究,与传统检测方法相比,其灵活性较好。其首先是将移动数据包中所包含内容的主要特征进行提取,之后通过数据挖掘算法对安全和恶意移动的数据包存在的特征进行学习,并对分类模型进行建立。通过实验可知,基于数据挖掘进行构建的分类模型可以对移动互联网数据包进行有效的分类。

数据挖掘 移动互联网 数据包 安全检测

1.研究的背景

1.1 移动互联网中的入侵检测系统

此系统主要应用于互联网的安全防护,入侵检测是指在进行收集信息的过程中,发现在系统中存在危害或是违背安全方面的行为进行检测的方法。其主要分为误用入侵检测和异常入侵检测两类,此项技术已在移动互联网的安全防护中得到广泛应用,其能够检测出恶意数据是否在移动终端中出现。

1.2 以数据挖掘为依据的入侵检测系统

数据挖掘主要是指利用科学的方法对大量的数据以及潜在的数据进行开发的全过程。其主要包含提取特征、对数据的预处理、模型的训练以及发现知识四个过程。为了使检测的准确性得以增加,可通过对恶意数据进行建立来检测其准确性。本文主要对部分安全以及恶意移动数据包进行搜集,然后对缺失值、去重以及归一化等相关数据进行处理,已达到挖掘建模的目的。

2.实验模型

2.1 模型的主要框架

基于数据挖掘所进行建立的安全检测主要包含数据检测和模型训练,数据检测主要包括数据预处理、特征移动互联网数据包以及构建完毕的模型,这些形成了新数据包,并对这些数据包进行安全检测;模型训练主要包含预处理文件、移动互联网数据包以及数据挖掘算法。

2.2 移动互联网数据包

针对移动互联网中的入侵检测系统主要分为两种,其一是移动终端中的内部数据,主要包括软件状态数据以及系统状态数据;其二是非移动终端的数据,主要包括蓝牙数据、联网数据等。本次研究主要是根据移动数据包中所包含的内容来进行分析的,对各类移动终端所包含的一些数据没有必要进行搜集,所以,其属于非移动终端的入侵检测数据。

2.3 数据挖掘算法

为了将特征提取对安全及恶意数据的区分性是否较好进行确认,本次研究对数据分类所采取的主要方法为分类算法。首先需要将数据包进行划分,主要划分为安全数据包和恶意数据包两类,之后通过其已设定的内在特征,将这些数据特征向量化,在所有分类算法中,最为常用的算法是决策树算法以及朴素贝叶斯算法。

2.3.1 决策树算法

决策树算法是以信息熵为基础的一种分类模型,树可以对分类规则进行表示,其具有直观的特点,因此,其可读性良好。决策树算法对树进行构造是以递归的方法来完成的,从而利用这种算法来解决一些分类问题,同时,这种算法还是一种贪婪的算法,其是通过向下增长的指定方式进行的,针对于树的节点选择,应选择没有重复的属性分类的节点,直至此决策树可以针对训练样本做好相应的分类为止,又或是将所有的属性已经使用完毕为止。

2.3.2 朴素贝叶斯算法

朴素贝叶斯是这样一种分类模型,其是以统计和概率为基础进行的,这种算法的主要的意旨在于对尚待分类的所有样本分属各种类别时所形成的概率进行计算,计算结果出现后,将此模型分配至较大概率的类别之中来达到分类的完成。

3.实验操作以及结果分析

3.1 实验操作

本次实验研究从数据信息库中选取安全数据20000条,恶意数据,4700条,其分组及组间数据如表一所示。并采取召回率、精度、错误率以及正确率对分类的结果进行分析和评价,并通过五折交叉法分别对决策树模型以及朴素贝叶斯模型进行测试,测试结果显示如表

?

?

3.2 结果分析

从以上数据可以看出,两种模型的性能在总体上都较好,并且两种模型的精度以及准确率都能够高于94%,但是在移动互联网数据包的召回率方面来看,决策树的召回率偏高,因此,朴素贝叶斯模型的性能在检测的过程中发挥的较为稳定。

4.结束语

本次研究主要以数据挖掘为基础。采用决策树算法以及朴素贝叶斯算法来对安全及恶意移动互联网数据包的行为模式进行学习,并通过入侵检测的方法对两种算法的召回率、精度、错误率以及正确率进行分析,结果表明朴素贝叶斯算法的稳定性能更加明显,因此对移动互联网数据包的安全检测应以此计算方法为主。

[1]袁腾飞.基于数据挖掘的入侵检测系统研究[J].电子科技大学,2014,11(2):221-221.

[2]陈茹茹.基于数据挖掘的移动互联网业务推荐模型研究[J].北京邮电大学,2014,17(2):45-49.

周佩(1982.11—),男,汉族,山东省福山县人,硕士研究生学历,高级工程师,研究方向:计算机信息系统分析与应用。朱娴睿(1978.04—),女,汉族,黑龙江省绥化市人,硕士研究生学历,高级工程师,研究方向:电子工程。何汉(1979.10—)男,汉族,黑龙江省哈尔滨市人,硕士研究生学历,高级工程师,研究方向:计算机应用。张毅(1982.12—)男,汉族,河北省高阳县人,大学本科学历,工程师,研究方向:计算机软硬件、网络工程。

猜你喜欢

决策树数据包数据挖掘
改进支持向量机在特征数据挖掘中的智能应用
二维隐蔽时间信道构建的研究*
探讨人工智能与数据挖掘发展趋势
民用飞机飞行模拟机数据包试飞任务优化结合方法研究
基于事故数据挖掘的AEB路口测试场景
C#串口高效可靠的接收方案设计
决策树和随机森林方法在管理决策中的应用
决策树学习的剪枝方法
软件工程领域中的异常数据挖掘算法
决策树多元分类模型预测森林植被覆盖