APP下载

数据挖掘技术在软件工程中的应用探究

2016-03-16严永兵卢立宁

环球市场 2016年25期
关键词:漏洞数据挖掘数据库

严永兵 卢立宁

北京中电普华信息技术有限公司

数据挖掘技术在软件工程中的应用探究

严永兵 卢立宁

北京中电普华信息技术有限公司

随着科技的进步,信息时代的发展,数据库在各行各业得到了广泛的应用。为全面满足数据库发展需求,需要对软件开发方式进行更新,例如数据挖掘技术的应用,将数据挖掘技术应用到软件工程中,通过寻找数据、文档以及相关数据集中规律,为软件工程的开发提供指导。基于此,文章就数据挖掘技术在软件工程中的应用进行简要的分析,希望可以提供一个有效的借鉴,从而更好的促进数据挖掘技术的发展。

数据挖掘技术;软件工程;应用

1.数据挖掘所涵盖的内容

数据挖掘的研究所涵盖的内容多种多样,但是究其根本主要包括以下几个方面:

首先,开发专用数据挖掘系统。针对不同的处理信息任务开发出不同的数据挖掘系统,一个完善的数据挖掘系统可以在不同数据库下工作,所以开发出一个完善的数据挖掘系统显得尤为重要。

其次,挖掘系统运行算法能够高效率运行。数据挖掘的功能是为了能够节省时间,提高工作效率,其最主要功能的实现都需要建立在极快运行速度之上,这就要求数据挖掘系统所使用的算法必须高效率,从而使得工作时间可以被接受。

第三,确保数据挖掘结果准确性﹑有效性。数据挖掘的结果必须达到用户所需要的目的,相关数据按规则现实,不相关数据抑制显示,相近数据提示显示。

第四,可视化的挖掘结果。所得到的数据必须清晰易懂,不需要在用任何解码方式对其进行处理,数据挖掘的结果通过可视化的过程予以展现。

第五,多层次数据挖掘。在数据库中许多数据都属于动态变化,或者是以交互的形式存在的,这就要求数据挖掘系统具有多层次性,动态搜索的特点才能对数据库进行不同角度的挖掘。

第六,多数据库挖掘。许多数据库通过Internet技术相连接起来,开发出通过Internet技术的数据挖掘方法可以在不同数据库中挖掘出所需数据。

第七,数据挖掘的安全性。网络和黑客的存在,让数据挖掘面临着极大的风险,所以要提高数据挖掘过程中的安全性,防止泄露个人信息,保证数据的可靠有效。

2.数据挖掘技术

2.1 神经网络数据挖掘技术

即通过科学﹑有效的算法,在大量数据信息中第一时间获取有用信息的筛选过程。而神经网络为主要的数据挖掘技术操作方法,具有良好的鲁棒性,可以实现并行处理和高度容错,在数据挖掘方面具有较强的优势,且不同操作模型对应的适用范围不同。常见的操作模型如离散模型﹑koholon模型﹑连续模型等,分别对应联想记忆﹑聚类自组织映射﹑优化计算。

2.2 统计分析

数据库字段项间存在函数关系与相关关系,通过统计分析操作方法,可以对各类信息进行有效分析,如常见的相关分析﹑回归分析与差异分析。

2.3 决策树

应用决策树操作方法,可以对大量数据进行整理和分类,然后从中选择对软件工程有价值的信息。在实际应用中数据分类效率高,能够在短时间内获得所需信息,可用于大规模数据信息的处理。

2.4 遗传算法

以生物自然选择和遗传激励随机搜索算法为基础,具有隐含的并行性,可以与其他模型建立联系,可用于大部分开发工程。

3.软件工程中数据挖掘技术的应用表现

3.1 用于软件项目管理方面

软件项目的管理呈现出复杂化和系统化的特点,数据挖掘技术应用于软件项目管理一方面表现在对组织关系的挖掘,比如公司举办年会等大型活动,在人员的分配上如果处理不好,就会出现混乱的局面,为了实现人力资源的合理配制,往往采用数据挖掘技术来区分每个职员的职责,实现项目管理的有序化,提高了办事效率;软件项目管理中使用数据挖掘技术的另一个方面就是挖掘版本控制信息,在此系统面临外系统入侵时提出警告是数据挖掘技术所具备的功能之一,除此之外数据挖掘技术可以检测该系统的修复情况,版本控制信息的作用就是方便了人们对版本信息的查看,而数据挖掘技术的使用为系统的安全运行提供了更有利的保障,使得软件项目的管理水平逐步提高。

3.2 漏洞的检测时数据挖掘技术的使用

当数据挖掘技术用于检测软件的漏洞时,第一步要弄清楚要检测什么样的软件,第二步就是要制定合理的计划,计划的目的是为了更好的对软件进行检测,不同软件的构成和性质决定了检测要采用不同的方式,紧接着就是对漏洞库中的数据进行整理,对于不需要的数据进行清除,除此之外对于丢失的项目要采取措施补救回来,用数值表示来代替数据属性。

另外,要对合适的数据模型进行验证,不同的项目会采取不同的方法,重要的是选择合适的发掘方式来使其形成测试集,进而可以对全部的结果进行比较,通过比较找出最满意的方式,数据挖掘技术的应用不见可以检测漏洞还可以对未知的漏洞进行防护,并且把漏洞的种类进行分析,整合出修复的方法,能使的在第一时间找出漏洞并进行修复,使得软件能够保持良好的性能,使其运行速度不至于减慢。

3.3 挖掘程序代码和结构中数据挖掘技术的使用

在挖掘程序代码和结构方面比较常用的一种数据挖掘方法就是克隆代码检测法,该方法分为度量﹑文本对比﹑程序结构和标识符对比这四种方法,四种方法各有各自的特点,具体的运用中需要考虑实际情况来确定到底使用那种方法。克隆代码检测通常会复制粘贴某一个代码,在特殊的要求下,会根据需求来改正某些代码,检测这些代码主要是为了防止大面积出现故障,维护系统的安全,为软件运行提供一个可靠的环境。另一个常见的就是Aspect的挖掘,Aspect的挖掘就是常见说的横切关注点挖掘。软件工程中面向方面软件的改造需要解决好Aspect的挖掘,虽然可以采用大量的方式来解决这个问题,但是最重要的方法之一就是度量分析法。

结束语

软件工程运用数据挖掘技术具有十分深远的意义。在进行挖掘技术的应用过程中,首先需要对挖掘的内容进行有条理的分析,也需要通过对其深化让其发挥更大的价值。只有不断探索研究,才能够让数据挖掘技术在软件工程中的应用变得更加成熟可靠,并在更加广泛的其他领域中得到更加优异的表现。

[1]叶翔.数据挖掘技术在软件系统中的应用[J].信息技术与信息化,2015,03:219-220.

[2]许文杰.数据挖掘技术在软件工程中的应用研究[J].电子技术与软件工程,2015,22:192.

[3]姚文涛.试论软件工程中数据挖掘技术的应用[J].河南科技,2015,23:67.

猜你喜欢

漏洞数据挖掘数据库
漏洞
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
数据库
三明:“两票制”堵住加价漏洞
漏洞在哪儿
数据库
数据库
数据库
一种基于Hadoop的大数据挖掘云服务及应用