数据挖掘技术在软件工程中的应用
2017-04-01孙晓迎
摘要:随着科技的进步,信息时代的发展,数据库在各行各业得到了广泛的应用。数据库中存储着大量的信息,提供给人们查阅、编辑、保存等功能。如何能使数据库信息的利用率达到最大化,对其进行快速充分的利用,逐渐成为人们研究的重点。目前数据挖掘技术在大数据分析中有着举足轻重的地位,基于此,本文主要分析数据挖掘技术在软件工程中的应用,以其能够产生借鉴作用。
关键词:数据挖掘技术 数据库 软件工程 应用
中图分类号:TP311.13 文献标识码:A 文章编号:1007-9416(2016)10-0072-01
数据挖掘技术是保证数据可靠性和安全性的重要基础,是提升软件工程应用效用的重要基底,需要引起人们的重视和关注。因此,探究当前数据挖掘技术在软件工程中的应用策略,提升数据挖掘技术的应用效能,对于软件工程的优化和管理来说具有深远意义。
1 数据挖掘所涵盖的内容
数据挖掘的研究所涵盖的内容多种多样,但是究其根本主要包括以下几个方面:首先,开发专用数据挖掘系统。针对不同的处理信息任务开发出不同的数据挖掘系统,一个完善的数据挖掘系统可以在不同数据库下工作,所以开发出一个完善的数据挖掘系统显得尤为重要。其次,挖掘系统运行算法能够高效率运行。数据挖掘的功能是为了能够节省时间,提高工作效率,其最主要功能的实现都需要建立在极快运行速度之上,这就要求数据挖掘系统所使用的算法必须高效率,从而使得工作时间可以被接受。第三,确保数据挖掘结果准确性、有效性。数据挖掘的结果必须达到用户所需要的目的,相关数据按规则现实,不相关数据抑制显示,相近数据提示显示。第四,可视化的挖掘结果。所得到的数据必须清晰易懂,不需要在用任何解码方式对其进行处理,数据挖掘的结果通过可视化的过程予以展现。第五,多层次数据挖掘。在数据库中许多数据都属于动态变化,或者是以交互的形式存在的,这就要求数据挖掘系统具有多层次性,动态搜索的特点才能对数据库进行不同角度的挖掘。第六,多数据库挖掘。許多数据库通过Internet技术相连接起来,开发出通过Internet技术的数据挖掘方法可以在不同数据库中挖掘出所需数据。第七,数据挖掘的安全性。网络和黑客的存在,让数据挖掘面临着极大的风险,所以要提高数据挖掘过程中的安全性,防止泄露个人信息,保证数据的可靠有效。
2 数据挖掘在软件工程中的应用
2.1 建立数据信息软件
2.1.1 数据仓库系统
数据仓库是面向主体的、集成的、稳定的数据集合,通过“仓库构建”来支持经营管理中的决策制定过程。这一过程主要包括以下几个阶段:一是源数据阶段:此阶段主要是对历史数据、当前数据和综合数据进行收集。二是源数据预处理阶段:其主要包括关系数据库、软件数据文档和其他。三是进入仓库管理阶段:主要包括数据仓库管理工具、抽取、转换、装载、元数据库和数据建模工具。四是知识基DM分析工具:分类分析工具、聚类分析工具、关联分析工具和序列分析工具。五是可视化的软件领域知识:揭示影响软件质量的必然因素。五个方面构成整个数据仓库管理系统。
2.1.2 数据仓库建模
数据仓库建模主要将已有的数据归纳一起,建立一个合理的数据资源库。这些信息包括客户需求信息、客户评估信息、软件系统信息、可行性研究报告。首先,需要将客户所需要的信息进行汇总整理,从而做好系统功能、界面、数据等方面的确定。其次,客户评估信息主要是应用软件测试,(其中包括动态测试,也包括静态测试,形式化测试)获得相应的评估信息,将其与客户所需要的信息进行汇总,权衡软件在应用中的质量,从中寻找可能存在的错误,并对其进行修改。第三,软件系统信息是软件应用的基础,其主要包括系统的规模、范围、总体要求,以及所需要的支撑环境。第四,可行性报告主要指的是其是否具有运行的可行性,技术、经济、法律、使用是否能够达到需要的目的。
2.2 对集成软件信息数据仓库进行信息挖掘
2.2.1 聚类分析发现
通过某些相似的需求将某一些客户分成一组成为聚类,使客户的信息更容易被开发人员了解,以便于提供更高服务水平,和满意的服务。将某些客户聚类为一组,可以专门为其要求开发出具有特别功能的软件,通过聚类分析,可以对客户的软件应用情况进行有甄别性的观察,从而让软件达到一种很好的使用效果。
2.2.2 分类分析的发现
与聚类完全不同,分类分析是通过已经标记的特点进行数据分类。分类就是为了通过记录表现来方便的描述这一类数据所具有的特点。分类分析主要应用于决策树、神经网络和径向基础函数等软件中。分类分析的结果可让我们在数据库的设计过程中更有针对性,可以通过软件对所应对的客户进行属性划分,针对不同的客户提供不同的服务或者保护。
2.2.3 序列分析的发现
序列分析是完全独立的一种分析算法,其区别于以上两种算法。这类算法主要是根据数据的序列或者事件进行检测。由于不同的客户要求同一软件为其提供的功能一般不同,因此,软件分析人员就可将客户按其所倾向需求的功能模式进行分类。例如当客户使用到某一软件的特定功能时,检索功能就会根据计算机用户的需求进行提示,询问是否按照计算机算法分析出的需求来进行下一步的搜索操作。
3 结语
数据挖掘技术在软件开发过程中有着广泛的应用前景,但是国内对此技术的研究仅仅在理论研究阶段,需要通过对其深化让其发挥更大的价值。只有不断探索研究,才能够让数据挖掘技术在软件工程中的应用变得更加成熟可靠,并在更加广泛的其他领域中得到更加优异的表现。
参考文献
[1]马保平.关于对软件工程中的数据挖掘技术的探讨[J].电子技术与软件工程,2015,19:196-197.
[2]徐赐发.数据挖掘在软件工程领域中的应用浅析[J].电子技术与软件工程,2014,19:206.
收稿日期:2016-08-12
作者简介:孙晓迎(1987—),女,汉,山东龙口人,大学本科,中级,研究方向:工程类。