探讨软件工程行业中数据挖掘的应用
2019-04-27闫绪鹏
闫绪鹏
摘 要:该文通过对软件工程行业中数据挖掘的重要性进行了分析,详细地阐述了数据挖掘在该领域的具体应用。希望通过此文,能促进该技术在软件行业中的应用,提升行业数据处理水平,保障软件平稳、可靠运行。
关键词:软件工程 数据挖掘 数据处理
中图分类号:TP311.5 文献标识码:A 文章编号:1672-3791(2019)01(b)-00-02
当今社会,随着“数据”的不断增加,相关数据处理技术也在不断优化升级。在软件工程中,也应采用先进技术,提升数据处理水平,保证软件开发的合理性和科学性,为用户提供更好的使用体验。“数据挖掘”在对数据的处理上有着很大的优势,在软件领域应用此技术势在必行。
1 软件工程行业中数据挖掘的重要性
近年来,随着信息技术的发展,互联网中的信息及数据不断增加,人类已经进入信息爆炸的“大数据时代”,要对“爆炸的”信息进行有效的处理,传统的数据处理方法已经不能满足大多数软件公司的需要,其迫切需要一种能够高速处理数据的技术,“数据挖掘”应运而出[1]。
数据挖掘技术能结合软件操作目的,通过分类、排序及关联等步骤,从大量的数据中发现并摘取“有用的”信息,为相关工作人员提供了便利;其在应用中可以按照一定算法将数据细分为各个类别,通过对数据的分析找到规律、建立模型,对后续运行进行预测;还可以通过对某些特定的数据进行针对性的分析,利用相似性找到不同数据间的联系,找出该数据的意义及价值。数据挖掘不是单纯的对数据进行静态分析,其在本质上是“动态的”,一般分为3个部分:第一,数据挖掘离不开预处理。在数据挖掘的整体工作中,最基础的步骤就是预处理,此部分在整体中也发挥着关键性的作用,通过获取、辨别、调取及交换数据,能够梳理出数据信息的整体脉络,掌握其中的逻辑关系,为数据创造更高层次的使用价值。第二,数据挖掘。在对数据进行预处理之后,需要对数据进行进一步的挖掘,明确挖掘目标及算法,对数据进行分类和总结,提高数据挖掘的效果。第三,深入分析。在分类之后需要对数据进行评估和分析,确定及呈现出数据的最终价值,为相关工作人员提供直观的数据意义及价值。将这些技术应用到软件工程行业,能有效提升软件中数据处理的能力,从而提升整体软件的运行效果,使用户体验更高水平的使用感受。
伴随着科技水平的不断提升,软件工程行业的技术也会不断优化升级,数据挖掘的作用会越来越大,其在该行业中的地位也会越来越突出,对于行业的长期发展具有重要意义。
2 软件工程行业中数据挖掘的具体应用
随着科学技术尤其是互联网的发展,数据挖掘技术在软件工程中发挥着越来越大的作用。一般情况下,数据的处理都要经过预处理、挖掘和深入分析这几个步骤,预处理的对象相关数据信息如代码、注释及缺陷等;在预处理的基础上,数据挖掘可以对相关信息进行细分,分门别类的对数据进行挖掘,找出有用的信息;最后结合数据挖掘的结果与软件的实际运作,对软件中的信息进行分析,找出漏洞,发送错误报告。无论是在软件的维护阶段还是完善阶段,都能通过应用数据挖掘技术,采用适当的算法实现对数据信息的统一管理,进而提高软件运行的效率与质量[2]。
2.1 对克隆代码的数据挖掘
对克隆代码进行检测是软件工程中最基础、最原始的操作,该检测是指通过比对系统中的文本及标识符等,对代码语言进行判断。在此方面可以应用数据挖掘技术,能通过相关函数对字符串进行匹配,对检测对象进行深入挖掘,从而起到优化比对,提升匹配效率的作用。除此之外,通过检测软件系统中的代码源能及时有效地发现并解决系统问题,为后续系统的维护与完善奠定良好的基础。
2.2 对开源软件的数据挖掘
开源软件从本质上与其他软件不同,其具有开放性、全面性和动态性,其全面性体现在对软件应用记录全面,既含有错误报告,也包含其他开发者活动。其动态性体现在相关人员的变化上。由于软件具有开放性,人员的变动特别大,人员的动态性在很大程度上影响着软件管理的效果。应用数据挖掘技术,软件公司能够有效把握数据的动态变化,实现高效、优质的管理。
2.3 对版本信息的数据挖掘
在软件工程中,应用数据挖掘的技术能够对工程版本信息进行控制。在实际的工程开发中,要对数据和信息进行统一的管理离不开对数据信息的充分掌握。数据挖掘技术的应用能够使相关工作人员详细了解当前系统的版本信息,在对数据进行分析及处理时能够借助不同模块间的差异及联系,更加准确、全面地掌握信息;除此之外,通过对数据的准确掌握,工作人员也能及时发现系统中存在的问题,能够采用适当解决办法进行处理,从而不断提升软件的全面性及稳定性,进而可以有效提升软件工程的质量。
2.4 对软件漏洞的数据挖掘
在软件的设计及应用中,对于漏洞的检测是重要环节,对漏洞进行及时的检测与维修能有效保证整个软件工程的可靠性及安全性。由于软件漏洞检测工作目标的明确性,数据挖掘可以针对具体的数据及信息进行比对,能规范检索范围,这样数据挖掘的准确度能更高,从而提升漏洞检测的效率。数据挖掘技术能够对相关信息进行深入挖掘,并对信息进行适当的转换,过滤掉无用信息,提炼有用信息,增加检测的针对性;还能对信息进行科学的选择和补充,对漏洞进行详细描述,用数值表示出来,准确定位漏洞,提升验证和处理效果。某软件公司还将此技术应用于软件运行前的系统测试,借此检验系统整体运行效果,增强其使用的稳定性及可靠性。
2.5 对执行记录的数据挖掘
在软件的设计与开发中,应用数据挖掘技术还能对执行记录进行挖掘,再根据所收集到的信息进行分析,发现并利用不同软件或不同模块间的联系和差异,跟踪数据信息执行路线,逆向建立模型,增强使用效果。具体流程是“初步插装—记录—过滤—建模”,通过对被检测的软件进行记录,能有效掌握软件的编程接口及相关变量变化,在此基础上对所获取的信息进行过滤和分类,用模型表达系统的具体特征,掌握系统运行规律。所以,在对执行记录进行挖掘时可以应用数据挖掘技术,这样不仅能够有效维护系统代码,对信息进行准确的过滤,还能增强软件的稳定性。
2.6 在人力管理中的数据挖掘
在软件开发工程中,除了对数据进行挖掘外,还应对相关工作人员进行有效的管理,数据挖掘也可以在这方面发挥作用。在员工的日常工作中,不可避免地要进行沟通交流,除了面对面交流,还会有网络上的交流。在使用网络进行交流时,可以利用该技术对这中间产生的电子信息及数据进行挖掘,从而了解人员间的大致关系,企业可以利用这一点将人员进行合理的调配,开展有效的管理工作,从而保证工程進度,提升工作效率。
3 结语
综上所述,数据挖掘技术在软件的设计及运行中能发挥相当大的作用,其能够对克隆代码、开源软件、版本信息、执行记录中的数据及信息进行挖掘,通过比对、分类和处理,呈现出数据的最终价值,其在人力资源管理中也有很好的应用效果。随着该技术的不断发展,其应用效果也会不断提升。
参考文献
[1] 李俊标,何佩.软件工程数据挖掘研究进展[J].电子技术与软件工程,2018(24):163-167.
[2] 杨继武.基于计算机数据挖掘技术的开发及其应用研究[J].信息与电脑:理论版,2018(24):29-31.