软件工程数据挖掘研究进展
2020-12-12张万舜
张万舜
(山东英才学院 山东 济南 250104)
1 软件工程数据挖掘的应用缺陷
1.1 软件工程数据复杂多变
通过分析软件工程中的数据能够看得出,按照一般性的理解能够将其分成两种类型,其一是结构化的数据部分,指的是软件的版本信息和软件程序的缺陷报告等;其二是非结构化数据部分,指的是软件中的文档数据、代码数据等内容。因为软件工程中数据分成了两种类型,因此不同的数据类型需要使用不同的算法实现[1]。但是两种数据类型之间还存在紧密的联系,比如在结构化数据种类中的缺陷报告数据中,报告中的缺陷代码在数据结构化数据种类的同时还属于非结构化数据种类,因此这使得软件工程数据管理的难度增加,造成了数据挖掘有效性降低。
1.2 分析方法不合理
软件工程数据挖掘过程中需要保证软件信息数据转化完全,最终得到数据共享的目的。但是依据传统的挖掘方法分析,这种方法不仅形式单一,同时还是得很多原软件数据中的图片等信息无法得到转化,最终造成了数据失真的问题。但是软件开发商需要较高的软件数据信息,因此这种传统的数据挖掘手段已经不适合现代的软件工程管理[2]。为了能够使得软件程序有效开发,需要做好信息整合工作,以相适应的案例完成数据挖掘工作,使得软件的功能更实用,促进数据挖掘的有效性。
1.3 缺乏统一的数据挖掘评价方法
数据挖掘工作受到了传统工作方法的惯性影响严重,因此造成的结果就是软件工程数据挖掘的有效性大打折扣。传统的数据挖掘工作已经使用了很长的时间,相对来说这种方法的实践性更高,但是从软件工程的数据管理角度出发就能够看得出,要想做好数据挖掘工作首先应当保证工作人员具有全面的数据信息,因为软件中数据的复杂性较高,因此使得在实际的工作中无法使软件程序中的数据有效表达,最终造成了评价结果不统一,影响了评价结果的实际效果。因为软件工程的数据信息量大,数据结构复杂,因此在进行数据挖掘工作的时候应当结合软件工程的实际分析,合理的分析软件工程的数据代码和注释。
2 提高软件工程数据挖掘的有效性措施
2.1 软件开发过程中的数据挖掘技术
软件开发过程中的数据代码等处于展开状态,这一过程中的数据挖掘主要是针对程序编写过程和程序成果进行挖掘[3]。在编写阶段,数据挖掘工作应当首先分析程序结构、程序功能等信息,然后在软件系统数据代码库中选择合理的模式,也就是说在这一阶段的数据挖掘工作中应当尤其注重软件的检索功能作用,提高工作效率,降低手工检索的工作量。在软件系统的检索栏中键入需要的关键字就能够快速的查找需要的信息,实现数据挖掘的智能化管理,提升数据管理的有效性。最后应当注重静态规则的作用,合理地分析软件的调用关系、多重继承关系等信息,通过递归测试的方法指导数据挖掘工作,提高工作的效率,使得工作者快速的掌握数据关联信息,提高关联信息的准确性。除此之外,还应当注重动态规则的作用[3]。通过动态规则用于设定静态代码,使之能够对应到数据库中,进而使得缺陷代码显露出来,提高数据挖掘的有效性,降低工作的失误率。针对软件编程的结果阶段中,应当提交修改的数据信息,使得缺陷代码显露出来,同时工作人员还应当充分分析需求者的要求,对缺陷代码定位,通过软件检测工作完成多种缺陷检测,并将检测的过程和结果记录下来,以方便处理软件程序中的错误。
2.2 高性能数据挖掘技术的应用
随着现代软件工程技术的不断发展,数据挖掘技术已经跟不上软件工程的更新速度,因此需要注重技术的创新。现代数据挖掘过程中需要重视软件检索的作用,通过软件检索能够降低工作量,提高数据挖掘工作的效率[4]。利用软件的树状网络结构和软件的静态网络规则能够建设软件链表结构,这也是保证数据挖掘工作的有效途径。结合软件结构的网络情况能够使得技术得到创新,使得数据挖掘工作效率提升。为了提高数据挖掘工作的有效性,需要将数据进行准确的预测。在传统软件缺陷定位中,数据挖掘工作需要通过整合数据实现,这使得缺陷表达受到了影响,因此在现代的软件工程数据挖掘过程中应当注重运用高性能的方法完成软件中缺陷查找,及时寻找病毒的位置,提高病毒检测的能力[5]。
3 总结
通过我国目前的软件工程管理情况分析,我国的数据挖掘工作还处于探索阶段,未来还需要很长的一段路要走。国内很多企业已经建设了软件工程数据体系,但是因为规模小,技术落后,因此这种数据建设工作仍旧没有达到商业化的水平。为了提高软件工程数据的开发效率,我国应当创新数据挖掘的方法,提高数据挖掘的有效性,建设自动化的数据库工作体系。因此注重软件开发过程和开发技术成为提高数据挖掘效果的有效手段。