数据挖掘技术在计算机软件工程中的应用
2023-03-22浙江安远检测技术有限公司朱赋阳
浙江安远检测技术有限公司 朱赋阳
随着我国社会的发展,我国互联网行业又有了显著的提升,今天我们主要讨论在计算机软件工程中的数据挖掘技术的各项应用。数据挖掘简单看就是在强大的数据库中,可以快速且准确到提取到需要的信息,可以更方便地为我们进行软件的开发以及管理。为了使人们有很好的体验,就需要我们在数据软件开发的阶段进行相应的管理,使得对一些复杂的数据能够进行更深层次的挖掘,就是在实际的软件工程当中,数据挖掘的时间并不长,在相应的理论分析和结果表明,数据挖掘技术在软件工程上起着十分显著的作用。具体来看,无论是银行、保险或者数据领域都有着一定的推进作用,甚至在医辽、教育方面数据挖掘技术也有着很重要的运用。数据挖掘技术应用在多个方面,比如说在开发软件运行过程当中,我们可以利用数据挖掘技术对软件的质量进行相应的分析,从而制定更合理的数据资源,避免我们在以后的工作中有错误产生。基于此,本篇文章对计算机软件工程中的数据挖掘技术的应用进行研究,以供参考。
数据挖掘是一个新的概念,主要是从低密度元数据中选择具有相对价值的信息数据,从而大大提高了数据的使用。因此,将数据挖掘科学应用于计算机软件工程可以确保元数据处理的质量和效率,从而优化重要数据的使用[1]。因此,如何将数据勘探科学应用于计算机软件工程的问题需要由技术人员加以研究和解决。
1 数据挖掘技术
数据挖掘技术,顾名思义就是在一个庞大的数据环境之下,我们能够有效的对我们所需要的数据信息进行相应的提取,可以对这些信息进行相应的分类和分析,使得这些信息更明确。在数据信息无处不在的网络世界,相应的软件工程所拥有的信息是杂乱且庞大的,而数据信息的存在是直接影响软件开发的,为了提高软件开发的工作速率,我们会利用数据挖掘技术,对信息处理有一个质的提升,而且还能有效地对信息进行筛选,能够及时的实现数据传输,使我们获得的信息是简单且有利的。一般来说,我们主要将数据挖掘工作分为3 个层次:(1)交互式可视数据探查;(2)自动模式提取;(3)模型构建。三个层次互相协作,相互递进,能够使我们大量的数据信息进行合理的分类。在实际的应用过程中,数据挖掘技术能够合理的将数据进行分析和分类,能够帮助我们在日后工作中对于各类数据的运用。
2 数据挖掘方法
随着技术的发展,数据挖掘有着很多的方法,最常用的有算法种类、轴线型数据挖掘法以及环形数据挖掘法。
(1)算法种类:算法种类一般用于大数据之中,在数据加工时有着明确的要求,我们在对算法类型进行分析时,首先会使用分类算法以及回归算法作为首要方法,在本质视角来看,在进行大数据分析时,我们会结合不同的算法方式来进行数据挖掘工作,使我们的工作能够顺利进行,而且这种方法能够将数据挖掘利用抽象的形式表现出来,这种方法相对来说在数据中的适应能力比较强,对于一般的数据挖掘来说,它有着更显著的可复制性以及适用性,深受人们信赖。
(2)轴线型数据挖掘法:这种方法主要是利用轴线,轴线的始终点作为数据挖掘的两个重要代表,这种方法相对来说具有明显的操作性,而且更方便人们修改。但是轴线型数据挖掘方法也存在一些不足,相对其他范围来说,这种方法的挖掘速度较慢,就是总体来说这种方法还是在数据挖掘工作时比较常见的一种方法。
(3)环形数据挖掘法:环形数据挖掘法就是将数据布局在一个环节当中,使得数据在输入和输出时对于数据分析有一个充分的体现,使人们更加直观的可以了解到各类数据信息,更方便于人们对数据的获取。而且每次数据挖掘的结果可以有效的和后续挖掘到的数据循环结合在一起,能够使数据有一个往复的状态,经过大量实验表明这种方法可以明显的看出数据利用率较高,且挖掘速度比较快,由于是环形数据信息,它能够持续的进行挖掘工作,但是它的流程比较复杂,在实际操作时有一定难度[2]。
3 数据挖掘技术应用的优势与不足
随着我国的网络不断发展,相应的信息技术也有了显著地提高,而我们所运用数据挖掘技术在各行各业都有了广泛的应用,同样的也是因为数据挖掘技术可以为人们提供很多便利,它可以保障信息的基本安全。数据挖掘技术在使用的时候它的特点尤为明显,就比如说精准、高效还有很强的预见性。在使用之前,会将我们所涉及的数据信息进行一个大量的收集,在经过自身对其分析运用,它本身的病毒监测以及信息提取能够进行各种网络风险预估,这样就会使得我们的计算机在使用时更加安全有效。虽然说数据挖掘技术能够及时发现计算机的病毒,但是在实际的运用过程中也有一定的缺陷。就比如说数据挖掘技术在使用的时候,由于数据源形式多样,很容易在运用中导致数据缺失等,再加上网络的分布情况以及环境数据挖掘技术并不完善,这也在一定程度上影响整个数据挖掘技术的使用感受,所以说就要求我们的相关部门加强对数据挖掘技术的研究,及时对数据挖掘技术进行优化和改善,以此来提高我们数据挖掘技术的使用效率。
4 计算机软件工程中的数据挖掘技术的应用分析
4.1 在软件执行记录上的应用
随着我国网络技术的发展,以及数据挖掘技术的创新,为了使软件在执行过程中所涉及的各项数据能够及时分析以及挖掘,我们的技术人员通过在处理程序的基础上,建立了全方位的分析处理,能够使得软件在运行的过程中更加准确,所以说在进行分析和挖掘时所记录的数据,需要我们提前确定好安装路径,还可以采用逆向建模的方法,将我们所需要的数据信息分析到实处,防止我们在以后的工作过程中所需要[3]。除此之外,我们的技术人员还应该及时关注软件在实际的运行过程中可能出现的漏洞或者其他问题,并且要及时作出解决方法,以此来确保我们软件本身的性能问题。我们更要对程序本身所具有的规则有深刻的了解,而且程序的各项规约挖掘都是通过对执行跟踪的各项相关程序所进行全方位的分析,并且能够及时发现和解决由程序代码所涉及的各项协议。除此之外,我们还要在跟踪信息时,保证信息的准确度。主要挖掘类型流程如下:首先我们会采用初步桶装的形式,对系统有一个全方位的分析,紧接着收集和整理我们涉及软件所对应的API 接口,保障我们的信息能够及时过滤以及跟踪,使其形成一个规约模式,保障我们相关系统功能有序进行。
4.2 软件故障检测
在实际的运行过程当中,我们的软件难免会出现一些故障,我们为了能够及时发现故障,特意安装了准确定位装置,对于挖掘技术,我们利用了信息定位的方式,能够在一定程度上帮助我们理解程序,能够使我们更方便的将工作落到实处。就目前来看,我们原有的自动化以及挖掘形式,大多体现在软件工程当中。通常情况下,规则挖掘主要是利用程序,再经过时态与逻辑的相互配合,这样可以确保我们数据信息的安全准确性;对于自动化挖掘来说,我们通常使用API 规则挖掘法,主要原因是这种方法的成熟度比较高,在工作中使用起来更加方便,但是操作过程比较难,定位系统也没有很强的准确性。随着我国的发展,我们的技术水平不断提高,特别是在描述程序运行轨迹方面,程序谱的存在为我们的工作提供了更多的便利,我们将正常软件和故障软件进行了对比,结果表明在我们接受了新的挖掘技术之后,更容易发现故障问题,而且能够准确无误的发现故障源,为我们制定解决措施提供了更多的选择[4]。
4.3 信息挖掘
在进行软件开发的过程中,由于数据信息的不同,我们就需要对不同的信息类型进行相应的信息挖掘。我们先进的软件工程可以对数据信息进行全方位的管控工作,加上软件工程的应用范围也非常广,软件工程可以合理的对数据信息进行有效的管理,确保软件在开发的同时能够将各项资源进行合理的更新,以此来保证软件开发的质量以及在开发过程中的工作效率,促进我们的项目顺利进行[5]。在数据挖掘的过程中,经过软件开发所更替的数据,我们的技术人员可以通过相应的程序及时的反应到软件的各种内部结构,而且还可以利用数据挖掘所在的优势,能够及时察觉到软件内部的各项困难,并且能够及时作出应对方式,对软件开发有一定的推进作用。
4.4 软件版本信息挖掘
软件版本信息挖掘,它在软件工程领域当中可以说是最广泛的技术之一。它在进行工作时,我们的开发人员会在软件开发的过程中利用版本控制软件对相应的信息进行统一管理。这样的目的是确保在软件开发的过程中使所有的数据软件工程在更新时能保持一致,确保软件在更新时的质量,同样的开发软件项目是软件工程的一种重要方式。在软件工程系统版本信息控制技术当中,数据挖掘技术可以说是最广泛的应用,它主要是重点研究软件开发在变更信息当中的各项数据挖掘,它不仅会在同一个软件平台下用不同的应用效果进行相应的分析和探索,寻找各个模块之间的关系,或者是说存在的差异,而且能够在一定程度上为我们分析和预测软件工程系统模块在工作中存在的各项指标,为以后的软件工程开发进行相应的分析[6]。
4.5 数据挖掘在软件工程开发中的应用
在数据挖掘时,一般软件程序的开发是整个软件工程的难点,对于整个软件的质量起着关键性的作用,所以说在进行开发时,我们必须要保证软件程序在开发时的质量,对相应的克隆代码进行检测,确保我们所使用的程序代码具有一定的准确性,这也是值得我们深入思考的。
5 软件工程中应用数据挖掘技术的方法
5.1 分类法
在执行软件工程方法时,我们首先为相应的分析模型建立一种方法,即根据相关规则和流程提前输入相应的数据信息,然后对其进行分类,以方便后续的分析模型。当前,我国现有数据挖掘技术在软件工程中最常用的方法有:判断书法、神经网络分类、树判断法等。其中判断树法主要依靠贪婪算法作为英雄过程中的核心算法,将构建自上而下的决策树框架。一般来说,框架上有很多节点,不同的节点对应不同的软件类别符号,有助于我们在应用程序中进行判断。
5.2 关联法
在进行关联法过程中,关联法具有一定的严谨度,它的规则本身就是将各类数据关联,所以就要求我们的工作人员在进行关联法时将各类有关联的数据进行分类。关联法的主要特点就是具有良好的支持度以及可信度,总体来说关联法在进行数据关联处理时是一项十分重要的方法。
5.3 聚类法
在进行聚类法的过程中,一般情况下我们的技术人员首先会对数据进行分类,以此来防止数据的相似,从而在工作中产生不必要的麻烦,同样的,不同类型的数据自身拥有不同的特点,作用效果也不同,一般情况下我们将聚类法主要分为3 类:划分法、模型法以及网络法。
5.4 软件项目组织管理
一般在软件项目立项以后,起初我们会借助一些相应的数据挖掘技术对我们的项目进行相应的分析总结。首先会根据数据挖掘系统中的一些组成成分来获取框架中的各种信息,为我们的技术人员提供更多的研究方向,与此同时,我们的项目关工作人员也会进行相应的数据整合并加以利用。就比如说在进行项目的研发过程中,首先我们要利用岗位之间的团结协作,时时交流,相互配合,为我们的数据挖掘技术更有序的顺利进行。除此之外,良好的数据挖掘技术可以有选择性的对人群之间的关系和层次进行清理,总体来说,这对软件项目的整体发展有了一定的提升作用。除此之外,数据挖掘技术也可以很方便的查看软件的版本信息,这是因为软件在使用的过程中会储存大量的数据,我们应该及时对这些数据进行相应的分析和完善,对于软件的更新有着积极的作用[7]。而且有了数据挖掘技术的存在,它能够及时地对软件系统进行维护,不但为我们节约了时间还控制了成本。但是在数据挖掘过程中也存在一些漏洞,这些漏洞还需要我们相应的技术人员不断完善系统,使软件项目能够合理的进行。
6 结语
新时期我国更加重视互联网经济产业的发展,尤其是5G 技术、人工智能和VR 技术等高科技技术必须促进相关软件的改造。应用数据提取技术可以大大提高软件工程的开发质量,提高整个软件开发工程的质量。
引用
[1] 龙艳.数据挖掘技术在软件工程中的应用[J].信息与电脑(理论版),2019,31(23):122-123+126.
[2] 韩建友.数据挖掘技术在软件工程中应用研究[J].网络安全和信息化,2022(6):67-69.
[3] 刘园园.计算机软件技术在大数据时代的应用试析[J].网络安全技术与应用,2022(5):61-62.
[4] 张立鉴.数据挖掘技术在软件工程中的应用研究[J].网络安全技术与应用,2019(06):47-48.
[5] 吴文庆.数据挖掘技术在软件工程中的应用[J].科技资讯,2019,17(13):7-8.
[6] 章立.大数据时代计算机软件技术应用[J].智库时代,2019(20): 32-33.
[7] 郄彬.计算机软件技术在大数据时代的应用分析[J].科技资讯,2022,20(17):1-4.