APP下载

数据挖掘技术在软件工程中的应用探究

2018-12-25姜文泽重庆邮电大学软件工程学院

数码世界 2018年6期
关键词:源代码结构化数据挖掘

姜文泽 重庆邮电大学软件工程学院

前言:软件技术如今已经在我们生活的各方各面中都得到了广泛体现,不过从可控性来说,软件技术可控性并不显著。软件在应用时会出现大量的数据,这些数据有着很高的价值。对开发软件的企业来说,合理运用数据挖掘这项技术,能够实现数据信息的再利用。在系统故障时及时处理故障问题,进而提高企业受益。

1 数据挖掘概述

数据挖掘即从混乱、复杂、大量的数据资料中获得所需数据信息,实现利润的再创造。数据挖掘事实上是多种技术的统称,包括多层次的数据挖掘、数据可视化挖掘、准确性数据挖掘、专用数据挖掘等等。

多层次的数据挖掘指的是通过交互形式或动态变化的方式获取数据资源[1]。

数据可视化挖掘指的是通过特殊的技术与方式,实现挖掘数据的可视化处理与显示。

准确性数据挖掘即为用户提供精准的数据信息,提高数据应用价值[2]。

专用数据挖掘指的是从不同系统中获取信息资源,在不同数据库中完成信息处理。

2 数据挖掘技术问题

2.1 信息太过复杂

软件工程信息数据复杂、种类较多[3]。人们一般将软件工程数据分为两类,一类是结构化数据,另一类则是非结构数据。软件代码会对非结构数据处理起到明显的作用,版本信息则会对结构化数据造成深刻的影响。结构化与非结构化两种数据之间存在着密切的联系。合理利用数据资源即通过特殊的技术从结构化与非结构化两种数据找到相似的规律。通过对两种数据的处理与整合,能够提高软件工程数据资源有效性。

2.2 缺少统一的评价标准

借助于数据挖掘,人们能够从庞大的数据信息中获得最有价值的结果,但由于缺少统一的标准,目前的软件信息出现了较为复杂的情况。如信息标书存有差异,致使信息获取者并不能合理应用与对比数据信息。

3 软件工程中的数据挖掘应用

3.1 软件开源

在开发软件时候会应用到大量的源代码,这些源代码数量庞大,对软件开源有着重大意义。此时可以使用数据挖掘技术将所需的源代码挖掘出来,降低软件开发难度,提高软件开发效率和软件开发质量。

3.2 软件管理

工作人员在管理软件时,会遇到大量的数据信息,不论是使用这些数据信息,还是处理这些数据信息都是一项比较繁重的工作。所以数据挖掘在软件管理中同样有着重要作用。人力资源的调配与分析对软件管理来说等同于数据管理的过程。大规模软件工程开发的人员结构非常复杂,为合理的调配和分析人力资源就必须使用数据挖掘技术处理和挖掘相关信息,降低时间成本和人力成本。

3.3 故障检测

数据挖掘还能够便捷、高效的检测软件故障。实现软件测试、软件故障原因搜集、数据清理和转换。在实际操作的过程中,数据挖掘会对系统内部的数据进行合理选择、抽取与采集,准确描述与定位系统漏洞和故障。在加快故障处理效率的同时,降低系统的维护成本。

3.4 数据信息

在软件工程中,数据库有着重要的作用。数据库能够为软件开发与应用提供数据存储,具体体现为源数据获取、处理与管理等工作。数据库建模能够将数据构建为合理、安全的数据库,包括可行性报告、软件信息、用户信息等内容。

3.5 挖掘记录

软件工程在运行中所产生的数据信息,同样会对企业管理软件项目、开发软件项目有重大影响。挖掘软件执行记录,就是在分析执行记录对之进行逆向的建模工作,从而达到了解程序、维护程序的目的。

3.6 版本信息挖掘

数据挖掘在版本信息中的应用,必须确保项目参与档案相同。这样才能够更加方便的获取数据信息,为系统更新提供便利。在系统管理和开发软件的过程中使用版本信息是非常寻常的事情。利用不同版本信息,能够获得不同的信息数据资源。通过所获取的信息数据检查系统的问题和漏洞。随着近些年数据挖掘在软件工程的应用越来越普遍,软件技术员的系统把控能力也在不断的加强,这在某些程度上推动了软件行业的发展。

4 结语

数据挖掘在软件工程中有着极高的应用价值。强化数据挖掘能力,推动数据挖掘进步,对软件工程应用和发展有着深远的意义。在数据挖掘这项技术的应用范畴越来越广泛的今天,挖掘技术也需要不断的研发与探究,只有这样挖掘技术才能够在软件工程中发挥更大的价值,为软件工程提供更加稳定、可靠的能力。

猜你喜欢

源代码结构化数据挖掘
改进支持向量机在特征数据挖掘中的智能应用
基于TXL的源代码插桩技术研究
改进的非结构化对等网络动态搜索算法
深度学习的单元结构化教学实践与思考
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
软件工程领域中的异常数据挖掘算法
保护好自己的“源代码”