APP下载

分析计算机数据挖掘技术的开发及其应用

2020-07-04刘树宝

电脑知识与技术 2020年15期
关键词:数据挖掘技术开发应用

刘树宝

摘要:由于现代科技的发展,网上的各类信息数据越来越多,面对这些海量数据,数据挖掘技术得以开发和发展。数据挖掘技术可以将大量数据信息进行处理从而输出想要的结果,其中融合了多种算法。相比于传统方法,具有一定的可行性和优越性。该文主要是分析数据挖掘技术相关的开发和应用,探究数据挖掘技术的工作流程和所带来的贡献。

关键词:数据挖掘技术;开发;应用

中图分类号:TP311 文献标识码:A

文章编号:1009-3044(2020)15-0057-02

随着“大数据”时代的到来,海量的信息数据给用户和商家都带来了不必要的麻烦,然而,数据挖掘技术的出现缓解了这个麻烦的问题,因此,数据挖掘技术越来越被各行各业的研究人员重视。

1大数据中的数据挖掘技术

1.1大数据的现状

从现在来看,大数据无非是指的来自各个商业或是平台的海量信息,对于现有的传统数据库无法表示或是处理这些过载的信息。随着时间和技术的进步,信息匮乏的时代已经结束,随之而来的是“海量数据”或是“信息过载”等爆炸式信息涌来,这便是大数据的到来,一些文章中对大数据做了定义,大数据指的是各种类型的数据集组合在一起的大数据集合。

由于这些大量数据的出现,给人们带来了很多不必要的麻烦,例如,我想要看一部电影,我打开一些电影方面的网站,发现有海量的电影数据,我无法找到比较心仪的一部电影,对我造成了很大的困扰。如何处理这些数据成为如今将要解决的问题,由于大数据所包含的范围很大,它包含了很多传统数据分析工具很难处理的问题,因此,数据挖掘技术被提出用于缓解大数据所造成的困扰。

1.2数据挖掘技术

数据挖掘技术指的是结合现有的数据集,分析数据并在其中挖掘一些对我们有益的信息或是规则。并且,数据挖掘技术给各行各业都带来了便利,例如:需求比较大的物联网,互联网平台等。数据挖掘技术通过分析和处理大数据,能够帮助平台精准的预测或是推荐一些信息数据。

数据挖掘技术通过发掘数据库中的大量信息来获取平台或是商家所需要的信息。虽然数据挖掘技术融合了很多种复杂算法,但是它遵循着一套总体的流程或是规则。在运行的时候,各个算法按着秩序分工合作从而摆脱了很多麻烦,达到自己的目标。数据挖掘技术一般分为三个阶段,分别是翻译数据、预处理数据和分析数据建模。其中,翻译数据其实就是转换数据的意思,将数据做转换使其在计算机允许的格式范围内,在这个阶段中,会选择一些有价值的数据供后续使用;预处理数据阶段对上一步所筛选和转换的数据进一步初始化,提高数据质量,保障后续工作高效运行,不会因为数据问题干扰后续工作;后面是对数据的建模,根据实际所提出的需求,对上面处理后的数据进行分析和建模,发现其中所存在的规则,这些数据会遵循这些规则所运行,得出最后的结果。

总之,数据挖掘技术是针对大数据做处理的,它帮助各个平台和商业解决了不少麻烦,数据挖掘技术是目前大数据领域和信息化领域所重视的一个研究课题,加快了现代科技的脚步。

2数据挖掘技术的开发

2.1传统方法

在开发计算机数据挖掘技术的过程中,统计是相较于其他方法来说最为传统的方法,主要包括了以下几种:第一是抽样分析方法。主要是从所有数据中抽取一部分数据来当作研究样本,旨在降低人们的工作压力,有效减少数据分析的数量。第二则是多远统计分析方法。此方法所面对的对象基本是那些具有复杂结构以及较高维数的因子与数据。除此之外就是统计预测方法,主要内容包含了回归分析预测分析法以及序列分析法。

2.2数据挖掘技术中的六种算法

数据挖掘技术是融合了各类算法,各个算法分工合作来提高对于数据的处理,相比普通的数据分析处理方法,数据挖掘技术更具有高效性、优越性和全面性。从现实生活来看,大数据对于可视化数据的处理能力在厂商和平台看来应用更为便利和广泛。因此,大数据中的有价值的信息是更为重要的,也就是说,数据挖掘技术对于数据的加工能力是研究人员所要重视的地方。目前的数据挖掘算法有很多,主要分为六类,分别是回归算法、分类算法、聚类分析、神经网络方法、关联规则和Web数据挖掘嘲。其中,回归算法是指分析因变量与它的多个自变量的关系并发掘变量的属性值之间是否有一定的规则或是相似性,这样就可以得到两个数据点之间的联系从而设计一些算法;分类算法指的是根据数据的类型不同点,将数据分为几种类型;聚类分析相当于找出数据之间的相似性,根据分类分析的方法再次做划分;神经网络方法是一种学习的方法,就像大脑一样思考和学习,对于输入的训练集进行学习和训练,对神经网络算法中的参数进行设定,然后到测试集中测试,即处理实际数据;关联规则是指数据中数据集合与数据集合之间的某种联系的算法;Web数据挖掘方法即从网页中不断挖掘并收集所需数据。

数据挖掘技术通过结合六类算法中的一个或是几个解决目前的需求,而不是只运用其中一个算法,它对大数据制定了一套规则,形成一套具有通用性的算法解决大数据的问题。相比传统方法,更加满足客户和商户以及平台的需求。

2.3数据挖掘法之轴线型

轴线型方法指把处理数据的整个过程看成一条轴线,这条轴线的整个流程即为数据挖掘的过程,从数据的输入开始,经过数据的预处理和分析,最后将数据输出。这个方法使得各个步骤分工明确,实现起来也很方便,但是也有很大的缺點,如果前一个步骤出现问题,将影响下面的步骤无法继续进行,比较耗时。

2.4数据挖掘法之环形

环形方法也就是将数据处理过程分布在一个环中,环的周长也就是数据挖掘的工作时长。环中的数据也就是数据的输入和输出,中间经历预处理和分析,和轴线型相同,但是这种方法相比轴线型效率更高,因为此次数据挖掘工作完成后可以马上运行到下一次循环中,不断持续,不会间断,但是整个过程相对复杂,实现比较困难。

2.5数据挖掘法之决策树

决策树数据挖掘法是一种内含有庞大数据,并围绕这些数据展开统计分类以及计算预测的挖掘手段,这种方式主要是依照有关数据,以此为基础展开数据操作。决策树中涵盖了许多针对数据分析的方法,现阶段比较完善的是CHAID以及RINT这两种计算统计方法。而当今计算机技术正在不断向前发展,有关数据统计的方式也在随之变得更为完善与科学,例如SLIQ和SPRINT技术就对连续属性的处理提出了更优良的解决策略,能够将繁杂的数据有序统一到决策树上。

3数据挖掘技术的应用

3.1市场方面

对于市场需求的统计是比较麻烦的,因为一个公司要推出一款产品之前,首先需要调查市场上面能够使用该产品的用户以及用户的需求,对于如何了解市场人群的兴趣点是一个问题,这时候就可以用数据挖掘技术来解决这个问题,通过数据挖掘技术统计这些需求数据并根据算法计算出用户的需求偏好度,遵循用户的需求和满意度去设计产品的质量。例如,如今流行的电商平台像淘宝、京东等,它们都会有一些猜你喜欢或是兴趣度推荐提供,这些提供是根据用户的历史行为数据进行建模,预测用户的兴趣度和喜好度,然后将用户可能喜欢的商品展示在用户面前,这样既省去了用户找某类不能描述的商品的時间,提高了购买率,也给商家带来了丰厚的利润。

3.2电信行业

电信行业与数据原本就有比较密切的联系;正因如此,运用数据挖掘技术能够有效促进此行业稳步发展。纵观目前电信行业的发展现状,其在价格竞争方面的态势是十分激烈的,而伴随着通信市场的日新月异,对电信行业中的各大运营商也提出了巨大挑战。现阶段中国电信行业正处于改革大背景之下,不仅促进了市场的有序竞争,也推动了电信市场的“更上一层楼”,电信行业朝着信息化与集团化方向发展已然成了该行业发展的大趋势。除此之外,移动、电信、联通等各大运营商之间的竞争日趋激烈以及5G技术的出现,使得其在客户服务水平上也向前迈出了一大步,很显然,现阶段移动信息化对于全球信息化服务起到的作用是决定性的。利用数据挖掘技术来深入探索大数据信息,主要内容涵盖了数据统计、业务数据、网络数据、交易数据以及日常数据分析等等,并与预测预警以及数据试验等模型相结合,从而为客户打造更优良完善的服务体系,以此来促使经济的进一步发展;但是,由于数据挖掘的工具基本上都属于共享形式,因此,运营商应该以挖掘工具为基础形式,不断展开创新创造,全面增强自身的市场竞争力。

3.3半导体行业

将计算机数据挖掘技术应用于半导体这个领域当中,其主要作用就是对软件进行精准检测。大体流程如下:在生产半导体元件的过程中,通过采集有关的元件数据信息,结合数据挖掘技术对元件信息展开精准的分析,从而判断此元件的质量是否符合规格标准,从而确保半导体能够正常投入使用。因此,计算机数据挖掘技术的使用,有效提高了判断元件合格与否的正确率。

3.4金融方面

不单单是指上述方面,数据挖掘方法在各个领域都有很大的应用,每个企业都有对于金融的管理,因为一个公司的金融支持着整个公司的运作,所以企业的规模与金融的管理和分析有着密切的联系。例如,通过处理和分析数据去预测公司股票,防御投资所带来的风险。这里可以投资某个股票前,通过数据挖掘技术,建模股票的生命周期中的数据,做出未来所出现的可能性比较大的各类风险,防止公司的错误投资,为公司的金融作保障,减少公司所带来的不必要的损失;除了这方面,它对于工作环境的预测和分析也有很大便利,例如,对于一些危险系数比较高的行业,可以通过数据挖掘技术建立模型对周围环境做分析,并设计周围环境的危险系数预警算法,如遇危险,立即拉响警报,减少人员伤亡,为公司的工作人员的安全作保障;还有关于开采方面,数据挖掘技术也做出了不少贡献,这方面的公司通过数据挖掘技术来帮助工作人员制定很好的开采方案,使得开采工作的效率增加。

3.5其他方面

除了以上几种实际应用之外,挖掘技术在税务行业也被较为广泛的使用。通过采取这项技术,能够及时发现和追踪某些单位的偷税和漏税问题,并展开第一时间的调查。数据挖掘技术围绕不同领域的纳税人,对其商业行为的基本规律进行分析与研究,提高了中国税收工作的实际操作效率。此外,也有效预防了偷税与漏税等等问题的发生,从而进一步保障了征税工作的有序开展。

4结束语

总的来说,随着科技的进步和大数据的发展,网上的数据量会越来越多,数据挖掘是缓解这个麻烦的有效方法之一,目前的数据挖掘技术已经很好地解决了很多问题,但是还是远远不够的,因为它的准确性和普遍性还需要进一步提高,因此,它仍然是相关领域的研究热点。

猜你喜欢

数据挖掘技术开发应用
河南方言文化资源的保护及其开发利用的研究
遵义红色旅游开发对策研究
单片机在电子技术中的应用和开发