大数据时代的数据挖掘技术与应用
2018-03-22孙福利
孙福利
随着社会科技的不断发展,计算机技术水平也在不断的提高,在这样一个大环境的影响下,各个行业也在大力开展数据挖掘的工作。数据挖掘技术的提升不仅能扩大数据信息的影响范围,还对企业发展有着一定的推动作用。因此大力发展数据发掘技术时目前各个企业的首要任务。在发展数据挖掘技术的同时还要了解到其在企业中如何运用,本文对数挖掘技术与应用做了简要的分析。
【关键词】数据挖掘 分析 应用 信息技术
1 数据挖掘技术的含义
1.1 大数据
在二零一一年中旬,全球著名数据研究机构肯麦锡研究院,发表文章声明,数据已经逐渐渗透到人们生活工作当中的每一个角落,已经在人们的生产工作当中占据了主导地位。而人们在大数据时代下对于数据的发掘与应用,告诉了我们在不久的将来生产效率将明显提高的必然走向。在文章发表的第二年上旬,美国就提出要投入巨资全面的发展大数据,从而进一步扩大数据信息技术的影响力。据研究表明,在肯麦锡发表的同一年,全球平均每人生产的数据以达到204800MB,其增长趋势还将不断的上升。
1.2 数据挖掘技术
数据挖掘技术是一门较为新颖的科学技术研究。他最早出现于二十世纪末,其主要面向商业群体方面的应用,数据挖掘技术就是在种类繁多且复杂多变的数据中找出一些不易发现且具有很高潜在价值的数据,也可以理解为就是从繁多的数据中,找到对企业有潜在价值的数据,进行不断地转化与分析,将得出的数据运用到企业运营当中,从而促进企业的发展进程。
2 对于数据挖掘技术的研究
2.1 聚类分析研究
聚类研究就是将实物或者概念上的物质进行整合,将相似的物质分结合分成一组。这种由多个相同或类似的物质组合成一组,且根据性质不同分成若干大组的研究方式就是聚类研究。从根本意义上讲,聚类研究就是对数据进行分类,在这过程当中从数据上找出一些潜在价值。但是它与常见的分类方式又有着一些差别,目前,有两种聚类研究的方式,首先是硬聚类方式,硬聚类方式就是将间隔比较近的数据进行整合。然后就是模糊聚类方式,模糊聚类研究方式就是根据数据的属性不同进行整合。这两种聚类研究方式虽然在方法上有所不一样,但是他们却有共同的目的。因此,数据挖掘技术研究的过程当中,模糊聚类发和硬聚类发都可以运用。
2.2 聯系研究
在自然界当中,各种物质之间都具有一定的关联性,一种物质的改变就会引起另外一种物质发生对应的改变,例如在同一生态系统当中,草减少了,就会引起食草动物的减少,而食草动物的减少就会引起食肉动物的减少。因此数据联系性的研究,是以自然界生态系统的变化关联性为基础理论的研究。可以理解为,在具有联系性的诸多数据当中,通过不断的分析研究,找出有意义的数据。联系性研究也是开展挖局数据研究的一种有效途径。
2.3 神经网络研究
神经网络研究就是指,神经网络对于一些数值较大的数据进行一系列的总结,得出计算机以及人工所分析不出来的模式趋势的数据。神经网络研究是涵盖在自主学习的数学模式范围之内的,它不仅可以具有指引的学习,还拥有没有指引的聚类,但是无论是有指引的学习还是无指引的聚类放入到神经网络当中,都是以相同的形式呈现出来的,现阶段数据挖掘技术研究当中常见的神经网络方式运用的方法是bp和rbf。
2.4 可见性技术研究
在数据挖掘技术发展过程当中最常见的辅助类技术就是可见性技术。它通过表格、动图、视频等表达手法准确生动的引领发掘掘,引领操作,展现成果等,可见性技术很好的解决了数据挖掘过程当中所遇到的一系列表达上面的难题。为客户能够更好的运用和熟悉提供了便捷,对数据挖掘技术的面向群体的扩展起到了推动性的作用。
3 数据挖掘技术的运行过程
3.1 数据的前期预备
前期数据预备是从大批量的数据当中通过挖掘预备出所需要的数据,数据预备是长期间且没有规律性的数据累计过程。由于最先的数据对于挖掘有不利的影响,所以要进行前期准备,通过一系列手段的处理过后,才能进行数据挖掘。数据预备的质量是发掘技术质量的第一影响要素。
3.2 数据挖掘
数据挖掘是整体运行的重要环节,依照其基本要求来说,运用有效的方式方法,才能找出数据的规律。
3.3 模式的预估
研究:模式的预估研究就是对找出来的数据,进行综合的统计分析得出有意义的数据,并将其叙述成人们能够懂的表达形式。
3.4 数据应用
数据应用就是对预估分析后的出的数据在实际操作当中运用上,这是整个过程当中最重要的部分,同样也是数据发掘技术的根本目的。
4 数据挖掘技术的应用
4.1 在市场上的应用
市场销售时最早开始用到数据挖掘技术的,其具体利用在分析用户挖掘出客户的一些消费特征,通过对消费者的消费特征进行分析,然后才去有效的营销措施来提升经济收益。
4.2 电脑网络上的应用
电脑网络对于数据挖掘的需求较高,就比如一些网站搜索及运用度上,都是同过对数据进行挖掘然后进行统计分析得出最适合消费者需求的数据,并且针对得到的数据制定相关的策略。
4.3 在通信行业上的运用
数据挖掘技术的持续稳定发展,推动了通信行业的发展,而其在通信行业的应用具体就体现在通信市场的大数据力找出适合其发展的道路,将企业的实际条件进行整合,形成一个较为庞大的数据库,对这些数据进行挖掘就成为了促进企业发展的主要途径。
5 结束语
在科技不断进步的大环境下,社会经济也得到了有效的发展,挖掘数据技术的水平也在显著的提升,给数据这种具有一定潜在价值的物质的研究分析带来了极大的帮助。现在商业企业的重点工作就是,在企业转型上把数据应用到实际操作当中,将数据转变为收益,使其变成企业发展的手段。如果企业的发展进程要想跟上社会的发展脚步,企业必须要做到了解数据挖掘技术,并且将其运用到实际运营商,这对一个企业的发展及其有利。
参考文献
[1]胡天状.数据挖掘技术在教育决策支持系统中的应用[D].杭州:浙江师范大学,2015.
[2]吴文绍.甘肃省教育管理信息决策支持系统[D].兰州:兰州理工大学,2015.
[3]丁守哲.基于云计算的建筑设计行业信息系统开发模式与实现技术研究[D].合肥:合肥工业大学,2016.
[4]刘华婷,郭仁祥,姜浩.关联规则挖掘 Apriori算法的研究与改进[J].计算机应用与软件,2014(01):146-149.
[5]卢建昌,樊围国.大数据时代下数据挖掘技术在电力企业中的应用[J].广东电力,2014.
作者单位
山东广电网络有限公司青岛分公司 山东省青岛市 266071