大数据时代的数据挖掘技术与应用
2018-01-18唐雅璇李丽娟吴芬琳
唐雅璇++李丽娟++吴芬琳
摘 要随着信息化改革的进行,大数据开始出现并得到快速发展,人们逐渐步入大数据时代。现阶段数据信息种类多、数量大,筛选所需信息较为困难,为此需要运用数据挖掘技术。该技术能够打破信息之间的相互影响与相互干扰,从而提高信息处理效率,为人们提供有效信息。本文主要讨论大数据时代背景下数据挖掘技术的应用情况。
【关键词】数据挖掘技术 大数据 云计算 应用
1 简述相关概念
1.1 大数据
麦肯锡研究院在2011年的一篇文章中正式提出了大数据这一概念,并且指出大数据应用广泛,在众多领域中发挥了重要作用,对人们生活与工业生产造成了较大影响。相关资料表明,2011年期间世界范围内的数据信息增加了1.8ZB,每个人都有超过200GB的信息资源。数据的增长是必然的发展趋势,利用统计学的相关知识可以发现数据量的增长速度将达到50%/年。因此,有效利用大数据能够改善人们生活质量,推动社会发展。
1.2 数据挖掘
上世纪80年代,数据挖掘技术开始出现,经过长期发展,该技术已经得到了较大改进,并发生了质的变化。之前,对大数据进行研究的是为了推动人工智能的发展,因此,数据挖掘对技术有着较高的要求,需要改进、创新原有数据。通常情况下,目标数据不可能直接得到,经常隐藏在大量模糊的数据库中,所以具备一定的挖掘潜力,操作者需要对相关信息进行分析,从而挖掘出目标数据。数据挖掘在许多领域中都得到了应用,对于商业领域,管理者在制定决策时需要对参考信息进行分析,因此需要在各类信息中发现隐藏的信息价值与信息规律,进而提高决策的准确性。
2 简介数据挖掘技术
2.1 相关理论
随着信息技术的发展与互联网的普及,数据挖掘技术的应用范围逐渐扩大,不仅在工厂生产与企业管理方面存在应用价值,并能应用于复杂且无规律的数据使用环境中。该技术能够通过一系列措施挖掘互联网平台中存储的数据信息,并对其进行处理,最终得出信息集合,以便人们查阅与参考。
2.2 数据分析方法
数据挖掘技术依靠相应的数据分析方法,只有正确选取分析方法,才能在大量数据中快速得到所需数据,发挥数据的应用价值,进而推广数据挖掘技术,扩大该技术的应用范围,提升其应用价值。任何一种数据都能通过数据挖掘来得到其内在规律与本质特点。实际情况中经常运用的数据分析方法包括:
2.2.1 特征性數据分析法
现阶段,数据资源在生活与工作中普遍存在,互联网平台中数据具备的功能、特征等获得了人们的广泛关注,并为此开展了相关研究。例如,遗传算法可以用于分析其他类型算法的适合度,该算法借助生物进化理论模拟数据信息的发展过程,构建真实性与虚拟性兼具的数据资源;人工神经网络中包含的信息种类繁多,利用数据挖掘技术对信息进行处理,通过计算机来分析复杂模式的特征与趋势;可视化技术在数据挖掘过程中应用较为广泛,作为一种辅助技术,其通过动画、图像等手段为数据挖掘提供操作指导。
2.2.2 聚类分析法
该方法是对抽象、模糊的数据信息进行收集、整理、分析与编辑,之后将具备相同特征的数据集合在一起来构建数据库。该方法适用范围广,较为常见,能够对任何数据信息进行挖掘。
2.2.3 关联分析法
数据之间经常存在一定的关联性,然而这种关联较为隐蔽,人们无法通过直接观察发现,而关联分析法能够利用数据之间的关联来设计数据关联方案,从而达到某一信息处理的目标。该方法主要应用于操作复杂、要求高的信息处理任务中。
3 数据挖掘技术的运用流程
3.1 数据准备
利用研究者之前构建的数据库进行数据准备工作,数据库中包含大量、多种类的数据,借助这些原始数据进行挖掘前的准备。
3.2 数据挖掘
进行数据挖掘工作,选取数据挖掘方法时应考虑到挖掘对象的实际情况,可以结合多种挖掘方法,从而了解数据之间存在的关联性。
3.3 模式评估
数据挖掘过程中的相关数据是模式评估的主要研究对象,而流程评估是对数据规则进行研究与分析,并将相关数据转变为文字内容,便于人们参考与利用。
3.4 知识应用
上述工作完成后,便可以得到目的数据及其存在的规律。因为数据挖掘是为某项工作服务,因此还需要进行知识应用。这一步骤是将数据结果应用于实际生活中,进而充分发挥数据价值,提供准确的参考信息。
4 数据挖掘的应用范围
4.1 电信行业
近几年,电信行业进入了快速发展时期,技术水平与服务质量都有了显著提高。企业为了获取更高的经济效益,扩大生产量,提升生产效率,需要提高资源整合效果,推进数据的无缝连接,通过数据的归类整理来发现数据中隐藏的特征、规则与价值,这一问题是电信行业普遍关注的焦点。利用数据挖掘技术,能够有效解决上述问题,保证该领域的持续发展。
4.2 市场营销
市场营销中经常应用数据挖掘技术,并且其应用该项技术的时间较早。将该技术运用至市场营销中能够分析用户的消费水平与消费习惯,进而改进商品制造方案与销售方案,扩大产品的销售量。目前,数据挖掘不仅应用于超市购物等形式的市场营销中,而且在金融领域的各个方面都得到了应用。
4.3 科学研究
科学研究的顺利开展需要对大量的数据信息进行分析,只有完全掌握数据规律与数据特征,才能发现新的知识与理论。对数据进行处理时需要利用合适的算法,通过数据挖掘技术对技术进行分类整理,并找到数据的特征与内在规律。如,分析DNA的相关数据、探索太空中其他星体等研究内容都需要进行数据挖掘。
5 结束语
随着社会的发展,数据挖掘技术有了较大的改进,已经应用于许多行业中。对该技术的研究是一项长期工作,需要持续进行。完善数据挖掘技术,使其能够快速、准确处理数据信息,发现数据中隐藏的规则,充分发挥其在特殊领域中的应用价值,增加企业经济效益。
参考文献
[1]李平荣.大数据时代的数据挖掘技术与应用[J].重庆三峡学院学报,2014(03):45-47.
[2]李文艳.大数据时代下数据挖掘技术的应用[J].数字技术与应用,2016(05):74-74.
[3]邵燕,陈守森,贾春朴等.探究大数据时代的数据挖掘技术及应用[J].信息与电脑(理论版),2016(10):118-119.
作者单位
厦门医学院 福建省厦门市 361023endprint