浅析大数据时代的数据挖掘技术与应用
2018-09-04周凌
周凌
【摘 要】随着计算机、互联网、移动终端产业的飞速发展,各行各业对数据的采集、传输、积累,数据逐渐成为最有价值的非物质产物,标志着大数据时代的到来。然而,虽然大数据之中存在极有价值的数据,但也拥有大量无价值或者冗余数据,让数据的价值大打折扣,这就衍生出了数据挖掘这一突破性的技术手段。数据挖掘技术一经问世就受到各行业的广泛关注,成为软件行业时下最热门的关键词和发展方向,其意义之重大可想而知。论文浅略分析和介绍了大数据的含义、数据挖掘技术的基本原理,并着重分析数据挖掘技术在各企业中的应用和价值。
【Abstract】With the rapid development of computer, Internet and mobile terminal industry, and the collection, transmission and accumulation of data in various industries, the data has gradually become the most valuable nonmaterial product, which marks the arrival of the big data era. However, although there is very valuable data among big data, there is a lot of worthless or redundant data that greatly reduces the value of the data. This leads to the breakthrough technique of data mining. As soon as data mining technology comes out, it has attracted wide attention from various industries, and has become the hottest keyword and developing direction in the software industry, the significance of which can be imagined. This paper briefly analyzes and introduces the meaning of big data, the basic principle of data mining technology, and emphatically analyzes the application and value of data mining technology in various enterprises.
【关键词】大数据;数据挖掘;应用
【Keywords】big data; data mining; application
【中图分类号】TP311 【文献标志码】A 【文章编号】1673-1069(2018)05-0189-02
1 引言
大数据是数据集优化、分配和管理发展的背景和平台。在操作过程中,数据的潜在信息不易准确搜索,需要进一步挖掘和优化数据挖掘技术。可见,数据挖掘技术在大数据时代占有重要地位。它的技术发展和应用表明,数据信息的编辑和处理功能影响重大,具有重要的发展意义和作用。
随着我国各行业市场化进程的推动,以及互联网、数据分析技术对传统产业的颠覆,“大数据分析”迟早会成为中国企业界突破藩篱的关键手段,依靠单一信息进行分析的系統已经无法满足市场需求,建立以多种信息采集、分析、识别、研判、归档、展现的综合性平台成为发展趋势。
2 数据挖掘技术的分析方法
2.1 聚类
聚类分析是将数据集划分为多个类似的组,其目的是最大限度地提高识别相同的数据类型之间的关联性。通过不同数据之间的关联性,找到有用的数据集。这种分析方法可以应用在客户群体、客户分类、背景分析,以此事先分析客户需求并提前进行准备,聚类分析广泛存在于心理学、医学、销售等领域中的数据识别分析。
2.2 分类及事先推测
分类是对相同的数据库里面的数据根据形式、特点进行对应分类,并针对不同的目的进行统计和划分。这种方式的好处是可以通过数据的某一特点,反映该数据项的目的需求。该方式可用于客户分类、客户特征、满意度、购买趋势的分析,该方式对于单一行业来说数据积累越多价值越高,是一种连续积累的价值功能模型。
2.3 关联分析
在自然界中,各事物之间存在一定的联系。关联分析利用这一特性,查找存在于本数据集合与对象集合之间的关联、相关性或因果结构。该方式能发现交易数据中不同商品的关联性,防止在交易过程中可能出现的问题,或者寻找市场的影响因素以不断改良自身产品,使利益达到最大化。
2.4 特征分析方法
特征分析方法的特点是在数据库内部的一组数据中提取关于该组的数据,从而显示整个数据的特征,作为营销人员对客户流失数据的提取,了解如何利用这些数据找到原因,有助于留住客户。
3 数据挖掘技术的应用
3.1 数据挖掘的基本过程
挖掘技术是一个集数据集成、数据挖掘过程于一体的综合分析系统,其需要依赖一个固定的工作流程来完成信息资源的整合和挖掘工作,一般分为三个步骤:一是数据的准备,从一开始就进行数据挖掘,必须明确需要挖掘的“目标数据”,也就是说进行数据挖掘时首先需要有数据基础及挖掘目的,不能盲目进行分析工作。在数据准备过程中,系统将根据特定的操作和指令,检索满足需求和目标的信息资源,并进行分类、清理、编辑甚至预处理。二是数据挖掘。经过处理后,需要对目标数据信息进行挖掘处理,使其能够正确、高效地引入管理机制。因此,操作环节是整个程序的关键环节。例如在数据挖掘中,我们可以结合数据挖掘目标要求,针对性地选取科学而又合适的计算和分析方法,对数据信息特征与应用价值等进行寻找和归纳;当然,也可以结合程序应用的需要,对数据区域进行固定,并在固定的数据区域内分类挖掘数据,从而得到更具深度和内涵以及价值的数据信息资源,并就挖掘到的数据结果进行分析和解释,从结果中将具有使用价值和意义的规律进行提取,并还原成便于理解的数据语言。最后是切实加强管理和计算等专业知识的应用,将数据挖掘技术实施中进行的总结和提取所获得的数据信息与评估结果在现实之中应用,从而对某个思想、决策是否正确和科学进行判断,最终体现出数据挖掘及时的应用价值。
3.2 技术应用的延展方向
在大数据时代,未来的几年中,数据挖掘技术的应用领域将进一步扩大,现已广泛应用于市场营销、科研、生产、制造、电信、教育,将逐步扩展到其他行业如航空航天、生物医药、刑侦、技术应用的发展,数据挖掘的功能要求必须变得更加丰富,以满足高新技术产业的发展[1]。
3.2.1 挖掘后数据信息资源的职能范围和表现形式
依靠单一的转型背景和环境促进数据挖掘技术是不科学不合理的,因此,在网络信息环境下,我们将不得不考虑社会经济的变化,科学技术,文化和环境的发展趋势等因素,这样才能更好地促进数据挖掘技术职能的转变,以最大化地发挥其应用成效。这主要是因为数据信息资源在挖掘后,其自身的职能作用将变得更加丰富,所以在信息技术环节下的数据挖掘技术将会随着限定条件变化,而将数据挖掘信息应用于技术管理和决策管理之中,能够更好地彰显企业在经济活動中的物质性质与价值变化趋势,并结合数据变化特点和具体的表现规律,将数据信息的基本要素、质量特点、管理要求等展示出来,所以其表现形式十分丰富。数据挖掘之后的信息在职能范围和表现形式方面均得到了丰富和拓展,而这也在一定程度上体现了网络拟定目标服务具有较强的完整性,且属于特殊的个体物品,同时也是对传统数据挖掘技术的创新和发展,从而更好地满足当前大数据时代对信息进行数据化的处理,并对不同种类业务进行整合和优化,从而提高数据挖掘技术服务的一体化水平。
3.2.2 充分利用大数据背景,防止数据挖掘技术信息失真
数据挖掘技术源于社会信息,因此,在各行各业对数据挖掘技术有需要的人应该对社会、网络等自身需要的信息资源进行总体规划,使其成为具有公共属性的产品,促进其个性化职能的发挥,主导、控制管理数据挖掘技术管理的各项工作 [2]。首先,大数据背景下的数据挖掘技术,信息技术程度要高,能被记录,挖掘、管理,因此,要促进数据挖掘技术和信息资源应用的转变,必须充分利用大数据背景,在业务和技术程序实现一体化。业务和技术程序的一体化也意味着数据挖掘技术可以把带来的资源消耗、变化及管理等进行科学有效的记忆,只要技术经营者愿意,能够获得发生在资源消耗源头的信息,这对评价数据信息资源消耗的效益是非常有意义的,有助于作业价值的评估,优化业务流程。在大数据背景下,重新定义了数据挖掘技术职能,数据挖掘技术的信息有内部和外部服务之间的差异,因此合理控制企业内部各阶段,各种类型的数据挖掘技术信息,以及辅助管理机制,提高了数据挖掘技术的相关功能。
4 结语
大数据时代给现在的社会发展带来很大的帮助,各种挖掘技术不断涌现,给数据的存储、分析、解决带来很大帮助,同时可以快速地将数据转换成财富,成为企业发展的工具,应该理解数据挖掘和应用的基本方法,这是企业转型发展的一个重要机遇,它可以帮助企业快速发展和生存,能最大限度对客户需求进行深度分析以制定合理的发展规划及产品定型,减少资金投入。
总之,大数据与深度挖掘技术不仅是一种新型技术形态,也是时代发展的必然趋势,具备极大的研究价值以及市场前景,正等待着我们的发掘和应用。
【参考文献】
【1】田志民,梁品超,任艳红,等.大数据时代下数据挖掘技术与应用[J].当代教育实践与教学研究,2017(10):4.
【2】李文艳.大数据时代下数据挖掘技术的应用[J].数字技术与应用,2016(05):74.