数据挖掘技术及应用
2019-03-20李明敏李玉壮钟佰霖任利峰
□李明敏 李玉壮 钟佰霖 任利峰
信息技术随着时代的发展而快速发展,数据库作为计算机领域的重要环节也不断复杂多样,其结果就造成了大量的数据成为所需数据的“绊脚石”,因为巨额的垃圾数据增多,传统模式下的查询、报表工具已经无法对数据进行挖掘。因此,能够处理巨额的数据并从中取得所需要的数据的数据挖掘技术应运而生。
一、对于如何定义“大数据”以及大数据的价值
大数据,又叫做巨量资料,它指的是相关数据量的规模宏大到通过人脑以及主流的软件工具处理仍然十分吃力,以在规定的时间内管理、处理、并整合成为有用的信息为目的。简单说大数据就是其内存储的数据数量十分巨大并且存储的数据十分混杂,使用常规的处理方法没有办法归类的宏大数据团。如何理解大数据,大数据是一个集合,这个集合是指在规定的范围内常规工具没有起到发现、整治和修改数据集合的作用,对于这种拥有的数据非常多并且表现出多种复杂关系的数据,并且能够使拥有的信息快速增长,这种操作方法就需求新的处理方法,使用这种方法能够使决策的能力、洞察的能力和工作流程更加简便并且节省时间。文章《大数据时代》中的作者维克托·迈尔-舍恩伯格和肯尼斯·库克耶们表明了对大数据的定义,大数据拥有五个非常明显的特点:数量巨大、数据传播的速度较快、其中的信息具有多样化、数据真实性高和密度的低价值。
当然随着大数据时代的发展,大数据的作用也逐步体现出来,例如的大数据的商用,大数据的商用彻底改变了现有的商业模式。例如以前是高层觉得不对或不合适决定让你作整改,现在是大数据的分析结构体现出决策失误的地方再作出整改,这种模式也更加明确地指出公司当前决策的失误更加令人信服,也起到了企业对内部人才的定义,当让这种模式的推动也起到另一种变动“垃圾进,垃圾出”数据的不合格进入骚扰,自动排除也使数据的使用率进一步提高。世界上一流的连锁超市沃尔玛的成功也离不开“大数据”,沃尔玛的经典案例“啤酒和尿布”相信大家都有一定的了解,走进超市你会发现超市内的啤酒和尿布是摆放在一起的,这是经过数据的调查与当地的生活习惯分析出的决策,它发现大多数人购买尿布是看到啤酒,大多数都会想到家里面的储备是否足够,在不够的情况下大多数人都会进行购买,这也是“大数据”成功的案例之一。
二、大数据挖掘的开发体现
对于计算机挖掘技术的研究工作,为了进一步了解挖掘技术的功能,在保证挖掘技术质量的前提下,可以把挖掘技术运用到社会的不同行业,促进计算机挖掘技术的进步,并得到深入的开发和利用。在传统意义上的统计方法主要包括统计预测、抽样调查和多元化统计。在这三种方法中,抽样属于以大量数据为前提的抽样调查技术,多变量属于结构复杂的数据分析方法,回归和对数分析都称为统计预测。大多数计算机其中的数据没有非常显著的特征。在这个阶段,可以使用图表等方式来实时显示数据,并直观地显示数据的特征。散点图等可视化技术层出不穷,而现在可视化技术在高维数据领域还有很多技术难点亟待解决。这种处理方法是一种通过计算机联机分析数据的处理方法。在线分析过程中,客户之间应积极配合,积极提出相关的数据分析要求。决策树主要用于对数据和预测数据这两个领域进行分类。在大多数情况下,神经网络分为三层:第一层是输入,第二层是隐藏,第三层是输出。通过这种方式,对数据进行调整和计算,并对数据进行分类和总结。
三、大数据的使用
从中国市场营销领域的整个发展期间来看,收集到客户的数据逐渐增多,已经超出人为所能掌控的范围。在这种状况下,通过计算机的一项技术对数据进行挖掘,对用户购物的这一实际行为以及客户日常购物的习惯进行分析,对这些数据所具有的属性特征进行归纳总结,这样能够最高化地加强所有企业具备的影像实力来提升这些企业所具备的综合竞争力。而且,通过使用对数据挖掘研究的这一项计算机当中的技术,可以使数据分析的工作效率很大程度上得到提高,更能准确地采集到客户购物时的取向以及对购物的习惯和兴趣点进行一个归纳了解,这样便能帮助商家来定制一些更高效率切实可行的商业策略。而这项技术在金融行业展开的分析工作大部分集中于两个领域:股票交易、金融投资。
一般来说,通过建立模型来分析未来的发展趋势。对于金融投资来说,存在巨大的风险。在进行这部分投资工作之前,必须对数据进行分析,针对可能出现的风险问题,采取有效的防范措施,选择正确的投资方向。根据金融业发展的地区进行有效的预测。从评价的开始到预测的全过程,可以对整个金融市场的发展进行预测。根据现有数据,进一步挖掘现有数据的内部关联,在制定良好的发展模型中,实现数据的科学预测。并且能够识别金融业中存在的欺诈问题,从而防止金融犯罪类型的发生。半导体在中国大型制造行业中得到了广泛的应用。在制造产品的过程中,不断出现大量的数据。在计算机技术中挖掘出数据后,对上述生产过程中的数据进行分析,可以有效地揭示生产过程中的一些隐患。在此前提下,产品的质量得到深入保证。此外,数据挖掘这一技术已经广泛地应用于由计算机进行的电子商务领域,通过不同类型的商业数据、各类用户的信息以及消费的实际情况,实时分析和掌握,加强了购物网站提供的服务在自身的个性化。除上述利用的几个应用方面之外,数据挖掘技术也已经应用于税务行业,可以通过数据挖掘技术,对一些单位的偷税漏税的问题第一时间展开针对性的追踪活动。通过深入分析和进一步研究纳税人在不同领域的经营行为,找出他们共同的规律,为我国税收工作提供一种有效的运作模式。为确保税收的顺利实施,应从单位的偷税和漏税两个方面展开有效的防范工作。
四、结语
在21世纪的当代,信息化快速占领了人们的生活,科技也随着时代的发展而发展,人们生活和工作中不可或缺的一部分从人的交流变成了计算机的交流。当然数据挖掘也成为了计算机信息领域的重要组成,数据挖掘是属于计算机技术当中的一个十分重要环节组成,并且它获得人们的关注以及使用已经起到了大面积的推广。之前的叙述已经表明了,数据库在计算机具备了数据挖掘这项技术时对人们起到了高效利用时间的作用,所以对计算机的数据挖掘技术的使用,应该展开进一步的研发工作,找出其中现有的技术缺陷,进一步开发数据挖掘,希望能对计算级领域做出进一步的贡献。