大数据浅谈
2017-03-08丁云建
丁云建
摘要:随着全面数字化时代的到来,我们日常的生活将全面数字化。本文浅谈了大数据的概念、大数据的产生、意义或者价值以及未来的发展趋势。
关键词:大数据;价值;发展趋势
中图分类号:TP311 文献识别码:A 文章編号:1001-828X(2016)030-000-01
大数据一词最早出现于1980年,未来学家阿尔文·托夫勒在《第三次浪潮》这本书中首先使用了大数据一词。然而在技术层面真正提出大数据这个词是2008年8月由维克托·迈尔-舍恩伯格及肯尼斯·库克耶两位数据工程师提出。随着互联网及计算技术的发展,今天,大数据已经成为我们日常无时无刻不在制造产生并运用的最重要信息资源。
2015年9月,国务院印发《促进大数据发展行动纲要》(以下简称《纲要》),系统部署大数据发展工作。《纲要》明确,推动大数据发展和应用,在未来5至10年打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效的经济运行新机制,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态。
一、大数据的概念
大数据这个概念提出并不早,从2008年提出至今,业界还没有公认的说法。就其定义而言,大数据是一个较为抽象的概念,至今尚无确切的定义。比较典型的有以下几种。
1.麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
2.维基百科的定义是:大数据是需要处理的资料量规模巨大,无法在合理的时间内,通过当前主流软件工具撷取、管理、处理并整理的资料,它成为帮助企业决策的的资讯。
3.Gartner研究机构认为:大数据是指需要借助新的处理模式才能拥有更强决策力、洞察发现力和流程优化能力的具有海量、多样化和高增长率等特点的信息资产。
4.IDC对大数据的定义是:大数据一般会设计两种或以上的数据形式。它要收集超过100TB的数据量,并且是高速、实时的数据流,或者是从小数据开始,但数据量每年会增长60%以上。
二、大数据的特征
1.数据量巨大
第一个特征是数据量大。随着互联网技术的广泛运用,互联网的信息急剧增多。大数据已经从TB级别跃升到PB级别。随着科技的进步,也许大数据的起始计量单位至少是PB(1000个TB)、EB(100万个TB)或Z(10亿个TB)了。
2.数据种类繁多
第二个特征据是数据类型繁多。包括网站日志数据、呼叫中心通话记录、各类社交媒体中产生的文本数据,各类位置信息数据等等。不仅包括传统的关系型数据,也包括未加工过的半结构化和非结构化的数据,例如网页、文档、视频、音频、图片、邮件等各个形势存在的数据类型。
3.数据价值密度低
第三个特征是数据价值密度相对较低。数据量在呈几何级数增长的同时,这些海量数据的背后所隐藏的有价值信息切并没有呈现出相应比例的增长,反而是因为量的巨大,从而获取和捕捉到对使用这些数据的使用者有价值和需求的难度成倍增加。
4.数据处理速度快、时效高
第四个特征是处理速度快,时效性要求高。这是大数据区分于传统数据挖掘最显著的特征。每一时刻,我们都在产生数据,都在进行数据更新,这就要求处理数据的速度必须快。
三、大数据的产生
大数据的产生是计算机和网络通讯技术被广泛运用的必然结果,特别是互联网、移动互联网、物联网、社交网络等新一代信息技术的发展。数据的产生可归类为以下四类。
1.由数据库产生的大数据
由企业内部的办公自动化(OA)、企业资源计划(ERP)、物料需求计划(MRP)等业务及管理和决策分析系统所产生的数据。这些数据通过多年的累计和沉淀形成企业内部的数据,通过多年的管理、清洗、集成、结构化和标准处理,可为企业管理决策提供支持和帮助。
2.由Web记录产生的大数据
在Web1.0时代,网站为用户指定了大量的标准化模块操作,用户在使用互联网时,参与度相对较低,对互联网的贡献度较低,产生的数据量也较少,进入Web2.0时代,互联网变成开放式的,用户的参与度更高,个人从Web1.0时代的数据使用者变成2.0时代的数据制造者,由此带来了数据量的爆发式增长。每时每刻,个人只要登录互联网就在制造产生数据。
3.由移动互联网产生的大数据
移动互联网也算是互联网,所以移动互联网产生的数据应该归类在互联网产生的数据范围以内,但是随着智能终端和无线通信技术的不断发展,移动互联网正成为每一个用户采用最多的互联网参与方式。
四、大数据的价值
在每时每刻产生的海量数据时,我们每一个人,每一个参与者都将自己的实际情况、企业的发展方向、股市的发展趋势、社会的价值导向、甚至恐怖份子的行动意图等各个方面。所有的过去和当下都可以用数据表示,我们所有的现象、本质以及未来都完全蕴藏在数据中。
五、大数据未来发展的趋势
趋势一:数据的资源化
大数据已成为企业和社会关注的重要战略资源,并已成为大家争相抢夺的新焦点。
趋势二:与云计算的深度结合
大数据离不开云处理,云处理为大数据提供了弹性可拓展的基础设备,是产生大数据的平台之一。
趋势三:数据泄露泛滥
未来几年数据泄露事件的增长率也许会达到100%,除非数据在其源头就能够得到安全保障。可以说,每个财富500强企业都会面临数据攻击,无论他们是否已经做好安全防范。因为企业的所有信息都包含在企业数据中。
趋势四:人类通过数据化永生
这个听起来比较玄乎,但确实是有可能实现并做到的。例如一个人的身体各种特征指标都可以用数据来表示,比如颜值,现今我们去医院的各种检查最后都是以数字的形式表示。当科学技术进步到一定程度,我的感情,我们的思维都可以用数字化表示的时候,我们每个人就可以在数字层面下得到永生。
六、结语
随着大数据时代的到来,我们每一个个体由数据的使用者变成数据的制造产生者,我们的所有完全融入了数字,形成一序列的数据链,在数据与数据之间只有充分融入,把握主动,站在数据挖掘的顶端才能更号的掌握未来。此文只是对大数据的一些浅显概念做了简单的阐述,不乏错误与不足之处,请斧正为谢!
参考文献:
[1]陈工孟,须成忠.大数据导论-关键技术与行业应用最佳实践.北京:清华大学出版社,2015.