大数据与云计算的邂逅
2015-01-30林崇责
林崇责
大数据与云计算的邂逅
林崇责
近年来,新一轮信息技术革命与人类经济社会活动的交汇融合,正在引发影响深远的经济社会发展的大变革。马云提出,人类已经从IT(Information Technology)时代走向DT(Date Technology)时代。数据作为重要的战略资源,其作用日益受到重视,“无数据,不说话”意识逐步深入人心。大数据和云计算自然而然的成为了新一代信息技术的两大发展趋势。2015年10月14日,浙江省长李强在云栖大会做了“数据充满机遇,云端决定未来”的主旨演讲。这里的“数据”就是指大数据,“云端”即指云计算。
当大数据遇上云计算,会带来什么美妙的结局呢?笔者认为,大数据与云计算两者相辅相成、相互促进。笔者尝试从大数据和云计算的内涵特征出发,来探究信息经济时代大数据和云计算两者密不可分的关系。
大数据是一种生产资源,蕴藏价值巨大。当前,人类已经进入大数据时代。随着摩尔定律的演变,计算机存储和计算技术进步和价格下降,使得人类经济社会活动“一切皆数据化”从理论成为了现实。正如你在沙滩上行走就会留下一串串脚印一样,无论你在使用电话、驾驶汽车、商城购物、医院看病等线下活动,还是你在网络聊天、起草文件、使用邮件、搜索资料等线上活动,甚至是呼吸空气、心脏跳动、夜间睡眠等生理活动,你的全部行为都会留下数据“足迹”,并以“0”和“1”的二进制形式存储起来。数据已然成为和能源、材料并列的战略资源,它作为一种必不可少的生产资料,蕴藏着巨大的财富。例如,美国匹兹堡大学将记录在报纸、报告、微缩胶片上美国各地自1888年以来有关传染病发生和死亡的多元、碎片、海量的数据收集、整理并实现数据化,建立了1888至2010年美国50多种传染病电子数据档案库,通过数据建模和分析,用历史数据证明了免疫苗的发明和使用,避免了一亿以上的美国人死于传染病。此外,Google公司还通过对全网络、全样本的流感有关的搜索查询总数和来自于传统流感监测系统的数据进行关联比较,分析出世界各个地方流感的活动情况。
大数据作为待开采的金矿,对信息技术提出了更高的要求。大数据作为以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,它的价值不在于占有,而在于应用。通常来说,数据本身是没有多少价值的,直到开发者有足够的能力去采集、储存、处理、应用这个数据,才产生价值,这个过程就是数据价值开发利用的过程。和传统的数据分析最大区别在于,大数据的价值往往隐藏在传统技术方式难以展现、错综复杂的关联关系中,对高频、海量数据处理的速度要求更高。一般说来,越有价值的数据越呈现出在线化(实时互动)、全量化(非样本)、行为化(更多细节)、意愿化(情感判断)和跨界化(多维关联)等特点,传统的IT架构的支撑已经力不从心,这对数据的IT处理能力提出更高的要求。
云计算是一种生产能力,正推动大数据以低廉成本变成财富。“行至水穷处,坐看云起时”。云计算为大数据分析处理提供了新的技术手段,它作为推动信息技术能力实现分布计算、按需供给、动态调整的全新技术形态,正契合了大数据对IT基础设施的高要求。云计算是把一堆杂乱无章的原始数据有效转化为知识的最佳手段,离开云计算,大数据的开发利用就会寸步难行。这也是Google、微软、Facebook、阿里、腾讯、百度等最领先的互联网企业都在研发自己的云计算平台、取代传统的IOE平台(以IBM服务器、Oracle数据库、EMC存储为代表的传统IT基础设施平台)的根本原因。当前,以阿里云为代表的云计算已经将计算加工成为和水、电、气一样的公共服务,借助“云”的力量,可以实现对多格式、多模式、高频度的大数据的统一管理、高效流通和实时分析,挖掘大数据的价值,发挥大数据的真正意义。
大数据和云计算相辅相成,助推数据强国建设。大数据与云计算在经济社会应用中产生的价值是有目共睹的。大数据和云计算比翼双飞的时代已经到来,它们的紧密结合,有利于加快建设数据强国,提升政府治理能力,推动经济转型升级。大数据是云计算的服务对象,也是实现最终价值的渠道;云计算是大数据开发利用的最佳手段。离开了大数据,云计算就成了“无源之水”;离开了云计算,大数据也就成为了“纸上谈兵”。笔者认为,“DT”时代,既要做好大数据的业务分析,也要注重云计算等支撑技术的研发应用,使得在挖掘“数据金矿”过程中实现事半功倍的效果。