短文两则
2014-03-10陈德彰
∷陈德彰
大数据
当前,全球已经全面进入信息时代,从20世纪80年代以来,世界人均储存信息的技术能力(the world’s technological per-capita capacity to store information)大约每过40个月就会翻一番(doubled roughly every 40 months)。到2012年,每天会产生2.5 百亿亿字节(exabytes,即2.5×1018)的信息。数据的深度分析和利用,对推动经济持续增长、提升企业的竞争力将起到重要的作用。
随着“云时代”(times of cloud computing)的到来,“大数据”(big data,英文解释为:the term for a collection of data sets so large and complex that it becomes difficult to process using on-hand database management tools or traditional data processing applications,即指一组非常庞大而复杂的数据,很难用现成的数据库或传统处理方法进行处理)。“大数据”成了一个 “高端大气上档次(high-ending, highfaulting and high-grade)”的时髦词汇,吸引了越来越多的关注。“大数据”时代的挑战包括数据的捕获、综合处理、储存、寻找、分享、转送、分析和视觉化(capture,curation, storage, search, sharing, transfer, analysis, and visualization)。
最早提出“大数据”时代已经到来的是全球知名咨询公司麦肯锡(McKinsey & Company)。麦肯锡在研究报告中指出,数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素;而人们对于海量(magnanimous)数据的运用预示着新一波生产率增长和消费者盈余浪潮(a new wave of productivity growth and consuming surplus)的到来。该报告发布后,“大数据”迅速成为了计算机行业争相传诵的热门概念,也引起了金融界的高度关注。数据本身也是资产,这一点在业界已经形成共识。
牛津大学网络学院教授的维克托·迈尔-舍恩伯格(Viktor Mayer-Schonberger)所著的《大数据时代:生活、工作与思维的大变革》(Big Data: a Revolution that Will Transform How We Live, Work, and Think)一书是开大数据系统研究的先河之作(pioneering work)。他在书中前瞻性地(with far sight)指出,大数据开启了一次重大的时代转型,带来的信息风暴正在变革我们的生活、工作和思维。他指出,大数据时代最大的转变就是,放弃对因果关系(cause-result relation)的渴求,取而代之关注相关关系(correlation)。也就是说,只需要知道“是什么”,而不需要知道“为什么”。这就颠覆(subvert)了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。该书认为,“大数据”的核心就是预测。“大数据”将为人类的生活创造前所未有的可量化的维度(quantifiable dimension)。“大数据”已经成为新发明和新服务的源泉,而更多的改变正蓄势待发(accumulate strength for a takeoff)。
“大数据”通常形容一个公司创造的大量非结构化和半结构化(non-structural and semi-structural)数据。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的大规模的平行电脑的软件分配工作(assign work to massively parallel software running on tens, hundreds,or even thousands of servers)。简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是“大数据”技术。“大数据”到底有多大?一组名为“互联网上的一天”的数据告诉我们,一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2,940亿封之多(当于美国两年的纸质信件数量);发出的社区帖子达200万个 (相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万。据有关机构监测统计,2011年全球数据总量已经达到1.8ZB1ZB,等于1万亿GB,相当于18亿个1TB移动硬盘的存储量,而这个数值还在以每两年翻一番的速度增长,预计到2020年全球将总共拥有35ZB的数据量,增长近20倍。2012年全球大数据企业营收为50亿美元,未来五年的市场复合年增长率将达到58%,2017年将达到500亿美元。
业界将“大数据”的特点归纳为4个“V”——Volume,Variety,Value,Velocity,即四个层面:第一,数据体量巨大;第二,数据类型繁多;第三,价值密度低;第四,速度快。
2013年,中国的互联网用户已经超过五亿人。海量的互联网用户创造了大规模的数据量。据预测,到2015年,全球有超过85%的500强企业将在大数据竞争中失去优势。这种发展趋势在中国同样不可避免,在未来的市场竞争中,能在第一时间从大量互联网数据中获取最有价值信息的企业才最具有优势。当前,大部分中国企业在数据基础系统架构和数据分析方面都面临着诸多挑战。根据产业信息网调查,目前国内大部分企业的系统架构在应对大量数据时均有扩展性差(with poor expansion capacity)、资源利用率低、应用部署复杂、运营成本高和高能耗等问题。国内企业为适应大数据时代而做出大规模调整是一种必然。中科院十多位院士向高层建议,我国应制订大数据国家战略。同时,国家发改委与中科院正在启动“基础研究大数据服务平台应用示范项目”,大数据国家战略或将提上议程。
这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界,还是政府,所有领域都将开始这种进程。有人把大数据称为“最科技的跨界”(most significant cross-field science and technology)。2011年是中国大数据市场的元年,部分IT厂商已经推出了相关产品,部分企业已经开始实施了一些大数据解决方案,国内一本名为《IT客》(ITer)的杂志每期卷首都有“大数据小姐的话”,还有“大数据专题”。2015年之后中国大数据市场将进入成熟阶段,据预计2016年交易量将接近100亿元。
比特币
比特币(Bitcoin,一译“比特金”)的创始人是日本京都大学的数学教授望月真一(Shinichi Mochizuki,当年化名中本聪Satoshi Nakamoto)。他于2009年提出了这种虚拟的数字货币(virtual digital currency)。与大多数货币不同的是,比特币不依赖于特定的中央发行机构,而是使用遍布整个对等(peer to peer,一般简化为P2P)网络节点(network node)的分布式数据库(distributed database—DDB)来记录货币的交易。比特币既可以被以计算机文件的形式保存在个人电脑中,也可以储存在第三方托管服务中,可以通过比特币地址发送给互联网上的任意一个人。不管身处何方,任何人都可以挖掘、购买、出售或收取比特币。作为一种便捷的支付手段(means/medium/instrument of payment),比特币没有繁琐的额度与手续限制。只要知道对方的比特币地址,即可进行支付。比特币的特点是分散化、匿名(anonymous),只能在数字世界使用,不属于任何国家和金融机构,并且不受地域限制,可以在世界上的任何地方兑换。
比特币也能套现(cash out),可以兑换成大多数国家的货币。可以用于购买一些虚拟的物品(virtual goods),比如网络游戏当中的衣服、帽子、装备等。只要有人接受,也可以用来购买现实生活中的物品(tangible goods)。一项调查显示,全球有上千商家表示接受比特币作为货币结算。目前,比特币在中国也出现井喷(blow out)的势头。淘宝网上销售这种比特币及相关产品的卖家多达上百余家。
比特币真正的价值来源于其规则的确定性、稀缺性、匿名性和不可封禁性。其好处包括不会被冻结(frozen)、无法跟踪(trace)、不用纳税、交易成本极低,也因此被部分不法分子作为洗钱的工具。
2009年诞生之初,比特币的身价极其低廉,仅为5美分左右,但之后随着影响力提升而疯狂上涨。2013年7月从200美元蹿升至440多美元,比特币交易数超过4.5万次。同年11月10日,比特币行情为 1∶6989,即1个比特币可以当做6,989元人民币使用。一些网站甚至接受比特币兑换美元、欧元等服务。毫无疑问,比特币已经成为真正的流通货币。
在金融危机爆发,美元不再是稳定世界经济的基石后,比特币悄然诞生。但这种“新货币”弹性太大,可能给经济注入更大的不稳定性(instability)。而其神秘的、像“次级抵押贷款”(secondary mortgage loan)一样复杂的产生方式,以及不受国家约束的“自生性”(emerge/come into being all by itself),都很难保证它不会消失。
比特币进入中国,起初只是年轻人的时髦玩意儿。不过人们对其并不感到陌生。近十年来有一百多万人在社交平台使用过Q币(Q coin)。2013年4月,四川芦山地震期间,公益组织“壹基金”(the One Foundation)收到百余枚比特币捐款,成为比特币在中国发展的一个标志性事件。有报道说,中国对这一货币新贵具有浓厚兴趣,每天约有四万名客户下载。对比特币的接受率迅速攀升。世界最大的比特币交易中心就在中国。报道还说,百度公司正在其巨大的客户网络中融入比特币支付,中国正迅速成为比特币市场的重要玩家(game player)。根据美国虚拟货币研究中心(US virtual currency research center)Genesis Block(网站名,中文名是“创世记块”),半数以上比特币交易价值是以人民币进行的。最近,比特币中国(Bitcoin China)已成为全球交易量最大的比特币交易平台,日最高交易量约11万比特币,最高日交易额已超过两亿人民币。
2013年,美国政府承认比特币的合法地位,使得比特币价格大涨,有专家认为,目前比特币更像纸黄金(paper gold),而不是一种严格意义上的货币,因此很难确定一个客观而合理的价值(objective and reasonable value),只能随市场波动,由于其匿名性,政府很难实行有效监管,因此风险较高(with high risks)。面对比特币近期暴涨暴跌,有投资者直呼看不懂。2013年11月19日,比特币兑换人民币最高成交价一度曾达8,000元人民币,较年初时上涨近80倍。但很快成交价又回落至4,383元,其最高价在一个交易日就可能达到45%。许多人对比特币感兴趣,将其作为一种新的投资渠道。《北京晚报》11月22日就刊有“中国大妈现身比特江湖的”的报道。许多人沉溺于这个虚拟世界的疯狂财富梦(crazy dream in the virtual world to strike fortunes)。可是有人说,投资比特币“玩的就是心跳(Play it for the thrill)!”更有人说:“这只是一个荒诞(absurd)的让人无法了解的游戏。”想要投资比特币的人一定要谨慎。