APP下载

在说“数据”吗

2015-06-13舒胜

航运交易公报 2015年20期
关键词:数据逻辑人类

舒胜

著者: 大数据战略重点实验室

出版者:中信出版集团

出版时间:2015年5月

定价:45.00元

“大数据”是一个时髦且内涵和外延均模糊的词,这个词在“马云们”的口中、在“码农”的口中、在官员的口中,以及在芸芸屌丝口中,应该是词同而意殊的。但是,即便如此,从其频繁地出现在人们生活中这一点来看,可以说明:对于数据的关心和依赖,已经成为现今社会各个阶层、社会经济各个领域的共性。

我们面前的这本关于大数据的编辑著作,为数据做了一个非常完美的概念游戏,将“大数据”概念的外延狠狠地“周延”了一把。使得“大数据”成为了概念,成为一种有固定性状的“成果”,这就脱离了大数据“流动”、“变化”的本性。令人不解的是诸如包括马云在内的阿里巴巴高管等,都对该书不遗余力地褒奖。所以,笔者不得不收藏起自己的“偏见”,仔细研究书本的内容,希望发现自己是错的。但无论多么努力地去放弃自己的立场,都难以给眼下这本书打一个及格分,都不能克制抨击该书的欲望。

该书不像一本讨论互联网或者大数据的书籍,更像是一本在数据领域的大而无当的规划大纲,如人们熟悉的各种文件那样,通篇充满了生造的概念及为其罗列各种特性和意义,而对实现的路径并没有过多的涉及。

书中写道:“块数据是一个新名词。到目前为止,人类生活、生产产出的大数据,无论是搜索引擎、电商、社交平台形成的企业大数据,还是天气预报形成的科学大数据,还是各个政府部门形成的行业大数据,都可以定义成‘条数据。而块数据则是以一个物理空间或行政区域形成的涉及人事物的各类数据的总和”。短短百来字,充满了似是而非的概念和论断:“块数据”、“企业大数据”、“科学大数据”、“行业大数据”和“条数据”。

首先,搜索引擎、电商、社交平台怎么就形成了“企业大数据”?难道不应该是搜索、电子商务、社交参与者的行为产生的痕迹吗?如果以数据占有者分类,那么无论数据怎么产生,中国社会只有三类数据,即政府占有的数据、企业占有的数据、个人占有的数据。问题是这样分类对解决现实议题有意义吗?“科学大数据”、“行业大数据”似乎都必须回答同样的询问。

其次,人类生活、生产产生的数据难道不存在于时间空间系统里吗?无论怎样划分时间和空间,实际的本质并不会改变。所谓的“条数据”、“块数据”就是一个数据,不是两个数据,只是研究者从不同的角度看待和利用它们而已。那些对于数据的分门别类已经毫无意义,越详细越“反动”,是对新兴的数据革命的“反动”。再次,本书对于观点的论证更多地或者说全部来自描述,作为依赖于算法和逻辑的数据产业著作,脱离了逻辑的分析和路径的设计,似乎只能给人隔靴捎痒、不知所云的感觉,没有人从中获得实际问题的解决方案。

作者团队可能需要明确几点,才能够在数据领域里做一些有意义的事。第一,数据的发生是人类活动的自然现象,当其发生时就拥有时空上的整体性;条条块块是数据分析过程中解决人类能力局限的方法,随着工具的升级,这个条条块块的内容和范围不停地发生变化。第二,在当前技术和逻辑能力条件下,无法记录和分析人类活动的,就不能成为数据,数据是被记录的生活、生产,并最终会被分析;同时人类的活动必定有不可被记录部分,那种包罗万象的大数据是不存在的。第三,“大数据”的应用并不包括所有现存数据,所谓“大数据”在应用层面都是局部的。大而全的大数据,有;但是大而全的大数据应用,没有。第四,“大数据”的应用是有风险的,由于这是一个全新的领域,风险的具体界线并不清晰,大数据应用过程中应该把应用的目的和范围人为降低和缩小。因为,数据是个人产生,而储存、应用、分析是与人对抗的组织(政府、企业、商业组织)进行的,其中的冲突和道德风险是与生俱来的。第五,“大数据”的应用是个技术问题,撇开技术谈数据都是空谈;“大数据”的应用同时是个逻辑问题,离开逻辑抽象,任何数据都不可能反映本质;大数据的应用还带有目的性,没有目的推动的数据应用,最终是找不到出路的,也是没有意义的。

这本书告诉人们的其实不是关于数据的故事,而是关于某类数据使用者的单方面的非数据层面的设想。endprint

猜你喜欢

数据逻辑人类
刑事印证证明准确达成的逻辑反思
逻辑
创新的逻辑
人类第一杀手
1100亿个人类的清明
浅谈计量自动化系统实现预购电管理应用