大数据向块数据发展
2015-09-10郑渝川
郑渝川
大数据时代已经到来。这句话已经被重复过无数次。先别忙着进行乐观地展望,我们现在所谈到的大数据,其实幅度和深度都相当有限,大量信息被封锁在信息孤岛上。各级地方政府和各部委,自上世纪90年代起上马了各自的电子政务工程,发展到现在,已实现基本的数据积累,各项业务办理和机关运转也切换到电子平台上。但各项电子政务工程并未实现真正意义上的信息共享,跨部门调阅数据很多情况下需要部门或地方领导出面,就更谈不上这些数据无障碍开放给社会和企业了。
电子商务、金融、电信等行业的龙头企业,深耕大数据也很有成效,沉淀了大量的有效数据,以及对于该企业价值不大,却有着较高社会应用价值的数据。这些信息和数据被认为是企业的核心资产,企业在加大信息采集、数据挖掘分析的成本投入同时,拒绝与其他企业、公共组织共享。
孤岛化的大数据,带来的最突出问题是数据采集分析的重复化,造成大量社会成本无谓消耗,也使得数据挖掘分析的水平长期难以提高。对于创业者和初创企业来说,信息和数据采集的成本之高,常常超出他们的负担能力,因而信息孤岛造成的结果是抑制创新创业,现有的创业者和企业也将尽可能避免在信息和数据采集上投入过多成本,将更主要的精力放在营销噱头上。
可以说,中国大数据发展已经走到了一个重要关口,如果继续延续现有的信息孤岛局面,政府、企业、社会组织、科研机构各自为政,数据挖掘分析的水平还是会继续提升,经济和社会应用价值也会体现,但必然因此滞后于美国等国家,且差距也将越来越大。与之相应的另一种选择就是,积极推进信息开放、数据共享,实现数据资源的融合集聚,跟上大数据的发展潮流。
《块数据》这本书针对条块分割“条数据”,提炼出一个对应的概念“块数据”,即以开放、共享、连接为特征的数据融合集聚机制,不但汇集了现有分隔化的大数据实体的数据资源,而且还借助智能设备、社交网络 扩张数据来源。“块数据”围绕人及其活动而产生,不但要收集人的静态数据,还要记录人的行为活动数据,以及思想、意识和意愿数据。但要真正走出目前的“条数据”,走向“块数据”,仍面临着诸多现实障碍。