中国出版业适合应用“大数据”吗?
2014-07-28陶丹
陶丹
关于“大数据”的定义、内涵、是什么众说纷纭、莫衷一是。但是,关于“大数据”的特点,却得到专业人士的共识。在维基百科、百度百科以及各种语言发表的关于“大数据”文章中,对于”大数据”的4个特点达成了一致。即:Volume(数据量大)、Velocity(输入和处理速度快)、Variety(数据多样性)、Value(价值密度低)。维克托在其《大数据时代》中表述,大数据并不是字面上所表述的“大”,大数据的内涵是:数据量巨大的、全部的、混杂的数据。
根据维克托的表达,“大数据”是全部的数据。数据量的全面是“大数据”的主要特点之一。也可以讲,只有提供全部的数据,才有可能应用“大数据”的解决方案。对于中国出版业来讲,能够提供全部的数据恰好是其重要特色。
1.与世界各国相比,中国出版业有历史悠久的全部数据,完全够格搭乘大数据的快车。
中国的出版业历史渊源悠久,拥有大量的实物记录,从公元前770~前221年的春秋战国时期,就有利用竹木简牍和缣帛记录的信息。
公元前206~公元220年纸的发明和推广使用,就有了利用纸记录的信息。大约在公元7世纪的唐代,中国发明了雕版印刷术,就有了利用雕版记录的信息。这也是中国出版业开始的标志。
10世纪下半叶到19世纪中叶,这一时期,发明了活字印刷术,印刷技术也不断得到改进和提高,出现了套版印刷术。1840年鸦片战争以后,西方的现代印刷术传入,图书、报纸和杂志也有了迅猛的发展,中国拥有了活字印刷术记录的信息。
1919年五四运动以后,特别是1921年中国共产党成立后,在中国萌发了新型的人民出版事业。1949年10月新中国成立后,中国的出版事业开始进入崭新的历史时期,发展到目前网络时代,我国已经拥有了数字化记录的信息。
综上所述,中国的出版业拥有从竹木简牍和缣帛记录的信息——雕版记录的信息——活字印刷术记录的信息——数字印刷记录的信息这样完整的、全面的数据,这些是中国出版业使用“大数据”的完美资本。
2.中国出版业在网络时代急需变革,“大数据”的提出与其一拍即合。
出版业面临众多媒体的挑战,特别是新媒体,分流着出版物的受众群。受众希望快捷、有效地获得知识和信息,而不必换成其他媒介。大数据的应用将把这个愿望变为现实,或者说哪种媒介应用了大数据就将在媒介的竞争中取得先机。在各行各业都在探索引用大数据的今天,出版界如果仍固步自封,等来的将是被其他媒介的收购或兼并。
3.中国出版业要实现跨越式发展,必须注重“大数据”的应用。
大数据是21世纪信息高速公路上的高速列车。只要回想一下上个世纪80年代的激光照排的应用,有效解决了图书出版周期长、出书慢的问题,从而推动了上个世纪出版业的持续发展的历史,我们就能够理解在媒体融合时代,如果人们仍然按照集约化调整、多元化经营、数字化生产的思路前行,已经很难取得跨越式发展的空间。所以只有从现在开始准备应用大数据的硬件、软件条件,不失为引入先进生产力时机。
大数据不光是大,最为主要特色是全面的数据。只有拥有全面的数据才有可能和大数据结合得上。此外,对于有着悠久历史记录的中国出版业而言,使用大数据具有天生的优势。还有,大数据的出现完全契合了目前中国出版业变革的需要。所以,“大数据”的应用是适合中国出版业的。
(作者单位系河北大学)