简论大数据时代编辑的信息处理能力
2016-05-14胥橙庭张蓓张彤
胥橙庭 张蓓 张彤
[摘 要] 根据大数据特征,从编辑应熟悉并应用种类丰富的信息载体、筛选和甄别高度复杂的不确定信息、建立信息网资源库三方面分析大数据时代编辑的信息处理能力。
[关键词] 大数据 编辑 信息处理能力 信息资源库
[中图分类号] G232 [文献标识码] A [文章编号] 1009-5853 (2016) 06-0040-02
[Abstract] The characteristics of the big data are analyzed. The information processing abilities of the editor in big data age are discussed, i.e., familiar with various information carriers and skilled in the use of them, screening highly complex uncertain information, and building the resource library of information network.
[Key words] Big data Editor Information processing ability Information databases
随着大数据时代的到来,科技期刊作为传统的科技信息的载体与传播途径,无疑已经并且还会持续地受到强烈的冲击,从而引起整个行业的彻底变革[1]。作为科技期刊编辑,如何改变旧有的工作模式,迅速找到适合大数据时代的工作方法就成了最大的挑战。面对复杂多变的大数据,如何采用全新的理念及技术,迅速有效地处理信息,是科技期刊编辑面临的最急迫的任务[2]。
1 大数据的信息特征
目前,对大数据还没有统一的标准定义,业界存在几种不同的定义[3]。一般情况下,大数据是指无法在一定时间内用传统IT技术和软硬件工具进行感知、获取、管理、处理和应用的海量、复杂的数据集合。大数据的主要信息特征有三点[4]。
1.1 信息的复杂性
信息的复杂性体现在两方面:一是信息载体多种多样,从互联网遍布物联网、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器;二是数据模型变化多端,从传统的文本信息转变为图形、图像、音频、视频等各种多媒体信息。信息的复杂多样性给传统的信息处理方式带来挑战。
1.2 信息的不确定性
信息的不确定性源于两方面因素:一是由信息固有的复杂性带来的原始数据的不准确性;二是由于传统数据处理方式在数据采集处理粒度、应用需求与数据集成和展示等方面的局限所导致的信息不同程度的不确定性。信息的不确定性要求编辑创新确认信息的方式。
1.3 信息的涌现性
大数据时代,每时每分每秒都有大量的信息产生,信息呈现前所未有的涌现性,使得数据信息的度量、研判与预测难以驾驭。如何在海量信息中保证目的性、时效性,是编辑面临的最大挑战。
2 大数据背景下科技期刊编辑应具备的信息处理能力
编辑的信息处理能力是指其对信息的敏感性、辨识性和把握信息的能力,以及正确而又精准地分析、选择、利用信息的能力。它是编辑在长期的编辑活动中,培养发展起来的一种捕捉、筛选、转换和利用信息并改变固有信息环境的能力。在大数据时代,编辑应具备以下信息处理能力。
2.1 熟悉并应用种类丰富的信息载体的能力
大数据时代信息载体的复杂性要求科技期刊编辑要熟悉并能熟练使用各种新型科技信息来源,如微博、微信、脸书等社交媒体。很多原来在科技会议、个人主页上率先发布的科学动态,可能演变为微博、微信、脸书中的一两句话,或者是网络公开课中的某一段落。科技期刊编辑不仅应当掌握这些碎片化信息的载体来源,还应当熟悉一些大型的科研工作者的个人社交平台,如researchgate、crossref等国际主流科研交流社区,要能迅速在科研工作者的数字圈中找到自己的位置,并凭借自身在专业上的敏感度,迅速获取原始信息。
不仅是个人媒体的发展带来变革,一些传统的大型数据库也不断推陈出新,为科技信息检索的定向性、个性化提供新鲜的技术。计算机科学的发展从一开始就与科技信息的传播息息相关。作为科技期刊的编辑,归根结底,就是要具备不断探索、不断学习的能力,这样才能在日新月异的技术变革中立于不败之地。
2.2 筛选和甄别高度复杂的不确定信息的能力
在大数据时代,信息来源纷繁复杂,编辑不再只是从官方网站、权威数据库以及纸质期刊上获得经过鉴别、可信的数据,还要从各种载体上获得未经证实的不确定信息。这就要求编辑依靠过硬的专业背景,提取隐藏的、潜在的有效信息,筛选、甄别并进行整合,经过分析、处理,提炼出需要的、有价值的信息。
筛选和甄别的过程,不仅需要编辑具备专业理论知识,还需要编辑掌握各种信息处理工具。信息的鉴别可以通过一些信息技术手段,如图形图像处理、视频提取、文本语义甄别等技术进行交叉验证,但这些都是客观技术,最终还是要靠编辑自身的专业素养、能力、信息敏感性等各方面的综合素质,才能使编辑在数据海洋中迅速准确地找到需要的信息。
2.3 建立信息网资源库的能力
大数据的最大特征是涌现性。海量的数据似乎存在自身的智慧,通过对来自大量自发个体的语义进行互相融合和连接而形成语义,整个过程随着数据的变化而持续演进[5]。可见大数据中不同类型、不同载体、不同结构的数据之间在进行着联络和发展,形成元数据网络。科技期刊编辑获得不同的信息之后,也应当借助元数据信息固有的特性,通过先进技术及专业知识的加工处理,形成本期刊、本专业特有的信息网络模型。在此基础上,为以后各种海量信息的处理提供标准、高效的流程。图1说明了大数据环境下编辑处理海量信息形成信息网络的过程。
所建立的信息网络可以根据自身的要求,网罗各种前沿科技动态、学者个人专业动向及国家政策调整、出版行业最新规划等各种信息,互相交叉,相互服务,为期刊的整体发展指明方向。
3 结 语
大数据环境下,编辑要具备信息处理能力,包括熟悉并应用种类丰富的信息载体的能力,筛选和甄别高度复杂的不确定信息的能力,建立信息网资源库的能力。在此基础上,编辑才能自如地驾驭信息。海量信息的大数据时代对编辑获取信息的能力提出了挑战,同时也给编辑获取信息提供了更多的机会和便利。只要善加利用,大数据会给编辑注入新的能量。
注 释
[1]柴英,马婧.大数据时代学术期刊功能的变革[J]. 编辑之友,2014(6):28-31
[2]胥橙庭,孙松茜,张彤,等.大数据时代编辑的信息获取能力初探[J].科技与出版,2015(3):43-44
[3]夏雪.基于大数据的科技情报研究刍议[J].江苏航空,2014(2):21-22
[4]王元卓,靳小龙,程学旗.网络大数据:现状与展望[J].计算机学报,2013,36(6):1125-1138
[5] 周傲英,金澈清,王国仁,等.不确定性数据管理技术研究综述[J].计算机学报,2009,32(1 ):1-16
(收稿日期:2016-01-27)