大数据时代下的情报学思考
2018-03-29张迎
张迎
[摘要]本文首先回顾了情报学的一些定义,包括广义的和狭义的,再介绍情报学的产生,接着介绍情报学面临的一些困境,并对大数据时代下的情报学发展进行思考,分析大数据给情报学带来的影响。因此,情报学虽然发展起来困难重重,但是因为大数据的出现,抓住机遇充分利用信息技术,情报学研究与工作也会得到很好的发展。
[关键词]情报学 大数据
现如今,大数据是当今的热点词汇。无论是中国还是美国,大数据成为各个领域关注的焦点,无论是商业界还是学术界,都打算或者已经与“大数据产生关联。情报学是以数据、信息为主要研究对象的学科。情报学在传统领域面临一些困境,例如学科困境、教育困境、职业困境。大数据时代给情报学研究带来了机遇,为解决这些困境提供了条件,但是与此同时也给情报学带来了挑战。情报研究工作需要新的思路和研究方法来适应大数据时代的到来,并在大数据环境下得到更好的发展。
一、情报学的定义
“情报学”术语是由法国学者阿曼德,路易斯创立的,并把它定义为“计算机情报处理”,其含义是用计算机进行信息处理的手段和学科课程的总和,还包括在人类活动各个不同部门使用计算技术的广阔领域。
情报学的狭义定义指的是科学情报学。情报是一种普遍的社会现象,科学情报学就是揭示这种现象的特性及其社会作用的学科。科学情报学的情报现象发生在科学领域内,与人类在认识和改造自然之中所积累的科学知识密切相关。科学情报学利用许多学科的理论综合研究科学情报的产生、收集、加工传递和利用。
二、情报学面临的困境
情报学发展主要面临三大困境,即学科困境、教育困境和职业困境,Griffith作为ASIST年会的主席讲演时,提到了情报学相互联系的三个方面:学科、教育和职业。本节将具体分析这三大困境。
(一)学科困境
情报学的发展主要面临以下两大困境:
一方面是学科名称与性质摇摆不定。情报一直与信息紧密相连,所以曾经“情报”被更名为“信息”,“情报学”也被叫做是“信息学”,大学里的信息学系、信息管理系取代了原有的图书馆学情报学系。另一方面是学科定位和发展不稳定、不成熟。固守客观知识的问题域(图书馆学的问题域),是符合这个学科的实际情况的,但是似乎不符合社会的潮流和拔高学科地位的需求,也不能将情报学真正与图书馆学相区别开;而脱离图书馆学的传统,又离开了原来的问题域,变成了技术的应用,这样,情报学学科同样也不是独立存在的,定位也因此变得模糊。
(二)教育困境
在图情教育方面可以发现以下特点:一是所授予的学位越来越不集中,即提供的课程越来越多学科化或者交叉学科化。二是课程的变化:课程的范围扩大了,更多地加进社会、经济等方面的内容;去掉和图书馆相关的,如目录、图书馆学、编目等方面的内容,而更多地代之以技术类的课程。在这样一个变化过程中,情报学容易失去内核。图情的核心课程一时不同于一时,一校不同于一校。
(三)职业困境
情报学缺乏职业认同感。举例来讲,美国情报科学协会ASIS更名为美国情报科学与技术协会,增加了技术色彩,提升和强调了在这一学科中的技术成分,这一协会包括管理者、计算机科学家、工程师、律师等等,但是就是没有情报学家。英国与图书馆协会独立存在的情报科学家协会,在20世纪末讨论出两种融合方案,一是与英国计算机协会融合,二是和图书馆协会合并。大多数成员选择与图书馆协会合并,组建英国图书馆与情报科学协会。所以说,图书、情报、档案一体化组织已经成为全欧洲趋势。
三、大数据时代的情报学
大数据的特点可以用4V来概括,即Volume,Velocity,Variety,Value。
(1)VoIume意思是数量巨大。现在的大数据中的数据其数据级以PB(1TB=1024TB)或EB来(1EB=100万TB)或更高计算。人类生产的所有印刷材料的数据量是200PB,而历史上全人类说过的所有的话的数据量大约是5EB。
(2)Velocity意思是处理速度快。对于大数据的处理速度,有一个著名的‘1秒定律或称秒级定律,也就是说在秒级时间范围内给出分析的结果,如果超出这个时间,数据就失去了价值。
大数据带来的机遇主要分为以下四个方面:
(1)大数据为情报学研究提供了丰富的数据资源支持。情报学研究大多建立在大量数据的基础上,人们时刻在以各种方式生产不同的数据,比如图片、动画、音频、视频等等。
(2)大数据使情报学学科技术日益完善。大数据的数据收集、存储、处理、分析、挖掘技术是大数据时代的产物,例如云计算、物联网、文本挖掘、数据可视化等等。
大数据给情报学的发展带来的挑战有:
(1)大数据的数量巨大、价值密度低的特点,使得获取信息的难度加大。随着互联网技术的发展,现在的大数据中的数据其数据级以PB(1TB=1024TB)或EB来(1EB=100万TB)或更高计算,但是真正有价值的数据只会是在很小的范围内。这就导致在提取有用信息时要利用先进技术,例如数据挖掘、文本处理等来进行信息提取。
(2)大數据的数据巨大,数据类型多样的特点,使得数据的管理成为一大问题。在大数据时代,已经不能用原有的传统的数据管理方式来管理数据,需要利用计算机硬件和软件技术,对数据进行有效的收集、存储、处理和应用等有效的管理,并促进其广泛共享,使之价值最大化。这对于情报学来讲,不仅仅是技术挑战,更是一种管理思维模式的转变。
四、结语
综上所述,情报学的发展面临很大的困境,但是大数据时代的到来为情报学研究带来了前所未有的机遇。大数据方面的丰富技术手段和方法研究,给情报学的技术和方法提供了指导。现在需要做的是在理论上对情报学的理论基础进行进一步的研究,建立起真正的情报学理论体系来,增进学科技术发展,提供更好的方法,让情报学逐步摆脱面临的种种困境。