大数据概念在图书馆中应用研究文献定量分析
2015-02-02孙雨
关键词:大数据;图书馆;定量分析法
摘要:文章以2009年以来中国知网(CNKI)收录的主题为大数据和图书馆的论文为研究对象,运用文献计量学、系统分析法等方法,从文献量、作者、来源期刊分布、关键词、主题内容等方面,对大数据在图书馆学领域的研究现状进行评述,并探讨该主题在图书馆学领域的发展方向。
中图分类号:G250.7文献标识码:A文章编号:1003-1588(2014)12-0103-04
收稿日期:2014-10-20
作者简介:孙雨(1988-),金陵图书馆助理馆员。1数据来源及检索方法
为了研究我国目前图书馆学大数据的研究情况,笔者确定以中国知网(CNKI)《中国期刊全文数据库》为主要数据来源,配合《中国优秀硕士学位论文全文数据库》《中国博士学位论文全文数据库》《中国重要会议论文全文数据库》等数据库,对大数据的研究现状进行分析。
“大数据”概念在国内最早于2009年左右被提出[1],本文在检索时间上选取2009年1月至2014年6月期间发表的论文为研究数据。以“大数据”和“图书馆”为关键词进行检索,对结果进行文献总量分布情况、作者情况、关键词及主题进行统计分析,共计检索到203篇文献。
2文献量分析
为了准确反映该领域的研究水平、发展程度及课题活跃性,以半年为时间单位对文献量进行统计,结果如图1所示。可以看出,从2009年上半年的0篇到2014年上半年的85篇,总体文献量成激增状态,尤其是2012年开始,每个阶段的发文量都不断增加。
2009年至2012年上半年,与大数据有关的图书馆领域发文量相对较少,并且通过内容分析发现,这个阶段的文献只是与数据挖掘等数据处理技术相关的论文。虽然2009年“大数据”的概念被提出,但并没有立即引起图书馆界的重视。而从2012年开始,大数据的概念不断进入图书馆学研究者们的视野,发文量急剧增加,尤其是2013年下半年、2014年上半年。在此阶段,图书馆领域对于大数据的研究进入了一个增长点,可以预见,未来一段时间,大数据仍是我国图书情报学研究的重点与热点。
3作者分析
3.1核心作者分析
分析检索到的203篇文献,作者共有248人(其中有8篇文章无署名作者)。表1是作者发布的文献量情况,从中可以看出该领域发文篇数与人数的数量与比例。其中,发表1篇文献的作者数量所占比例达到95.56%,远远超过洛特卡定律[2]中提到的60%的比例,这表明现阶段我国研究该领域的人员比较分散,科学生产力还相对较低。
6主题分析
研究这203篇文献内容,可以发现,现阶段关于大数据在图书馆应用中的研究大体分为两个方面:图书情报学和计算机技术应用学。目前这两个领域,是研究大数据图书馆应用研究的核心领域。
“大数据”时代的到来最早是由全球知名咨询公司麦肯锡提出,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”[7]通过对203篇研究大数据在图书馆中应用的论文进行内容分析,可以发现研究方向主要分为以下几个方面。
6.1图书馆可用的大数据及来源
大数据伴随着互联网、云计算、物联网、社交网络等技术的兴起而呈指数级增长。在大数据时代,各种数据随时随处都在。而对于图书馆而言,“读者第一,服务至上”是永恒的主题,也是图书馆的立身之本,所以用户信息、服务信息等非结构化数据是主要收集对象。
另外,图书馆的数字化资源、网页和数据库等资源的读者访问数据以及社交媒体访问数据,甚至是RFID射频数据也构成了图书馆大数据的主要来源。正是这些大量的、多样的、高速发展的、具有真实性的数据,支撑起了图书馆大数据的主要组成部分。
6.2改变数据处理方式,提供创新服务
图书馆传统的数据处理方式是将纸质文献资源不断地进行数字化、网络化处理,并在原有资源的基础上,尽力满足用户的最大需求,使资源得到最大程度的利用。而大数据时代,图书馆的数据处理将发生极大的变化,如根据收集分析用户数据,对读者的借阅习惯、爱好、信息需求甚至社交方式等进行数据分析,提供针对性强、个性化的服务[8]。
同时,这也要求图书馆的部分传统业务,向数据挖掘、数据分析方向转变。随着需要处理的数据量增多,图书馆需要不断地提升数据分析处理的技术水平,从大量数据中挖掘出潜在的价值,才能不断地创新服务方式、提升服务水平。
6.3消除信息不平等
进入信息时代以来,信息不平等现象就一直存在。随着信息传播技术、传播渠道的不断发展,信息不平等现象不断地放大,大数据时代也不例外。由于不同地区、组织、机构以及个人在对数据收集分析使用中的信息差距,数据不平等是大数据时代呈现的最明显的信息不平等现象。
图书馆在应用大数据时,也应致力于消除信息不平等现象。图书馆可以通过维护发展公共图书馆制度、倡导社会责任与社会包容和提供公共智慧服务来消除数据不平等,维护大数据时代的信息公平[9]。
6.4保护用户隐私数据
大数据时代,图书馆为了能够有效地了解读者需求,需要通过处理平台对高速增长、结构复杂的数据进行采集、整理、归纳和分析。在这个过程中,被采集的用户数据包括个人隐私数据都会被全方位的监视与控制。如何保护海量用户隐私数据,也是众多学者研究的课题。
首先,图书馆必须自觉遵守相关法律法规,并制定相关规范,形成保护用户隐私的机制。其次,应提高用户隐私数据收集处理过程中的安全管理,并应致力于研究开发保护隐私的相关技术。最后,应加强培训员工保护用户隐私的意识,形成图书馆的自我约束和自我监督的氛围。只有这样,图书馆才能为读者提供大数据时代安全、高效、放心、满意的个性化服务[10]。endprint
6.5大数据与新媒体营销
大数据时代的到来为图书馆的新媒体营销注入了活力。图书馆新媒体营销的运作核心是基于对内容与营销过程中积累的数据的分析,图书馆通过分析调研,掌握用户需求,并基于用户需求实时调整内容和营销模式。而支持新媒体能够对用户需求做出快速响应的,则是背后对用户和内容实时监控所形成的大数据。通过大数据挖掘和分析技术,图书馆新媒体可以随时调整其内容和营销策略,提高服务的精准度,让内容生产和营销模式层出不穷[11]。
7结语
通过对大数据在图书馆中应用的研究文章进行各种信息的分析,可以看出,大数据时代图书馆将会迎来服务营销方面新的发展机遇,但同时大数据也在数据安全方面给图书馆带来了挑战。
首先,大数据给图书馆带来了新的机遇。大数据环境下,图书馆可以通过分析海量数据,向用户提供针对性、个性化、专业化的服务,还可以根据用户需求,调整和改变图书馆营销模式,配合新媒体技术,吸引更多用户。
其次,大数据时代图书馆需要面对挑战。大数据时代的到来,图书馆需要处理大量高速增长的非结构化的用户数据。保护用户隐私数据,则是图书馆必须面对的问题。同时,图书馆也应致力于消除数据收集过程中的信息不平等现象,维护大数据时代的信息公平。
可以预见,一段时间内,大数据仍然是图书馆学领域研究的热门课题。随着相关研究的逐渐深入、参与研究的学者不断增多,相信大数据时代将给图书馆的发展带来更多的活力。
参考文献:
[1]百度百科.大数据[EB/OL].http://baike.baidu.com/subview/6954399/13647476.htm?fr=aladdin.
[2]百度百科.洛特卡定律[EB/OL].http://baike.baidu.com/view/40602.htm?fr=aladdin.
[3]沈奎林,杜瑾.Web2.0在图书馆应用方面研究论文的定量分析[J].现代情报,2010(10):140-143,154.
[4]百度百科.布拉福德定律[EB/OL]. http://baike.baidu.com/link?url=mJ2y3-NRa2QxPkYEQq3jq
2yfT2Vk3jFFDiLGHPsqrJV JMf7iaYmQI-P-tef
SaoDy.
[5]苏新宁.图书馆、情报与文献学研究热点与趋势分析(2000-2004)——基于CSSCI的分析[J].情报学报,2006(3):373-383.
[6]百度百科.大数据时代[EB/OL].http://baike.baidu.com/view/9424571.htm.
[7]杨海燕.大数据时代的图书馆服务浅析[J].图书与情报,2012(4):120-122.
[8]韩炜.大数据时代公共图书馆消除数据不平等的路径选择[J].图书馆论坛,2014(3):14-21.
[9]维克托·迈尔·舍恩伯格,肯尼思·库克耶,盛杨燕,周涛译.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2012.
[10]王薇.看互联网思维如何改变传媒业[J].媒介,2014(5):30-34.
(编校:崔萌)endprint