APP下载

大数据在图书采访工作中的应用研究

2018-10-23胡丽琴

价值工程 2018年33期
关键词:采访大数据图书馆

胡丽琴

摘要:本文对大数据在图书采访工作中的应用进行了研究,发现虽然大数据应用已是当前各行业的热门发展方向,但是在图书采访工作中的应用情况整体比较落后。有一些实力强的图书馆已有大数据应用于采访工作的实践,采访人员有更多决策参考依据,提高了采访质量。但大部分图书馆对大数据的应用还处于比较简单的阶段。本文认为采访人员应积极主动推动大数据应用,从而更好地完成采访工作。

Abstract: This paper studies on application of big data in the books acquisition work, and found that although the big data is the current hot trend in many industries, but it is relatively backward. In some libraries people make good use of big data in books acquisition, but most libraries in the application of big data is still in relatively simple stage. This paper argues that acquisitioning staff should promote the application of big data to do better books acquisitioning work.

关键词:图书馆;大数据;采访

Key words: library;big data;books acquisition

中图分类号:G25 文献标识码:A 文章编号:1006-4311(2018)33-0268-02

0 引言

大数据(Big Data)是指“那些大小已经超出了传统意义上的尺度,一般的软件工具难以捕捉、存储、管理和分析的数据[1]”。上世纪80年代美国已经有人提出大数据的概念,而计算机和互联网技术的发展,使各类记录的数据量激增,近几年“大数据”已成为人们关注的热点。2013年11月,我国十多位院士向高层建议我国应制定大数据国家战略,并在发展目标、发展原则、关键技术等方面做好顶层设计,提出了包括构建大数据研究平台、构建大数据良性生态环境、构建大数据产业链等,并提出“在安全、医疗、卫生、教育等公共服务领域开展大数据应用示范,提高应急处置能力和安全防范能力,提升服务能力和运作效率[2]”。2015年8月,《国务院关于印发促进大数据发展行动纲要的通知》(国发〔2015〕50号)发布,明确了发展大数据的指导思想、发展目标和发展任务,为未来我国大数据发展与应用指明了方向。同年10月,《中共中央关于制定国民经济和社会发展第十三个五年规划的建议》发布,明确提出了“实施国家大数据战略,推进数据资源开放共享”。在国家政策层面的导向和各行业发展的需求下,大数据在我国的发展进入了快速发展的时期。2014年12月,我国第一家大数据交易平台北京中关村数海大数据大数据交易平台正式发布上线,2015年4月14日,我国首个大数据交易所在贵阳挂牌。其后,武汉、河北、上海、浙江等地相继创建了大数据交易平台或交易中心。以贵阳大数据交易所为例,截至2018年8月,交易金额已经累计突破3亿元,会员数量2000多家,可交易的数据总量超过150PB[3]。可以说,我们已经身处大数据的环境之中。

1 大数据应用于图书馆采访工作的背景

图书馆的建设发展与国家和社会发展的节奏息息相关。大数据环境下,图书馆的各项工作不仅遭遇到了压力,同时也迎来了发展的机遇。图书馆作为文献信息资源中心,为读者提供各类纸质图书、期刊杂志报纸以及电子资源的阅读和利用服务。利用互联网及计算机技术,读者能够方便快捷的从图书馆借阅或者获取自己需要的资源。但在大数据环境下,读者在其他领域体验到了企业基于用户大数据分析的优质服务,对比图书馆相对落后的服务模式难免会产生体验舒适度的落差,读者可能会因此放弃图书馆而转到其他途径获得所需要的服务。另一方面,图书馆面对压力如果能顺应潮流,积极利用大数据为读者提供更优质的服务,则会开拓图书馆发展的新领域。本文从图书馆采访工作的角度,对我国图书馆目前在大数据领域开展的服务进行了研究,试图总结和提出图书馆利用大数据的实践方式和途径,以期在今后的工作中有更大的进步和发展。

2 基于大数据的图书采訪辅助系统

基于大数据的图书采访辅助系统主要是指通过收集分析馆藏、流通和检索等环节的数据,实现图书采访的辅助决策功能。以复旦大学图书馆开发并使用的图书采访辅助决策支持系统为例,通过“从网络底层、图书馆集成管理系统、数据库厂商等多途径获取图书馆的现有馆藏数据、流通数据和OPAC检索日志数据,构建基于图书馆流通日志的图书借阅数据仓库维度模型和基于OPAC日志的点击流数据仓库,实现对不同类型的数据进行多维度统计分析[4]”。通过图书采访辅助决策支持系统,复旦大学图书馆的采访人员能够对已有馆藏进行各类分析从而结合本馆的资源建设策略进行调整和优化,还能通过流通和检索数据的分析来获取馆藏的利用情况以及读者想要阅读的图书信息。南昌大学图书馆的中文图书采访辅助系统通过在汇文系统上加挂数据采集系统来实现,系统提供的数据包括“作者简历与背景、作者在该领域发表的论文数量和论文被引用情况(基于CNKI平台)以及作者以前的作品被读者借阅的频次以及数量[5]”。采访人员在对新书书目进行筛选时,通过关联数据采集系统的作者信息掌握新书作者在本专业领域的影响力及在本馆的受欢迎程度,由此做出是否购买的决定。经统计,南昌大学图书馆通过辅助系统采选的的图书,“零借阅率下降了30%[5]”。清华大学图书馆2013年开始建立了以学者为中心的知识关联网络,通过海量文献数据的分析自动甄别出清华大学目标学者,获取这些学者的相关学术信息,因而在参访工作中能利用这些信息进行决策[6]。

其他基于大数据的系统如四川省图书馆陈雪樵等人提出的“基于大数据的图书馆应用系统”平台[7]、兰州商学院马晓亭设计的图书馆大数据资源整合平台[8]等。但这些系统基本停留在设计阶段,尚未得到实际应用。

通过大数据的挖掘和分析,图书采访辅助系统能够帮助采访人员更准确地掌握本馆的资源建设和利用情况,采访工作更精准更符合馆藏原则和读者需求。

3 基于图书馆信息管理系统的数据应用

虽然基于大数据的图书采访辅助系统对高质量的采访工作来说有很高价值,但系统的建设依赖于图书馆的综合实力,只有少数大馆才有人力财力来实现。对大多数图书馆来说,也可以退而求其次,在采访工作中直接利用图书馆信息管理系统提供的数据分析功能,也能有效地提高采访质量。如江苏汇文软件公司的Libsys图书馆管理系统,其最新版本LibsysV5.5增加“集成汇文云服务采访协同应用,基于汇文云服务的大数据分析,为采访人员提供必要的决策帮助[9]”。

3.1 信息管理系统统计功能模块的应用 图书馆信息管理软件都自带各种功能模块,其中的统计模块一般能实现对系统数据的各种挖掘和统计分析功能,与采访相关的功能如流通综合统计、利用率分析、馆藏文献统计、读者成分分析等。如能充分利用统计模块,对馆藏的实际利用情况进行精确的评估,就可作为采访工作的参考依据。如辽宁科技大学图书馆在中文图书采访工作中利用汇文系统中的统计功能,对馆藏的类目结构、学科机构进行了数据分析对比,发现了重点学科、新增专业和停办专业相关馆藏建设中存在的一些问题,并据此调整优化了原有的采访原则[10]。

3.2 信息管理系统检索功能模块的应用 检索功能记录了读者在使用图书馆信息管理软件的过程中的痕迹,采访人员可以通过检索功能提供的数据了解读者关注度高的图书信息,从而及时采购图书。如汇文系统的书目检索系统有热门检索词、热门借阅、热门图书及被读者收藏最多的图书等排行。清华大学图书馆的水木搜索平台提供清华人物和热门标签两种热门搜索,还根据读者搜索次数绘制了热点研究学科的年度变化曲线。采访人员可通过统计的热门检索词或读者收藏的数据及时购买读者关注的图书,也可以参考热门借阅和热门图书根据实际的流通频率增加热门图书的复本。

随着大数据应用的逐步升温,各种图书馆信息管理系统都在逐步增强大数据的挖掘和分析功能,因此图书馆的采访人员也可直接利用这些功能作为采访工作的辅助手段,提高图书采访质量。

4 大数据在图书采访中的应用现状分析

结合上述研究,大数据在图书采访中的应用现状主要包括下面两个方面。

4.1 大部分图书馆采访人员的技术实力不足以实现大数据的应用 数据获取途径最佳是能在图书馆已有信息管理系统基础上开发出适合本馆的采访工作平台,能收集汇总来自出版社、书商、读者等各方面产生的大量数据,包括书目信息、作者信息、读者借阅等等。数据获取后的分析也是大数据系统必备的功能,目前的数据分析能力现状与数据获取能力都取决于图书馆所用信息管理系统及采访工作平台的功能。但是目前只有少数图书馆能自行开发并使用基于大数据的图书采访辅助系统,其他大部分图书馆还依赖于软件公司的信息管理软件所提供的数据。虽然这些数据也在一定程度上对采访工作有帮助,但软件公司提供的都是同质性的数据及分析,缺乏个性化的、满足本馆采访需求的辅助决策功能。数据分析人员是大数据得以应用的人力基础,但是图书馆采访人员中以图书情报等相关专业人员为主,要完成海量数据的分析工作是非常困难的。虽然采访人员有利用大数据的迫切愿望,但实际的数据处理能力并不足以完成大数据的分析工作。

4.2 大数据在各图书馆采访工作中的应用冷热不均 虽然大数据是近几年各领域的热门,但在图书馆工作中却表现出冷热不均的情况。清华大学图书馆、复旦大学图书馆等大馆表现出积极的态度,自行开发利用大数据技术平台挖掘数据价值,尤其在采访工作中提供辅助决策依据。但其他中小馆则局限于技术和财力,虽有心追随大数据的潮流,却只能尽量在现有的信息管理软件基础上获得有限的大数据和数据分析。除图书馆实力的影响外,管理者的发展思路也影响了大数据的应用。一些中小馆的管理者还处于“守成”的思想阶段,即使认同大数据的发展趋势,也没有将大数据与图书馆的发展联系起来。同时,管理思想的局限性也影响了采访人员的工作主动性。

5 总结

本文对大数据在图书采访工作中的应用进行了研究,发现虽然大数据应用是当前各行业的热门发展方向,但是在图书采访工作中的应用却比较落后。大部分研究处于理论研究阶段,只有少数图书馆已经有大数据应用的实践经验,这些实践经验证明大数据应用于图书采访工作能提高采访质量,使得采访人员有更多决策参考依据。因此,采访人员应该积极推动大数据在采访工作中得到利用,争取馆领导的思想和技术支持,从而尽快利用大数据更好地完成采访工作。

参考文献:

[1]涂子沛.大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活[M].桂林:广西师范大学出版社,2013.

[2]中国互联网络信息中心互联网政策研究全球动态[EB/OL].[2018-06-23].http://www.cnnic.cn/gcjsyj/qyjsyj/hlwzcyj/qqdt/201312/t20131205_43369.htm.

[3]貴阳大数据交易所发展成就[EB/OL].[2018-08-23].http://www.gbdex.com/website/view/aboutGbdex.jsp.

[4]张计龙.大数据驱动图书馆业务应用与服务创新[J].上海高校图书情报工作研究,2013(03):1-6.

[5]袁芳.大数据环境下图书馆文献资源建设模式的变革[J].图书情报工作,2015(18):91-94.

[6]中国新闻出版网.大数据环境下清华大学图书馆的实践[EB/OL].[2018-06-23].http://www.chinaxwcb.com/2013-08/ 29/content_276028.htm.

[7]陈雪樵,等.基于“大数据”的图书馆应用系统平台设计思路[J].四川图书馆学报,2016(02):15-18.

[8]马晓亭.大数据时代图书馆数据整合系统构建研究[J].图书馆建设,2014(06):83-87.

[9]江苏汇文软件有限公司Libsys5.5正式推出[EB/OL].[2018-06-23].http://www.libsys.com.cn/product_libsys55.php.

[10]吴玉,张作来,苗永菊.大数据时代高校图书馆面向学科建设的中文图书采访机制[J].中国冶金教育,2015(06):81-85.

猜你喜欢

采访大数据图书馆
图书馆
浅谈记者在体育新闻人物采访中如何打破“中国式思维套路”
美媒估计《采访》亏了3000万