大数据时代图书馆文献资源建设模式的变化
2019-12-13何聪
何聪
摘 要:近年来,国内外的图书馆都在转变观念,重视图书馆中各类数据的收集、存储和管理,在用户数据管理软件开发、用户利用文献资源的数据分析与共享、文献资源选择的用户主导决策等方面进行了有益的尝试。本文分析了大数据时代下图书馆文献资源的构成体系,并讨论了再造文献资源建设模式及其方法,提出了相应的措施。
关键词:大数据技术;图书馆大数据;文献资源建设;图书馆变革;模式创新
1 图书馆大数据的构成体系
随着互联网的发展,网络化传播、数字化出版、移动化阅读成为人们的首选,尤其是随着社会化媒体的发展,博客、微博、微信、朋友圈的发展,作者、读者的身份逐渐模糊,个人既是信息内容的消费者,同时又是内容的生产者和传播者。海量用户参与到数字信息生产、传播、出版的各个环节,形成了大量的出版、传播、阅读与使用数据。从数据生成角度,可以分为专家生成的专业数据、用户生成内容和信息设备采集生成内容。
依据用户生产、传播、浏览、阅读、收藏、购买、利用等数据进行存储、管理和分析,建立读者数据库,管理读者信息并分析其关注的问题,发现其兴趣、爱好、阅读和购买习惯,可为图书馆进行有针对性、即时性的购买提供精准化的推荐或推送信息,提高图书馆经费的使用效率和效果,改进图书馆资源购买的方式,提高资源规划的科学性和预见性。
在大数据环境下,图书馆必须开展全方位、全过程、跨部门、跨机构、多途径地采集、存储、加工和整合用户在本图书馆网络系统、其他网络环境、社交网络、移动阅读、监控设备和传感器等信息来源的数据,图书馆必须开展与出版商、数据库供应商和信息资源平台之间的数据共享与合作,才能全面、准确地掌握读者的阅读行为、阅读兴趣与阅读需求、阅读需求以及阅读方式变化趋势等数据资产,为改进图书馆管理与服务效率,变革文献资源评价、选择的标准与方法,提高文献资源建设的科学性、预见性、系统性等工作提供决策支持。
2 大数据有助于再造文献资源建设模式
2.1 大数据为资源采购提供决策支持
频繁变化的应用背后,不变的是永恒的数据。大数据的研究机构Gartner认为:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。图书馆大数据的来源也呈多样性的特征,它包括图书馆业务数据、文献数据和用户数据3种基本类型。用户使用数据是指用户在使用图书馆信息资源或信息设施的过程中可以被计算机所记录的用户信息行为数据,既包括网络环境中的信息行为数据,也包括物理空间中的信息行为数据。
图书馆系统通过大数据技术的运用,掌握读者使用资源的交互数据,如图书浏览、数据库访问、检索、下载记录、评论、推荐等信息,可以更加有效地评估读者对各种资源的使用情况,尤其是通过挖掘用户检索日志,对那些被多次检索而图书馆又缺藏的资源的购买和补充提供非常有力的依据,能够更全面、更精准、更及时地掌握单个图书馆或者某个系统、某个地域全部图书馆的用户对信息资源获取与利用的情况,为图书馆文献资源的采访决策、优化配置和数据库的删选调整提供科学的依据,也为图书馆再造文献采访模式提供有力的保障。
2.2 大数据推动“读者决策采购”模式的发展
近年来,国内外各类图书馆普遍面临文献采购经费投入减少的问题,无论是外文纸本期刊还是外文数据库的购买都出现不同程度的下降,这对捆绑销售、集团购买和整库或全库购买等方式都会带来不利影响。由于经费困难等因素,国外有部分图书馆已经停止以大宗交易(bigdeal)(整库购买、捆绑销售)方式购买期刊资源,代之以按篇付费(pay-per-view,PPV)等模式。按篇付费方式订购期刊论文,或按需购买单本电子图书和按需出版等方式的兴起,实际上是读者决策采购(patrondrivenacquisition,PDA)在图书馆资源订购中的体现。
2.3 大数据创新图书馆资源的动态管理机制
文献资源的有效组织和科学管理是图书馆文献资源建设的重要组成部分。有些图书馆往往重视资源的购买而忽视资源的有效组织和整合。互联网时代的知识生产呈幂级数增长,知识体系的更新更加频繁,人们在图书馆检索中不只需要获取某一知识点,更需要获得知识体系。知识体系的动态构建和检索结果的有效呈现需要大数据的数据处理技术给予支撑。谷歌知识图谱、搜狗知立方、百度知识图谱等搜索引擎的推出,为用户的搜索关键词返回多种媒体形式、多种知识点组成的知识关联结果,这大大扩展了用户搜索的知识体系,值得图书馆界学习和借鉴。
3 创新图书馆文献资源建设的措施
3.1 树立大数据思维
维克托·迈尔-舍恩伯格在《大数据时代》一书中讨论了关于大数据的3个思维变化:1)不是随机样本,而是全数据;2)不是精准性的,而是具有混杂性,尤其是大数据的简单算法比小数据的复杂算法有效;3)不是因果关系,而是相关关系。就图书馆而言,大数据思维是一种重视用户数据,重视用户使用行为,平等对待用户需求的理念,按照用户的需求抉择图书馆资源建设和服务的理念。同时,要求图书馆重视对图书馆和科研机构等相关数据的存储、管理、分析和利用,彻底改变过去在图书館管理、资源建设和服务工作中凭表面印象就决定的思维方式和决策方法。
3.2 培养大数据馆员
大数据将重建图书馆的知识管理体系。面对大量异质、异构的数据,图书馆需要解决大数据的可表示性、可处理性、可融合性及可靠性等关键问题。这就需要一批掌握大数据分析工具来对数据进行有效挖掘、分析预测的数据馆员,需要一批从关注资源技术、图书馆技术转变为关注知识技术和用户技术,从提供劳动力密集服务转变为提供方法、工具与计算密集型服务的分析师,通过数据挖掘软件和Citespace、LiterMiner等可视化工具来绘制科学知识图谱,了解和预测科学发展前沿和动态,提供有针对性的、个性化的推送服务。
3.3 充分利用现有大数据工具,精准推送文献
Altmetrics是一种基于社会网络的学术影响力评价方法,该方法利用Altmetrics工具收割文献管理系统和社交网络中涉及某一研究成果的相关信息,通过对这些信息进行计算达到评价该学术成果影响力的目的,目前网络上已有多种此类工具,如Altmetric.com、ImpactStory、PlumAnalytics等。另一方面,OA资源作为馆藏资源的重要组成部分,越来越受到人们重视,但是图书馆在收集OA资源时往往缺乏参考工具,Altmetrics在一定程度上为我们提供了依据。南昌大学图书馆利用Altmetric.com通过MEDLINE主题词、匹配PUBMED提问等条件进行设置,每季度向医学院相关课题组提供学科影响力排在前10名的论文,大受欢迎。
4 结语
总之,大数据技术正在对图书馆的资源评价、选择、组织和服务等工作产生越来越大的影响,图书馆应当科学有效地采集、存取、管理数据,并通过分析,提炼出有价值的信息,支持管理层作出及时有效的决策。需要指出的是,我们对大数据不能迷信,大数据不是万能的,它也存在自身局限性。我们必须从本单位的实际情况出发,循序渐进,量力而行,切忌好大喜功。
参考文献
[1]孙坦.开放信息环境:学术图书馆信息资源建设的重新定义[J].中国图书馆学报,2013(3):9-17.
[2]张计龙.大数据驱动图书馆业务应用与服务创新[J].上海高校图书情报工作研究,2013(3):1-6.
[3]陈超.图书馆如何迎接大数据时代?[J].图书馆杂志,2014,33(1):4-7.
[4]乌恩.智慧图书馆及其服务模式的构建[J].情报资料工作,2012(5):102-104.
[5]叶兰.研究数据管理能力成熟度模型评析[J].图书情报知识,2015(2):115-123.