基于大数据的图书馆读者决策采购模式探究
2019-03-18丁鑫
丁鑫
摘要论文分析了互联网时代图书馆读者决策采购的由来、特点与发展现状,介绍了大数据与图书馆读者决策采购模式结合的作用,研究了大数据在图书馆读者决策采购模式中的具体应用,以及基于大数据的图书馆读者决策采购模式的构建方法。
关键词 大数据 互联网时代 图书馆 读者决策采购
分类号 G250
随着互联网技术的发展,数字化资源成倍增长,极大改变了图书馆馆藏资源结构。虚拟馆藏所占比例的增多,要求图书采访实践不断汲取新理念,通过优化图书采访策略提高采购质量。读者决策采购(PDA)是数字图书馆依托互联网环境,将用户需求转化为量化指标,以用户为中心的新型文献采购模式。PDA也称作用户驱动采购,将读者作为图书采访决策主体,根据读者意愿设定采购触发机制,确定图书采购标准与参数的模式。它在一定程度上弥补了传统文献采访存在的不足,如资源更新不及时等,进而提高馆藏建设质量。然而我国图书馆界有关PDA的实践较少,还需要解决采购标准不统一、流通数据处理、读者需求不系统等问题。大数据是应用广泛的数据处理工具,与图书馆读者决策采购模式结合,能够优化采访决策制定流程,主动挖掘用户需求,保障图书采访的科学性,为图书馆资源组织体系完善提供了机遇。互联网时代图书馆能够正确应用大数据技术,依托大数据辅助制定采访决策,更好地满足读者需求。
1 图书馆读者决策采购模式现状分析
图书馆文献采访工作,经历了由现场采购、专家选书到读者决策采购的变化过程,每一种模式的应用,都与当时的馆藏实际和技术水平相对应。目前有关国外图书馆的读者决策采购模式的理论研究和实践较多,美国的大学图书馆是研究的主要对象,但针对我国图书馆界的理论研究较少,应用实践还处于初步探索阶段。
1.1 理论研究现状
2010年,美国大学与研究图书馆协会(ACRL)在《学术图书馆的十大趋势》中提到了“客户驱动采访”的概念,由此拉开了PDA研究的序幕[]。2011年,张甲和胡小菁结合美国案例发表了国内首篇系统阐述PDA模式的论文,并将PDA界定为图书馆内一种新型的采购模式[]。2014年,我国对PDA模式的研究达到了最高峰,这几年的研究虽然有所回落,但它依然是我国图书馆界研究的热点问题[]。
其研究内容主要包括以下几个方面。①PDA服务的研究综述或述评。研究者主要从PDA产生的背景、内涵和特点、实现模式和路径、典型的案例等方面对PDA的相关理论进行研究。除此以外,还有研究者从实践的角度总结了国外PDA模式的特点、实施形式和发展趋势。②PDA模式的内涵、争议、特点、影响因素等方面的研究。这一部分在研究综述和述评中均有体现,王芙蓉特别从大数据的角度对PDA模式进行了分析,并提出了行为分析模型和读者决策文献资源采购模型的实现过程[]。③PDA模式的实施形式研究。唐吉深指出,国外PDA模式的实施形式可分为图书馆联机目录(OPAC)触发型、馆际互借触发型、网络书店触发型三种[]。吴锦荣在此基础上提出PDA模式的实施形式应该有五种,分别是自制书目PDA 采购、征订书目PDA 采购、PDA 采购、PDA 借閱和PDA访问[]。④PDA模式的实施路径研究。研究者认为,以网上荐购为接入点、分阶段实施、服务平台的搭建、付费和预算管理、风险控制等是PDA模式实施路径中的重要环节。⑤PDA案例的研究。美国是PDA模式研究的主要阵地,除此以外,还有研究者从德国、加拿大等国家的图书馆角度进行了PDA模式的研究。
1.2 实践应用现状
PDA模式的实践应用比理论研究要早。1990年,PDA模式的雏形在巴克内尔大学(Bucknell University) 图书馆出现,它的初衷是为了解决馆际互借服务中的实际问题[]。21世纪初,web2.0的出现让PDA模式在美国大学图书馆中得到了广泛的应用和推广[]。2010年以后,PDA模式逐渐渗透到威廉玛丽学院、威尔斯利女子学院等中小型学术性图书馆中[]。相关调查结果显示,目前美国最少有42家图书馆已经开展了PDA服务[2],最典型的案例包括杨百翰大学图书馆、普渡大学图书馆、伊利诺伊大学香槟分校图书馆、加利福尼亚州立大学的波拉克图书馆、丹佛大学图书馆、杜克大学图书馆、爱荷华大学图书馆等。除了美国以外,全世界还有600多家图书馆采用了PDA的服务模式[]。
在国外PDA热潮的推动下,我国也进行了一系列的探索。2011年,佛山市图书馆首次设立了“新书借阅处”,开展纸质图书的PDA服务,成为了我国PDA实践中的开创性案例[]。同年,香港中文大学图书馆开展了电子图书的PDA服务[]。2012年,台湾学术电子书暨资料库联盟开设了西文电子书的PDA项目试点[]。2015年,中国社会科学院图书馆引入了外文电子书PDA服务[]。除此以外,厦门大学图书馆[]、南开大学图书馆[]、香港科技大学[]等更实施了长达一年以上的PDA项目试点。虽然国内目前还没有出现真正意义上的PDA实践模式,但在电子图书和纸质图书的PDA实践中已经取得了具有中国特色的创新性探索。
2大数据对图书馆读者决策采购模式的影响
读者决策采购模式的局限性,可以通过技术手段进行优化,为图书馆的馆藏建设提供新思路。互联网时代信息环境瞬息万变,不变的是大数据。基于大数据思维的数据采集、过滤与价值挖掘,预测用户的阅读偏好与需求[],为文献采购提供技术支持,推动读者采购决策模式深入发展。
2.1 图书馆大数据的来源与构成
互联网时代,图书馆大数据的产生,不仅来源于馆藏业务数据,还来源于自动化系统生成的流通日志、用户行为数据等。其中,读者在利用各类信息工具,对馆藏资源进行检索过程中产生的非结构化数据,是分析用户行为、改进服务的有效依据[]。大数据种类繁多、体量庞大,蕴藏着巨大的价值。随着互联网技术的发展,数字化出版、移动阅读成为主流,个人不仅是信息的接收者,也是生产、传播者。更多的用户参与到信息利用整个周期中,也产生了大量有用的数据。图书馆在文献资源建设中,通过跨部门、跨系统采集数据,对不同来源的大数据进行挖掘分析,发现其中的应用价值,能够更好地满足读者个性化需求。
2.2 大数据为PDA提供技术支持
PDA作为新型文献采访方式,成为众多图书馆人研究的主题[]。然而图书馆PDA模式的推行,需要保障所获取读者需求的准确性,解决数据兼容问题,保障不同系统之间的有效衔接。大数据技术的应用,为图书馆主动获取有用数据,全面分析读者阅读需求、兴趣爱好,制定合理的文献采访决策提供了支持。大数据的应用,突破了不同系统、不同机构之间的限制,让图书馆能够掌握不同学科更为准确、及时的资源利用情况,优化文献采访配置,重构文献采访模式。它为PDA提供了精准的数据来源,保障采访决策符合读者意愿,且不背离馆藏建设初衷,从根本上解决了采购资源利用率低、信息滞后等问题。
2.3 大数据推动PDA模式发展
图书馆用户在检索馆藏信息与数据库访问过程中,会产生大量异构数据,这些数据与用户的阅读需求、服务诉求息息相关。大数据技术通过对用户数据进行深入挖掘,全面分析、预测用户需求变化趋势,不仅有助于图书馆制定文献采访决策,也是优化读者决策采购服务的有力途径。对大数据技术的应用,促使图书馆开展与出版社、社交网站、书商、通讯服务商等广泛的跨界合作,获取更多数据来源渠道,掌握更多有价值的信息,促进服务内容与技术的融合。此外,大数据技术的引入,将读者需求变为可以量化的指标,提高了PDA服务效率,也为文献采购的系统、科学性提供了保障。
3 大数据在图书馆读者决策采购模式中的应用
图书馆系统每天都会产生大量数据,依托大数据技术的数据预处理、数据挖掘与读者需求预测等操作,作用在于把握读者个性化需求,辅助馆员制定采访计划,保障PDA服务的科学有效性。
3.1 数据预处理
图书馆在实施读者决策采购前,需要对各项数据进行全方位采集,从多个异构系统中捕捉相关信息,保障不同数据库中数据采集端的均衡分布,并将采集的信息导入图书馆自动化系统中。由于采集的初始数据存在大量噪声,或者部分数据存在缺损,这就需要图书馆员对原始数据进行预处理,通过数据清洗、过滤、分析与加工,保障所获取数据的质量[]。依托数据分析软件对所获取数据进行统一处理,剔除其中的异常数据,及时填补缺漏,保障数据格式的一致性;对于来源不同的数据,通过格式转换,使其适应图书馆系统;对重复数据进行合并或精简,保障关键数据的完整性、有序性。
3.2 数据统计分析
图书馆经过数据预处理后,需要利用MapReduce等数据统计分析软件,对大量数据进行综合分析与分类汇总。首先需要将大量数据输入多个存储文件夹中,然后依据不同数据的特征,对这些数据进行归纳整合,从中发现不同数据之间存在的规律。如根据读者需求,通过MapReduce分析不同读者群体之间是否存在联系,分析不同读者需求数据的特征,在归纳基础上总结规律,并将获得最后的结果导入自动化系统,进而为读者决策采购提供参考。在整合、统计与归纳分析过程中,馆员可以掌握读者对不同类型文献的偏好,或根据馆藏图书借阅数据,在对借阅信息进行聚类分析基础上,了解不同层次用户的阅读倾向,也可以发现不同时间段图书的流通情况。
3.3 读者需求预测
图书馆用户在访问PDA系统过程中,如检索馆藏资源、提出请求、查询信息等过程中,会产生大量数据,而他们通过微信、微博等访问互联网也会留下历史记录,这些都为预测分析读者需求提供了依据。由于这些数据分布广泛,结构复杂,图书馆在采集处理后,还需要利用大数据分析软件进行深入挖掘,从中发现读者的隐含需求,实时掌握读者需求变化趋势,为制定采购决策服务,保障读者决策采购的准确性。为了更好地把握读者需求,保障读者数据挖掘的准确性,保障读者决策采购符合馆藏资源建设大方向,图书馆可以设计读者行为分析模型(如图1),从文献采购与读者需求两个层面,通过大数据分析处理,发现文献内容与读者需求之间的联系,最终获得反映读者需求偏好的结果,为PDA系統提供可靠的决策支持,保障读者实际需求与读者决策采购的一致性。
4基于大数据的图书馆读者决策采购模式构建
图书馆PDA的实施并非一蹴而就的,而是需要在实践中不断改进与完善。对大数据技术的应用,不仅体现在数据分析处理方面,也需要图书馆在PDA实施的不同阶段,把握大数据的开放性、关联性、动态性特征,保障与采访决策制定、过程监控与效果评估的有效结合(如图2),保障数据利用的系统、准确、可靠性,促进PDA流程的持续优化。
4.1 采访决策制定阶段
图书馆文献采访决策的制定,是结合读者需求数据统计分析结果,综合考虑馆藏建设规划、经费投入等诸多因素,得出的科学的采购方案。它关系到PDA实施的最终效果,也体现了图书馆的服务水平[]。在这个阶段,图书馆员有必要设计合理的文献采购标准,明确不同文献的采购要求、价格区间等,并通过与供应商协同沟通,选择适宜的合作者。馆员应该认识到,面对读者日益丰富的需求,对采访决策的制定,不应该仅凭个人经验,还需要依托大数据技术,在采集分析多项数据基础上,对供应商资质进行评价,设定合理的文献采购参数。同时馆员需要根据馆藏特色,确定重点采购对象,引导读者发现并借阅优质馆藏资源,提高文献组织效率,凸显自身的核心竞争力。
4.2 PDA过程监控阶段
PDA的实施过程涉及多个主体,本身就是图书馆、读者与书商之间的博弈[]。书商提供的图书质量与服务水平,图书馆对读者需求的掌握是否准确,数据处理是否及时等,都影响到最终的服务效果。通过调查研究,发现很多图书馆由于协调不力、经费不足等因素,不得不终止PDA项目或调整方案。为此,做好PDA实施阶段的数据监控工作,对数据进行高效管理,根据大数据分析结果及时解决问题,调整PDA参数,跟踪分析文献流通量、借阅率等指标,避免采购经费透支,维持各项工作的有序性是必要的。例如,黑龙江大学图书馆在PDA实施阶段,借助金盘管理系统统计分析读者预约数据,制作预约热点图书目录。在对比馆藏数据基础上,确定文献采购数量,保障采购决策合理性,并通过数据监控及时补充馆藏不足,强化了文献保障能力。
4.3 PDA效果评估阶段
图书馆借助大数据分析,综合评估PDA实施效果,发现服务中存在的问题,可以为后续业务的实施提供参考,进一完善读者决策采购方案,提高读者决策采购服务效益。例如,2016年杭州图书馆推出“悦读”服务计划,读者借助专用APP在线挑选图书,并到购书中心办理借阅手续,由图书馆支付费用,形成先阅读后馆藏的PDA模式。这是国内图书馆对PDA的有益尝试,是对纸本文献PDA的前期实践,取得了较好的效果。为保障PDA实施的持续性,该馆尝试构建跟踪效果评价机制,借助大数据技术分析PDA运行中存在的问题,根据分析结果改进服务流程,旨在建立适应本馆实际的、成熟的PDA服务模式。
5 结语
读者决策采购是图书馆采访工作革新的一大亮点,贯彻了以人为本的思想,应当把PDA作为一个传统采购模式的有效补充[]。目前,国内对PDA的研究处于起步阶段,实践项目不多,还存在很大的提升空间。大数据对图书馆服务产生了深远影响,它与读者决策采购模式的结合,通过对海量数据的归类、分析与价值挖掘,为图书馆制定采访决策提供了依据,保障了采访服务的针对性与高效性。依托大数据技术的信息挖掘整合能力,打破了不同机构的信息壁垒,也为图书馆与出版社等机构的跨界合作提供了条件,将进一步推动读者决策采购服务范围拓展。
参考文献:
谷秀洁.2010年学术图书馆十大趋势[J]. 图书与情报,2010(4):66-68.
张甲,胡小菁.读者决策的图书馆藏书采购:藏书建设2.0版[J].中国图书馆学报,2011,37(2):36-39.
王博文,刘华.读者决策采购研究热点与合作者网络分析[J].图书情报工作,2015,59(S2):148-152.
王芙蓉.大数据环境下基于读者决策的图书馆文献资源采购模型研究[J].图书馆学研究,2017(12):54-59.
唐吉深.我国读者决策采购(PDA)研究述评[J].图书馆学研究,2015(2):22-28.
吴锦荣.国外图书馆联盟PDA模式及对深圳图书馆联盟的启示[J].图书情报工作,2017(13):44-52.
朱美华,郑建瑜.浅议读者决策采购(PDA)[J].图书馆工作与研究,2014(2):62-66.
ANDERSON K J, FREEMAN R S, HéRUBEL J P V M, et al. Buy, dont borrow: bibliographers analysis of academic library collection development through inter-library loan requests[J]. Purdue University, 2002.
刘华.以读者为主导的文献资源建设[J].图书情报工作,2012(5):89-93.
蔡屏.PDA 认识误区之解析与建议[J].图书情报工作,2013(16):65-70.
张彦静.我国图书馆读者自主采购的探索与思考:以佛山市图书馆“新书借阅处”为例[J].图书馆学研究,2013(15):54-58,76.
刘丽芝,吴玉珍.需求驱动采购电子书的实践与思考:以香港中文大学图书馆为例[J].图书馆论坛,2014,
34(4):127-134,22.
付兵.基于读者决策的电子书联盟采购研究:以台湾学术电子书暨资料库联盟西文电子书PDA采購项目为例[J].现代情报,2014(5):139-141.
张佶烨,贾苹.社科院图书馆首次将PDA模式引入中国[EB/OL].[2017-11-22]. http://www.edu.cn/info/zy
yyy/szzy/201504/t20150416_1247995.shtml.
杨薇,陈娟,向琳艳,等.购买,而不是借阅:厦门大学图书馆读者决策采购的实践[J].图书馆杂志,2016,35(6):36-39.
CASHL前瞻性课题2014年结项情况汇总[EB/OL].[2017-11-22].http://www.cashl.edu.cn/portal/html/article349.html.
王凤满.三种电子书PDA模式影响研究:以香港科技大学图书馆为例[J].现代情报,2016(12):85-89.
杨丹丹.利用大数据分析法提高图书馆读者决策采购(PDA)效能探析[J].图书馆工作与研究.2015(1):60-62.
徐春艳,许丽丽,洪艳霞.大数据在高校图书馆信息资源建设中的应用探析[J].农业图书情报学刊,2017(2):27-29.
王寒冰.大学图书馆馆藏资源质量评价指标研究[J].农业图书情报学刊,2017(2):42-46.
李卉.面向图书馆半结构化馆藏数据的智能检索系统研究[J].农业图书情报学刊,2017(2):61-64.
刘乾凝.都市农业云数据的知识产权管理问题及对策[J].农业图书情报学刊,2017(2):118-121.
于迎辉,张芹,景民昌.读者决策采购(PDA)在国内图书馆实施的若干思考[J].图书馆工作与研究,2014(3):62-65.