APP下载

图书馆数字资源建设的困境与对策*

2018-07-05许建兵

图书馆学刊 2018年4期
关键词:检索期刊图书馆

许建兵

(湖南省少年儿童图书馆,湖南 长沙 410005)

随着现代信息技术和网络技术的发展,数字资源种类和数量越来越多,数字资源建设在图书馆资源建设中的比重越来越大,数字化服务在图书馆服务中的地位不断上升。数字资源建设相关的采购模式、统计与分析、评价与效益、利用与服务等问题被越来越多的图书馆决策者、建设者和研究者关注。数字资源建设分为自建特色数字资源和采购商业数字资源两类,笔者侧重对后者进行研究。

1 数字资源建设的现状

1.1 数字资源呈几何倍数增长

文化与科技的融合,使得数字资源急剧增长。据国际数据公司(IDC)发布的研究报告显示,全球数据总量正以年均50%的速度增长,预计到2020年将达到40ZB(相当于4万亿GB),我国数据量将达到8.6ZB,占全球21%[1]。大英图书馆的报告也表明:越来越多的资源将以数字形式出版,到2020年80%英国出版的期刊将是纯数字的[2]。

1.2 数字资源在图书馆馆藏结构中所占比重越来越大

《2016中国公共图书馆事业发展基础数据概览》统计结果显示,全国公共图书馆2016年新增数字资源购置费占新增藏量购置费的比例为18.96%,比2015年增长6.43%[3]。《中国图书馆年鉴2016》统计结果显示,全国公共图书馆新增电子图书30,994万册,占新增总藏量的85%[4]。教育部高校图工委事实数据库统计显示,全国739所高校图书馆平均电子资源购置费251万元,占文献资源总购置经费的52%,其中985高校图书馆电子资源购置费1,387万元,占比56%[5]。可见,无论是公共图书馆还是高校图书馆,数字资源在馆藏结构中所占比重越来越大。

1.3 读者数字阅读需求日益旺盛

中国互联网络信息中心(CNNIC)2018年1月发布的第41次《中国互联网络发展状况统计报告》显示,中国网民规模达7.72亿,互联网普及率为55.8%,网民上网行为主要有即时通讯、搜索信息、网上阅读、网络购物等[6]。中国新闻出版研究院2018年4月发布的第十五次全国国民阅读调查报告显示,我国国民数字化阅读率持续上升,2017年为73%,较2016年的68.2%上升了4.8个百分点,较2015年的64%上升了9个百分点[7]。日益增长的网络读者,及其产生的数字阅读需求,要求图书馆提供优质的数字化服务。

2 数字资源建设与服务中存在的问题

2.1 数据库平台不同,数据结构各异,导致资源利用不便利

随着社会智能化程度的不断提高,读者在搜索信息时更偏爱精准检索,并希望通过知识、图谱等功能协助其深度挖掘资源。目前大多数图书馆的数字资源在资源类型、数据结构、检索方式等方面均存在较大差异,读者检索资源时需要登录不同的平台,遵循各自的检索策略反复检索,没办法一站式发现自己想要的资源,使用起来很不便利,阻碍了数字资源效益的发挥。近年来,虽有国内外信息机构研究开发 的 WorldcatLocal(WCL)、EBSCO Discovery Service、超星发现等平台,在一定程度上解决了用户统一认证和资源统一检索的问题,但仍存在缺乏高级检索、全文链接不稳定等问题,查全率有待提高[8]。

2.2 统计标准不同,无法精准分析,难以科学指导采购决策

在数字资源利用统计标准方面,欧美国家自20世纪末便提出了若干方案,影响较大的有国际图书馆联盟联合组织发布的《基于网络的信息资源利用统计评价指南》、英国COUNTER项目组发布的《网络化电子资源在线使用统计》、美国图书馆协会发起的电子资源绩效评价项目等,其中COUNTER标准可以比较不同资源商和出版商的访问数据,应用最为广泛。据调查,我国数字资源仅知网遵循了COUNTER标准,超星、博看、中文在线遵循了国内相关标准,其余资源均参考某不知名标准或未遵循标准[9]。例如,知网提供登录次数、检索次数、浏览篇数、下载篇数等指标,数据以次和篇为单位,各项相加得到使用总次数;维普提供登录次数、浏览篇数、下载篇数3个指标;超星提供参考咨询页数、点击全文链接次数、下载量等指标。有的以篇为单位、有的以次为单位、有的以页为单位,各项相加得到总访问量。这些数据可以纵向对比往年的使用情况,但无法统一成相同的标准进行横向对比和分析,不利于评价成本效益,难以科学指导采购决策。

2.3 资源垄断、同质化严重,图书馆难以采购完整的数字资源

同方知网、维普资讯和万方数据是国内三大知名数据库品牌,被绝大多数高校图书馆、公共图书馆和专业图书馆使用。知网收录期刊1.09万种,论文5100万篇,维普收录期刊1.2万余种,论文5900万篇,万方收录期刊8000余种,论文3600余万篇。这些数字资源提供商都与部分期刊签订了独家授权,如知网独家1500种,维普独家500种,万方独家1400种,如表1所示。这些期刊具有排他性,只有购买了才能使用,造成一定程度的垄断。而且,这3个数据库均不同程度收录了大量同质化期刊。有资料显示,维普与知网收录相同期刊约6500余种,维普与万方收录相同期刊约6700种,万方与知网收录相同期刊约6000种[10]。若想拥有较完整的期刊文献,则不得不重复采购6000余种同质期刊。而外文数字资源的垄断则更加严重,如E1sevier、Springer、Wiley-Blackwell、Taylor Francis这四大数据库涵盖了全球一半以上的医学期刊和科技期刊[11]。

表1 知网、维普、万方期刊文献统计

2.4 资源价格上涨,图书馆难以满足读者日益增长的数字文献需求

数字资源尤其是外文类资源的销售政策一般只销售使用权,用户不具备所有权或永久使用权。为保证有该类资源可用性及资源收藏的连续性和系统性,图书馆不得不年年续订。而数字资源提供商或代理商为了获取高额利润,利用读者对资源的依赖,以及图书馆不得不购买的心理,不断提高数字资源价格[12]。有数据显示,中文类数字资源年涨幅一般小于10%,而外文类数字资源年涨幅约10%-20%,甚至更高。如,E1sevier年涨幅曾达到20%-30%,引起国内30余家图书馆集体抵制;英国皇家化学学会(RSC)数据库2015年以后对吉林大学访问费涨幅达到400%,中山大学涨幅500%,引起多个高校联合抵制[13]。数字资源不断上涨的价格极度考验着图书馆的采购经费,图书馆越来越难以满足读者日益增长的文献需求。

2.5 读者需求提高,馆藏资源有限,供需矛盾突出

尽管图书馆数字资源采购的比重越来越大,但读者对资源的要求越来越具体,对文献质量的要求也越来越高,造成资源供给和读者需求之间的矛盾。从资源内容来看,因为近年不少学术机构将发表SCI/SSCI论文作为科研工作者重要考核指标,所以国内专家学者纷纷将研究成果发表在国外有影响力的刊物上,这在一定程度上影响了中文资源的学术价值[14]。加之中文资源同质化,外文资源价格垄断,使得馆藏资源数量有限,品质有待提高,读者满意度不高。从采购方式来看,图书馆往往按照经费额度,馆藏结构和往年采购习惯制定采购方案,没有充分调研读者需求,也没办法获取较精准的资源利用数据来指导决策,造成资源采购和读者需求“两层皮”现象,加剧了资源的供需矛盾。

3 数字资源建设与服务的对策建议

3.1 整合异构资源,基于人工智能建立功能完善的数字资源服务平台

目前图书馆数字资源整合有以下四种模式:一是基于数字资源导航的整合,即将URL地址集合成导航;二是基于OPAC系统的整合,将数据库出版商提供元数据导入图书馆自动化系统,形成整合的查询系统;三是基于元数据仓储的整合,即将各类型异构元数据高度集成为一个整体;四是基于元数据仓储和资产管理的整合,先将元数据分类,再提取题名、作者等关键元素进行解析,然后对元数据进行清洗、去重和整合,形成统一的资源平台。第一种方式并不能实现真正意义的统一检索;第二种方式可以实现实体馆藏和虚拟馆藏的相互揭示;第三种方式可实现各种异构资源的统一检索,为数据挖掘和知识发现奠定基础[15];第四种方式可实现资源统一检索和资产统一管理,难点在于不易及时获取元数据,解析和清洗难度也较大[16]。

较理想的模式是综合以上模式的优点,基于元数据整合建立统一的数字资源服务平台,引入人工智能技术优化检索算法,遵循COUNTER标准设计统计分析模块,增加用户统一认证模块,使得数字资源服务平台既能实现各类型异构数据智能化的统一检索,又能实现纸质资源、自建数字资源和商业数字资源的关联揭示和知识发现,还能有效解决读者无法一站式登录和检索,以及无法获取精准的成本效益报告来指导采购决策等问题。

3.2 综合评价资源,为数字资源建设提供依据

数字资源的评价大致分为以下几方面:一是资源内容的评价,包括收录资源权威性、完整性、及时性等要素。一般来说,专家学者、核心期刊、权威机构、权威索引收录或出版的文献会比较权威;时间跨度较长、学科领域覆盖较广泛、主题层次较深入、文献数量较多的资源完整性会比较好;数据更新速度较快、频度较高的资源更为及时。二是检索功能的评价,首先,看检索方式是否齐全,既要有面向初级读者的简易检索,也要有面向科研读者的高级检索,还要有面向信息读者的专业检索;其次,看检索结果的处理是否科学,既能按相关度、时间进行排序,又能概览篇名摘要,还能下载或传递原文;再次,看查全率、查准率是否高,有无漏检误检情况。三是系统平台的评价,包括平台是否运行稳定,速度是否快,能否在移动平台使用,能否通过社交媒体分享交流等。四是使用成本的评价,包括资源使用次均成本,数据资源整体成本等,成本越低的资源效益越高。

3.3 成立专门机构,科学合理地建设数字资源

数字资源的建设应成立专门的建设采访委员会,制定采购制度,明确岗位职责,各司其职、科学合理地采购数字资源。建设采访委员会由以下几方面人员组成:决策者、采购人员、学术科研人员、参考咨询人员、宣传推广人员、技术维护人员、财务管理和审计人员。采购人员负责各类型的数字资源的试用和市场调研,了解资源内容、系统平台和检索功能的优劣,横向对比产品的价格,然后根据连续性、系统性等采购原则提出采购计划。专家学者和参考咨询人员就采购计划提出不同意见和建议。技术维护人员就技术实现提出意见。采购人员调整采购计划报决策者审批。采购计划批准后进入招标采购流程,整个采购流程由财务管理人员和审计人员负责付款、监督和把关。宣传推广人员负责数字资源的宣传和推广,以及读者信息素养培训。

3.4 引入PDA理念,优化数字资源采购模式

PDA(Patron Driven Acquisitions)是近年在美国率先兴起的数字资源采购方式,主要指根据读者需求和资源使用情况进行数据库的采购,国内学者通常译为读者决策采购或需求驱动采购。2011年,美国图书馆协会的ALTCS研讨会将其推向高潮,美国、德国等多家图书馆相继启动PDA项目,取得了较成功的经验。PDA采购方式以读者需求为导向,注重资源的利用率,优势是可以提高读者参与度、优化经费结构、减少采购中的主观臆断、提高资源利用率,可为经费紧缩和读者满意度低的供需矛盾提供解决方案[17]。劣势是读者意见可能不够专业、采购经费不能无限度满足读者需求、资源可能不再有连续性和系统性[18]。所以,采访委员会应整合PDA方式和传统采购方式,形成优化的数字资源采购模式。在采购资源前,采访委员会应进行广泛的读者调研和相关部门工作调研,充分了解读者需求和工作需求。同时应对上年度的资源利用情况进行统计分析,提供成本效益分析报告。综合读者需求报告、成本效益分析报告,以及资源市场调研、馆藏采购政策和专家意见,共同决定数字资源建设方案。

3.5 建立图书馆联盟,推动区域数字资源联合采购和共建共享

目前数字资源采购以单个图书馆独立采购为主,少有的联合采购也多在公共图书馆、高校图书馆、专业图书馆系统内部小范围的进行,造成资源重复采购和经费浪费。打破系统壁垒,成立图书馆联盟,推动真正意义上的区域数字资源共建共享势在必行。跨系统的联合共建可以有两种方式:一是组织专家团队,和资源供应商整体谈一个比较低的价格,规定参与联盟的成员馆采购该资源不能高于此价格;二是对于各成员馆都要购买的通用资源由联盟出面购买一套,授权所有成员馆使用,费用根据各成员馆的规模和使用情况分摊。前者灵活性较大,可以省去图书馆与不同资源供应商谈判的精力,专家团队对资源内容的把握比较权威,价格相对也比较低,购买外文类数字资源时多采用这种方式;后者共建共享力度更高,适合购买中文常规数字资源。同时,图书馆联盟还可搭建网络咨询平台,利用各成员馆的资源优势、人才优势和信息技术优势,为读者和其他成员馆提供文献传递服务,提高本区域的文献保障率。国内比较有代表性的网络咨询平台有NSTL、CALIS、CASH、上海市图书馆知识导航、全国参考咨询联盟、湖南省联合在线咨询等。

4 结语

图书馆对数字资源的投入越来越多,但由于种种原因,投入与产出并不成比例,数字资源建设与服务面临着诸多困境。笔者认为,在资源建设方面,区域内各图书馆应联合起来,注重读者需求,重视资源利用和评价,优化采购模式,实现数字资源的共建共享。在资源服务方面,应建立具备用户认证和统一检索功能的数字资源服务门户,解决用户反复登录、检索不精准、使用不便利等问题,提升资源使用效益;应进行数字资源宣传和推广,增加资源的知晓度;还应举办信息素养培训,提高读者使用技能,确保资源有效利用。

[1] 张俊.5万亿蓝海待开掘大数据行业号角再起[N].南方日报,2017-12-18.

[2] 刘元珺,郑强.公共图书馆数字资源评估指标分析[J].图书情报工作,2014(2):49-51.

[3]国家图书馆研究院.2016中国公共图书馆事业发展基础数据概览[M],2017.

[4] 中国图书馆学会,国家图书馆.中国图书馆年鉴2016[M].北京:国家图书馆出版社,2017.

[5] 吴汉华,姚小燕.我国高校图书馆年度经费支出现状分析[J].高校图书馆工作,2017(4):60-67.

[6]CNNIC.中国互联网络发展状况统计报告[EB/OL].[2018-5-14].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/.

[7] 中国新闻出版研究院.第十五次全国国民阅读调查报告[EB/OL].[2018-5-14].http://book.sina.com.cn/news/whxw/2018-04-18/doc-ifzihnep4386289.shtml.

[8] 翟中会.资源发现系统存在的问题及其对策[J].图书馆建设,2015(3).

[9] 胡大琴.中文数字资源使用统计数据的调查研究[J].图书情报工作,2017(15):104-110.

[10] 于洋.国内三大中文数字期刊库的比较分析[J].河北科技图苑,2016(4):54-58.

[11] 吴高,韦楠华.我国图书馆数字资源采购问题与对策研究[J].图书馆建设,2012(12):20-24.

[12] 史淑英,张静.反垄断法视域下高校图书馆数字资源价格模型研究[J].国家图书馆学刊,2017(4):108-112.

[13] 史江蓉.反垄断法对数字资源出版商许可权滥用行为的规制[J].图书馆学刊,2016(1):10-13,27.

[14] 朱晓华,等.SCI/SSCI期刊与中文权威核心期刊论文的学术价值评价——基于地理工作者的感知分析[J].地理学报,2016(4):680-692.

[15] 肖希明,刘巧园.基于元数据仓储的公共数字文化资源整合研究[J].图书馆,2015(9):17-21,26.

[16] 孙锐,杨新涯,廖维.构建在元数据仓储上的文献资产管理[J].图书馆论坛,2017(7):9-16.

[17] 刘春梅,李志军.美国两所高校图书馆PDA评估模式分析及启示[J].图书馆杂志,2017(10):78-84.

[18] 王艾.基于PDA的高校图书馆数字资源建设的SWOT分析[J].赤峰学院学报:自然科学版,2015(10):220-221.

猜你喜欢

检索期刊图书馆
期刊更名启事
期刊简介
期刊问答
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
图书馆
浅议专利检索质量的提升
去图书馆
期待您的加入