循证视角下图书馆数字资源证据驱动评估决策研究*<br/>——以中文全文学术期刊数据库为例

循证视角下图书馆数字资源证据驱动评估决策研究*
——以中文全文学术期刊数据库为例

2023-12-13张若楠史淑英

图书馆研究与工作 2023年12期

张若楠史淑英

（1.西安交通大学图书馆陕西西安 710049）

（2.西安交通大学期刊中心陕西西安 710049）

随着计算机网络的迅猛发展，信息与知识数字化使数字资源成为知识社会发展的基础性资源。根据《2020年中国高校图书馆基本统计数据报告》显示，截至2020年年底，我国高校图书馆数字资源经费高达39.21亿元[1]。数字资源购置费已超过纸质资源购置费，且呈现持续增长趋势，数字资源已成为大数据时代图书馆的馆藏重点。

随着高校图书馆文献资源建设的重心逐步由纸质向数字资源倾斜，图书馆越来越重视数字资源所带来的效益和价值。美国国会图书馆在新的5年（2022—2026）数字馆藏战略中指出，要重点关注馆藏资源的评估，建立馆藏跟踪数据，获取并分析馆藏进一步发展的信息[2]。全国数字图书馆建设与服务联席会议发布的《数字图书馆资源管理指南》中指出，商业数字资源占用经费多、服务需求大，权益内容广泛且复杂，对其管理尤其应给予重视[3]。数字资源评估已成为当前图书馆发展的重中之重。

在数字资源建设过程中，一般会伴随重采购、轻评估的问题。如何对数字资源的内容品质、学术性、权威性等方面进行有效评估，在兼顾用户需求、馆藏结构、经费等因素的基础上实现数字资源建设的科学性和合理化，是图书馆现阶段致力解决的一个问题。

1 相关研究

1.1 数字资源评估研究

国外图书馆数字资源评估研究开展较早，涵盖范围也相对广泛。20 世纪70 年代起，国际图书馆联盟、欧洲共同体、美国图书馆协会、国际标准组织、美国国家信息标准协会、国际图书馆协会与机构联合会等机构就开展了一系列有关数字资源评价指标、标准和方法的研究，代表项目有ICOLC、E-measures、EQUINOX、E-Metrics、COUNTER等。以国际图书馆协会与机构联合会发布的《数字资源馆藏建设的关键问题：图书馆指南》为例，该指南围绕图书馆数字资源管理和评估中的关键要素展开，涉及内容、技术要求、功能性和可靠性、供应商支持、供应、用户评价等多个方面[4]。美国图书馆协会发起的“电子资源计量”（Measures for Electronic Resources，E-Metrics）项目，组织了美国20多个著名的研究图书馆与出版商/数据库商共同合作，旨在建立一个系统科学的数字资源评估指标体系[5]。此外有学者探讨了数字资源的选择标准及选择过程、数字资源选择与管理、资源引进前后评估等问题[6]。随后不断有学者对评估指标进行总结和补充，形成了相对完善的数字资源评价指标体系，并已经从理论研究转向应用研究。

国内相关研究主要集中在综合各类数字资源的特点，提出一般性的评估指标体系与标准规范等方面。如CALIS（China Academic Library & Information System，中国高等教育文献保障系统）数字资源评估指标体系、DRAA（Digital Resource Acquisition Alliance of Chinese Academic Libraries，高校图书馆数字资源采购联盟）开展的高校图书馆集团采购引进数据库评估等。罗春荣等学者提出了包括用户需求、资源内容、使用便捷性、适用与运行环境、成本效益、后续服务6个方面的数字资源评估指标体系[7]。肖珑等人基于自身丰富的数字资源采购经验，对数字资源评估指标体系做了进一步的延伸和扩展[8]。此后不断有学者从数字资源服务绩效[9]、使用统计分析[10]、决策评价指标体系[11]等方面进行研究与探讨。

综合来看，国内外关于不同类型的数字资源形成了一些相对一致的评估标准，但是在对评估标准定义、实际适用性方面的讨论还略显不足，缺乏一定的科学程序和方法指导，从而导致数字资源评估在实践中可操作性不强[12]。我国虽然也有学者开展了实证研究，但相较国外而言，更多地是从理论层面进行探讨，如资源评估指标选择、模型确立等，将理论与实证相结合的研究尚未形成规模。

1.2 数字资源建设中存在的问题

通过对国内外数字资源建设与评估相关研究成果和实践经验进行梳理和分析，结果发现：当前国内外数字资源建设中存在着内容重复建设、资源采购浪费等问题。

库兹敦大学罗巴赫图书馆对其购买的EBSCO和ProQuest两大数据库集成商提供的近50 万种电子书订阅包展开数字资源评估，通过对资源内容重复对比并结合COUNTER报告，结果显示，EBSCO和ProQuest集合有30%—40%的重复，且总体使用率很低。在39万本电子书中，只有2.5%被用户实际使用过[13]。蒙大拿大学密苏拉分校的曼斯菲尔德图书馆也开展过一项数字资源评估项目，其中一项重要的评估指标就是对全文期刊的重复率进行对比分析[14]。

20 世纪90 年代以来，随着互联网的应用和普及，以CNKI（中国知网）数据库（以下简称“知网”）、万方数据知识服务平台（以下简称“万方”）、VIP（维普）期刊资源整合服务系统（以下简称“维普”）、超星数字图书馆（以下简称“超星”）等为代表的商业性数字资源迅猛发展，逐渐成为了我国数字资源建设领域的中坚力量。目前，我国的数字资源建设已经初具规模，但还存在着资源内容重复建设、标准规范不统一等问题。图书馆无法对采购资源进行有效的横向统计分析[15]，缺乏多库间跨平台对比等实证研究成果。

本文以循证学方法为图书馆数字资源评估建立分析方法与实践模式，从图书馆自身实际出发，在数字资源评估体系确立与应用过程中充分强调“证据”因素。以西安交通大学图书馆中文全文学术期刊数据库为例，以数据库内容质量为切入点，系统地开展定量评估，使数字资源评估更能反映出以科学为依据的图书馆决策过程，为提升图书馆数字资源评估质量提供借鉴与参考。

2 数字资源循证评估分析

2.1 循证图书馆学

循证理念始于20世纪末的循证医学，由此衍生出来循证图书馆学（Evidence Based Librarianship，EBL）。循证图书馆学在1997 年由Eldredge提出[16]，他认为EBL是一个将最佳证据融入图书馆科学决策的结构化过程。2011 年版美国《高校图书馆标准》中提出了基于循证评价方法的图书馆绩效评价模式，为高校图书馆文献资源建设提供了规范指南[17]。Conner[18]提到EBL中最关键的环节就是寻找证据，进而对产生的研究证据进行批判性的评估与应用。

国外图书馆界关于循证图书馆与信息实践（Evidence-Based Library and Information Practice，EBLIP）的相关探讨已经持续了10 届会议，当前对EBLIP的研究大多集中于英美国家。通过对历届会议主题与内容进行调查分析，国外图书馆界对于EBLIP发展的探讨愈发清晰与细化，主要呈现以下特点和趋势：（1）重视证据的收集，发挥关键证据在决策中的重要性；（2）对循证工具的应用逐渐明晰，用定量和定性等研究方法收集证据；（3）重视对证据的批判性评价；（4）解决问题从以馆员为导向到以用户为导向转变。

循证强调的是将信息用科学方法转化为客观、系统的证据，本文在循证视角下审视数字资源的证据性及实践价值，提出以证据为核心的数字资源循证评估模型，确保数字资源评估工作有的放矢，有理有据。

2.2 以证据为核心的数字资源循证评估模型

循证以科学证据为基础，科学证据是循证的核心和关键。该模型在循证图书馆学的基础上延伸，由问题、证据和实践3个基本要素构成，并将证据作为理论框架的核心元素，体现了从问题到应用的完整过程。具体流程包括：（1）问题提出；（2）证据生成；（3）证据综合；（4）证据应用；（5）实践评估（见图1），将循证理论与研究实践联系起来，提供了一种用于辅助决策的方法，以期实现数字资源评估的良性运转和循环发展。下面本文以中文全文学术期刊数据库为例验证所提出的评估流程的有效性和可行性。

图1 以证据为核心的数字资源循证评估流程

2.2.1 问题提出

当前数字资源采购内容重复的问题在文献资源建设过程中一直存在，而这种现象在中文数字资源采购中尤为突出。目前国内数字出版行业发展日趋繁荣，但由于缺乏有效的监督和规范化管理，缺乏资源间的对比分析，导致购置资源的重复率较高，在一定程度上影响图书馆中文数字资源建设的质量[19]。

尽管国内外早已有学者针对期刊数据库展开评估研究，但大多局限于外文期刊数据库，鲜有学者对中文期刊数据库进行关注，中文期刊数据库在支撑学科建设与科学研究中也起到重要的作用，往往是评估工作中容易忽视但需要关注的重点。

中文全文学术期刊数据库长期以来在图书馆数字资源中占比较大，是图书馆数字资源的核心内容。以西安交通大学图书馆为例，其数字资源经费约占文献资源建设经费的87%，中文全文学术期刊数据库约占图书馆数字资源的50%以上。一直以来，收藏高质量的学术期刊是本馆数字资源建设的重点工作，但目前在中文全文学术期刊数据库内容重复建设与质量评估方面的工作还有所欠缺。基于当前数字资源建设中存在的问题，结合西安交通大学图书馆中文数字资源建设现状，确定需要开展中文全文学术期刊数据库评估，关注知网、万方、维普和超星中约37 700种全文学术期刊，系统地把握这4个数据库的内容质量情况，辅助本馆后续进行相关科学决策。

2.2.2 证据生成

证据生成阶段包括对证据的收集与处理。本次评估针对图书馆订购的4个中文全文期刊数据库进行数据采集与处理，根据数据库商提供的期刊目录数据，主要包含刊名、曾用刊名、英文刊名、出版商、ISSN号、收录起始期、URL等字段信息。针对多源数据的目录字段存在名称混杂、格式不一等情况，在不影响源数据正确的前提下，为多源数据分别建立统一、规范的目录字段，方便后续进行查询、比对。从馆藏信息角度提供期刊标识字段（见表1），方便按需制定数据处理规则。

表1 订购期刊目录标识字段

为了保证评价标准的统一，本次评估采用多源匹配法，将多源数据中的关键特征字段信息进行规范化处理，对不同源数据进行匹配，得到最佳匹配期刊集。多源匹配法实施过程较为繁琐，主要通过编写代码的方式先后对期刊刊名、ISSN号、刊名缩写等关键特征进行匹配比对，计算不同源数据中期刊的匹配率，从而保证期刊匹配的规范化和准确性。通过进行数据清洗，核对数据的有效性和完备性，筛除无效数据并进行记录。通过Python语言进行编程，批量读取多源数据内容并进行规范化处理，具体包括：去除主要字段中的标点符号、统一英文字段的大小写格式、完善ISSN号的数据规范等。

2.2.3 证据综合

证据综合是在证据生成的基础上，进一步生成具体的评估指标以适应实践应用。证据综合不仅要考虑证据的真实性和有效性，也要兼顾应用于数字资源评估的适用性和可行性。主要体现在所需证据获取方式和途径的真实可靠；指标体系要结合实际工作，指标数量避免冗余繁杂，以定量指标为主，减少定性指标。对数据库收录的期刊数量和质量内容方面进行准确的量化评估是本次评估的重点，包括资源覆盖情况和收录数据情况。以资源内容与质量为关键点，下一级指标是上一级指标的影响因素，以侯振兴[20]、李娜[21]、肖珑[8]等人的相关研究为参考依据，选取2个二级指标和6个三级指标，并对指标做出了具体说明，最终形成立足本馆实际的数字资源评估指标体系，如表2所示。

表2 数字资源内容质量评估指标

2.2.4 证据应用

经过前期数据采集与处理，在精准获取多类数据源数据的基础上，依据内容质量评估指标，对数据进行分析与比较，具体分析订购期刊数据库中重复期刊的数量、核心期刊数及覆盖学科等情况。

如图2所示，令A、B、C、D为四个不同的集合；在本次评估中关注的是不同集合共有的和独有的部分，即期刊列表中彼此重复的部分和完全独有的部分、期刊列表与核心期刊列表共有的部分、期刊列表与教育部一级学科及学校重点学科共有的部分。

图2 期刊列表集合韦恩图

依次按照期刊目录中的Journal、ENJournal、ISSN、IDs等关键字段内容，依据上述制定的比较规则，分别对各数据库期刊重复情况、核心期刊比例、覆盖学科比例进行分类分级比较，查询源数据的目录内容，若匹配，则标记相关信息。

2.2.5 实践评估

实践评估阶段主要包括过程评估、效果评估和动态评估三个方面。基于以上评估指标对中文全文学术期刊数据库内容质量进行分析，评价证据应用的效果，以评估结果调控资源结构[22]。

（1）过程评估：主要评估证据应用过程是否顺利。对各个环节进行不断的重复性评价，有助于及时发现问题、分析原因。例如在对资源重复情况进行对比分析时，由于目前国内各数据库商提供的期刊列表标准不一、格式各异，部分刊名或者ISSN号存在错误或不一致的情况，导致比对结果存在误差，需要进行二次筛查，人工清洗期刊列表数据，提高比对结果的准确性，在一定程度上增加了评估的难度。同时在对核心期刊标准的选择上以《中文核心期刊要目总览》和中文社会科学引文索引（Chinese Social Sciences Citation Index, CSSCI）为主，以确保核心期刊匹配的权威性。

（2）效果评估：主要评估证据应用后实践的效果。结果显示，在资源内容重复情况方面，4 个数据库平均重复率为60.55%，独有期刊占比分别为16.75%（知网）、17.56%（万方）、45.32%（维普）、7.95%（超星），如表3所示。超星数据库中独有期刊占比相对最低，进一步分析发现，超星的独有期刊的出版源大多以美国科研出版社、汉斯出版社等开源出版社为主，期刊类型主要以文化科普类、中小学教参等为主（影响因子平均在0.5以下）。在核心期刊占比方面，4个数据库的核心占比情况分别为：《中文核心期刊要目总览》期刊占比分别为23.02%（知网）、21.44%（万方）、14.09%（维普）、17.87%（超星）；CSSCI期刊占比分别为6.25%（知网）、6.25%（万方）、3.39%（维普）、4.76%（超星），整体上看，知网的核心期刊占比相对最高。在学校一级学科覆盖情况上，西安交通大学共41个教育部一级学科，4个数据库覆盖情况分别为知网78.82%、万方88.27%、维普71.5%、超星86.03%；在14个重点学科（第四轮学科评估结果为A-及以上）覆盖上，4个数据库整体覆盖率相对而言均有待提高（见表4）。

表3 数据库内容重复情况

表4 学校重点学科覆盖情况

（3）动态评估：数字资源循证评估是一个动态循环的连续过程，不仅要关注过去与当前数字资源的发展，也要跟踪与预测未来数字资源的变化趋势。因此，根据本轮评估结果，在后续的工作中，将会重点关注数据库的使用情况与用户反馈。此外，对各数据库进行模拟停订，从馆藏、经费影响、核心保障率、利用率、学科影响等方面进行评估，评估模拟停订后对中文数字资源建设的影响及效果，以支撑后续科学决策。同时，根据数据库商提供的用量报告，各数据库用量高峰期主要集中在每年的4—6月和10—12月。因此，除了要加强对数字资源全年度用量的监测，还要重点关注用量高峰期用户的使用情况，进一步挖掘用户的隐性需求。

3 启示与思考

3.1 实施全生命周期的数字资源循证评估

图书馆可定期开展数字资源循证评估，将循证评估嵌入数字资源的全生命周期中，包括数字资源的创建、存储、管理、共享、使用等各个阶段，以确保数字资源的质量、可持续性、可访问性等方面得到保障。在应用过程中，具体问题具体分析，如指标的选择需要考虑其全面性和代表性，其次指标的权重分配需要更为精准和科学，以确保评估的准确性和有效性。数字资源在其生命周期的各阶段与各环节体现出不同的作用和价值，图书馆需要对数字资源进行长期有效的动态监管与数据采集，将循证评估内嵌于数字资源的全生命周期中，有助于提高数字资源管理和利用效率。

3.2 选择合适的评估工具和应用场景

数字资源循证评估模型为图书馆提供了一种基于证据开展评估的方法，在实际中可应用于不同的场景，如采购决策、馆藏管理、用户服务、阅读推广、质量控制、费用效益分析等方面。针对不同问题和应用场景，不同的评估内容和侧重点所使用到的评估工具可能会不一样，因此要选择可操作性强、规范化的知识工具，包括访问统计工具、用户调查工具、质量评估工具、数据可视化工具等，以确保评估结果的准确性和可信度。例如北卡罗莱纳大学格林斯博罗分校杰克逊图书馆开展的基于循证的数字资源营销项目，馆员借助问卷调查工具确定影响数字资源利用率的因素，并基于所获得的证据有针对性地开展主题讲座、数字资源系列研讨会等资源推广途径[23]。

3.3 依据评估结果动态调整与优化

循证评估嵌入数字资源全生命周期中，是一个动态闭环过程。可以根据评估结果优化决策，动态调整数字资源建设方向。例如针对数字资源使用情况和成本进行评估，根据结果可对经费进行优化性调整，加强预算编制论证和数字资源分类管理，根据经费投入及实际需求科学调整订购策略。例如耶鲁大学惠特尼医学图书馆基于循证的方法来确定下一年度停订期刊列表，以最高效地利用图书馆的资源。此外，依据评估结果，优化数字资源的可访问性和可用性，加强数字资源宣传推广与整合，基于用户画像进行用户细分，按照不同学科、不同学院、不同受众群体等特征为用户进行个性化和精细化的资源推送。对数字资源进行深度标引与揭示，将数字资源整合到图书馆发现系统、资源门户上，加强交叉学科间的标引关联度，进一步提高数字资源的利用率与使用效益。

3.4 组建数字资源评估工作组

在实际评估的过程中，仅依靠一个部门可能无法保证证据获取的完整性和准确性，因此需要成立数字资源评估工作组，组建一支具备不同技能的馆员队伍，组织跨部门相关人员协作，通过开展全方位、多维度、多层次的数字资源评估，包括制定评估策略、收集数据、分析使用情况、分析成本效益、评估资源质量和可用性、改善服务等方面，强调各个环节证据获取的科学性和严谨性，保障数据的可用性和质量，确保更好地决策和管理数字资源，进一步满足用户需求，推动数字资源的发展。