全球图书馆开放获取和开放内容现状调查与启示
——基于《图书馆开放内容活动:方向相同,轨迹不同——来自2 0 1 8年OCLC全球理事会调查结果》报告解读
2022-02-14宗兴慧罗皓洁山东理工大学信息管理研究院
宗兴慧,王 芳,罗皓洁(山东理工大学信息管理研究院)
自国际学术界、出版界、图书情报界为推动科研成果及人文信息的广泛交流而采取开放获取(Open Access,OA)以来,OA期刊和仓储得到迅速发展。2018年,联机计算机图书馆中心(OnlineComputer Library Center,OCLC)全球理事会与OCLC Research合作开展了一项关于全球图书馆基础开放内容的调查,希望进一步了解全球图书馆开放内容活动的现状[1],其将广义的开放内容定义为“免费提供、不受限制、任何类型在线内容的全部范围”,包括科学OA期刊文章、专著和预印本,以及其他类型的开放资料、开放教育课程、政府文件、灰色文献、数据集、数字化特殊馆藏和其他遗产馆藏、可免费获取的视频、软件、工具或其他类型的原始数字资源。2020年7月1日,OCLC发布《图书馆开放内容活动:方向相同,轨迹不同——来自2018年OCLC全球理事会调查结果》(以下简称《图书馆开放内容活动》)报告[1],该报告通过对图书馆开放内容活动的广泛定义以及对全球图书馆开放内容活动现状的广泛调查,为图书馆界开展开放内容活动提供了崭新的视角。
1 报告的特点
1.1 报告内容的全面性
《图书馆开放内容活动》报告共38页,包括前言、摘要、引言、调查范围和方法、关于受访者、调查结果、讨论、致谢、附录9部分。调查结果部分包括当前和计划中的活动类型、活动开展年限、活动投资金额、活动成功性评价、提升活动影响力的最佳范围及OCLC在全球开放内容活动支持方面的作用等内容。该调查报告有助于全面了解全球图书馆开放获取与开放内容的现状以及其他相关内容。
1.2 调查过程的严谨性
该报告以研究型图书馆与大学图书馆的开放内容活动为研究对象,将研究型图书馆与大学图书馆的开放内容活动作为一个整体予以考察,体现出调查研究的系统性。报告主要采用访谈法收集数据,调查样本由来自69个国家的511个受访者构成,涵盖了不同制度文化背景下的开放内容活动,体现出调查研究的多样性。在调查结果分析中,使用大量图表进行数据分析,体现出调查研究的可靠性。
1.3 具有实践指导意义
该报告一共收集了14项开放内容实践活动以及不同国家在开放内容活动中的政策支持。该报告从开放内容活动实践出发,到调查报告结果总结,紧扣报告主题,肯定了OCLC对全球开放内容活动的支持以及疫情防控期间开放内容活动的贡献,能够指导图书馆应对开放内容活动中的挑战,对图书馆开展开放内容活动具有实践指导意义。
2 报告核心内容分析
在调查过程中,考虑到不同国家的图书馆在开展活动中呈现出的差异性,调查组设计了一组在访谈过程中可以使用的开放内容活动作为参考,以便全面掌握与开放内容相关的图书馆政策、活动和服务范围。开放内容活动被划分三个类属(开放内容生产、开放内容的可发现性和可用性、开放内容的收集和管理)14项开放内容活动。首先,开放内容生产,包括开放内容推广(目的是使人们获取到开放内容,包括数据标准化工作和员工培训)、开放内容出版(即作为出版商的图书馆)、数字化馆藏(包括明晰数据开放共享产权以及在公共领域提供馆藏资源)、支持作者/研究人员/教师创建开放内容、数据服务(即开放研究数据管理的活动)、文献计量服务。其次,开放内容的可发现性和可用性,包括用户数字素养教育(包括广泛的后台工作,使外地制作的开放内容能够在本地使用,如链接到开放内容的目录或lib指南以及电子资源管理许可证)、选择非图书馆管理的开放内容、促进开放内容的可发现(使开放内容更易于查找和使用,如设置OA按钮)、与开放内容的深度交互(即通过统计和机器学习技术与数字化开放馆藏交互,包括帮助用户与开放内容进行交互的服务与平台,如用于文本挖掘或数据可视化工具的API)、评估。最后,开放内容的收集与管理,包括机构知识库、数字图书馆、原生数字(合法化)馆藏/网页存档等。
2.1 图书馆参与开放内容活动的积极性提升
在“图书馆当前和计划开展的活动”问答方面,97%的受访者表示正在参与当前的开放内容活动,74%的受访者计划在当前活动之外参与新的开放内容活动。由表1可知,在当前参与的开放内容活动中,机构知识库是参与度最高的活动,其次是用户数字素养教育和促进开放内容的可发现。在计划参与的开放内容活动中,每一项开放内容活动都有11%~18%的图书馆计划参与,其中数据服务以及与开放内容的深度交互是计划参与度最高的活动,这在一定程度上表明图书馆参与开放内容活动的积极性正在提升。
由表2可知,除数据服务和与开放内容的深度交互外(由表1可知这两项活动是计划参与度最高的活动),评估、数字图书馆、开放内容出版、促进开放内容的可发现、原生数字(合法化)馆藏/网页存档、文献计量服务及开放内容推广是未来较受关注的开放内容活动类型。同时,不同国家在计划开展开放内容活动方面存在差异。在德国,数据服务和促进开放内容的可发现排名较高;在英国,数据服务、评估和开放内容出版排名较高;在加拿大,数据服务和评估是计划开展较多的活动;在荷兰,与开放内容的深度交互及开放内容出版是计划开展较多的活动;在美国和澳大利亚,评估和数字图书馆占比较高。
表1 当前参与和计划参与的开放内容活动
表2 按国家分类的图书馆计划参与的活动类型(占比20%及以上)
2.2 图书馆开放内容活动的参与度受国家开放政策影响
在“不同国家图书馆参与当前开放内容活动”问答方面,可以揭示出一些有趣的现象。如表3所示,在14项开放内容活动中,澳大利亚、加拿大、荷兰和英国在绝大多数活动的参与度上都要高于样本平均值,而美国有一半的开放内容活动低于样本平均值。出现这种差异的一个重要原因是国家开放政策。如,英国在评估、澳大利亚在文献计量服务方面远高于平均水平,与英国的科研质量评价框架及澳大利亚的卓越研究报告有密切关系,这些国家开放政策对评判科研活动资助经费和评价机构科研实力产生了重要影响。此外,在国家的资助机构中,英国、澳大利亚、荷兰要求那些被资助的科研项目成果要以开放的形式提供,欧盟“地平线2020”计划也要求经同行评审的科学出版物和科研数据能够开放获取。
表3 不同国家图书馆当前参与开放内容活动的类型
2.3 图书馆开放内容活动的成功性评价不一
在“当前参与的开放内容活动(基于您的衡量标准)有多成功”问答方面,超过一半的受访者认为其参与的开放内容活动是成功的,不到十分之一的受访者认为活动没有成功,10%~20%的受访者表示他们对开放内容活动的成功没有衡量标准。由表4可见,受访者在对非常成功的开放内容活动评价上呈现出国别差异。机构知识库在美国、英国和荷兰被认为是非常成功的开放内容活动,而在机构知识库上参与度最高的澳大利亚却没有将此项活动评价为最成功的开放内容活动,而数字化馆藏、开放内容出版、数字图书馆被认为是最成功的活动。由此可知,图书馆在对开放内容活动的成功性评价方面是以个人主观评价为主,缺乏客观统一的评价指标。
表4 不同国家非常成功的开放内容活动
2.4 图书馆开放内容活动的开展年限不同
由表5可知,在“当前参与的每项开放内容活动开展年限”问答方面,有一半的受访者表示曾参与过这14项活动中的12项,并且参与时间都超过三年。在当前参与的开放内容活动中,有超过70%的受访者表示在机构知识库、数字图书馆、数字化馆藏、支持作者/研究人员/教师创建开放内容这4项活动中有三年以上的参与经验。在开展年限1—3年的活动类型中,与开放内容的深度交互、评估、数据服务、促进开放内容的可发现、选择非图书馆管理的开放内容这五个活动类别占比比较大。在开展年限小于一年的活动类型中,占比最高的两项开放内容活动是评估和文献计量服务。另外,大多数图书馆(69%)表示没有停止任何开放内容活动,在少数停止开放内容活动的案例中,其综合原因是财务因素和活动对机构价值的不确定性。通过研究图书馆开放内容活动的开展年限可以发现,图书馆在整个开放内容活动中的参与范围越来越广,且参与度与成熟度具有相关关系。
表5 当前参与的开放内容活动的开展年限
2.5 量化开放内容活动投资额存在困难
在“当前参与的开放内容活动的资金来源(预算项目、FTE分配、项目专项资金)”问答方面,70%或更多的受访者可以表明资金来源的活动是:机构知识库(79%)、数字化馆藏(76%)、数字图书馆(74%)、数据服务(74%)、开放内容出版(72%),并且前三项活动也是参与度和成熟度较高的活动。由表6可知,在预算项目中,机构知识库和数字图书馆占比最高,究其原因,这两项是产生主要年度运营成本的服务(软件、硬件、托管费用、财团费用等);在FTE(全职人力工时,也称相当全时工作量,是对从事科技活动人员投入量的一种测算方法)中,数据服务排名第一,其次是文献计量服务,表明这两项活动的开展需要依赖更多的专业知识和工作人员;在项目专项资金中,数字化馆藏占比最高。此外,受访者普遍只能具体说明当前参与的开放内容活动的资金来源,无法说明图书馆在当前参与的开放内容活动上的投入和支出,也不能提供在当前参与的开放内容活动上的预算支出占图书馆预算总额的百分率,其原因在于大多数图书馆在预算编制和规划实践中通常不会区分开放内容和付费内容。
表6 开放内容活动的资金来源
2.6 机构是提升开放内容活动影响力的最佳范围
在“开放内容活动提升影响力的恰当范围是什么”问答方面,45%—79%的受访者认为“机构”和“地方”是最佳范围。另外,在提升具体某一项开放内容活动影响力的最佳范围上呈现出一定的差异(见表7)。如机构知识库、原生数字(合法化)馆藏/网页存档、数字图书馆、开放内容出版以及与开放内容的深度交互这几类活动在“全球”范围比例仅次于“机构”,说明这些活动除了在“机构”还适合在“全球”范围内开展。此外,值得注意的是,不同受访者对于“最佳范围”观念的差异也与国家开放获取和开放内容所处的阶段不同有关。如,随着英国开放政策的不断深入,图书馆已经从国家宣传工作过渡到地方执行国家任务阶段,因此英国受访者表示提升活动影响力的最佳范围是“机构”与“地方”,而在“国家”范围提升的影响力较小。
表7 提高影响力的最佳范围
2.7 OCLC与图书馆开放内容活动最相关的研究领域
在“以下哪个OCLC研究领域与您的开放内容活动最相关”问答方面,大多数受访者表示,促进开放内容的可发现、元数据的标准化、优化资源共享、研究数据管理、特殊收藏与档案及链接数据是与图书馆开放内容活动最相关的研究领域。此外,一些发展中国家图书馆希望OCLC能够围绕开放获取和开放内容方面的专业发展,为他们提供更多有关开放内容研究和培训方面的帮助。如,巴哈马图书馆希望OCLC能提供关于开放内容研究和培训的现有文献和倡议;纳米比亚图书馆建议OCLC为图书馆员提供短期在线的专业发展课程,创建一个知识库平台,使图书馆员能够存放其开放内容,从而通过社交网络分享对课程学习的反馈;尼日利亚图书馆表示在非洲,开放内容活动概念仍然相对较新,图书馆员在这一领域需要大量的培训,但仍然相信未来能够在开放获取和开放内容方面有所作为[1]。
3 讨论
3.1 全球图书馆在开展开放内容活动中呈现出的共性
调查显示,在14项开放内容活动中,图书馆的参与度正在不断提高,相比其他类型图书馆,研究型图书馆和大学图书馆更可能参与到大多数的开放内容活动中。绝大多数图书馆正在加紧当前参与以及计划参与开放内容活动,并且他们认为所参与的开放内容活动是成功的。超过一半的受访者希望提高他们所参与的开放内容活动的影响力。图书馆的数据服务活动有望加快,并且数据服务在提高开放内容活动影响力、未来规划和资金来源方面的比重相对较高。图书馆对评估和文献计量服务的参与度增加,表明人们对收集有关开放内容活动数据的兴趣日益增加。对于大多数受访者而言,在其参与的开放内容活动中提高影响力的恰当范围是“机构”和“地方”。
3.2 全球图书馆在开展开放内容活动中呈现出的差异
机构知识库、数字图书馆和数字化馆藏是参与度和成熟度最高、预算资金覆盖范围最广、成功率最高的开放内容活动,其他开放内容活动普遍不够成熟,也没有足够的资金保障。但值得一提的是,数据服务在资金和速度方面都具有很强的优势,因此我们可以预测它将成为未来的增长领域。除此之外,在开放内容活动的参与度、成熟度及成功率方面,国家之间存在差异。在某些情况下,如在开放内容推广、数据服务和文献计量服务方面,国家间的差异也反映了不同国家采取的开放科学政策差异。
3.3 图书馆在量化开放内容活动的投入资金上存在困难
对于大多数图书馆来说,量化开放内容活动的投资额存在困难,即受访者可以指出当前每项开放内容活动的资金来源,但是却无法说明图书馆在当前参与的开放内容活动上的投入和支出,也不能提供在当前参与的开放内容活动上的预算支出占图书馆预算总额的百分率。
3.4 新冠肺炎疫情潜在地推动图书馆开放内容活动的实施
该调查数据收集时间为2018年底至2019年初,反映了新冠肺炎疫情之前的时间快照。疫情发生后,全球图书馆迅速以开放的方式提供与新冠肺炎相关的科学文献、发现和数据集,帮助医疗机构加快研究进度,这对大规模开放研究数据和科学信息无疑是一个巨大的推动。从前在线获取资料的重要性从未像新冠肺炎疫情防控期间那样引人注目,可以说,疫情的到来直接对图书馆支持开放内容活动的实施产生了重要的影响。
3.5 OCLC在支持开放内容活动中所发挥的作用
图书馆认为未来OCLC在支持其开放内容活动,特别是在开放内容可发现性和可用性方面发挥着重要作用。同样,他们认为OCLC在研究开放内容的可发现性和元数据的标准化方面是与图书馆开放内容活动最相关的两个方面。OCLC主要通过以下方式支持开放内容,同时提高开放内容的可见性和可发现性:①记录来自出版商、图书馆馆藏和WorldCat第三方的开放内容;②支持开放获取发现过滤器并将Unpaywall集成到发现产品中;③建议在MARC21中指明OA访问和许可元数据;④参与国际图像互操作框架(IIIF)工作,在CONTENTdm中实施IIIF,并尝试在开放馆藏中发现资源;⑤开发通用的AI工具,帮助用户在超大型元数据集和文本语料库中探索实体和上下文;⑥帮助订阅管理者跟踪期刊资料包中的开放获取资源比例,并对开放获取和许可内容使用进行比较,协助图书馆的规划和决策;⑦开展用户行为研究,重点是“在用户的生活中思考图书馆”,尤其是用户不断发展的信息检索、获取和再利用行为[1]。
4 调查报告对我国图书馆开展开放内容活动的启示
4.1 提升图书馆开放内容活动的参与度
调查结果显示,机构知识库、用户数字素养教育和促进开放内容的可发现是当前图书馆参与较多的活动,我国图书馆目前对这三项活动有较高的参与度,如我国在高校和科研系统中共开设279个机构知识库列表,其中约92%的高校机构知识库元数据量在10万条以上[2]。今后,我国图书馆需要继续深入开展图书馆开放内容活动,提高14项开放内容活动的整体参与度,尤其是新兴活动,如与开放内容的深度交互、评估、数据服务、促进开放内容的可发现、选择非图书馆管理的开放内容、文献计量服务等。这些新兴活动是图书馆参与开放科学的一个很好的切入点,我国可以先由全国性的图书馆联盟或协会、组织来全面推进和指导图书馆开展开放内容活动,同时加强开放内容活动设施建设,使图书馆具备开展开放内容活动的硬件条件,为用户提供有效的开放内容活动服务。
4.2 积极推进国家开放政策的制定
调查结果显示,图书馆开放内容活动的参与度受国家开放政策影响。我国目前已经制定了一些开放政策,如国家自然科学基金委员会和中国科学院分别发布的《国家自然科学基金委员会关于受资助项目科研论文实行开放获取的政策声明》和《中国科学院关于公共资助科研项目发表的论文实行开放获取的政策声明》,用于支持公共资助的科研论文的开放获取[3]。今后,我国可以借鉴英国、澳大利亚、荷兰等国家的先进经验,如英国的科研质量评价框架、澳大利亚的卓越研究报告等,积极参与开放获取政策的制定,与科研基金资助机构、研究人员、学术团体、出版商共同努力,促进我国图书馆开放内容活动的实施,从而构建更为开放、公平、高效的学术生态环境。
4.3 推动图书馆“后疫情时代”开放内容活动的实施
疫情发生后,全球图书馆迅速作出反应,以开放的方式提供与新冠肺炎相关的科学文献、发现和数据集,可以说,新冠肺炎疫情的暴发直接对图书馆支持开放内容活动的实施产生了重要的影响。因此,在疫情防控期间,图书馆要及时对大流行病开放内容活动情况进行整理与分析,发现其中的新进展以及产生的新问题,并提出相应的研究思路与对策。另外,针对疫情防控常态化及疫情防控期间的高校网络教学,高校图书馆应积极行动起来,积极开展诸如线上读书会、实施阅读推广、共建教学平台、设立学科馆员、加入在线课程等方面的工作,推动开放内容活动的发展进程,为图书馆开放内容活动在后疫情时代的继续发展扫除障碍,使图书馆的发展能够不断适应新环境下的各种新需求。
4.4 加强与OCLC等相关机构的合作
调查结果显示,OCLC在支持开放内容活动尤其是技术层面发挥了积极的作用。近几年,我国图书馆开始注重对开放内容技术领域中新技术的应用,如国内第一个区块链图书馆(前海区块链图书馆)于2017年建成[4],天津大学AI“智图”机器人研发成功并投入使用[5],复旦大学在2019年底引入了IIIF即国际图像互操作框架[6]。但是,国内图书馆仍然缺乏自有的、统一的开放内容技术框架[7],因此,国内图书馆应积极开展与OCLC等相关机构的合作,牢牢抓住技术发展带来的契机,积极在开放内容活动方面进行突破,不断改革与创新,同时结合国内实际情况,在理论研究和实践探索中有选择地实施和改进,从而为图书馆提供更高效、便捷的开放内容[8]。
4.5 合理量化图书馆开放内容活动的投资额
调查结果显示,大多数图书馆对于量化开放内容活动的投资额存在困难,即受访者可以指出当前每项开放内容活动的资金来源,但是却无法说明图书馆在当前参与的开放内容活动上的投入和支出,也不能提供在当前参与的开放内容活动上的预算占图书馆预算总额的百分率。因此,国内图书馆要根据实际情况,吸取全球图书馆在开放内容活动方面的经验,在预算编制和计划实践中区分开放内容和付费内容,探索新形势下的资金重组模式,认真研究开放内容活动的资金量化机制,为今后的图书馆资金量化工作打好基础。