APP下载

德国高校开放获取机构知识库建设现状研究

2021-12-14

图书馆界 2021年4期

张 伟

(广州图书馆,广东 广州 510623)

1 引 言

开放获取(Open Access,OA)是指对人类生产的科学知识自由和不受限制的获取。经过政府机构、出版行业、教育科研机构和图书馆等近20年的探索和推动,各界对开放获取的重要意义已经达成共识:开放获取能够加速学术知识的及时传播和广泛利用,更大限度地支持学术研究成果的公平可及,有利于加快科技进步和社会创新。机构知识库(Institutional Repositories)是开放获取运动下的重要产物,其与开放获取期刊(Open Access Journals)、学科知识库(Disciplinary Repository)共同构成开放存取运动的三大分支。机构知识库是搜集和保存一个或多个大学知识产出的数字资源集合。机构知识库中收录的资源类型多样,主要包括各种学术研究成果含期刊论文和学位论文;科学实验中产生的一系列实验数据、实验记录和实验结果;软件产品及其相关的技术文档;科研活动中创造的其他智力产品和数字化对象等。高校作为一种有大量学术知识产出的机构,将其学术成果集中缴存和展示,有利于各种数字资源的保存和传播,同时,也有助于相关决策部门及时获知学校和科研人员的学术成果状况,从而更好地制订学科发展规划、资源分配、人才培养调度政策。

2 德国高校开放获取的实践背景

从欧洲乃至整个世界范围内来看,德国都是开放获取运动最坚定的支持者和推动者。2003年,为保证出版物尽可能广泛地传播,由德国研究基金会(DFG)、大学校长会议、科学理事会联合各大学签署《开放获取柏林宣言》,开放获取的概念在德国被明确提出,宣言希望全球科研机构都能参与开放获取运动。2013年4月,德国颁布的《著作权法》的修改议案明确支持作者的二次发表权。该法案提出,学术期刊作者在首次发表论文的12个月之后,有权再次向公众免费提供其作品或者将其作品存储于其他存储库中。2013年5月,德国内阁通过促进公共资金资助研究结果开放获取的草案,针对为期刊作出学术贡献的作者引入“不可分割复用权利”,草案适用于在公共资助研究项目的框架内或制度上受资助的非高校研究机构产生的成果。德国联邦教育与研究部(BNBF)优先考虑资助与开放获取的相关项目。德国研究基金会(DFG)为开放获取项目提供专门的研究基金,资助德国部分大学作者在开放获取期刊上发表论文,同时也支持机构知识库的建设。德国科学组织联盟在2018年启动第三期数字信息计划:计划在2018—2022年期间,针对新的数字化出版形式,通过构建跨数字平台的研究和教学网络、对科学领域中数字出版物的新形式及其作为研究成果的评估、对大量研究数据的机器分析和解读,以及数字时代的科学实践的重要性的研究来推动研究成果的进一步促进科研成果的开放获取。

为推进开放获取的进程,德国马普学会等科研资助机构于2016年3月21日发起倡议,希望2020年起实现学术期刊大规模开放获取,这就是“开放获取OA2020倡议”。为进一步加快开放获取速度,在欧洲研究理事会(ERC)的支持下,欧洲11个国家的科研资助机构于2018年9月4日联合签署一项开放获取计划,即受到公共资金资助的科研项目研究成果从2020年1月1日起必须进行开放出版,这就是“S计划”。“开放获取OA2020倡议”和“S计划”使开放获取由单纯的倡议逐步走向强制或准强制,商业出版机构也不得不作出相应调整,使开放获取又重新成为当下讨论的热点问题。

德国高校作为开放获取柏林国际会议的积极参与者,对开放获取运动起到了极大推动作用。据统计,目前德国已经有250多所大学教育机构签署了《柏林宣言》。根据ROAR的统计数据显示,目前德国在ROAR上登记的OA知识库有242个,占整个ROAR中登记的知识库的5.3%,在世界排名第二,仅次于美国,在欧洲排名第一。德国在OpenDOAR中注册的开放存取知识库已经达到275个,占注册总量的4.9%。

3 样本的选取

本研究选择德国的海德堡大学、慕尼黑工业大学、柏林洪堡大学、弗莱堡大学、蒂宾根大学、法兰克福大学、埃尔朗根-纽伦堡大学、明斯特大学、德雷斯顿工业大学、基尔大学、美因茨大学、维尔茨堡大学、杜塞尔多夫大学、杜伊斯堡-埃森大学、波鸿鲁尔大学、莱比锡大学、斯图加特大学、雷根斯堡大学、耶拿大学、科隆大学、柏林自由大学、汉堡大学、卡尔斯鲁厄理工学院、亚琛工业大学、乌尔姆大学、柏林工业大学、哥廷根大学、慕尼黑大学、汉诺威医学院和波恩大学30所高等学校作为研究的样本。

以上样本的选择基于以下三个方面考虑:一是在开放获取知识库的建设、服务、技术、版权和评价等方面有一定的进展;二是资料的可获得性;三是参照在世界大学排名中心(CWUR)和德国开放获取知识库排名网站(OARR)的排名情况。

4 德国高校机构知识库资源的建设及运营

4.1 机构知识库资源分布情况

本研究所调查的30所德国高校均建立了自己的机构知识库。其中,除汉诺威医学院因为网络问题未能查询到相关数据,其余29所高校共建设了41个机构知识库。据统计,拥有1个机构知识库的高校有20所,占比69%;拥有2—4个机构知识库的高校共有9所,占比31%。通过进一步分析,拥有多个OA知识库的高校会以按照学科或者文献类型来划分不同的知识库,方便用户检索和利用。例如,柏林自由大学的网络文献库和在线学位论文库,哥廷根大学的GOEDOC文本库、GeoScholar地理学科学术文献库、eDiss学位论文库、GEOLEO地球系统与宇宙学科知识库,海德堡大学的heiDOK文档存储库和heiDATA数据档案库等。

表1 德国各高校机构知识库数量统计表

4.2 机构知识库资源的组织和利用

机构知识库主要收藏本机构在科学研究中所生成的各种原生资源。从文献揭示的深度来说,应当包括期刊论文、学位论文、研究报告、实验数据等;从载体来说,应该包括除纸质文献的各种数字化对象,如电子文献、磁介质文献、光介质文献和其他多媒体文献等,因此,如何进行资源的有效组织和利用就是各个高校需要解决的重点问题。在资源的分类上,德国各高校采用的是平行交叉分类的方法,分类标准有学院/机构、出版年份、作者、文献类型、DDC、主题、文献集成、语言、领域和载体类型。其中,学院/机构和出版年份是两个主要分类标准,原因是学校主要负责OA机构知识库的整体规划和架构设计,具体的资源建设是由图书馆联合各个学院/机构完成,反映的是机构知识库主要特点——机构性。同时,OA机构知识库的资源都是电子资源,对时效性有一定要求,而出版年限是衡量时效性的重要指标。此外,如文献类型、DDC、主题反映的是文献的内容(学科和专业)特征,因此作为第二分类标准。而语言、文献集成、载体类型反映文献的形式特征,作为第三分类标准。

在资源的检索和利用方面,这30所高校OA机构知识库提供了多种检索途径和检索方式,包括目录式检索、简单检索、高级检索、一站式检索、全文检索和元数据检索。目录式检索作为最基本的检索方式,即将各种资源按照文献类型、主题、语言、领域、载体类型等大类排列组织起来,用户可以直接按类层层点击浏览;简单检索即直接在检索框中输入相关检索词,检索结果将按照相关性顺序排列;高级检索支持字段检索,提供了题名、作者、关键词等多个字段和检索途径,检索结果精确,检准率高;一站式检索主要是在拥有两个以上机构知识库的高校采用,可以帮助用户在不同OA机构知识库之间进行跨库检索,提高检索效率;另外,蒂宾根大学、明斯特大学、杜塞尔多夫大学、乌尔姆大学、莱比锡大学和斯图加特大学等6所高校还提供了全文检索,而乌尔姆大学则是唯一一个同时支持全文检索和元数据检索的高校。

资源的获取主要是通过E-mail和RSS两种方式。因为在这30所高校中,大部分高校的检索结果只有题录和摘要信息,只有6所高校提供全文检索结果,如果要获取原文需要向OA机构知识库进行请求,由系统将需要的资源通过邮件的方式发送给用户。如果用户希望持续跟踪某个领域或者主题的文献,则可以通过RSS进行订阅和关注,由系统自动推送相关资源到用户邮箱。

4.3 机构知识库软件及技术实现

软件是构建机构知识库的核心和基础设施,选用何种软件将直接影响机构知识库的建设和运行质量。从国际范围内来看,目前由于各个机构在所属领域、机构构成、资源状况、用户需求等方面的不同,导致机构库系统软件的种类繁多。美国开放社会研究所(OSI)提供的《机构仓储库软件指南》(A Guide to Institution Repository Software)中列出了9个IR系统软件,如Archimede、ARNO、CDSware、Dspace、Eprints、Fedora、i-Tor、MyCoRe和OPUS等。在本研究所选的30个样本中,除波鸿鲁尔大学、耶拿大学、波恩大学、卡尔斯鲁厄理工大学、亚琛工业大学和汉诺威医学院6所高校未明确所使用的IR系统软件之外,通过对其余24所高校进行统计分析发现,德国高校构建机构知识库的软件主要分为三大类:开源仓储软件,如Eprints和DSpace;独立仓储软件,如MyCore;区域性仓储软件,如OPUS、MPGEdoc等(见表2)。

表2 德国24所高校机构知识库软件统计表

4.3.1 开源仓储软件。Eprints是由英国南开普敦大学设计,面向学术研究机构进行开放获取资源系统构建的开源软件。在一个Eprints软件下可以同时安装和运行几个独立的机构知识库,他们拥有共同的底层源代码,但是各自的构造方式却不同。它对OAI协议具有良好的兼容性,能够满足不同机构知识库之间的互操作要求。Eprints因此成为创建机构知识库最快捷、成本最低的一种方式,未来能够适应由开放获取期刊、科学数据、学位论文、报告和多媒体等资源共同组成的混合型知识库的要求。全世界范围内有超过200个机构采用该软件,在德国已有海德堡大学、慕尼黑大学、克隆大学、乌尔姆大学和雷根斯堡大学等5所高校使用,并且在此基础上进行了拓展,开发出了适合本机构的不同版本。

DSpace是由MIT和惠普公司在2000—2002年合作开发的,以实现对大学科研成果的采集、发布、永久保存及开放访问为目的的开放源代码数字资源存储库。最初只是搜集MIT成员的研究报告、数据库、音频和视频及其他格式的重要文件,由于其开源特性,延伸出各种不同的版本,被世界范围内的多个机构和高校所采用。它能够实现对文本、音频、视频和图像等各种不同种类信息的存储与管理。Dspace以社群概念来设计系统结构,这种设计支持学校、部门、研究中心和其他大型研究机构共同使用,同时,允许各个机构根据自己的需求定制系统的工作流程和其他相关策略。其基本的技术架构为存储层、业务逻辑层和应用层,与此相对应的三个界面分别服务于资源提交者、终端用户和系统管理员。由于其支持分布式的内容管理和多样性的工具集成,DSpace目前已经成为世界范围内应用最广泛的机构仓储软件。在德国,蒂宾根大学和哥廷根大学使用此软件,并且在原有版本的基础上进行了深度开发。

4.3.2 独立仓储软件。MyCore是德国杜伊斯堡-埃森大学的多媒体技术与学习主机项目的成果,随后由各个大学联盟进行进一步开发,目的是提供一种支持数字图书馆和机构仓储的软件包。它提供一个基于“核心”功能的示例应用程序,来指导用户使用元数据配置文件构建自己的应用程序。它的“核心”功能包含建立机构仓储所需的分布式检索、OAI接口、流媒体文件管理和元数据在线编辑技术等,通过本地配置就可以满足不同知识库的特定需求。杜伊斯堡-埃森大学是其主要建设者和推动者,也是该软件的忠实用户。该软件除了能够进行IR资源的管理,在商业性内容管理方面也具有良好的前景,可以用于更大规模的机构仓储。因此,柏林自由大学、基尔大学、杜塞尔多夫大学等3所高校也积极跟进,利用此软件建立本机构的IR系统。

4.3.3 区域性仓储软件。斯图加特大学在线出版系统(OPUS)是由斯图加特大学计算机中心和图书馆在1998年开发的,目的是为教师、学生和机构成员提供一个可以管理自己的电子出版物如发表和未发表的文章和学位论文的系统。该项目最初由德国研究网和德国联邦高等教育部共同资助,目前由斯图加特大学资助。OPUS软件被约70多所德国大学用于管理本机构的电子出版物,并且该系统支持在所有使用该软件的机构知识中进行元数据检索,但并不是所有机构都使用OPUS作为它们的存储库平台。大多数OPUS是由机构的图书馆进行管理和运营,也有一部分是由大学图书馆、出版社或者学术计算机中心负责。OPUS的接口和文档主要是德语,并且目前软件的所有应用也都在德国,因此,对德语国家的存储库的实施具有最直接的吸引力。

4.4 机构知识库的评价

OA机构知识库作为科研人员进行学术交流的一个平台,其资源的质量成为研究者关注的一个重要指标。一般来说,科研人员会将学术质量较高的科研成果发表,以展示自己的科研进展和科研水平。科研人员提交给OA机构知识库的文献有两种形式,一种是预印本(Preprint),另一种是后印本(Postprint)。后印本论文多是已经在传统的纸质期刊上发表过的论文,这部分论文经过了严格的同行评议,得到了本领域内专家的认可,论文本身的质量和学术价值相对来说比较高。而对于预印本来说,有以下三种形式:1)未经发表的原始研究成果;2)已经投稿等待发表的成果;3)已经投稿但是未被录用的成果。以上三种形式的预印本严格来说都是未经同行评议的,论文的质量难以保证。不可否认的是在所有开放获取仓储内,有相当一部分质量不高的预印本论文,这也是导致开放获取仓储难以成为主流学术交流平台的关键原因。因此,不同类型的开放获取仓储都有自己相应的质量控制和评价机制。目前,世界各国在各开放仓储的评价包含资源数量、学科分布、回溯时间、更新速度和服务水平等5个指标,但是,这些指标太过笼统,缺乏可操作性,难以科学、公平地评价各机构知识库的实际情况。

在德国国内机构知识库的评价工作具体是由开放获取机构知识库排名(OARR)网站来负责的。OARR是由德国、奥地利和瑞典三国的高校和科研机构发起的OA知识库评价项目。该项目的最重要的工作就是对发起国的各科研机构和高校OA知识库进行排名。OARR的调查委员会认为,没有对比就没有进步,其创立的目的是希望通过排名揭示OA知识库的最佳模式,使OA知识库的建立者认识到其中的不足,从而提高自己的服务。OARR从2014年开始每年评价一次,排名结果在当年9月份的Open-Access-Tage会议上公布。每年1月之前,OARR会在最新的排名中列出每个开放获取存取库。随后会联系该存储库的管理员,通过在线表单提交其数据。在此过程中,OARR将管理员视为最可靠的信息来源,以最大限度地减少索引中的潜在错误数量。管理员所提交数据中的所有留空字段将被视为不存在,相应的分数记为0。最后由OARR团队来审查提交的所有数据,以确保结果的质量和有效性。

目前,OARR的评价体系共有可用性(Usability)、增值服务(Value-added Services)、元数据(Meta-data)和互操作性(Interoperability)4个一级指标和41个二级指标(见表3)。每个一级指标和二级指标都被赋予了一定的权重(分值),通过对各个指标进行综合评价后给出一个总分数(满分100分),以此作为排名的依据。OARR强调,因为开放获取的发展日新月异,因此,这些指标不可能是静态的,并且OARR未来的新版本可能会和以往的任何版本都不同,甚至可能更复杂。OARR团队每年都会根据各开放获取知识库的反馈及时对指标进行增减,对指标进行补充说明或者解释,调整指标的权重。因为OARR的评价团队是由不同国家的开放获取研究专家组成的第三方评价机构,因此,能够保证在评价指标的设计、数据的审核、评价的开展以及最后的评分方面保持中立和客观,评价的结果更有说服力。德国共有25所高校的31个OA知识库进入该排名,其中,雷根斯堡大学的Publikationsserver der Universität Regensburg知识库以89分名列榜首,乌尔姆大学的DBIS EPub知识库以36分排名最末,31个知识库平均得分为60.7分,低于平均分的OA知识库有16个,占总数的52%,即其中有一半的高校机构知识库难以达到标准。考虑到OARR排名的目的,若以得分最高的雷根斯堡大学作为最佳范例,大部分高校还有较大差距,建议各高校借鉴雷根斯堡的大学的经验,参照OARR的标准并结合本机构的实际情况加以完善和提升。

表3 开放获取机构知识库(OARR)评价指标(1)资料来源:作者根据OARR网站整理。

续表3

4.5 机构知识库与著作权保护

德国高校普遍采用的绿色开放获取模式是最容易与传统出版产生冲突的一种方式,因此,如何界定图书馆、作者和出版商三者之间的权利界限,保护各利益相关方的著作权成为各高校机构知识库建设中重点关注的问题。

首先,需要界定的是读者的权利。作者对其作品的人身权一直存在,而财产权如果转让给出版商,则由出版社拥有,但是作者的二次公开权由德国版权法赋予,不受出版合同制约。这样既提高了对著作权的保护水平,也肯定了开放获取在促进教育和科研方面的作用。能否保证双方利益的平衡,关键在于作者对版权法和第三方合同是否严格遵守。其次,是出版商的权利。如果出版商与作者签订了著作权转让协议,即相当于获得了对该作品的独家使用权,在未达到二次公开所规定的期限(一般为12个月)之前,出版商有权利拒绝作者将其作品通过其他途径出版或者存入机构知识库。这样既没有忽视作者对作品创作所付出的劳动,也使出版商能在一段时间内获得相应的经济收益。再次,是对图书馆的权利。图书馆是机构知识库的具体建设者和运营者,既不参与作品的创作,也不参与出版社的利益分配,只起到资源保存的作用,因此,图书馆的权利范围较窄。图书馆对作者存入其知识库的资源拥有永久使用权,但是这种使用权是非独家、非营利性的,即图书馆可以将作者的作品存储到其他载体中,可以以教育和科研为目的对作品加以使用,但是不能限制作者将作品再次存储或者二次出版。

4.6 机构知识库建设中的国际合作

随着世界范围内开放获取运动的深入开展,各个机构在资源建设、技术储备和服务能力方面的问题开始显现,以单个组织或机构为主导的开放获取建设模式已经难以满足现阶段开放获取实践的要求,因此,机构之间的合作成为开放获取进一步发展的现实需要。在这种背景下,各种跨领域、跨地区甚至跨国的开放获取联盟开始发展起来,各联盟成员之间通过项目或者计划的形式来开展合作以解决当前面临的各种问题。德国各高校通过多种方式和途径来与各个机构和组织开展合作:1)同周边国家开展合作。例如,与奥地利、瑞典等国合作建立开放获取信息平台(http:∥openaccess.net)和OARR开放获取机构知识库排名网站,致力于推动地区开放获取的发展,最大限度地实现资源共享。2)参与欧盟开放获取项目。例如,加入欧盟EP7框架计划、OpenAIRE和SHERP等开放获取学术交流项目,提升在欧洲范围内的开放获取的影响力。3)积极参与诸如COAR和SHERPA等国际性开放获取组织,争取世界范围的合作,提高开放获取的水平。

5 德国高校机构知识库建设的特点

通过对德国30所高校机构知识库建设的现状进行调查分析发现,德国高校在机构知识库资源的建设上呈现出以下几个特点:

一是资源的建设和利用并重。机构知识库作为各高校全面搜集本机构科研成果的主要平台,通过制订本机构的开放获取政策,建设专门的平台或系统、资源的有效组织、资源的多途径检索等推动了知识库的建设。随着各高校的大力建设和推介,凭借优质的资源和良好的服务,知识库在德国高校的科研发展和学术交流的推动作用逐渐显现。

二是平台软件的开放性和定制化相结合。选择何种平台和软件来构建OA资源体系直接影响着OA资源的建设和服务质量,因此,德国各高校一般根据本校的教学科研特点、资源的整体状况和服务的需求来选择相应的平台和软件。基本的要求是开放性和定制化相结合,开放性是指平台和软件首选开源软件平台,并且能方便地进行部署和扩展,定制化各高校根据自身情况来购买或者开发自己的知识库管理软件。例如,MyCore是一款独立仓储软件,需要收费,因此,在调研的30所德国高校中仅有4所大学使用;而OPUS是斯图加特大学开发的一款区域性仓储软件,由于其具有良好的阔爱占星和适应性,对德语有很好的支持,因此,在德国国内有70所大学使用此软件。此外,还有慕尼黑大学资助开发的media TUM、柏林洪堡大学的PEGEdoc、佛莱堡大学的FreiDok plus和明斯特大学的memory-alpha。

三是科学而规范的评价机制。在机构知识库的评价方面,德国已经拥有一个相对科学和规范的评价体系,即开放获取机构知识库(OARR)排名,OARR由两级指标构成,评价指标每年会根据实际评价结果和各成员库的反馈进行动态的调整,一级指标体系目前稳定为4个,只是权重有所变化,新的趋势是该指标体系在元数据和互操作性方面的权重有所增加。随着奥地利和瑞典的加入使该评价系统在欧洲范围内的影响力日益提升,OARR委员会希望未来能将该评价系统扩展至全球。

四是广泛和深入的合作渠道。德国高校在开放获取领域的合作广泛深入,合作内容多样。1)国家层面的合作项目。例如,与奥地利国家图书馆合作建立期刊数据库ZBD,该数据库由超过 3 700 多个图书馆联合创立,数据总量超过 1 500 万条;由德国、奥地利和瑞典联合建立的OARR,目的就是揭示OA知识库的最佳模式,使各个机构知识库之间相互学习,提高开放获取的服务水平。2)跨地区和跨组织的合作项目。例如,全球开放获取知识库联盟、欧洲学术出版与学术资源联盟、德国国家数字信息计划、OpenAIREh、OpenDOAR等项目。3)与商业OA出版机构的合作。例如,PloS、BMC、BMJ、RSC和国际高能物理学会等。合作内容包括资源的联合建设和评价、资源的跨库检索、数据的互操作、开放出版协议等。

6 结 语

中国作为2003年《开放获取柏林宣言》的先期缔约国之一,政府和科研资助机构从政策和实践两个层面对开放对学术资源的开放获取表达了支持。在政策层面,李克强总理在全球研究理事会2014年北京大会上的致辞中明确表达了对开放获取的支持。2014年5月,国家自然科学基金委员会发布《关于受资助项目科研论文实行开放获取的政策声明》,中国科学院随后也发布《关于公共资助科研项目发表的论文实行开放获取的政策声明》。在实践层面,以国家自然科学基金委、中国科学院及其下属各研究所为代表的科研机构和以厦门大学、清华大学、浙江大学等为代表的部分985高校在开放获取机构知识库的建设、运营、管理等方面取得了不错成果。但是,大部分高校在资源建设、服务水平、资金支持、技术储备、资源和服务的评价机制等方面还有许多待解决的问题。未来,国内高校还需要继续深入研究不同国家高校机构知识库建设的现状及经验,结合国内各高校的情况,提升国内高校机构知识库建设、管理和运营水平。