论开放存取资源的整合利用
2015-11-14章丽姗
章丽姗
(中共湖北省委党校,湖北 武汉430022)
一、问题的提出
开放存取(Open Access,简称OA)是国际科技界、学术界、出版界、信息传播界为推动科研成果利用Internet 自由传播而发起的运动。根据《布达佩斯开放存取倡议》(Budapest Open Access Initiative BOAI)的界定,OA 意味着某文献在公共网络里可以被免费获取,并允许任何用户阅读、下载、复制、传递、打印、检索、链接全文、建立索引、用作软件的输入数据或其它任何合法用途。用户在使用该文献时不受财力、法律或技术的限制,只需在存取时保持文献的完整性,对其复制和传递的唯一限制,或者说版权的唯一作用应是使作者有权控制其作品的完整性及作品被准确接受和引用。
OA 是不同于传统学术传播的一种全新机制。该机制以互联网为媒介形态,用户在互联网上免费获取学术信息和研究成果的全文服务,在互联网上传播作品的作者可以基于不同法律文本和授权协议(比如创作共用协议)对作品版权进行取舍。在OA 模式下,学术成果可以在全球实现无障碍地传播,对于研究人员而言,任何研究人员能够使其科研成果可见度最大化,扩大其研究成果的影响力,并能更好地管理其智力成果;可以在任何地点和任何时间不受经济状况的影响,平等免费地获取和使用学术成果。对于学术研究机构而言,不仅能扩大机构的影响力,还能有效管理机构拥有的科研成果。对图书馆而言,充分利用开放资源,可以降低对期刊文献的再投资。OA资源主要存在于OA期刊、OA 仓储(包括学科库和机构库),以及其他OA资源中(如个人网站、电子图书、博客、学术论坛、文件共享网络等)。国内外一直将OA 期刊与OA 仓储看作是开放存取的两种平行路径,即“金色之路”(Golden Route)和“绿色之路”(Green Route)。
随着开放存取模式的发展,开放存取的资源日益丰富。如从2002年到2011年,OA 期刊文献检索系统DOAJ 各国发布的期刊数量跳跃式增长,其中美国的开放存取期刊年平均增长数量超过100 种,其他国家也逐步介入开放存取资源的建设。开放存取资源的利用日益广泛。据汉斯出版社(Hans Publishers)提供的信息显示,该出版社提供的60 余种OA 期刊主页访问量每月高达500000 余次,已刊文章下载量每月达到70000 余次,DOAJ 的日均访问量达17700 人次。
随着OA运动的发展,从全球来看,有两个问题日益凸显:一是开放存取资源的内容分散。开放存取资源的种类多样,且可以在网上免费分享。但这些资源分布在不同的网站上,未经整合,读者对开放存取资源的利用需要在分散的网站上去查找,为学术科研带来不便,给开放存取资源利用率的提高带来障碍。二是开放存取资源的质量参差不齐。如出现在OA 仓储中的资源质量不受控制或控制较少,导致开放存取资源的质量有高有低。从我国来看,开放存取资源的推广利用还较落后。截止2011年11月20日,我国在DOAJ上的开放存取期刊仅排在全球第39位;在OpenDOAR中的机构库只有31 个,基本排在香港地区大学与中国科学院的机构库。正是基于开放存取资源利用存在的不足,本文提出加强对OA资源的整合利用,从而在全球范围内促进开放存取资源的充分利用,以提高科学研究成果的利用效率。
二、开放存取资源整合利用的路径
开放存取资源的整合利用有三条实现路径:OA期刊/内容之间的整合利用、学科库与机构库的整合以及机构库联盟建设、OA 期刊与OA 仓储融合。
(一)OA 期刊/内容的整合利用
开放存取期刊的整合利用是开放存取资源利用的重要方面。目前,除本身集中开放存取期刊的DOAJ 等网站外,国外已开发有Google Scholar、CiteSeerX、Cite-Base、Scirus、OAIster等开放存取资源搜索引擎,国内已开发外文开放存取期刊集成服务系统FOAS 等专门搜索开放资源的搜索引擎。另外,OALIB 这类专门整合开放资源的网站,经过人工分类,可搜可览,方便查找开放期刊资源。在期刊整合方面,美国国会图书馆的CONSER(cooperative online serials)小组做出了表率。该小组于2011年筹划了“合作开放存取计划”(CONSERCooperative Open Access Journal Project),即CONSER 与DOAJ 合作,确保CONSER 的记录对所有DOAJ 期刊都可获取,CONSER 并持续提供新的文献至DOAJ。CONSER 记录被电子资源管理和检索系统利用,以追踪电子期刊文献如DOAJ 和其他电子期刊文献。
此外,部分开放资源在内容上进行了整合。如原来的生物学数据是通过一系列数据库保存和发布的,而生物学知识在纸质版上。随着网络期刊提供更多的开放存取内容、版权限制的减少,数据库和印刷版的区别已经不大。为了利用此机会,有学者将开放存取文献和RCSB(the Research Collaboratory for Structural Bioinformatics)蛋白质资料库(PDB)进行整合。RCSB蛋白质将数据库与文献的整合,为同时开放和免费获取数据库和文献内容提供了机会。
(二)学科库与机构库的整合以及机构库联盟建设
OA 仓储早期是以“学科库”的形式出现的,学科库是专门收集某一特定学科各种类型的研究资源的电子文档。1991年建立的物理学领域的arXivJ 是出现最早的、知名度最大的学科库。2002年10月,麻省理工大学与惠普公司合作推出的DSpace,宣告了机构库的正式诞生。由于学科库一般只存储某人或几个学科领域的学术资源,而机构库则集中存储某个机构的研究成果,因此,两者的融合将使得用户可以同时从学科和机构的双重角度获取研究成果。
机构库联盟是指几个机构以一个机构为基地联合构建知识库,并通过合作的方式,将各自的机构库资源整合起来,统一提供数字化服务。机构联盟知识库可以避免技术设施的重复投入,也可以使机构库资源得到广泛利用,从某种意义上来讲,其也为成员机构之间在科研上的合作提供了更大的可能性。
很多国家已开始意识到开放资源整体建设的重要性,并在学科库与机构库的整合以及机构库联盟建设方面进行了实践。经过搜集、查证,笔者将查到的机构库联盟项目进行了整理,如表1 所示。
表1 部分机构库联盟/整合项目
国家 项目 网址 简介英国 SHERPA-LEAP http://www.sherpa-leap.ac.uk 2004年2月启动,由伦敦大学Birkbeck 学院、伦敦帝国理工学院、伦敦大学国王学院共同建立的机构库,目前已有13 所学校参与,其作为机构库的同时,也是机构库联盟的管理者。该项目也囊括了成员的博客信息。加拿大 CARL Institutional Repository Program http://www.carl-abrc.ca/projects/open_access/oa_can_context-e.html 2002年由加拿大研究图书馆协会(CARL)发起,旨在支持加拿大高校机构库的建立。荷兰 ARNO http://cf.uba.uva.nl/en 2000年,由荷兰特文特大学、阿姆斯特丹大学、提尔堡大学共同参与,旨在建立大学文档储存库,提供参与机构的科学产出。荷兰 DAREnet 暂无由16 个来自荷兰大学及相关的机构主持,他们之间表面上是联盟制,各个机构分别负责自己的机构知识库,实际是在DAREnet 系统下联系在一起形成国家的机构知识库。立陶宛 eLABa 暂无该系统最重要的任务之一是建立开放存取基础设施,然后逐步将eLABa整合入国际开放存取基础设施。eLABa 符合整合入欧洲和世界范围开放存取项目的条件,如项目NDLTD, DRIVER,DART-Europe,PEER 和OpenAIRE 等。中国 ISCAS-IR 系统 http://ir.iscas.ac.cn国内由中国科学院以中国科学院研究所(全国各地共89 个研究所)为单元构建各所的IR 系统,通过元数据开放获取和内容聚合的方式,建立起全院联合的机构仓储服务体系。日本联合国HARP NDLTD http://harp.lib.hiroshima-u.ac.jp http://www.ndltd.org该项目是广岛市区域的一个联盟机构库,主页面为日语。截止2011年11月20日,联盟包括文教女子大学、比治山大学等共计13 所大学及广岛大学图书馆协会参与。由NDLTD 建立并维护。NDLTD 是一个促进采用、创造、利用、传递和保存电子博士论文和硕士论文的国际性机构,旨在支持学术电子出版和开放存取与世界范围地促进和分享知识。
从上表可以看出,部分国家不仅政府重视开放存取机构库整体建设与整合,地区性的机构库整合也拉开了序幕。高校与图书馆协会是参与机构库整合的重要机构,在机构库联盟与整合中主要扮演着发起者的角色。
参考DOAJ 与OpenDOAR可以看出,美国的开放资源居全球首位。在机构库联盟项目的建设上,美国的机构库联盟也多于他国。这种资源建设的领先促进了美国学术资源的开放与传播,并在开放存取资源建设领域起着重要的引导作用。
中国科学院软件研究所机构知识库(ISCAS Open-IR)的出现为我国机构库资源整合与利用起着良好的引导作用,用户可以自行提交作品,通过审核并在该系统发布。目前该系统含有期刊论文、学位论文、会议论文、软件著作权、专利、其他、专著章节/文集论文、研究报告、科研项目、专著等资源类型,但数量不多,大部分为中文文献,仅提供内部人员权限,为资源的利用设立了门槛,总体上说,开放资源的开放程度不够。另外,中国科学院在机构库建设中领先于高校等科研机构,国内的机构库建设缺乏相应的沟通与合作,这也成为我国机构库建设的一大诟病。
有学者将机构知识库联盟建设的方式分为两类:一是数个机构组成联盟共同经营机构库,如美国加州大学电子学术网(eScholarship)搜集典藏十个加州大学校区及附属研究机构的电子文档,并共同经营管理;二是机构库联盟的集中化典藏,最具代表性的是区域或国家机构知识库,由会员机构提供内容,上传至集中的机构知识库。如荷兰的DAREnet 项目即在DAREnet系统下联系在一起形成国家的机构知识库。
(三)OA 期刊与OA 仓储融合
2001年,《布达佩斯开放存取倡议》(Budapest Open Access Initiative BOAI)将开放存取的实现策略总结为“金色之路”(Golden Route)和“绿色之路”(Green Route),“金色之路”和“绿色之路”都是开放存取的实现途径。但是二者各有优劣。一是OA 期刊文献类型少,而学科库和机构库具有收录学术论文、会议报告、技术报告、课程资料等各种类型文献的优点;二是OA期刊质量较高而OA 仓储质量水平较弱;三是机构库一般有权限限制,其开放范围和程度有限。因此,将OA 期刊与OA 仓储进行融合,既可以弥补OA 期刊文献类型少的不足,又有助于提高OA 仓储的质量及其开放程度。
有学者指出,“金色之路”和“绿色之路”本身就是互补的策略,OA期刊可以以OA仓储的方式运作,OA仓储同样可以以开放存取期刊的方式运作,从而使OA期刊与OA 仓储融合发展。
目前,国际上一些机构和组织在OA 期刊与OA仓储融合上做了一些有益的尝试。如巴西的科技在线图书馆SciELO(The Scientific Electronic Library Online),SciELO 是拉丁美洲、加勒比海等国家科技期刊开放存取计划的建设项目,是一种合作性网上电子出版模式,其出版的期刊涵盖了农业、植物学、动物学、医学等多个领域。SciELO(The Scientific Electronic Library Online)建立之初旨在收录巴西的期刊,当前期刊收录已覆盖了大部分拉丁美洲甚至延伸到欧洲国家。它的目标是利用电子出版和开放存取模式,提高巴西最好的科技期刊的显示度、可获取性和可信度,建立可靠的文献计量学和科学计量学指标数据库,促进发展中国家科学交流的改进。SciELO 电子出版模式已被阿根廷、哥伦比亚、哥斯达黎加、墨西哥、秘鲁、葡萄牙、乌拉圭等国采用,在SciELO 主页上可链接到这些国家的开放存取期刊。由于SciELO 中的每一个期刊的出版都是完全免费的,整个项目可以看做是一个主题的或基于主题的机构库,加入了同行评审和网络出版的技巧。因而SciELO 决定采用Willinsky 等开发的“开放期刊系统(OJS Open Journal System)”也就不足为奇了。OJS 是一个促进研究成果或学术文献的传播与质量提高的免费软件。SciELO 采用该系统之后,等于在机构库中加入了同行评审的环节,致使SciELO的运行方式与机构库十分接近。
三、促进开放存取资源整合利用的措施
开放存取资源的整合利用,对各国文献的传播与利用存在着重要影响,越来越多的国家或机构开始投入开放存取资源整合的项目建设。以下笔者从法律、政策、资源三个方面提出促进开放存取资源整合与利用的建议。
(一)制定与完善有利于开放存取资源整合利用的法律法规
法律是开放存取资源整合利用的重要基础。保障开放资源整合利用,首先要从法律法规方面保障公民的信息获取自由,明确规定用户的信息获取权利。其次,保障开放存取资源的知识产权。由于整合利用的资源来源广泛,需充分考虑可能出现的知识产权问题。在法律上,现行的开放存取要实现信息自由传播和资源共享,既需要避免触及现行法律法规的边界,特别是著作权法、版权制度关于著作者对于自身知识产权的独占权。又要通过新的法律法规的出台与对现行法律法规的完善来为开放存取服务提供法律支持和保障,使国家法律法规在保护著作者合法权益的同时,使人类先进的文明成果能够得到更广泛、更快速地传播,从而推动人类社会快速向前发展。
(二)制定促进开放存取资源整合利用的政策
开放存取资源的整合利用,需要较多人力、物力的投入,每个机构的单独进行,容易导致资源重复建设与利用效率低下。因此,在开放存取资源的整合过程中,必须充分发挥政府、国家图书馆、相关图书馆协会等组织的引导与协调作用,制定相应的政策,为大型开放存取资源整合项目提供支持。
瑞典开放存取资源整合的实例说明,国家政策和国家图书馆在政策执行与协调方面所起到的巨大作用。瑞典的OpenAccess.se 项目在评价过程中得出这样的结论:瑞典国家图书馆作为开放存取项目的协调者,对项目的顺利进行产生了重要影响。同时,瑞典的开放存取期刊需要加强各方协作,才能更好地发展。立陶宛创立了科学与研究电子文件信息系统(the Information System of e-Documents of the Science and Studies),被命名为立陶宛学术电子图书馆(eLABa)。该系统最重要的任务之一是建立开放存取基础设施,然后逐步将eLABa 整合入国际开放存取基础设施,其政府的倡导在整个系统建设过程中起了重要作用。另外,有学者指出,韩国的机构库由政府机构管理,如果各方协作一致,公布机构库的目标,并且管理机构和研究人员合作,贡献所有研究成果,机构库将更有活力。
因此,在开放资源建设的过程中需要各方面的合作,只有集中力量,才能取得更好的效果。我国在机构库建设与开放期刊的整合中,需要制定政策,促进高校、研究机构协调一致,从而更大范围地促进我国科研成果的传播与利用。
(三)控制开放存取收录资源质量
开放存取资源的质量控制是开放存取运动中一个倍受关注的问题,直接关系到开放存取的发展前景。传统的学术期刊在发展过程中形成了一系列的评价指标与质量控制机制,如专家评审制度或同行评议制度。开放存取期刊的同行评议采取了严格的标准,是编者、编辑委员会、评议者等共同参与同行评议的过程。需注意的是作者投稿时更多的是关注期刊的学术品质和学术声望,而非其运作的模式。部分作者不愿对开放存取期刊投稿是因为其质量的不确定。如果能够对开放存取期刊的质量进行严格控制,保证其学术品质,赢得学术界的认可,开放存取期刊业具有更广阔的市场和更大的利用价值。
开放存取机构库的电子文档则包括预印本和后印本两类。预印本指的是论文原稿完成后送至期刊出版社等待发表的文献,包括已投稿但未被审核接受的文献及未投过的文章。后印本则是经过同行评议,校对并已正式发表的文章,质量有保证。因此,预印本文库的质量控制是开放存取机构库质量控制的重要内容。
并非所有开发存取资源都有被整合利用的价值,质量较低、文献收录把关不严的机构库及开放期刊在资源整合的过程中势必影响资源整合的整体质量。正如德国的Wolfram等指出,大量的开放存取活动都依赖于分散的开放数字存储站点,如图书馆和其他类型机构,这些内容都是本地化的,而开放存取应该提供学者全球化和全面的信息内容。尽管一些搜索引擎如OASITER,BASE 和Google Scholar 等在这方面迈出了第一步,为充分发挥分散的、合作的信息的潜在影响和建立同质基础信息平台,本地化数据储存必须有高的质量标准。开放存取资源质量直接影响资源整合的选择,尤其是当前开放资源的整合项目逐步展开时。开放存取资源的质量控制是用户利用这些资源的基础,因此,在同行评审、机构库文献收录过程中必须严加控制。
结语
开放存取资源整合的目的在于提高开放存取资源的利用率,扩大信息共享,促进信息自由交流,保障信息公平。尽管开放存取资源越来越多,并得到用户的广泛认可,但其利用率仍有待提高。资源的价值,就在于其最大限度地被开放利用,如果开放存取资源过于分散,部分资源将长期得不到有效利用,对于开放存取资源建设者而言也是一种浪费。因此,需要通过OA期刊/内容的整合,学科库与机构库的整合以及机构库联盟建设,OA期刊与OA仓储融合等途径实现开放存取资源的有效整合,并在其过程中需要用法律保障,用政策促进以及政府、机构、科研学者的共同努力,同时还需要控制开放存取资源的质量。
[1]开放存取期刊[EB/OL].http://www.doaj.org,2011-07-20.
[2]王云娣.OA期刊十年:数量猛增影响力有待提升[N].中国社会科学报,2012-06-11.
[3]易斯琦,宗乾进,袁勤俭.走向融合——开放存取发展趋势[J].图书馆杂志,2012,(7).
[4]张红丽,吴新年.e-Science环境下面向用户科研过程的知识服务研究[J].情报资料工作,2009,(3).
[5]曾苏,马建霞,祝忠明.机构知识库联盟发展现状及关键问题分析[J].图书情报工作,2009,(24).
[6]DOAJ by country[EB/OL].http://www.doaj.org/doaj?func=byCountry&uiLanguage=en,2011-11-19.
[7]L.Krevit,L.Crays.Herding cats:Designing Digital Commons@The Texas Medical Center,a multi-institutional repository[J].OCLC Systems &Services,2007,(23).
[8]eScholarship repository[EB/OL].http://repositories.cdlib.org/escholarship,2011-07-20.