国内外机构知识库建设现状及建议
2017-04-07朱立禄宋世俊王琳
朱立禄++宋世俊++王琳
〔摘要〕本文通过Open DOAR、ROAR、Cybermetrics Lab、CAS IR GRID和CALIS高校机构知识库系统,调查了国内外机构知识库的建设现状,总结了我国机构知识库建设现阶段存在的问题并提出相对应的措施,以期对我国机构知识库的建设有所帮助。
〔关键词〕开放获取;机构知识库;OpenDOAR;ROAR
DOI:10.3969/j.issn.1008-0821.2017.03.020
〔中图分类号〕G25074〔文献标识码〕A〔文章编号〕1008-0821(2017)03-0109-07
〔Abstract〕The development status of worldwide institutional repositories were analyzed based on the investigation of institutional repositories according to Open DOAR,ROAR,Cybermetrics Lab,CAS IR GRID and CALIS China Academic Institutional Repository.The existing problems of the institutional repositories construction in China were summarized and some corresponding measures were provided.
〔Key words〕open access;institutional repository;OpenDOAR;ROAR
开放获取(Open Access,简称OA)是学术界、图书馆界和出版界为推动科研成果利用Internet自由传播而发起的运动。国外学者Peter Suber根据有关开放获取的“3B宣言”,认为开放获取的核心理念是非常简单的,即“用户可以通过网络不受价格障碍和大多数的许可障碍就可以获取研究性文献”[1]。2002年2月,布达佩斯开放获取倡导(Budapest Open Access Initiative)提出了开放获取实现的两种途径:开放获取期刊和开放获取仓储,而开放获取仓储也称为开放获取知识库,包括基于学科存储的学科知识库(Discipline Repositories,简称DR)和基于机构存储的机构知识库(Institutional Repository,简称IR)[2]。
建设机构知识库可以实现对机构研究成果的开放存取,促进机构内外学者、师生之间的学术交流;有利于长期保存机构的研究成果,体现机构在科学研究、技术应用、教育教学、经济和社会发展等方面的综合实力[3],缓解图书馆由于出版期刊价格上涨而导致的预算缩减问题,填补馆藏空白,推动图书馆的文献资源建设,更好地服务机构的教学、科研和创新活动[4]。
自从20世纪90年代机构知识库的概念被提出以来,有关机构知识库的理论和实践研究就从来没有停止过[5]。理论研究主要集中在机构知识库的基本概念、与开放获取(Open Access)的关系、对传统学术交流的影响等;而实践研究主要是集中在不同的学术研究机构和政府机构根据自身需求和目标构建本机构的知识库,并向本机构成员提供服务[5]。
1世界机构知识库建设现状
目前世界上有很多OA资源注册站点,这些站点接受仓储项目建设者提交的信息。目前在此方面最重要的网站是由英国诺丁汉大学和瑞典兰德大学于2005年共同创办的“开放获取知识库名录”(The Direct of Open Access Repositories,简称OpenDOAR)[6]和由英国南安普顿大学于2003年创办的“开放获取机构知识库注册”(Registry of Open Access Repositories,简称ROAR)[7]。
自从2002年Dspace系统问世,世界范围内出现了大规模机构知识库的建设,并且很多国家已经取得了显著成效。截至2007年3月,OpenDOAR上收录的机构知识库仅有853个[8];而在2010年8月30日,OpenDOAR就收录机构知识库1 714个,ROAR收录机构知识库1 625个[9];截至2012年11月,DOAR收录的IR已达2 230个,在ROAR中注册的IR超过2 994个[10];截至2014年11月1日,OpenDOAR收录机构知识库2 728个,ROAR收录机构知识库3 216个[11]。而在2016年11月,OpenDOAR收录机构知识库达到3 271个[6],ROAR收录机构知识库4 358个[7]。从图1中可以看出,世界范围内的机构知识库总量在近年呈现明显的增长趋势。不到10年时间,仅在这两个平台注册的机构知识库就从不到1 000个增长到4 000多个。
根据OpenDOAR统计数据[6],世界范围内机构知识库在各大洲的分布情况及集中分布地区如图2所示。由图可见,在世界知识库的分布中,欧洲的机构知识库数量所占比例最大,占世界所有机构知识库总量的45%;其次是亚洲和北美洲,分别占总量的20%和18%。进一步分析可发现,在机构知识库总量所占比重较大的大洲中,其知识库分布的国家也相对集中。如北美洲的机构知识库有82%集中于美国;欧洲的机构知识库虽然分布相对广泛,但是排名前3位的英国、德国和西班牙,分别占欧洲机构知识库总量的17%、13%和8%,也占大洲机构知识库总量的1/3以上; 在亚洲,日本领先于亚洲其他国家和地区,占亚洲所有机构知识库总量的25%;中国和印度排在第2位,分别占总量的16%和11%,印度尼西亚的机构知识库总量也占一定的比例。在机构知识库蓬勃发展的过程中出现了多套用于构建机构知识库的免费开源软件。根据OpenDOAR的统计数据,各个机构知识库的建设软件统计状况如图3所示。由图可见,当前世界机构知识库应用最广泛的开源码软件是DSpace、Eprints和Digital Commons。使用这3种软件的机构知识库数量分别为1 447个、446个和157个,占所有机构知识库总量的44%、14%和5%,使用率之和超过60%。除此之外,使用次数超过50的软件还包括OPUS(80次)、WEKO(67次)、CONTENTdm(56次)、Fedora(54种)和Greenstone(52种),这5种软件使用率之和为9%。以上8种排名最靠前的软件的使用率总和约为72%。事实上,在OpenDOAR平台上统计的软件总量达150多种,除上述8种使用較多的软件外,很多软件只有1个或者少数几个机构知识库在使用,这说明不同机构知识库可选用的成熟软件系统很多,而各机构独自开发的知识库软件正在兴起。
2中国机构知识库建设现状
我国机构知识库建设起步较晚,但是发展迅速。从2016年11月11日在OpenDOAR上收录的机构知识库分布情况来看,我国被收录的机构知识库共有103个,其中大陆地区共有34个,港澳地区有9个,台湾地区有60个。在大陆地区被收录的34个中,有26个是中国科学院系统的机构知识库,6个是大学机构知识库。构成比例关系如图4所示。
实际上,我国的机构知识库数量远不止这么多。由于OpenDOAR是国外机构建立的英文网站,对中国很多以中文为基础语言搭建的机构知识库的发现能力有限,导致很多已经建立且功能完善的机构知识库未能被统计进去。
近几年国内较重要的机构知识库联盟主要包括中国科学院系统的中国科学院机构知识库网格(CAS IR GRID)和以教育部中国高等教育文献保障系统(CALIS)牵头的高校系统(CALIS高校机构知识库)。
21中国科学院机构知识库网格(CAS IR GRID)
中国科学院机构知识库网格建设工作起步于2007年。通过近10年的试点、示范及规模推广与服务工作,中国科学院机构知识库在促进全院研究所开展机构知识管理,保存、传播和共享研究所科研成果方面取得了显著成效,已成为中国科学院数字科研知识环境重要的有机组成部分,是目前国际科研机构中最大的公共资金资助科研成果共享系统之一,在示范和推动我国公共科研成果开放共享方面发挥了重要作用[10]。
2012年10月,中国科学院文献情报中心、北京大学图书馆、中国科学技术信息研究所等14家国内著名科研机构共同组建了“中国机构知识库推进工作组(China IR Implementation Group)”,旨在推动我国开放获取的发展,标志着我国开放获取的发展进入新的阶段。目前中国科学院内已有110余家研究所的IR建成或者在建,该系统共收录各类数据总量72万余条(见表1),全文開放总量近54万条,累计浏览量和下载量分别达到12亿次和近1 600万次[12]。由这些数据可以看出,该网格已取得了非常好的建设成效,并产生了深远的影响。
从各个研究所机构知识库建设情况来看,截至2016年11月11日,中国科学院各个研究所搭建的公开服务机构知识库中数据总量达到10 000条以上的研究所有24家,其中数据总量前20位的机构如表2所示。由表可见,目前中科院研究所数据总量超过20 000条的有8家,排名前10名的研究所数据总量均超过15 000条。
机构知识库的数据访问量能从一定程度上反映该数据库产生的社会影响力,中国科学院各个研究所机构知识库访问量超过10万次的有74家,其中访问总量排名前20位机构的如表3所示。由表可以看出,排名前10位的机构知识库访问总量均超过300万次。访问总量超过200万次的有13家。从全文下载总量来看,访问总量前20位的机构中,有10家机构全文下载量超过30万次。全文下载量排名最靠前的3个机构下载总量均超过100万次。这3个机构分别是半导体研究所、力学研究所和文献情报中心,全文下载量分别约为265万次、117万次和105万次。
在软件利用方面,中国科学院是统一部署并逐步推进,因此其下设各个机构用的软件都是中国科学院在Dspace的基础上根据自身要求进行深度开发了的CSpace系统。
22CALIS高校机构知识库
CALIS机构知识库建设项目最初由北京大学图书馆、北京理工大学图书馆、重庆大学图书馆、清华大学图书馆和厦门大学图书馆5个示范馆联合建设,目前有40所高校图书馆参与[13]。项目建设采用“分散部署、集中揭示”的组织方式。“分散部署”即由CALIS中心提供机构知识库建设系统,参建高校自行搜集本校学术资源,并在其机构知识库上发布。“集中揭示”是指CALIS机构知识库中心系统通过收割元数据的方式来集中揭示参建高校机构库的学术资源,并以此作为高校学术成果利用的统一窗口[14]。
总体而言,由CALIS牵头的高校机构知识库的建设和发展不能令人乐观。从网站统计数据可知(如表4所示),目前在该平台登记的高校有40个,但能够正常访问的却只有14所,分别为西安交通大学、重庆大学、江苏大学、北京大学、西南林业大学中国矿业大学、厦门大学、广西民族大学、湖北民族学院、中国人民大学、贵州民族大学、深圳大学、桂林理工大学南宁分校、海口经济学院,占所有登记高校机构知识库总数的35%。有2所学校不对外访问,分别为哈尔滨工程大学和浙江大学,占所有高校机构知识库总数的5%。其余24所学校的机构知识库网站链接不存在或无法登录,占所有高校机构知识库总数的60%。
从文献数量来看,元数据量超过1万条的机构有11个,全文数据条目超过1万条的仅有9个。其中全文总量超过1万条,且全文率达100%的机构有5家,分别是重庆大学、集美大学、沈阳师范大学、中国矿业大学和厦门大学。作为CALIS的发起机构,重庆大学、北京大学和厦门大学的元数据和全文数据总量均超过10 000条,但清华大学和北京理工大学的数据量偏少,仅2 000余条。
从网站建设软件使用情况来看,高校机构知识库建设使用最多的仍然是DSpace软件系统,包括清华大学、厦门大学、北京师范大学、集美大学、沈阳师范大学等29家机构使用该系统,占所有机构总数的725%。其余软件的利用情况为:2家机构使用CALISIR系统建设,分别为北京大学和湖北民族学院;2家机构使用JAVA软件建设,分别为重庆大学和四川美术学院;2家机构使用RISS软件建设,分别为云南大学和贵州民族大学;2家机构使用自建软件,分别为西安交通大学和西南林业大学;哈尔滨工程大学机构知识库使用维普软件系统;西南政法大学机构知识库使用IKL软件系统;江苏大学机构知识库使用IKL软件系统。
3我国机构知识库建设存在的问题和建议
31我国机构知识库建设存在的问题
1)我国机构知识库目前在数量上发展迅速,但是知识库总数相比高校、研究机构的比例偏低。以我国高校为例,根据国家教育部发布的《2016年全国高等学校名单》[15],截至2016年5月30日,全国高等学校共计2 879所,其中:普通高等学校2 595所(含独立学院266所),成人高等学校284所。而在CALIS机构知识库联盟中登记注册的机构知识库仅有40所,其中能正常访问的仅14所,占所有高校总数的5‰。
2)我国机构知识库整体建设水平不高,国际影响力远不及英美日等发达国家。根据西班牙 Cybermetrics Lab的Ranking Web of Repositories显示[16],排在世界机构知识库影响力前500位的机构中,世界几个主要发达国家的数量分布情况为:美国136个、英国55个、德国33个、日本30个、加拿大28家。我国进入前500位的机构知识库有10家,其中台湾地区有7家,分别为政治大学、成功大学、台湾大学、中国文化大学、国立中央大学、国立交通大学和国立清华大学;香港地区有1家,为香港科技大学。大陆地区包括排名第120位的厦门大学机构知识库和排名第328位的中国机构知识库网格。总体来看,我国台湾地区机构知识库影响力较大,但是大陆地区机构知识库影响力略显不足。
3)软件系统种类及功能单一,收藏产品类型不全。软件平台的类型决定机构知识库存储对象的种类、存储对象的互动性、安全性以及提供服务的多种能力等[9]。陈美华等于2014年11月对Open DOAR上收录的我国机构知识库使用软件系统进行的统计表明[11],除了中国科学院在DSpace的基础上根据自身要求进行深度开发了CSpace系统、奇迹文库的自开发软件、香港中文大学使用的Drupal、岭南大学使用的Digital Commons以及台湾中央大学使用的ETD-db以外,主要使用的是开源软件DSpace,而且大多直接采用DSpace默认设置(浙江大学等),或只是简单对DSpace进行本地化(厦门大学),致使我国机构知识库软件平台功能显得十分单一,缺乏个性化。从机构知识库收藏的知识产品内容来看,大部分的机构知识库收藏的资源类型主要是期刊论文、会议论文和学位论文等,图像、多媒体等复合数字资源则收集的较少[11]。
4)相关制度、体制建设滞后,执行力度不够。我国于2005年6月在北京召开“科学信息开放存取战略与政策国际研讨会”、2010年在北京召开的“第八届开放获取国际会议”,2014年在北京召開的全球研究理事会峰会,通过《开放获取行动计划》,要求推动实现全球公共资助科研项目学术论文的开放获取,这些都充分体现了国内社会对开放获取的支持和重视。尤其是2014年5月15日,中国科学院和国家自然基金委分别发布了《中国科学院关于公共资助科研项目发表的论文实行开放获取的政策声明》和《国家自然科学基金委员会关于受资助项目科研论文实行开放获取的政策声明》,要求得到公共资助的科研论文在发表后把论文最终审定稿存储到相应的知识库中,在发表后12个月内实行开放获取。这些不仅表明了我国政府对开放获取运动的积极态度和立场,也体现了政府对其支持的决心和信心。但是到政策执行层面,相应的实施细则、考核、激励体制不够健全,导致政策执行力度不够。相当数量的机构知识库管理者在确定了政策基本框架后却没有及时进行具体政策规定的补充[11],导致很多政策落实不到位。
32我国机构知识库建设的建议
机构知识库的建设是一项系统工程,要保证其健康持续发展,需要从改变对机构知识库的认识,完善相关机制,革新技术,加强服务功能的完善等多层面出发[11]。需要机构决策层、管理层、用户层的不同参与,也需要服务、技术、政策等多团队的通力合作,更涉及机构、作者、数据库商等多方利益的平衡[10]。针对我国机构知识库建设现状,我们提出以下建议:
1)政府层面:完善制度、体制建设,细化执行方案设计,加大监督检查力度。灵活选用制度强制存储和出台相应激励政策鼓励自存储相结合的方式,从根本上扩大大学、研究机构等对机构知识库建设的重视程度。
2)机构知识库设计和管理者层面:加强技术开发,丰富软件平台功能;主动同世界主流OA登记平台接洽,提升知识仓储国际影响力;强化用户的开放获取意识,引导用户自己认识到利用机构知识库可以达到知识产品数字化保存、管理、共享等方面的便利,鼓励用户主动存缴。
4结论
学术信息开放获取已成为影响全球学术交流、信息共享的开放获取运动。作为支持开放获取的重要实现平台和产品形式,机构知识库(IR)在世界范围内得到了广泛的开展。我国在机构知识库建设起步交完,虽然也取得了阶段性的成果,但是相比美国、英国、日本等发达国家和地区,无论在数量、质量和建设成效方面都存在一定的差距。我们应该参考国外先进经验,结合本国国情,探索具有中国特色的机构知识库建设模式,提升我国知识产品的管理水平,扩大我国科技成果影响力。
参考文献
[1](美)Suber Peter.开放存取简编[M].李武,译.北京:海洋出版社,2015.
[2]韩进文.机构知识库建设现状研究[J].商,2015,(44):217.
[3]王瑞文,刘东鹏.构建高校学术信息机构库的知识交流环境分析[J].情报理论与实践,2008,31(4):554-556.
[4]陈松青.高校机构知识库建设探讨[J].情报探索,2015,(8):83-85.
[5]陈和.机构知识库发展趋势探析[J].图书情报工作,2012,56(21):62-66.
[6]Open DOAR[EB/OL].http:∥www.opendoar.org/,2016-11-11.
[7]ROAR[EB/OL].http:∥roar.eprints.org/,2016-11-11.
[8]何琳,李劲.国内外机构库研究综述[J].图书馆建设,2008,(1):26-29.
[9]万文娟,吴高.国内外机构知识库建设现状比较研究[J].国家图书馆学刊,2010,(4):31-35.
[10]张冬荣,祝忠明,李麟,等.中国科学院机构知识库建设推广与服务[J].图书情报工作,2013,57(1):20-25.
[11]陈美华,刘文云,刘昊,等.国内外机构知识库建设研究[J].情报理论与实践,2015,(9):55-59,63.
[12]中国科学院.机构知识库服务网格[EB/OL].http:∥www.irgrid.ac.cn/,2016-11-11.
[13]Calis.CALIS高校机构知识库[EB/OL].http:∥ir.calis.edu.cn/.
[14]聂华,韦成府,崔海媛.CALIS机构知识库:建设与推广、反思与展望[J].中国图书馆学报,2013,39(204):46-52.
[15]中华人民共和国教育部.2016年全国高等学校名单[EB/OL].http:∥www.moe.gov.cn/srcsite/A03/moe634/201606/t20160603248263.html,2016-11-11.
[16]Ranking Web of Repositories.Top Instifufionals[EB/OL].http:∥repositories.webometrics.info/en,2016-11-11.
(本文责任编辑:孙国雷)