国内外机构知识库研究可视化分析
2018-03-06刘子辉陈祖琴谭光月
刘子辉,陈祖琴,谭光月
(重庆科技学院图书馆)
机构知识库(Institutional Repository,简称IR)的概念产生于20世纪90年代。2004年,我国学者将IR的理念引入国内,国内有关IR的理念研究逐渐兴起并成为研究热点,且很多科研机构都开始建设本单位的IR。截止2016年10月,在Open Doar上注册的IR数量已达3,238个,其中排名第一的是美国(485个),其次为英国(249个)、日本(196个)、德国(194个)、西班牙(123个)以及法国(119个);我国在Open Doar上注册的IR数量为39个。从统计数据上可以看出,我国的IR建设与国外相比有一定的差距,但是我们应该看到,国内众多的IR虽未进入到Open Doar的名单之中,但很多的机构都搭建了IR平台,将本单位内部产生的正式或者非正式智力成果有序整理,推动科研成果的转化、交流及文献资源的共享。本文利用可视化软件CiteSpace,选择中文数据库CSSCI进行检索,检索途径为所有字段 =“机构知识库”,共得到数据289条;同时,选择外文数据库Web of Science进行检索,检索途径为主题=“Institutional Repository”or“Institutional Repositories”,共得到404篇文献,分别对检索出的国内外文献进行清洗,从而保证数据的相关性。
1 文献分布
通过对IR研究的论文量和论文分布进行分析,反映其研究热度的变化,从而研究IR在我国的发展情况。
1.1 国外文献分布
通过对国内外有关机构知识库的文献进行统计(见图1),可以发现,国外有关IR的论文最早出现在2000年,Burchill等在论文中提出,马尼托巴卫生政策和评价中心希望开发一个知识库来处理数据文档,并促进内部沟通和与其他网站的合作。[1]文章中论述的知识库及其功能就是IR的雏形,但是文章中并没有明确提出IR的概念。2002年,Raym Crow首次提出IR的概念,即数字馆藏收集和保存单一或者多所大学社区的智力成果,同时指出IR是学术机构面临的重要战略问题。[2]此后的2003-2008年,国外的发文量增长迅速,论文量由最初的1篇增长到38篇,可以说自2002年IR概念被提出以来,迅速引起了学者的关注,有关IR的研究和实践迅速升温。2008-2013年,有关机构知识库的论文发表量稳定在30篇左右,大家对IR的研究热度持续不减,2014年和2015年,有关IR的发文量分别为50和57,说明有关IR的研究热度持续升温。
图1 国内外IR研究的文献年份分布图
对国外有关IR研究的文献按照国别进行可视化分析(见图2),发表论文量排名前几位的分别是美国(131)、英国 (41)、西班牙 (35)、澳大利亚 (17)、印度 (17)、加拿大 (15)、巴西 (15)、德国 (14)、马来西亚(13)。可以看出,美国在IR的研究最多,论文的贡献量也最大,这和IR起源于美国且在美国的理论研究与实践开展比较深入有关系。同时,论文分布于55个国家和地区,前9个国家发表的论文量为298篇,即16%的国家其论文发表量占整个论文量的74%,论文分布非常集中。
图2 国外IR研究的文献国别分布图
1.2 国内文献分布
由图1可以看出,我国有关IR研究的论文最早出现在2005年,共有2篇论文,其中《机构知识库:数字科研时代一种新的学术交流与知识共享方式》,其参考文献基本是国外文献,也能够印证此阶段国内有关IR的论述非常少,这篇论文不仅较早地向国内介绍了IR,同时较为系统地论述了IR的含义、数字科研环境中IR的内容、IR在数字科研环境中的作用、数字科研环境中IR的构建工具,介绍了DSpace等构建IR平台的软件。[3]从2005年到2010年,有关IR的论文发表量从2篇发展到40篇,其研究热度迅速升温,有关IR的概念、作用与意义被大家接受,并且开展了我国IR的理论与实践研究。很多单位自主搭建了IR平台,如中国科学院、北京大学、西安交通大学、厦门大学等开展了相应的实践活动。从2010年至2013年,有关IR的研究热度有所下降,这和IR建设中遇到的问题有一定关系,如IR建设无法获取经费保障、存储文献单一、作者担心知识产权被侵犯故积极性不高等。这一阶段大家对机构知识建设多了一份冷静与反思。2014年与2015年,该领域的发文量回升,相关的研究热度增加,所以说任何一个新事物,在发展中总不会一帆风顺,总会在曲折中前进,IR建设也不例外。
2 文献贡献量、核心作者、核心期刊分析
2.1 文献贡献量分析
论文的发表数量在一定程度上反映了论文作者对IR领域的知识贡献量。下面通过CiteSpace对文献贡献量进行可视化分析,分析哪些作者对该领域做了大量的研究。
(1)国外文献贡献量。国外有关IR研究的作者排名靠前的分别是Abrizah.A(9)、Xia.JF(8)、Bjork.BC(5)、Yakel.E(4)等,国外有关IR的研究者较为分散,大多数研究都只是发表了1-2篇文献,发表3篇以上文献的作者只有10人。Abrizah.A来自马来西亚大学,在2009年发表了第一篇关于IR的论文,他以马来西亚一所研究密集型大学的学者为研究对象,调查了他们对开放获取知识库的使用及宣传,以及他们对机构知识库(IRs)作出贡献或不作贡献的原因,这项研究的结果为由高校创建或与高校相关的机构知识库在保存和传播数字材料时提供参考。[4]他的其他论文内容主要包括图书馆员在机构知识库变革中的作用,亚洲大学开放获取机构知识库的全球视野,阻碍了作者在开放存取库中自我存档的因素分析以及通过机构间存储库共享图书馆和信息科学学者资源的动机和阻力等。
(2)国内文献贡献量。从下表可知,论文发表量排在前10的作者中,祝忠明发文19篇,祝忠明及其研究团队从2008年发表的第一篇论文开始,对IR的多个方面都进行了研究,如IR与科研管理信息的集成研究、IR的模式选择、内容建设及推广、以及IR联盟的建设等;马建霞的论文发表量也非常多,其论述的主要内容有机构知识库的建设现状、机构知识库联盟的建设现状及对策等。
图3 国外IR领域论文发表量图谱
表 机构知识库领域论文发表量
2.2 核心作者分析
高被引作者是在某学科中发表的文献被大量引用的作者,其发表的文献对其他人的研究产生了较大的影响,通常被认为是该领域的核心研究者。
(1)国外核心作者。通过CiteSpace可视化分析发现(见图4),被引用次数在20以上的作者有18位,排在前几位的有 Crow R、Harnad S、Suber P、Sqan A等,其中,Crow R自2002年担任SPARC的高级顾问起,他开始与学术和科学团体以及其他非营利出版商合作,建立能够支持开放获取出版物的模式。Crow R是IR的奠基者,其发表的相关论文对其他学者的研究有重要的学术价值。从数据可以看出,国外有关IR的研究,形成了该领域的核心作者,这些核心作者即包括Crow R这样的IR的奠基者,也包括Harnad S、Suber P等研究者,但是从整体看,相关的研究者比较分散。
图4 国外IR研究核心作者图谱
(2)国内核心作者。国内相关文献高被引作者最高的是邓君,其次是张晓林、曾苏、郭少友、柯平、吴建中、常唯、韩珂等。其中,邓君的研究涉及IR的建设现状、模型构建、发展动力、利益机制、技术成本等,其发表的多篇论文引用率都非常高,为其他研究者都提供了重要的帮助与启迪,对IR的发展起到了推动作用。张晓林发表的有关IR的论文内容涉及IR的内容保存与传播权利,IR的政策、功能和机制分析,IR的发展趋势与挑战等,被很多学者关注与引用,影响非常深远。相比而言,国外在IR领域的研究出现了特别权威的学者及有影响力的文章,而国内有关IR的核心作者更为分散,没有形成特别权威的学者。
2.3 核心期刊分析
为了直观地呈现出该领域文献的分布情况,我们通过CiteSpace对IR有关的来源期刊进行了可视化分析,即该领域的大量文献主要被发表在哪些期刊上,从而分析出该领域文献的核心期刊群,找出哪些是国内外IR领域的核心期刊。
(1)国外核心期刊。国外高被引期刊主要有D-Lib Magazine,LearnPublishing,SerialsRev,JAmSoc Inf Sci Tec,JAcadLibr等,其被引频次都在60以上。其中,D-Lib Magazine被引频次达到121,在所有的期刊中其被引频次非常突出,表明这些期刊在IR领域的研究起到重要作用,在这些期刊上发表的有关IR的论文质量很高,被其他学者学习、借鉴、引用,给其他学者的研究更多的启迪。
(2)国内核心期刊。《图书情报工作》《中国图书馆学报》《图书馆杂志》《图书馆论坛》《情报科学》《情报资料工作》等这些期刊都是高被引期刊,其中《图书情报工作》被引频次更突出,说明其在有关机构知识库的研究中起着重要作用,其刊载的论文质量更高,更具有学术价值。
从国内外核心期刊对比分析发现,国外的核心期刊除了D-Lib Magazine之外,分布更为均匀,被引频次在20以上的有33种期刊;而国内的核心期刊除了图书情报工作比较突出之外,其分布相对不均匀,比较集中。
3 IR研究的知识基础分析
一个研究领域的知识基础支撑着该领域的发展,为该领域的进一步发展奠定了理论与实践基础。文章基于CiteSpace软件,以Timeline和Cluster两种方式显示,分析奠基性文献和高被引文献。[5]
3.1 国内外IR研究的奠基性文献
(1)国外奠基性文献。有4篇文献为IR研究的奠基性文献。① Harnad S论述了“由于研究人员需要支付费用才能获取相应的信息资源,给他们的科研带来障碍,随着开放存取的发展,作者只需将他们的文章存放在开放的机构知识库中,即可让全球所有的科研人员检索与下载,实现了信息资源的共享,给科学研究提供信息保障。”[6]② Lawrence S指出“免费获取科学文献,可以给科学研究带来极大的方便,可以最大限度地利用科学文献、加快科学进步,所以作者和出版商都应该推动文献信息开放获取运动的发展。”[7]③ Kling R指出“在信息时代,传统的交流模式已发生了很大的变化,现在通过电子媒介进行学术交流是一种发展趋势,各个科学领域都已开始通过知识库进行学术交流,实现文献的检索、下载、传递。不同的科学领域已经开发并且在论文和电子领域中使用截然不同的交流论坛。”[8]④ 上文中提到的Raym Crow的论文。
(2)国内奠基性文献。国内奠基性文献有以下几篇。① 黄凯文等人发表于2005年的论文,介绍了“公共获取运动”实施的模式、常用的软件系统及支持的标准。[9]② 董文鸳等人的论文介绍了机构库的定义及产生的原因,阐述了机构库的特点及国内外相关项目。[10]③ 吴建中发表于2004年的文献指出,IR对图书馆业务及其生存发展提出了严峻挑战。[11]
3.2 国内IR研究的高被引文献
(1)国外高被引文献。国外高被引文献有Raym Crow发表于2002年的论文,[2]被引用45次,其内容不再分析。第二篇是Antelman K的文章,被引用了28次,在文中作者关注了哲学、政治学、电气和电子工程、数学的文献信息获取情况,在这四个学科中,用户可以免费获取该学科的文献信息,这种公开获取文献信息的情况影响非常大,获得大家好评。[12]第三篇文献是Davis Philip发表于2007年的文章,主要论述了“大家虽然都很关注机构知识库的开发与实施,但是教师对参与机构知识库建设积极性并不高”,文中通过对自然、社会、人文科学的教师进行访谈,了解他们对机构知识库的认识、态度、动机、行为。[13]
(2)国内高被引文献。国内引用频次最高的是郭少友于2006年发表的论文,被引频次为19次,其主要介绍了机构库建设过程中会遇到的服务模式选择问题、法律问题、内容建设问题、资金问题等。[14]第二篇文献是张晓林于2008年发表的论文,被引频次为16次,提出了机构知识库建设中相应的存缴、组织、传播、保存以及扩展服务功能要求,阐述传播保护和权益管理政策,并提出相应的支撑机制。[15]
4 热点领域研究
通过对IR研究的关键词词频分析,梳理了不同时期IR的研究热点,可以分析IR领域研究的热点变化及发展方向。
4.1 国外IR研究热点
通过关键词分析,Institutional Repository、Open Access、Digital Library、University、Scholarly Communication、Library、AcademicLibrary、Dspace、DigitalStorage等出现频次较高。同时,对关键词进行聚类分析,国外的研究热点主要有:Digital-storage、Sustainable Development、Future of Journey、Business School、Confidentiality、Knowledge Management等,可以看出这些方面也是图书馆的研究热点。
4.2 国内IR研究热点
经统计可知,高频关键词依次为机构知识库(251次)、开放获取(39次)、开放存取(35次)、Dspace(12次)、机构知识库联盟(10次)、知识管理(8次)。同时,对关键词进行聚类分析(见图3)发现,呈缴、科研数据、Altmetrics、RDF、Archimede、数据模型、机构知识库IR、机构知识库联盟、数字图书馆等是IR领域的研究热点。
[1] Burchill C,et al.Organizing the present,looking to the future:An online knowledge repository to facilitate collaboration [J].Journal of Medical Internet Research,2000,2(2):e10.
[2] CrowR.The case for institutional repositories:ASPARC positionpaper[EB/OL].[2017-01-31].http://www.sparc.arl.org/sites/default/files/instrepo.pdf.
[3]常唯.机构知识库:数字科研时代一种新的学术交流与知识共享方式[J].图书馆杂志,2005(3):16-19.
[4] Abrizah A.The cautious faculty:Their awareness and attitudes towards institutional repositories[J].Malay sian Journal of Library&Information Science,2009,14(2):17-37.
[5]胡德华,种乐熹.国内外学科馆员研究的可视化分析与比较[J].图书馆理论与实践,2015(6):36-41.
[6] Stevan H.The self-archiving initiative.Freeing the refereed research literature online [J].Nature,2001(410):1024-1025.
[7] Lawrence S.Free online availability substantially increases a paper’s impact[J].Nature, 2001, 411(6837):521.
[8] Kling R,McKim G.Not just a matter of time:Field differences and the shaping of electronic media in supporting scientific communication [J].Journal of the American Society for Information Science, 2000, 51(14):1306-1320.
[9]黄凯文,刘芳.网络科学信息资源“公开获取运动”的模式与方法[J].大学图书馆学报,2005,(2):38-41,3.
[10]董文鸳,袁顺波.聚集学术机构知识的中心机构库(Institutional Repository)探析[J].图书馆杂志,2005 (8):51-55,59.
[11]吴建中.图书馆VS机构库——图书馆战略发展的再思考 [J].中国图书馆学报,2004(5):7-10.
[12] Antelman K.Do open-access articles have a greater research impact? [J].College&Research Libraries,2004,65(5):372-382.
[13] DavisPM,Connolly M J L.Institutional repositories:Evaluating the reasons for non-use of Cornell University’s installation of DSpace [J].D-lib Magazine,2007,13(3):2.
[14]郭少友.机构库建设的若干问题研究[J].中国图书馆学报,2006(1):77-80.
[15]张晓林.机构知识库的政策、功能和支撑机制分析[J].图书情报工作,2008(1):23-27,19.