APP下载

国外机构知识库研究的可视化分析

2017-08-30武同雁

现代情报 2017年8期
关键词:信息可视化

武同雁

〔摘 要〕 本文以CiteSpace II为工具,以Web of Science中的相关文献为信息源,采用可视化分析方法,对国外机构知识库研究领域的经典文献、重要作者、重要期刊和研究热点进行了定量分析与可视化呈现,以期能对我国机构知识库的研究有所启发。

〔关键词〕 机构知识库;信息可视化;CiteSpace II

DOI:10.3969/j.issn.1008-0821.2017.08.023

〔中图分类号〕G255.76 〔文献标识码〕A 〔文章编号〕1008-0821(2017)08-0161-06

〔Abstract〕Taking the CiteSpace II as the tool,getting the data from the Web of Science,and using the method of information visualization,the paper made the analysis of the research on foreign institutional repository from the aspects of classic papers,important authors,important journals and hot topics.

〔Key words〕 institutional repository;information visualization;CiteSpace II

随着计算机、网络和数字化技术的迅速发展,大量数字资源急剧增长,如何对这些有价值的学术资源进行有效管理,成为图书馆在数字科研时代面临的新挑战。同时,期刊价格的持续上涨,造成了“学术交流危机”日益严重,学术界呼唤新的学术交流途径。进入新世纪后,机构知识库的出现为学术交流提供了一种新的选择[1]。

机构知识库一经问世便受到了各界的广泛关注,呈现出理论研究与实践建设齐头并进的局面,先后涌现出ePrints、DSpace、Fedora等用于机构知识库建设的系统平台,各个国家及相关学术机构不断推出促进机构知识库发展的相关政策,瑞典发布了《瑞典开放存取先导计划》(national open access initiative),以最大限度地推动瑞典高校及科研机构的科研成果实现免费开放,国际图联则推出其机构知识库IFLA Library,中国科学院也于2008年开始系统推进机构知识库建设,并以其集成服务网络平台对中国科学院各研究所建立的机构知识库进行整合与一站式服务。经过20余年的发展,机构知识库建设已经取得了令人瞩目的成绩,截至2017年2月,OpenDOAR收录的机构知识库数量已经超过了2600个[2],相关研究文章也不断涌现。

信息可视化(Information Visualization)是结合了多个学科理论与方法(如数据挖掘、图形学、人机交互等)的一种数据挖掘方法,通过利用计算机实现对抽象数据的交互式可视表示,可视化技术可以有效揭示出信息之间的关系和信息中隐藏的本质规律。本文采用信息可视化方法,对国外机构知识库研究现状进行深入分析,以便于挖掘隐藏在数据背后的知识内涵,快速借鉴国际前沿性研究成果。

1 数据来源与可视化工具

本文研究数据来源于Web of Science,数据库选择为SCI-Expanded, SSCI, A&HCI三个数据库,文献类型限定为Article, Review和Proceeding Papers,语种限定为英语,检索并请说得到机构知识库的相关文献357篇。

CiteSpace II是由美国德雷克赛尔大学(Drexel University)信息科学与技术学院的陈超美博士开发的免费软件,利用该软件可以将知识和信息中引人注目的最前沿领域和学科制高点,以可视化的图像直观地展现出来,帮助人们挖掘、分析和现实科学知识以及它们之间的相互关系,并能够较为直观地识别学科前沿的演进路径及学科领域的重要文献[3][4]。为了解近年来国外机构知识库研究的总体情况,本文即利用该软件,通过文献共被引、作者共被引、期刊共被引以及关键词聚类等途径,并结合文献计量方法,对国外机构知识库研究的整体情况进行定量分析与可视化呈现。

2 结果分析

2.1 经典文献分析

经典文献是一个研究领域中非常重要的文献,不仅体现在其被引频次高,同时中心度也高,即处在整个研究领域中较为核心的位置。通过运行CiteSpace II,选择文献共被引(Cited Reference)为节点,得到机构知识库研究中经典文献的可视化图谱,如图1及表1所示:

从上述图表中可以看出,有5篇文献的中心度和被引频次较为突出,其中被引频次和中心度最高的文献是Crow发表的“The case for institutional repositories: A SPARC position paper”,该文是机构知识库研究领域中具有奠基意义的重要文献,在该文中,Crow详细论述了机构知识库出现的背景、定义、作用、基本组成部分,影响以及建设中应该注意的问题等基础理论[5],因此被研究人员广泛引用也就在情理之中了;Lawrence在2001年首次指出,科研人员通过机构知识库、学科知识库等途径进行自存储可大幅提高论文的被引频次,他以119,924篇计算机科学领域的会议文献为样本,发现自存储论文的篇均被引率为7.03,非自存储论文为2.74,自存储论文具有显著的引用优势[6]。Lawrence的研究结论引发了一场大范围的关于自存储能否提高论文被引频次的讨论,不少学者以多个学科领域的文献为研究样本展开了实证分析,其中Antelman的研究成果具有较大的影响力,作者以哲学(Philosophy)、政治学(Political science)、电子与电气工程(Electrical and electronic engineering)和数学(Mathematics)等4个学科领域2017篇文献为样本,對其自存储情况和被引情况进行了比较分析,发现自存储论文比率分布在17%-69%之间,引用优势在145%-191%之间[7];Chang以OCLC Systems & Service特邀编辑的身份发表了名为“Institutional repositories: The librarys new role”的论文,该文重点探讨了机构知识库对图书馆的影响以及图书馆的应对策略,指出图书馆应采取加强对馆员数字资源管理能力的培训、制定机构知识库政策与管理制度等措施[8],该文对之后关于机构知识库与图书馆关系的探讨产生了较为重要的影响。此外,Chan发表的“Supporting and enhancing scholarship in the digital age: The role of open-access institutional repositories”主要探讨了机构知识库对学术交流的重要影响[9],也成为关于机构知识库对学术交流影响研究中的代表作。

2.2 重要作者分析

对于一个领域而言,发表论文数量多的作者、被引频次高的作者以及处于研究中心位置的作者都应该算作是重要作者。据统计,发表论文数量最多的是来自印第安纳大学(Indiana University)的Xia JF和马来西亚马来亚大学(University of Malaya)的Abrizah A,均发表文献9篇,Xia JF主要关注机构知识库的评价问题,包括机构知识库评价指标体系的构建以及实证调查分析等内容;Abrizah A主要就机构知识库发展对学术出版的影响以及科研人员对机构知识库的态度、存储意愿等方面展开研究。

中心度反映的是某节点在网络中的重要性程度的一个重要指标,通过运行CiteSpace II,选择作者共被引(Cited Author)为节点,既可从被引和中心度的角度反映出作者的重要程度。具体如图2所示:

从图2可以看出,中心度较高的作者分别是Crow R, Lynch CA, Harnad S, Chan L, Foster NF 和Suber P等6人,这些作者也是本领域中的重要作者。Crow R和Lynch CA是机构知识库基础理论研究的先驱,先后发表了多篇具有重要影响力的研究论文/报告;Harnad S的研究兴趣则为学术出版和开放存取,他先后创办了开放存取期刊Psycoloquy、知名的学科知识库CogPrints和美国科学家开放存取论坛(American Scientist Open Access Forum),虽然Harnad S的研究兴趣不局限在机构知识库,但其研究成果对该领域的研究产生了重要影响。此外,通过对原始数据的进一步分析发现,虽然Chan L, Foster NF和Suber P发表的文献数量较少,但都发表了影响较大的文献,因此能够成为本领域的重要作者,如Foster NF在2005年即发表了关于科研人员对机构知识库的态度及采纳意愿的文章,这对机构知识库用户行为研究与资源建设研究产生了重要影响。

2.3 重要期刊分析

一个领域中的重要期刊,不仅是那些发表论文多的期刊,更应该是发表了具有重要影响力的期刊。据统计,发表论文最多的期刊是Serials Review和Program: Electronic library and Information Systems,均发表论文23篇,占总数的6.44%。发表文献最多的6份期刊如表1所示:

通过运行CiteSpace II,选择期刊共被引(Cited Journal)为节点,得到结果如图3所示:

从图3可以看出,基于被引和中心度的角度,D-Lib Magazine, Serials Review, Learned Publishing, College & Research Library, Nature, Ariadne, Portal: Libraries and the Academy等7份期刊表现较为出色。其中,Serials Review和Learned Publishing发表论文的数量也排在前2位,是国外机构知识库研究领域名副其实的重要期刊。D-Lib Magazine和Ariadne则都是开放存取期刊,尤其是D-Lib Magazine持续刊载了多篇机构知识库研究领域的相关论文,虽然该刊没有被Web of Science收录,因此在载文统计中其价值无从体现,但从被引和中心度的角度却证实了其在机构知识库研究领域的重要地位。此外,College & Research Library, Nature和Portal: Libraries and the Academy也发表了一些具有较大影响力的论文。因此本文将上述发表论文数量较多和影响力较大的11份期刊称为国外机构知识库研究领域的重要期刊。

2.4 研究热点分析

关键词在一篇文章中所占的篇幅虽然不大,但却是文章主题的概括与凝练,同时参考文献也能在一定程度上反映研究的兴趣所在。因此对关键词和参考文献进行分析,可以确定某一个领域的研究热点。本文通过运行CiteSpace II软件,对关键词和参考文献进行聚类分析,得到结果如图4所示:

通过图4可以看出,国外机构知识库的基础理论研究、用户研究、评价研究、资源建设研究以及实践建设研究是本领域的研究热点问题。

1)机构知识库的基础理论研究,作为一个21世纪才出现的新生事物,对其基础理论进行重点探讨也在情理之中,与此相关的聚类包括#1 open access initiative(开放存取先导计划)、#8 scientific publication(科研出版物)、#9 Internet(因特网)、#10 responsive institutional repository(機构知识库)、#11 open archive(开放存取文档)、#21 scholarly publishing(学术出版)、#28 future direction(未来发展方向)等7类。据此可看出国外机构知识库的基础理论研究主要包括机构知识库的定义、特征、影响以及未来发展等方面,如Lynch详细阐述了机构知识库的定义、特征、重要性、影响、建设中应该注意的问题及未来发展方向,他指出,机构知识库不应该只是一个数据库或硬件的组合,而是学术机构利用各种研究成果为科研人员提供的一种服务,其未来的发展方向将是多机构开展合作的联邦式机构知识库(federated institutional repository)[10];Oppenheim详细分析开放存取期刊和机构知识库对数字出版的影响,他指出,虽然现在机构知识库的出现还不足以对出版体系产生实质性影响,但在未来相当长一段时间内机构知识库将迅速发展,并最终对学术出版体系产生重要影响[11]。

2)机构知识库的用户研究,机构知识库的发展离不开用户(科研人员)的支持,因为机构知识库中的资源全部都来自于科研人员。与此相关的聚类包括#12 purpose(目的)、#15 google user (google用户)、#16 journal author behavior(作者行为)、#19 faculty content(机构成员的研究成果)、#22 research student(学生)等5类。如Kim以社会交换理论(Social Exchange Theory)为理论基础,构建了一个科研人员在机构知识库中进行自存储的激励因素模型,该模型包括成本、收益、内在激励因素和个人成长经历等4个方面的因素,结果表明这些因素都会对科研人员是否接受机构知识库产生重要影响[12];Serrano-Vicente等人发现,科研人员对机构知识库的认知度较高,大多数科研人员均了解机构知识库的意义,但参与度不够理想,多数科研人员均没有在机构知识库存储资源的经历,同时科研人员对机构知识库的认知度和参与度均存在着学科差异[13]。

3)机构知识库评价研究,随着机构知识库数量的迅速增加,如何对其进行有效评价,成为学者们关注的话题。与此相关的聚类包括#17 factor(因素)、#24 success(成功)、#26 critical success factor(关键成功因素)等3类。如Westell提出了机构知识库建设的8个关键成功因素,分别是强制政策、契合学术机构的整体规划、资金模式、与数字化中心的关系、互操作性、评价机制、学术机构的支持度和资源长期保持策略[14];Kim 则构建了一个机构知识库的综合评价模型,该模型包括4个方面,分别是内容、系统与网络、用户及提交者以及管理与政策,作者通过韩国的机构知识库对此模型进行了实证研究[15]。

4)机构知识库的资源建设研究,机构知识库建设过程中一个非常关键的问题便是其资源建设问题,机构知识库只有为科研人员提供高质量的学术资源,其价值才会得到充分体现,因此该主题受到了相关研究人员的重点关注。与此相关的聚类包括#6 exporting metadata(获取元数据)、#7 digital preservation(数字资源保存)、#29 electronic thesis development(学位论文的资源建设)、#30 knowledge infrustructure(知识基础设施)和#31 search engine coverage(搜索引擎覆盖率)等5类。据此也可以看出这一主题的研究内容包括数字资源的组织、数字资源的长期保存、特殊数字资源建设以及数字资源利用等内容。如Markland利用GoogleScholar和Google两个搜索引擎对英国境内的26个机构知识库资源进行了检索,期望通过搜索引擎对机构知识库资源的覆盖率来探讨其利用问题,结果表明,搜索引擎科研较好地查找机构知识库中的数字资源,但排在首位的并不一定是最相关的检索结果,因此还需要科研人员做一定的鉴别才可以[16]。

5)机构知识库实践建设,整体而言,机构知识库研究呈现出理论研究与实践建设共同发展的局面,因此对机构知识库实践建设中的相关问题进行探讨也成了本领域的一个研究热点。与此相关的聚类包括#0 southampton(南安普顿)、#2 action plan(实施计划)、#14 business school(商科学校)、#25 carl(加拿大研究图书馆协会)等4类。如Doctor对印度一所商科学校的机构知识库建设情況及科研人员的接受度进行实证调研,结论认为在该校建设机构知识库是可行的[17];网络信息联盟(Coalition for Networked Information, CNI)、英国联合信息系统委员会(UK Joint Information Systems Committee, JISC与及荷兰SURF基金(SURF Foundation in the Netherlands)则于2005年对美国、英国、澳大利亚等13个国家的机构知识库实践建设情况进行了大范围的调查与分析,结果表明机构知识库建设已经受到各国相关机构的重视[18]。

3 总结

综上所述,机构知识库作为一个新生事物,其相关问题受到了学界的广泛关注,在国外已经形成了以Crow等人为代表的核心作者,以Serials Review和D-Lib Magazine为代表的核心期刊,并在机构知识库基础理论、评价、用户行为及实践建设等方面展开了研究。相比之下,国内机构知识库的建设起步较晚,发展程度也相对较低,在研究的广度与深度方面与国外相关研究还存在着一定的差距。总体而言,国外相关研究可以从以下几个方面对国内相关研究及实践建设提供启示:

1)国外不少相关研究都采取理论与实践相结合的方式开始,即在机构知识库实践建设工作的基础之上,开展调查等实证研究,并据此对机构知识库的发展进行分析,提出具有针对性的建议。同时,由于国外有众多项目如DRIVER等多个项目支持机构知识库的发展,因此也有相关研究是对这些项目进行介绍与总结。而我国由于机构知识库实践建设不够理想,因此大多数研究还停留在理论探讨或者对国外研究进展介绍等层面。因此,在今后的研究中,有必要拓展研究广度与深度,提升研究质量。

2)从研究热点方面来看,国外的研究已经从更广的角度对机构知识库相关问题展开探讨,其研究主题也从基础理论研究演进至用户行为、机构知识库评价及实践建设等方面,而国内相关研究则显得角度较为单一。因此今后的发展过程中,需要重视研究主题的进一步拓展,以保证相关研究的可持续发展。

3)目前国外研究已经进入到了机构知识库实践建设引领理论研究的阶段,如何解决建设中诸如系统平台构建、资源内容建设、机构知识库可持续发展、用户行为等方面的问题,是相关研究关注的重点。国内的研究则显得与实践建设较为脱节,实践建设明显跟不上理论研究的步伐,只有中国科学院等少数学术机构的实践建设取得了不错的成绩。因此,未来有必要大力推动国内机构知识库实践建设,以达到理论研究与实践建设齐头并进的局面。

参 考 文 献

[ 1 ] 董文鸳,袁顺波. 聚集学术机构知识的中心:机构库(Institutional Repository)探析[J]. 图书馆杂志,2005,24(8):51-55,59

[ 2 ] OpenDOAR.[EB/OL] [2017-02-06] http://www.opendoar.org

[ 3 ] Chen C.,CiteSpace II:Detecting and Visualizing Emerging Trends and Transient Patterns in Scientific Literature[J]. Journal of the American Society for Information Science and Technology,2006,57(3):359–377

[ 4 ] 周金侠. 基于CiteSpace II的信息可视化文献的量化分析[J]. 情报科学,2011,29(1):98-101,112

[ 5 ] Crow R.,The case for Institutional Repositories:A SPARC Position Paper [R/OL] [2017-02-26] http://works.bepress.com/ir_research/7/

[ 6 ] Lawrence,S.,Online or invisible?[J]. Nature,2001,411(6837):521

[ 7 ] Antelman,K.,Do Open-access Articles have a Greater Research Impact?[J]. College & Research Libraries,2004,65(5):372-382

[ 8 ] Chang S. H.,Institutional Repositories:The Librarys New Role[J]. OCLC Systems & Service,2003,19(3):77-79

[ 9 ] Chan L.,Supporting and Enhancing Scholarship in the Digital Gge:The Role of Open-access Institutional Repositories[J]. Canadian Journal of Communication,2004,29(3/4):277-300

[ 10 ] Lynch C. A.,Institutional Repositories:Essential Infrastructure for Scholarship in the Digital Age[J]. Portal:Libraries and the Academy,2003,3(2):327-336

[ 11 ] Oppenheim C.,Electronic Scholarly Publishing and Open Access[J]. Journal of Information Science,2008,34(4):577-590

[ 12 ] Kim,J.,Motivations of Faculty Self-archiving in Institutional repositories[J]. The Journal of Academic Librarianship,2011,37(3):246-254

[ 13 ] Serrano-Vicente,R.,Melero,R. et al.,Open Access Awareness and Perceptions in an Institutional Landscape[J]. The Journal of Academic Librarianship,2016,42(5):595-603.

[ 14 ] Westell M.,Institutional Repositories:Proposed Indicators of Success[J]. Library Hi Tech,2006,24(2):211-226

[ 15 ] Kim Y. H.,& Kim H. H..,Development and Validation of Evaluation Indicators for a Consortium of Institutional Repositories:A Case Study of dCollection[J].Journal of the American Society for Information Science and Technology,2008,59(08):1282-1294

[ 16 ] Markland M.,Institutional Repositories in the UK:What can the Google User Find There?[J]. Journal of Librarianship and Information Science,2006,38(04):221-228

[ 17 ] Doctor G.,Capturing Intellectual Capital with an Institutional Repository at a Business School in India[J]. Library Hi Tech,2008,26(1):110-125

[ 18 ] Westrienen G. V.,& Lynch C. A.,Academic Institutional Repositories:Deployment status in 13 Nations as of Mid 2005[J]. D-Lib Magazine,2005,11(09) also [2017-02-26]

http://www.dlib.org/dlib/september05/westrienen/09westrienen.html

(本文責任编辑:郭沫含)

猜你喜欢

信息可视化
基于大数据的图书馆信息模式与个性化服务研究
计算机网络安全可视化研究平台设计与实现
论信息可视化设计在个人简历中的应用
标签的可视化进程初探
基于毕业生求职简历的信息可视化研究
信息可视化技术在数字图书馆馆藏资源检索中的应用研究
浅析信息可视化在用户体验研究中的设计
试论网页中信息可视化的交互式设计