APP下载

基于Histcite的数字图书馆领域文献计量分析

2018-02-20臧弘毅

创新科技 2018年12期
关键词:数字图书馆

臧弘毅

摘 要:本文以Web of Science文献数据为样本文献,利用引文分析可视化软件Histcite对样本文献进行操作,分析数字图书馆领域内的文献发表年份、地区、核心期刊、核心作者等,绘制引文编年图,从而剖析其研究方向和发展规律。

关键词:数字图书馆;引文分析;Histcite

中图分类号:G254    文献标识码:A    文章编号:1671-0037(2018)12-87-4

DOI:10.19345/j.cxkj.1671-0037.2018.12.022

数字图书馆指的是对各种数字信息资源采取数字技术进行处理和存储的图书馆,其实质上是一种多媒体制作的分布式信息系统[1]。随着互联网技术的快速发展,数字图书馆得到了快速发展,因此对数字图书馆的研究分析是有必要的。

本文利用引文分析可视化软件Histcite,选取Web of Science中关于数字图书馆的文献进行分析,从文献数量、高被引作者等方面分析,绘制引文图谱,掌握其发展脉络,了解其核心课题及研究前沿。

1 文献来源与研究方法

1.1 文献来源

本文研究分析所需的样本文献数据均来自Web of Science数据库。所采取的检索策略是以“Digital library”为主题词进行检索,选取的年限为“2018年之前”,类型为“information science library science”,文献类型为“Article”,共得到1 944篇文献。以全记录与引用的参考文献为下载内容,纯文本格式为下载格式进行下载。

1.2 研究方法

引文分析是利用数学和统计学的方法,同时采用比较、归纳、抽象等一系列逻辑的方法,对期刊、论文、作者等各个分析对象的引证与被引证现象进行有效的分析,从而揭示其中的数量特征和内在规律的一种文献计量分析方法[2]。

Histcite是由SCI的创始人尤金·加菲尔德开发的一款可视化引文分析软件,Histcite及History of cite,意思是引文分析历史。它可以利用图示的方法展示某个领域内的不同文献间的关系,可以了解某一领域的发展方向,绘制出其发展脉络,确定其核心作者、重要文献等重要内容。

本文所采用Histcite中的指标有:

①LCS(Local Citation Score),本地引用次数,是指某篇文献在下载的所有文献中被引用的次数;②GCS(Global Citation Score),引用次数,是指某篇文献在WOS中被引用的总次数;③LCR(Local Cited References),引用本地参考文献数量,是指某篇文献引用的所有参考文献中,有多少篇文献在当前数据库当中;④CR(Cited References),引用所有参考文献量,是指某篇文献在WOS中引用的所有参考文献;⑤TLCS(Total Local Citation Score),本地引用总次数;⑥TGCS(Total Global Citation Score),引用总次数。其中,若某篇文献的GCS值高,则表示该文章被全球范围内的专家广泛关注。若某篇文献的GCS高,但LCS小,则表示关注该文章的专家学者来自于多个领域。

2 分析与结果

将从WOS中下载的1 944篇文献导入可视化引文分析软件Histcite当中,共得到1 918篇分析记录,缺失26篇,其原因可能是文献格式问题。在剩余的1 918篇文献中,文献分布在2001—2017年,共计3 318个作者,76种期刊,44 802篇参考文献,3 212个关键词,本地引用次数(LCS)为1 373,引用次数(GCS)为9 687。

2.1 文献发表年份分析

下载的1 918篇文献的年份分布如图1所示。

由图1可以看出,首先出现在2001年,其原因可能是在此之前关于数字图书馆的相关文献并没有归类在“information science library science”中,因为数字图书馆是伴随着互联网技术的发展而产生的,依靠于现代计算机技术和现代通信技术。2002年增长过后又在2003年、2004年维持了2001年的水平,从2004年开始快速增长,在2006年达到顶峰,该年有183篇数字图书馆方向的文献,并在2007—2015年保持在一个较高的水平上,但是近两年的文献量呈持续下降趋势。2005年后维持在较高水平的原因可能是2005年由国际图联管理委员会探讨制定并在2007年底正式通过《国际图联数字图书馆宣言》,该宣言倡导消除数字鸿沟,促进世界文化与科学遗产的普及,其重要方法就是各国各类图书馆对数字图书馆的积极推广。近两年下降的原因则可能是数字图书馆发展日渐完善,创新点减少,或者研究过程中出现了一定的瓶颈从而导致发文量有所减少。

2.2 文献发表国家(地区)分析

数字图书馆的兴起是在美国,并在全球范围内快速发展起来,此次研究的1 918篇关于数字图书馆的文献来自78个国家和地区,表1是发文量排名前9位的国家和地区。其中,欧美发达地区占主要,最多的是美国,发文量为612篇,占总计1 918篇的32%。可以說美国在数字图书馆领域的研究是最领先的,研究能力最强,其原因可能是:①计算机技术及互联网技术的快速发展;②国家政策的扶持与资金投入较大;③美国作为世界上综合实力最强的国家之一,拥有大批的图书情报人才等。欧洲地区的发文量紧随美国之后,其可能是法国国家图书馆馆长让纳内在2005年发起倡议的“欧洲数字图书馆建设计划”引起的欧洲对数字图书馆领域的研究快速发展。随着综合国力的提升和互联网技术的快速发展,逐渐涌现出一批优秀的图书情报人才。我国在数字图书馆方面的重视程度也逐渐增强,研究能力也逐步进入世界前列,发文量排在第四位,有165篇,占8.6%。

2.3 文献发表核心作者分析

目前,核心作者的确定还没有完全统一的标准,一般来说可按照发文量和被引用量进行确定。根据普赖斯平方根定律可知,核心作者的发文数量将占该领域所有文献总数的一半,核心作者最低发文数量为m=0.749[nmax],其中nmax为发文量最多作者的发文量,本文的取值为17,计算得出m=3。所以核心作者的发文数量应该在3篇以上,发文作者在3篇以上共有208位,占发文作者总数3 318的6.2%,共发文926篇,占总发文量的48.2%,基本符合普赖斯定律(Price'Law)。

本文对发文量排在前十位的作者(如表2)和本地被引量(TLCS)排在前十的作者(如表3)进行分析,发现两项均排在前列的有Nicholas D、Goncalves MA、Huntington P、Jamali HR等。在这当中Nicholas D(大卫·尼古拉斯)发表的论文最多,大卫·尼古拉斯是伦敦大学学院的图书馆、档案和信息学的学科带头人,他主要的研究领域是信息通信技术对战略性用户群体的影响、信息需求分析、联机与数字图书馆的使用与评估等方面,有着多年的研究经验,并承担了30余项国家项目,发表300多篇论文。其中有2个具有核心影响力的项目,分别是:①电子期刊的评估与使用;②英国国家电子书平台构建。同时,他还担任《信息管理协会会报 :新信息展望》(Aslib Proceedings: new information perspectives)的主编。

2.4 文献发表核心期刊分析

经分析,选取的1 918篇文献来自78种期刊,排名前十的期刊共发文972篇,占51%。而根据英国科学家布拉德福德提出的布拉德福德定律,刊载论文总数约占1/3的期刊是该学科的核心期刊,可以看出《ELECTRONIC LIBRARY》《LIBRARY HI TECH》《PROGRAM-ELECTRONIC LIBRARY AND INFORMATION SYSTEMS》《JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY》《RESEARCH AND ADVANCED TECHNOLOGY FOR DIGITAL LIBRARES》等为该领域的核心期刊,具有较强的学科影响力。分析本地被引量可以发现,被引量排名靠前的期刊其发文量也排名前列。从所列的期刊列表可以看出,涉及数字图书馆的研究论文主要发表在与图书馆学、信息学相关的期刊上,但是,美国著名的数字图书馆杂志(D-Lib Magazine)并不在统计列表上,其原因是该期刊不在SCI、SSCI的收录名单当中。

2.5 引文时序分析

Histcite中最具有特色的功能就是形成文献引文编年图,其可以反映一段时期内某一领域内的重要文献及其引用关系,可以了解该领域的研究方向和主题发展的历史脉络。由于文献数量较多,本文选取样本文献中LCS值较高的前100篇文献进行数字图书馆引文时序分析,如图2所示。其中每一个圆圈代表一篇文献,圆圈内的数字为文献序号,圆圈的大小代表文献被引用量的多少,圆圈越大表示文献的被引次数越多,受关注程度越高,文献间用箭头连接,箭头表示文献间的相互引用关系,箭头指向是被引用文献。同时,还可以用连线的密集程度来判断研究活跃程度,连线密集就说明研究活跃,文献间相互引用频繁。

由LCS排序前100的文献组成的引文编年图可以看出数字图书馆领域呈现出3个较为明显的引证关系链,第一个是以文献18、52、345、917为主要文献,第二个是以文献306为主要文献,第三个是以文献924为主要文献。同时,图中还存在着一些孤立的且被引次数较高的文献,如文献309、716等,产生这样的原因可能是LCS的阀值选取不够高,一些文献的相互引用关系未能表达出来,或者是这些文献中数字图书馆并不是主要内容。通过增大LCS的阀值和阅读独立文献的摘要等验证了本文作者的观点。

第一个引证关系链中,可以明显看出大致有4篇重要文献,第一篇是序号18,由Hong W; Thong J Y L等在2001年发表在《JOURNAL OF MANAGEMENT INFORMATION SYSTEMS 》上的《Determinants of user acceptance of digital libraries: An empirical examination of individual differences and system characteristics》,这也是引证关系链1中最早的一篇文献,其基于对一个大学优秀数字图书馆的585个用户的调查研究,结果支持了TAM对用户使用数字图书馆意愿方面的预测以及外部信息对易用性和有用性的影响,得到个体差异和系统特征对数字图书馆易用性和有效性有显著影响的结论。第二篇是序号52,由Monopoli M, Nicholas D等发表在《ASLIB PROCEEDINGS》上的《A user-oriented evaluation of digital libraries: case study the “electronic journals” service of the library and information service of the University of Patras, Greece》,其对希腊佩特雷大学使用图书馆和信息处电子期刊服务的情况进行了相应的评估。调查这些电子期刊服务用户以及他们使用服务的频率、使用的原因、使用的访问点和使用的搜索方法和服务。此外,邀请用户在电子期刊和纸质期刊之间进行选择,并指出一些阻碍他们访问电子期刊服务的因素。第三篇是序号345,由Xie HI于2006年发表在《LIBRARY & INFORMATION SCIENCE RESEARCH》上的《Evaluation of digital libraries: Criteria and problems from users perspectives》,该文主要对数字图书馆的标准进行探究,从48个不同的角度来进行评估,最终得出用户认为的数字图书馆标准(收集质量、任务可使用性、系统性能效率、服务质量、用户意见征集),揭示了当前数字图书馆设计与开发中存在的问题,探討了改进数字图书馆设计的建议,并提出了进一步研究的领域。第四篇是序号917,由Nov O,Ye C在2009年发表在《JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY》上的《Resistance to Change and the Adoption of Digital Libraries: An Integrative Model》,该文通过对一些资料的研究,包括信息技术的采用、社会心理学、数字图书馆的使用等,利用结构方程模型来探讨数字图书馆发展的阻力。通过对重要文献的分析,不难看出引证关系链1中研究的重点是数字图书馆影响因素和数字图书馆的标准。

第二个引证关系链中的重要文献有序号306的,Pomerantz J在2005年发表在《JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY》上的《A conceptual framework and open research questions for chat-based reference service》,文章探讨了在提供同步、基于聊天参考过程中的各个步骤以及在每一步中提供这种服务所涉及的问题,探索的目的是提出一些开放性的研究问题,提供一个基于聊天的参考服务的高层次抽象模型,并希望该模型可以作为未来基于聊天参考的应用程序开发的概念模型。通过结合关系链中其他文献的分析研究,可以看出引證关系链2主要是对参考咨询方面进行的研究。

第三个引证关系链则有序号924,Choi Y, Rasmussen E于2009年发表在《JOURNAL OF ACADEMIC LIBRARIANSHIP》上的《What Qualifications and Skills are Important for Digital Librarian Positions in Academic Libraries? A Job Advertisement Analysis》为主要文献。该文通过收集分析1999—2007年间高校图书馆发布的数字图书馆招聘信息中的数据,验证了数字图书馆人员配置需求和所需资格的变化,证实了数字图书馆员在高校图书馆中的地位得到了有效的提升。结合文献5、36可以看出,在引证关系链3当中主要研究的内容是关于数字图书馆馆员应具有的能力及其重要性。

3 结语

数字图书馆已经有将近20年的发展历史,它的兴起是计算机技术与通信技术发展的产物。数字图书馆的发展离不开图书情报领域的专家,同时也与计算机通讯领域有着密切的联系,多方面促成了数字图书馆今天的成就。

本文通过利用Histcite对WOS中关于数字图书馆的1 918篇文献进行分析,对数字图书馆领域的核心作者、核心期刊等有了一定的认知,并通过引文时序分析对其研究方向有了直观的了解,并能够对未来发展方向有一定的指引,同时对引文编年图的分析也验证了对核心作者、核心期刊等分析的正确性。

参考文献:

[1] 肖明,沈英.国内外数字图书馆研究现状及未来走向[J].现代图书情报技术,2000(6):25-28,87.

[2] 闫伟东.数字图书馆发展的可视化分析[J].公共图书馆,2012(1):30-34.

[3] 罗昭峰.引文分析软件histcite简介[EB/OL].(2018-03-09)[2018-09-10].http://blog.sciencenet.cn/home.php?mod=space&uid=304685&do=blog&id=383399.

[4]张月红.HistCite:一个新的科学文献分析工具[J].中国科技期刊研究,2007(6):1096.

猜你喜欢

数字图书馆
我国医学数字图书馆研究的文献计量分析
互联网思维下数字图书馆个性化服务建设研究
谈图书馆资源与小学数学教学有效整合
论新时代公共图书馆员的职业素养
充电者的知识殿堂——数字图书馆
高校图书馆的未来发展模式刍议
浅析“互联网+”时代的图书馆管理
基于云计算的数字图书馆建设与服务模式研究
刍议数字图书馆计算机网络的安全技术及其防护策略