Scientometrics2000~2014年载文分析*
2016-06-05玲王丽丹
王 玲王丽丹
(1.天津大学图书馆 天津 300072;2.天津大学管理与经济学部 天津 300072)
Scientometrics2000~2014年载文分析*
王 玲1王丽丹2
(1.天津大学图书馆 天津 300072;2.天津大学管理与经济学部 天津 300072)
以SCI数据库中Scientometrics2000~2014年期间刊载的2 415篇论文为研究对象,采用文献计量学的方法,从载文量、被引情况、合作情况、核心作者、研究热点等几个角度进行分析,同时对中国作者发表的论文进行重点分析。研究结果表明,中国的发文量逐年上升,2011~2014年一直排在第一,但是总被引次数以及篇均被引次数都偏低,合作论文以国内合作为主,国际合作比例偏小,主要的合作国家有美国、比利时等。
情报学 期刊评价 文献计量学 Scientometrics
1 前言
科学计量学是对科学进行定量研究的学科,由于科学的数学化趋势的推动和科学学发展的带动,科学计量学迅速发展壮大,于20世纪60年代成为一门学科而被人们接受[1]。经过100多年的发展,人们对科学计量学的研究也在不断深入,科学计量学初步形成了自己特有的研究方法和评定指标。
1978年创刊于匈牙利的Scientometrics是刊载科学计量学领域的研究论文、短讯、评论的一种顶级的代表性期刊。本文拟采用文献计量学的研究方法,以Scientometrics这本期刊为例,对其载文、被引、词频以及合作等情况进行分析,揭示国际上科学计量学的发展状况,以及我国科学计量学的发展近况、国际影响力以及亟待解决的问题,以期为我国科学计量学的进一步发展提供参考。
2 数据来源与研究方法
本文作者于2015年5月在SCI数据库中检索Scientometrics2000~2014年期间刊载的论文,排除检索结果中的书目提要、书评、编辑材料以及信件等147篇非学术论文,最终得到2 415篇论文,作为本文的研究对象。采用文献计量学的方法,对这批论文从多个角度进行分析。
3 Scientometrics2000~2014年载文分析
3.1 载文量
载文量也称发文量,是指来源期刊在统计当年发表的全部论文数,它们是统计期刊引用数据的来源[2],是衡量一种学术期刊吸收和传递情报能力的主要指标[3]。
3.1.1 各年载文量 笔者对2000~2014年Scientometrics每年的载文量进行统计分析(如图1),图1清晰地显示了各年载文量的变化趋势。由图1可见,2000~2014年期间,Scientometrics各年载文量虽然有小幅的波动,但整体上呈现递增的趋势。具体来讲,2000~2005年,每年载文量相差不大,且都不超过100篇。2006年增长迅速,比2005年增加约50篇,2007、2008年有回落。自2009年开始,除个别年度(2011年)有小幅回落以外,各年的载文量一直持续增长,2010年突破200篇,2014年首次突破300篇,数量达到新高。
图1 2000~2014年Scientometrics各年载文量
3.1.2 各国发文量 本文依据2000~2014年Scientometrics载文第一作者所属国家,统计出发文总量大于100的8个国家历年发表的论文总数,如图2所示。由图2可以看出,在早期(2000~ 2010年),荷兰、美国和比利时发文量排在前列,占据很大的比例,这主要因为科学计量学发源于欧美国家,且这些国家有较强的研究实力,形成了一些研究中心,拥有一批活跃的科学计量学研究者。自2011年起,中国的发文量增幅明显,2001~2014年发文量一直位于第一,笔者认为这取决于中国学者对科学计量学的关注和重视以及科学计量学国际合作的增强。在诸多国家中,中国可以说是科学计量学研究的后起之秀。
图2 发文总量大于100的国家历年发文走势
3.2 被引情况分析
期刊的篇均被引次数是该期刊刊载论文的总被引次数数量之和与论文数量的比值。篇均被引次数是对期刊进行引文分析的主要指标,因为总论文数量、总引用次数都会受到期刊出版周期和总出版期数的影响,而篇均被引次数则排除这些因素,可以从一定程度上反映学者对期刊论文的认可程度。本文依据2000~2014年Scientometrics所刊载论文的被引信息,统计各年度所刊载论文的总被引次数以及篇均被引次数。由于总被引次数和篇均被引次数数量相差比较大,为清晰看清走势,用纵轴主坐标轴代表总被引次数,纵轴副坐标轴代表篇均被引次数,从图3中可以清楚看到,总被引次数和篇均被引次数的走势大体一致。
图3 历年总被引次数、篇均被引次数
3.3 合作情况分析
合作率是考察作者合作程度的重要指标之一[4]。排除作者栏信息为空的文献,2000~2014年Scientometrics载文中共有1 371篇合作论文,合作论文数量占载文总数(2 415篇)的比率(即“合作率”)为56.77%。其中,国内合作的有851篇,国际合作的有520篇。历年载文总篇数及合作论文篇数如图4所示。
统计显示,总篇数与合作论文篇数的变化趋势趋于一致。合作论文的篇数受总论文篇数的影响,在2008年之前呈现缓慢上升的趋势,而在2008年之后,上升的趋势明显加强,这也从一个侧面说明了合作研究逐渐成为科学计量学研究领域的一种重要方式,科研合作程度随时间的推移在不断增强。仅2011年的合作论文篇数略微有所下降,这一方面是由于受总篇数下降的影响,另一方面科研合作受到诸多复杂因素的影响,数量上的波动完全正常。
图4 历年载文总篇数及合作篇数
国际合作更能够体现科学计量学研究的国际化以及受各国重视的程度,因此本文运用UCINET与Gephi对520篇国际合作论文进行了进一步的统计分析,以作者所属国家为节点,以合著论文篇数为权重,构建国际合作网络,并统计出每个节点的度,如图5所示。从图5中可以看出网络中存在几个中心节点,说明网络图具有无标度特性。还可以看出,比利时和匈牙利的合作权重是最高的,这主要取决于两国在科学计量学领域的发展基础深厚,科学计量学在两国的发展氛围较好的原因。中国和美国的合作权重处于第二位,第三位是美国和英国的合作权重。
3.4 核心作者分析
科学生产率是科学工作者创造科学成果的效率,可通过作者在一定时间撰写论文数量来衡量[5]。通常,在社会科学中用卢梭定律来确定人群中精英学者的数量,该定律称:在规模为N的人群总体中,内含杰出的精英者为N0.5。普赖斯受该理论的启发,通过计算后得出:一位高产作者发文量m应为最高产作者发文量nmax的一半,具体公式为高产作者即为核心作者。根据此公式,2000~2014年Scientometrics载文共有作者3 321个,最高发文量为63,则计算后最大整数为8,那么依此公式,Scientometrics核心作者的最低发文量应该是8篇。经过统计,发文总量大于等于8的作者总数有76个,核心作者占比为2.29%。
图5 国际合作网络图
图6中选取了发文量前20名的作者,横坐标代表作者,纵轴主坐标轴用来衡量作者发文的总被引次数,又因为作者发文总量、篇均被引次数相对于总被引次数来说相对较小,为清晰看清对比,采用纵轴副坐标轴来衡量发文总量以及篇均被引次数。图6中的折线显示了每位作者的总被引次数,数值对应纵轴主坐标轴;每位作者的左、右两柱分别表示的是作者发文总量、篇均被引次数,数值对应的是纵轴副坐标轴。
从图6中可以看到,匈牙利的Glanzel W的发文总量、总被引次数均为最高且遥遥领先,特别是总被引次数达2 200余次,其余作者均未超过1 000次,篇均被引次数排第三,这与他的国籍不无关系。在匈牙利,科学计量学的研究基础较为深厚,科研环境较好。发文总量位于第二、第三的分别是比利时的Egghe L和Rousseau R,比利时也是科学计量学发展较早的国家。这三位不仅发文总量高,其论文的总被引次数都超过500次,而且分别获得了1999至2001年的普赖斯奖,说明这三位作者实力非常强,在科学计量学领域的影响力也较大。
发文总量前20名的作者中,Ho Y S、Schubert A、Mayer M、Moed H F这四位作者的总被引次数、篇均被引次数都比较高,他们的论文总被引次数均超过500次,篇均被引次数均超过30次。
图6 发文总量前20名的作者发文总量、总被引次数、篇均被引次数
4 研究热点分析
4.1 词频分析
关键词是论文不可或缺的组成部分,是表达文献主题概念的术语,它是从文章题名、摘要和正文中抽取的能够最简洁、最直接反映论文主题内容的词或词组[7]。关键词频次的变化可以从一个方面透露出研究热点的形成和转移。词频分析法是利用能够揭示或表达文献核心内容的关键词或主题词在某一研究领域文献中出现的频次高低来确定该领域研究热点和发展动向的文献计量方法[8]。标签云图是一种对标签(关键词)的可视化组织和表现方式。标签云图中的标签通常是单词,一般按字母顺序排列,标签的重要性(权重)通过字体大小或者颜色来标示,这就使得通过字母顺序和重要程度查找标签成为可能[9]。
本文采用标签云图的方式,统计分析2011~ 2014年Scientometrics载文的关键词词频,以揭示科学计量学的研究热点。由于表达同一主题的关键词可能有多种不同的表达形式(如Bibliometrics、Bibliometric等),本文根据研究主题对关键词进行了合并整理,选取2011~2014年频率大于5的高频关键词,运用ROSTCM生成各年度的高频关键词标签云图,并将四年的标签云图合并在一起方便比较和查看,最终生成图7。
通过对图7中每年的标签云图的比较,我们发现,在众多关键词中,高频关键词有“文献计量学”(Bibliometrics)、“引文分析”(Citation analysis)、“引文”(Citations)、“评价”(Evaluation)、“合作”(Collaboration)、影响因子(Impact factor)、H指数(Hindex)、网络计量学(Webometrics)、专利(Patent)、中国(China)、社会网络分析(Socialnetwordanalysis)、三维螺旋(Triplehelix)等,反映出其研究热点和趋势。
图7 2011~2014年Scientometrics载文高频关键词标签云图
5 中国相关研究
近年来,随着中国科学计量学的不断发展以及我国学者国际交流的不断增强,我国科学计量学的发展也呈现出良好的上升趋势。本文选取2000~2014年Scientometrics上中国作者参与发表的论文从发文量、被引以及合作几方面进行分析。
5.1 发文量及被引分析
前文图2表明,在世界各国中,自2011年起,中国的发文量一直位于第一,中国作者已累计在Scientometrics上发表309篇论文。为了说明这些论文的被引情况,笔者借助期刊篇均被引的概念,计算出参与发表论文的作者所属国家的篇均被引次数,通过比较国家间的总篇数、总被引次数以及篇均被引值,可以很大程度上说明一个国家论文的质量。
表1选取总被引次数大于1 000的9个国家进行分析,按总被引次数由大到小排序。从表1中可以看到,比利时、荷兰和美国的总被引次数排名前三位,均大于3 000次。在篇均被引次数上,比利时、荷兰和匈牙利的篇均被引次数均大于20次,高于其他国家。而中国作为发表论文总篇数仅低于美国的国家,其总被引次数和篇均被引次数都不高,这足以说明,中国的论文质量还有待提高。
表1 各国发文量及被引次数
5.2 合作分析
论文的国际合作情况可以很好地说明一个国家科学研究的国际化程度。中国作者在Scientometrics累计发表的309篇中,有302篇是合作论文,有7篇论文的作者是单独作者。本文对中国作者参与发表的这302篇合作论文分为两类进行统计:第一作者国家为中国的论文,第一作者国家为非中国的论文。
5.2.1 第一作者国家为中国的论文合作情况 第一作者所属国家是中国的合作论文总数225篇,其中,国内合作139篇,占合作论文的61.78%,说明中国国内合作占据主要地位。国际合作论文数量86篇,主要的合作国家是美国、比利时等。从表2中,国内合作和国外合作对比可以看到,国际合作与国内合作的数量还是有一定的差距,中国的国内合作强于国际合作。说明在学术合作方面,中国还应该加强国际合作。
表2 第一作者国家为中国的论文合作情况
5.2.2 第一作者国家为非中国的论文合作情况第一作者国家为非中国的论文总数是77篇。在合作中,中国作者作为参与者,与比利时、中国台湾、德国等的合作较多。比利时在科学计量学的学术基础和突出表现奠定了中国与其合作次数较多的基础,中国与其合作可以充分利用其在科学计量学方面的影响来提升自己的学术研究水平。从表3中也可以看到,中国与中国台湾的合作排名第二,说明海峡两岸在科学计量学合作上比较活跃。此外,德国、匈牙利与中国的合作论文都有7篇。
表3 中国作为参与国家与其他国家、地区的合作情况
6 结论
本文通过对Scientometrics2000~2014年的载文从载文量、被引情况、合作情况、核心作者、研究热点等几个角度进行分析,同时对中国作者发表的论文进行深入研究。研究结果表明:
(1)2000~2014年期间,Scientometrics累计载文2 415篇,各年载文量虽然有小幅的波动,但整体上呈现递增的趋势;从各个国家发文量的比较来看,2000~2010年,荷兰、美国和比利时发文量排在前列,自2011年起,中国的发文量增幅明显,一直位于第一。
(2)论文的总被引次数和篇均被引次数的走势大体一致。
(3)2 415篇载文中共有1 371篇合作论文,合作率为56.77%,其中国内合作851篇,国际合作520篇。国际合作权重前三位的是:比利时和匈牙利,中国和美国,美国和英国。
(4)发文总量大于等于8篇的作者总数有76个,核心作者占比为2.29%。发文总量前三位的作者是Glanzel W、Egghe L和Rousseau R,其总被引次数都超过500次,而且他们分别获得了1999至2001年的普赖斯奖,说明这三位作者实力非常强,在科学计量学领域的影响力也较大。发文总量前20名的作者中,Ho Y S、Schubert A、Mayer M、Moed H F这四位作者的总被引次数、篇均被引次数都比较高。
(5)2011~2014年高频关键词标签云图反映出文献计量学、引文分析、影响因子、H指数、网络计量学、社会网络分析等是Scientometrics近几年的研究热点。
(6)中国的发文量逐年上升,且2011~2014年一直排在第一,但是总被引次数以及篇均被引次数都偏低。从第一作者国家为中国的225篇论文来看,国内合作139篇,占合作论文的61.78%,国际合作论文数量86篇,主要的合作国家是美国和比利时;从第一作者国家为非中国的77篇论文来看,比利时、中国台湾、德国、匈牙利与中国作者的合作论文数量较多。
通过前文分析,笔者认为,中国在科学计量学领域不仅应增加论文的数量,更重要的是进一步提高论文的质量和被引频次;同时,可继续加强和深化国际合作,主动参与其他国家和地区的科研项目、寻求合适的科研合作伙伴,力求通过Scientometrics这一期刊展示中国更多、更好的研究成果,提升中国在科学计量学领域的地位和影响力。
[1]方 勇.科学计量学的方法论研究[M].重庆:西南师范大学出版社,2006:1.
[2]朱礼军,陶 兰,刘 慧.领域本体中的概念相似度计算[J].华南理工大学学报:自然科学版,2004(32):147-150.
[3]吴起立.基于本体的题名自动分类研究[J].情报学报,2011 (1):51-55.
[4]SubramanyamK.Bibliometricsstudiesofreaearchcollaboration:A review[J].Journal of information science,1983,10(6):33-38.
[5]许雯燕,康平立,龚 勋.科学生产率的分布及其产生机制[J].现代情报,2007(9):212-214.
[6]王崇德.文献计量学引论[M].桂林:广西师范大学出版社,1997:162-164.
[7]邱均平.文献计量学[M].北京:科学技术文献出版社,1988:440-446.
[8]马费成,张 勤.国内外知识管理研究热点——基于词频的统计分析[J].情报学报,2006(2):163-171.
[9]廖 凤,张建勇.Keyword Cloud在文献检索中的应用研究[J].图书馆杂志,2010(9):57-61.
(责任编校 田丽丽)
An Analysis of the Articles in Scientometrics From 2000 to 2014
Wang Ling1,Wang Lidan2
1.Library of Tianjin University,Tianjin 300072,China; 2.College of Management and Economics,Tianjin University,Tianjin 300072,China
Taking 2 415 articles in Scientometrics from 2000 to 2014 in SCI database as research objects and adopting the bibliometrics method,this paper analyzes the state of this journal concerning the number of its articles,citation,cooperation,core authors and research hotspots and especially studies Chinese authors’articles.Results show that the number of the articles by Chinese authors is continuously on the rise,ranking first from 2011 to 2014,while their total citations and citation per article are quite low and their co-authors are mainly from China with only a few from United States,Belgium,etc.
information science;periodical evaluation;bibliometrics;Scientometrics
G353.1
王 玲,女,1974年生,硕士,副研究馆员,主要研究方向为文献计量学、专利情报,发表论文22篇;王丽丹,女,1990年生,2013级情报学硕士研究生,主要研究方向为文献计量学、专利情报,发表论文1篇。
*本文系天津大学自主创新项目“我国十所高校及中科院专利引证的比较研究”(项目编号:2013XS-0098)、天津市哲学社会科学研究规划资助项目“市场竞争环境下高校图书馆专利信息服务模式构建”(项目编号:TJTQ11-020)的研究成果之一