APP下载

国内图书情报核心期刊高被引论文分析

2022-01-16魏招远王佳英

科教导刊·电子版 2021年34期
关键词:情报发文图书

魏招远 王佳英 单 菁 李 冉

(沈阳建筑大学信息与控制工程学院 辽宁·沈阳 110168)

0 引言

核心期刊是图书情报领域的主要学术平台,其刊载的论文代表了我国图书情报领域整体的研究层次和学术水平[1]。根据ESI数据库的界定,高被引论文指近十年来被引频次排在前1%的论文。论文的被引频次,一定程度上可以反映该论文的质量和水平。高被引论文之所以引起大量读者关注是因为论文中的大量内容可以导向该学科研究的热点及发展方向[2]。高被引论文作为科学评价的重要组成部分,其相关问题已成为当前业界和学术界共同关注的热点话题。从现有研究来看,高被引论文研究吸引了多学科研究者的积极参与,不同学科从不同研究视角对高被引论文展开不同层面问题的探讨,形成各具特色的研究成果。高被引论文对期刊影响力、影响因子有重要影响是学界的共识:对作者而言,高被引论文意味着高学术影响力;对期刊而言,高被引论文是期刊高质量、高水平的主要贡献者,对期刊引证指标也有重要贡献;对机构而言,高被引论文是评价其研究状况、学科研究特点和学术影响力的客观指标之一[3]。图书馆是一个档案型机构,以藏书为主体的色彩较浓厚,与社会之间的关联度一直很小[4]。有学者通过引文统计发现,在人文学科中,图书馆、情报和档案学的学科被引自引率(92.53%)和施引被引率(84.64%)都最高,这说明这些学科的知识较封闭,其特点是信息在固定渠道内传播和流动,对周边学科产生的辐射和影响较小,由此认为图书馆、情报和档案学在这方面“非常典型”[5]。我国对于高被引论文的研究十分广泛,但由于图书情报学科研究人员数量少,学科发展时间短,相关论文少等原因,导致图书情报学科的高被引论文研究进展缓慢。

论文的被引频次能够客观地反映该论文的影响力及其在学术交流中的作用和地位,因此,近年来论文被引频次成为国际上普遍采用的科研水平评价标准之一[6]。发文量的变化能反映一个领域的发展状况和不同发展阶段[7]。对高被引论文的研究必须与时俱进,随着数字时代的发展,许多新技术、新体系的出现也为高被引论文的研究提出了许多新思路,配合当今的新思路再对图书情报专业高被引论文进行研究是非常有必要的。洞悉研究前沿领域,有助于把我科学领域未来研究和发展的趋势,有利于促进学术研究的理论升华[8]。本文通过分析近十年来图书情报领域高被引论文,来探究高被引论文对于学科的发展方向及趋势是否存在确定的引导关系,并对今后的研究进行展望,以期为未来该领域的理论研究和实践应用提供借鉴和参考。

1 研究方法

1.1 数据采集

在对比中国知网(中国知识基础设施工程)数据库平台、万方数据知识服务平台、维普网等多个平台后,发现中国知网对于论文被引量数据更新最快,因此选用中国知网数据平台作为本次数据统计的主要平台,其他数据平台的数据作为辅助支撑。通过中国知网查询在期刊名称中分别输入19种图书情报学核心期刊刊名为检索词进行检索,出版年度为2011-2020年。将检索结果中被引次数≥100次的论文作为高被引论文选中,统计高被引文章的篇目名称、作者、发文机构、发表时间、被引次数、下载次数和关键词。当统计数据发生异常时(如检索不到输入的期刊名称,或检索后发现该期刊被引量与其他期刊存在较大差异)选用其他数据平台用相同方法再次进行检索。

1.2 作者及发文机构的去重统一

由于多数文章的作者和发文机构不止一个,因此,在统计作者和发文机构时要采取两种统计方式。首先,先将第一作者及第一发文机构单独统计一次,列出图表观察;最后,再将第一作者及发文机构与其他作者及发文机构综合统计一次,同样列出图标观察,并比较两次统计之间的差异。此外,在统计高频作者时不免有重名现象,对出现频次≥3次及部分出现频次≥2次易重名作者在中国知网学者库中进行重名审查。

1.3 发文机构及地域划分

在统计发文机构地域时,某些发文机构名称不同但地域相同,皆按地域次数相加而算(例:武汉大学科学评价研究中心;武汉大学信息管理学院,则算作武汉出现2次)。在统计发文机构时如出现同类情况,发文机构的单位相同,科系不同皆以发文单位为准(例:武汉大学科学评价研究中心;武汉大学信息管理学院,则算作武汉大学出现2次)。在统计发文机构地域时,采取多种划分方式共同统计的方法。首先,按发文地市划分;最后,按发文省份划分。

1.4 主题统一性

在文章主题及关键词的统计时,常常出现名词实质意思一致,但名称不一致的问题。由于作者对于相同问题的不同表达,其表明的实质意思却是一致的,如微信公众号、微信公众平台。二者实际并无较大差异,因此,在统计过程中则不予区分,皆按其中一类进行统计。

2 结果分析

2.1 期刊来源分布

通过对期刊来源进行统计,在19种图书情报学核心期刊中,被引次数≥100的论文共有217篇。如图1所示,在统计的217篇高被引论文中,其中《中国图书馆学报》34篇,《图书情报工作》33篇,《情报杂志》29篇,《图书与情报》22篇,《大学图书馆学报》15篇,《情报科学》12篇,《图书馆杂志》11篇,《图书馆建设》9篇,《情报理论与实践》9篇,《图书情报知识》8篇,《现代图书情报技术》7篇,《图书馆学研究》6篇,《情报资料工作》5篇,《图书馆工作与研究》5篇,《国家图书馆学刊》4篇,《图书馆论坛》4篇,《图书馆》3篇,《图书馆理论与实践》1篇,《情报学报》被引次数≥100的论文在多个数据平台中均未检索到。

从以上期刊发表的数量来看,《图书情报工作》《中国图书馆学报》《情报杂志》《图书与情报》四种期刊被引次数大于100的文章均超过了20篇,而《图书情报工作》及《中国图书馆学报》分别贡献35、34篇。由图2可以更为直观的展现出各图书情报核心期刊在近十年来高引论文中所占的比例。可见,这四种期刊在近十年图书情报领域占有重要地位,其发表论文的质量也是非常之高的。

图1:近十年核心期刊高被引论文篇数

图2:近十年核心期刊高被引论文占比

2.2 作者的分布

一门学科的建设与发展离不开学科的领军人物。在学科的发展过程中基于“优胜劣汰、适者生存”,总会有一些研究人员通过自身努力,在科研成果、人才培养、团队建设和平台建设等方面脱颖而出,成长为本学科的“执牛耳者”,领导与引领本学科学术共同体的成熟与进步,凸显本学科“制高点”和“突破口”地位。学科领军人物有多个维度来评判,但研究成果数量与质量是个核心指标,表征了学术共同体的公认程度。通过对研究论文的统计分析,基本上可以找出某时期内某一学科的领军人物[9]。

由于不同文章发文者数目不一,我们将采取两种统计方式,分别将第一作者出现频次与全部作者出现频次进行统计。由图3可见,在统计的217篇高被引论文中,其中王世伟作为第一作者发表的论文共5篇;张晓林、邱均平作为第一作者各发文4篇;范并思、韩翠峰、王国华、魏群义、张晓林为第一作者发表的文章各3篇;魏群义、王国华、兰月新、黄如花、韩翠峰、范并思、初景利为第一作者发表的文章各3篇,其余作者各以第一作者发表论文1~2篇不等。

图3:第一作者出现频次

图4:全部作者出现频次

其次,不仅仅只统计以第一作者的发文数量,第二、第三等作者的被引文章数量在高被引论文中也极具代表性。高被引文献著者合作度及合作率的值都很高,这在一定程度上说明情报学研究更多强调团队合作,较多的合作者能够保证研究内容具有相对高的科学性[10]。而且,许多高频出现的第一作者也会以第二作者的身份出现在高被引论文作者之中,将各高被引论文全部作者统计更有利于发现最高频次出现的作者,更能够精准的找出本学科的领先者。因此,我们还要将217篇高被引论文中所有作者出现的频次进行统计,观察其结果与只统计第一作者的结果之间的差异。在进行数据整理后,将出现频次≥3的作者筛选出来作为高出现频次作者。在217篇高被引论文中,其中出现频次最高的作者为王世伟,共5次出现在近十年高被引论文的作者中。邱均平、王国华、魏群义、张晓林四位作者在近十年的高被引论文作者中各出现4次。作者初景利、范并思、韩翠峰、侯桂楠、黄如花、霍然、兰月新、李晨晖、刘炜、王波、朱庆华各发表3篇。其余作者各出现频次为1~2次。

我们将作者出现频次分梯队排序(发文量最高者列为第一梯队,其次为第二梯队,以此类推)以便观察。通过对比第一作者发文量发现,作者王国华、魏群义以总量4篇跻身到第二梯队;作者朱庆华、王波、刘炜、李晨晖、霍然、侯桂楠、曾润喜总量3篇跻身到第三梯队;作者资芸、钟辉新、张仲华、张兴旺、薛秀珍、秦晓珠、刘炜、廖寅、李国俊、李白杨、胡小菁、成颖、曾润喜以总量2篇进入第四梯队。其余作者只有一篇进入被引次数大于100的高被引论文。通过上述统计发现,在统计第一、二梯队时,虽然有作者通过非第一作者使自己的高被引论文作者出现频次增加了,但是在第一、二梯队中所有作者的出现频次均是建立在其以第一作者发文大基数上浮动的;然而在统计第三、四梯队时发现,第三梯队仅有两人以第一作者出现在高被引论文中出现过,第四梯队仅有四人在高被引论文中出现过,其余多数作者从未出现在近十年图书情报学科高被引论文第一作者中。在第二梯队中有魏群义、王国华两位作者凭借非第一作者增加了出现频次。在分析时发现,作者魏群义在非第一作者出现时,共同作者杨新涯有两篇论文都进入了高被引论文;作者王国华以非第一作者出现时,共同作者曾润喜通过与作者王国华、兰月新合作使自己的论文两次进入高被引论文中,而王国华、兰月新、魏群义皆是高频出现的高被引论文作者。因此,可以发现高被引论文的高频出现作者在能够发出高质量论文、引领学科前进的同时,还能够使身边人、共同合作的人更上一层楼,获得学术成绩。优秀作者对周围作者的“辐射”作用是非常明显的。

2.3 发文机构的分布

高被引论文产出机构,即作者所在机构[11]。在217篇高被引论文中,有394名(含重名)作者来自324家机构。在统计高频作者发文机构时仍要采用两种统计方式。首先以第一作者发文机构统计,其中武汉大学以26次出现频次排居榜首,中国科学院以12次的出现频次排列第二;北京大学、吉林大学、南京大学各出现8次;中山大学出现6次;华中科技大学、上海社会科学院信息研究所、上海图书馆各出现5次;华东师范大学、重庆大学图书馆各4次;北京师范大学、东北师范大学计算机科学与信息技术学院、南开大学等10家机构各出现3次;其余79家机构及杂志社各出现1~2次不等。

由图5可见,武汉大学在高被引论文第一作者发文机构中出现频次非常之高,甚至是第二名的一倍之多。可见,武汉大学在我国图书情报研究领域占据领先地位。

图5:第一作者机构分布

其次,我们再用所有作者发文机构统计,武汉大学以总出现频次37次依旧位列第一,中国科学院出现20次,南京大学出现16次;北京大学、吉林大学各出现11次;中山大学出现9次;华中科技大学公、上海图书馆、重庆大学各出现7次;桂林理工大学出现6次;北京邮电大学、华东师范大学、上海社会科学院信息研究所、中国人民大学各5次。东北师范大学、昆明理工大学、南开大学等6家机构各出现4次;北京师范大学、兰州商学院、清华大学图书馆等8家机构各出现3次;其余125家机构及杂志社各出现1~2次不等。

图6:全部作者机构分布

由图6可见,武汉大学依旧是我国图书情报领域的重点研究机构。这更加明确了我们对图书情报领域重点研究机构的认知。其他机构在搞研究的同时,要紧密的和这些处在前沿领域的机构交流、学习。通过此次统计发现,近十年的图书情报行业高被引论文几乎98%都来自国内高校。我国应该更加重视、巩固高校的学术地位,开设合理的评价制度与奖励机制,从而激励更多的高校师生投身于学术之中[12]。

2.4 发文机构地域分布

发文机构的地域分布可以直观的反映出该学科领域的重点研究区域。再通过对于重点研究区域周边省市的统计观察,了解高频作者发文机构地域对于周边省市是否具有辐射正相关的作用。通过对于发文机构的统计,我们将发文机构的最小单位规定到市级,按发文机构所在地市来整理发文机构的地域分布。通过统计,我们用饼图图示发文机构所在地市的分布情况。

图7:发文作者机构城市分布

从图7可见,北京、武汉、上海、南京四个地市几乎占到了核心期刊高被引论文发文机构所在地市的一半。北京、武汉分别有62、50家发文机构出现在高被引论文作者发文机构地域统计中,说明这两个地市是我国图书情报行业优秀文章发文的重心,虽然在上文中得出武汉大学在我过图书情报领域研究中有着领先地位的结论,但在统计作者发文机构地域时,北京市却一改常态,以发文机构总数领先了武汉市。说明北京市在图书情报行业的研究中多点开花,机构分布广泛。武汉市则略显单调,仅个别机构一枝独秀。

一个地市的优质论文发文量是否与其所在的省份之间有联系,是我们分析图书情报核心期刊高被引论文的重要研究部分。同时我们需要探究的还有地市的出现频次是否也影响着其周边省市的优质论文发文数量。因此,我们需要进一步统计中国各个省份的图书情报核心期刊高被引论文作者所在机构的分布情况,观察我国图书情报专业研究的重点所在省份。

通过图8所示,我们可以看到发文作者所在机构地市的出现频次与所在发文作者所在机构省份的出现频次有直接影响,发文作者所在机构地市的出现频次对于发文作者所在机构省份的出现频次影响是非常直观的。但是我们在统计过程中也发现了些许不同,河北省(秦皇岛、廊坊、邢台、张家口、保定)和山东省(济南、威海、烟台、潍坊、枣庄)分别有5个地级市出现发文作者机构;广东省(广州、

图8:发文作者机构省份分布

2.5 研究主题分析

引文分析作为一种广泛应用的文献计量学研究方法,早在20世纪20年代就已出现[13]。关键词表达了论文的研究主题,是论文的核心与精髓[14]。它是作者对文章核心研究内容的精炼,学科领域里高频词出现的关键词和从数据样本中,对每一篇文献进行提取后分析出的名词短语可被视为该领域的研究热点[15]。研究热点的体现,往往是在某个研究领域或方向中出现了大量的被引。研究热点之所以成为研究热点,往往是以少数研究论文的高被引作为重要标志和特征的[16]。在217篇高被引论文中,共含572个关键词。关键词可以说明一篇论文研究的大致方向及研究内容,对于高被引论文中关键词出现频次的统计可以导向出图书情报专业目前研究和发展的方向趋势。对这572个关键词选取出现频次≥5次的高频复现词进行统计。我们发现,“大数据”以30次的最高出现频次排在了第一名,这说明在大数据时代下,图书情报的研究方向是紧跟时代潮流的。“图书馆”及其相关关键词的出现总频次也非常之高。“图书馆”“高校图书馆”“图书馆服务”“移动图书馆”“智慧图书馆”“公共图书馆”“数字图书馆”的出现频次之和高达97次,可以反映出我国图书情报在研究在紧跟潮流的同时,依旧把图书馆相关的研究作为研究重点。

通过数据观察,由图9所示,我们发现“微信”“微信公众平台”“微博”等新媒体关键词出现在了榜单之中,而且在高被引论文中出现的频次比较高,可以推断,新媒体在图书情报的研究过程中也产生了较大影响。在研究的同时,我们又可以借助这些新媒体作为研究手段,能够更准确的获取我们想要的信息。这更加全面的印证了我国图书情报学近十年在以图书馆为基础研究的同时,是与时俱进,运用新技术,紧跟社会大趋势的。

图9:关键词出现频次

图10:发文数量年份统计

2.6 发文年份趋势分析

我们所统计的是自2011年~2020年近十年来图书情报核心期刊被引次数≥100的高被引论文,在这些高被引论文中,2011年发表的论文共52篇;2012年发表的论文共45篇;2013年发表的论文共43篇;2014年发表的论文共30篇;2015年发表的论文共26篇;2016年发表的论文共17篇;2017年发表的论文共4篇;2018年发表的论文共4篇;2019、2020均无论文出现在被引次数≥100的高被引论文当中。

由图10可见,高被引论文自统计的最远年份至今总体呈递减趋势,统计年份越远,高被引论文数量越多;发文时间越早,被引用的次数也就越多。可以得出,论文的被引受论文发文时间影响。论文的被引频次好比滚雪球,雪球滚得越大越容易被注意到,其被引次数就越可能增加,然而滚雪球也是需要时间成本的,发文的时间对于被引频次的扩大有着非常大的影响。在217篇高被引论文中,2019、2020均没有出现高被引论文,2018年存在了2篇,这说明一篇优秀论文从发表到被高频引用大约需要2年的时间。高质量论文被发现、被引用是有时间发现过程的。

2.7 论文篇幅对于被引次数的影响

关于论文篇幅与被引频次的关系,大多数研究认为提高论文篇幅有利于增加引用[17]。通过对于近十年图书情报核心期刊被引次数≥100的论文的统计,由于相同期刊篇幅差别不是太大,我们采取每本期刊选出被引次数第一名来统计,找出相关规律。通过统计,《中国图书馆学报》中“阅读推广与图书馆学:基础理论问题分析”全文共9页,被引502次;《图书情报工作》中“国内中文自动分词技术研究综述”全文共5页,被引365次;《大学图书馆学报》中“高校图书馆应对MOOC挑战的策略探讨”全文共5页,被引243次;《图书馆杂志》中“图书馆需要怎样的‘大数据’”全文共7页,被引247次;《图书馆论坛》中“阅读推广、图书馆阅读推广的定义——兼论如何认识和学习图书馆时尚阅读推广案例”全文共7页,被引279次;《图书馆》中“大数据时代图书馆的服务创新与发展”全文共2页,被引230次;《情报科学》中“B2C电子商务网站用户体验评价研究”全文共7页,被引175次;《图书馆建设》中“未来图书馆的新模式——智慧图书馆”全文共5页,被引413次;《现代图书情报技术》中“K-means算法研究综述”全文共8页,被引322次;《图书情报知识》中“突发公共事件网络舆情研究综述”全文共9页,被引201次;《情报资料工作》中“智慧图书馆及其服务模式的构建”全文共3页,被引219次;《情报理论与实践》中“微博用户特征分析和核心用户挖掘”全文共5页,被引182次;《情报杂志》中“大数据时代个人信息保护的现实困境与路径选择”全文共6页,被引294次;《图书馆工作与研究》中“文献计量法与内容分析法比较研究”全文共3页,被引177次;《图书馆理论与实践》中“论网络信息时代的‘被遗忘权’——以欧盟个人数据保护改革为视角”全文共6页,被引147次;《图书馆学研究》中“微信公众平台及其在图书馆移动服务中的应用与研究”全文共5页,被引180次;《图书与情报》中“图书馆阅读推广亟待研究的若干问题”全文共5页,被引359次;《国家图书馆学刊》中“慕课,撬动图书馆新变革的支点”全文共7页,被引173次。

图11:论文篇幅与被引频次

关于论文篇幅与被引频次的关系,业界倾向认为其呈正相关关系,近年来图书馆情报与文献学期刊载文量急剧下降或许与之相关,有必要重新进行剖析。通过具体的数据整理分析,由图11可以观察到,其中蓝色柱状代表论文篇幅,红色曲线代表被引频次。整体上来看,论文篇幅的长短对于被引频次并无太大影响,如此结论与业内普遍认可的论文篇幅与被引频次关系并不一致。作者如果想要通过增加论文篇幅来获得被引频次的上涨很可能事与愿违。

3 结语

我们绝不排除个别高质量论文因保密和不公开等因素无法被主流数据库所检索到,但这并不影响我们所统计的高被引论文所能够导向出的信息。这些高被引论文所能导向出的信息对于专业的发展是有着巨大的辅助及推动作用。

本文通过对近十年图书情报核心期刊高被引论文的期刊来源分布、作者分布、发文机构分布、发文机构地域分布、研究主题分析、发文年份趋势分析、论文篇幅对被引次数的影响几个方面分析,得出如下结论:

(1)通过对于217篇高被引论文期刊来源的统计,我们发现在19种核心期刊中《中国图书馆学报》及《图书情报工作》两种期刊中出现高被引论文的频次最高,说明这两种期刊的质量水平在图书情报领域居于先导地位。

(2)通过对于217篇高被引论文的作者来源统计,王世伟、张晓林、邱均平等作者被引用的论文篇目非常之高,说明该作者的论文质量非常高,他们走在了近十年图书情报研究领域的最前列。后又通过对几位作者相关发文分析,发现该几位作者与其他作者合作时使得其他作者的发文多篇入选了高被引论文。说明优秀作者对于周边作者的“辐射”作用异常明显。通过与优秀作者进行合作交流,能够直接影响自身发文的质量水平。

(3)通过对于发文作者机构来源的统计,我们发现武汉大学在这217篇论文中作为发文机构出现的频次非常之高,而且其总数远高于其他发文机构,说明我国图书情报研究的重点机构在武汉大学,武汉大学在全国图书情报研究领域起着很强的带头领导作用。

(4)通过对于作者发文机构所在地域的统计,我们发现北京市和湖北省武汉市,两地所有的发文机构出现频次非常之高,说明了北京市和武汉市是我国图书情报的研究的重点地市,这两个地市在我国图书情报研究方面是领先的。在培养图书情报人才方面,可以适当增加学员到两地去学习、实习机会,这样非常有利于我国图书情报人才的培养。通过对于发文机构省市的分析,我们发现,高频出现高被引论文的地域基本集结在特定的地市(如北京市、武汉市、上海市等)。湖北省作为高频出现高被引论文的省份,其高被引论文全部都来自武汉市。如此现象,其他省市是否可以借鉴,将本省内研究图书情报机构进行资源优势整合,划定重点研究机构,使得省内研究者通力合作,以达到更好的研究效果。

(5)通过对于这217篇高被引论文的主题分析,发现大数据、图书馆、阅读推广、微信公众平台等关键词出现频次非常之高。由此可以看出,我国图书情报研究在坐实“图书馆”相关研究的基础上,不断与时俱进,紧跟社会研究大趋势,结合社会新方法,走在学科研究的最前沿。其中微信公众平台、微博等新媒体的出现,不禁让我们发现,图书情报的研究也利用到了新媒体,将新媒体作为研究工具也成为我国研究图书情报的新手段。

(6)通过对于发文年份的分析,我们发现发文年份越早,其被引次数相对越高,一篇文章的发文及被引与时间的关系是成反比的,发文时间越近期,被引频次相对越少,说明一篇好的文章被发现是需要一个时间过程的,这个过程据估算大概在发文之后的2年被显现出来。

(7)通过本文对于论文篇幅与被引频次关系所用的方法分析,得出了论文篇幅与被引频次之间总体并无直接关系。多数研究认为论文的篇幅对于被引频次和论文质量的提高是有直接影响的。许多作者认为如果大幅增加论文的篇幅,就可以使自己的论文更受关注,增加被引频次。然而,这种想法可能无法达成其目的。虽然论文的被引频次是评论一篇论文质量水平的重要因素,但是统计表明论文篇幅与被引频次并无太大关系,一味地追求论文的篇幅并不会导致被引频次的增加。

猜你喜欢

情报发文图书
情报
情报
情报
图书推荐
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
欢迎来到图书借阅角
校园拾趣
爷孙趣事
以牙还牙
班里有个图书角