开放获取论文缓慢响应现象研究
2022-11-10刘佳雨
刘佳雨
(南京邮电大学 图书馆,江苏 南京 210023)
0 引言
论文的首次被引通常被认为是它生命周期的开端,也是实现零被引的一个突破[1]。首次被引速度的快慢可以衡量文献的科学价值,一般来说被引速度越快,越能表示这篇文献观点新颖有价值[2]。但是也存在“睡美人”这类特殊的文献,常常“沉睡”很久才被人们发现[3],目前对“睡美人”文献的研究大多仍是针对其中高被引论文的延迟响应展开,而对其他占比为大多数的延迟响应的所谓“低被引”论文却缺少研究。高低被引的界线两边本就存在模糊地带[4],一些所谓的“低被引”文献的被引次数可能并不少,所以除高被引外的论文同样具有科学价值。不同于以往以高低被引的标准进行分类,本文提出以首次响应时间为界线将论文进行分类,将高低被引论文一起进行比较。
首次被引与开放获取之间的研究较少。对于OA(开放获取)与nOA(非开放获取)论文在首次被引阶段的表现,有学者将混合出版期刊的OA与nOA论文发表后前3年的响应程度进行对比,结果显示OA具有响应快速的起步优势[5]。该研究仅针对单一领域的某本期刊,结果或许不具备推广性,但是这一方向的研究对OA论文的引文机制、引文生命周期以及优势探索有明显的积极意义,需要更多关注。
综上,目前的研究对除高被引外文献的延迟响应研究较少,也较少有论文探索OA论文与首次响应的关系。本文提出以OA和nOA论文的首次响应时间为研究对象,将所有论文按快速、普通和缓慢响应进行分类,展现OA与nOA在首次响应速度上的不同特点。本文对缓慢响应做出定量的界定,展示OA缓慢响应现象的特性与独特的引文生命周期,有助于从引文周期角度更细化地展现出OA优势具体作用于引文周期的某一阶段,有利于科研工作者更清晰地认识OA与nOA优势。
1 数据与定义
1.1 数据
本文选择Hindawi公司旗下的期刊论文为研究样本。Hindawi是世界上最大的完全开放获取(Fully Open Access)期刊出版商之一。Hindawi公司收录了从1874年开始的OA论文[6],收录较早期的论文,给予OA论文充分的被引用时间,方便进行OA引文的研究。
本研究选择发表时间为2000—2001年收录在Hindawi网站上的所有开放获取论文,共搜索到3 418篇,除去未被引用的论文,共得到2 466篇OA论文及其被引相关数据。之后,再根据OA论文中的关键词,在SCI中随机检索出相似领域的2 466篇已获得引用的nOA论文,记录文献的基本信息。
1.2 缓慢响应的定义与量化
匈牙利学者Schubert等[7]在研究中首次提出论文发表到首次被引之间的“响应时间”。本文延用“响应时间”这一概念。考虑开放获取因素的加入使得论文的首次被引时间较分散,仅分为快慢两类论文会使分类不够准确,所以本文根据所有论文的响应时间将论文分为快速响应论文、普通响应论文和缓慢响应论文。依据Sun等[8]在论文中将2年内设为立即响应(Immediately)以及将5年后设为轻微沉寂(Light Disappearance)论文的区分标准,本研究将发表后2年内完成首次被引的论文定义为快速响应论文;第3~5年内完成首次被引的论文则为普通响应论文;第6年开始才被第1次引用的论文称为缓慢响应论文。
2 结果与分析
2.1 基本统计
2 466篇OA和2 466篇nOA论文发表后获得首次被引时间的分布情况,如图1所示。图1横坐标表示每篇论文首次被引时间,横坐标“1”表示在发文当年即发文第1年被引用,“-1”表示OA论文因为提前出版在正式发表前1年就获得了首次被引;纵坐标表示在某个时间点获得首次引用的论文篇数。整体来看,nOA与OA论文的趋势大致相同,在论文发表后的前两年获得首次被引的论文数呈上升趋势,且nOA论文获得首次被引的论文数量多于OA论文。第一年,有385篇nOA和157篇OA论文获得了首次引用;发表后的第2年完成首次被引的论文数达到顶峰,nOA与OA论文分别有897篇和508篇获得首次引用;第3年,nOA与OA论文均有453篇论文获得首次被引。随后每年完成首次被引的论文数量大致呈现逐年减少的趋势,但是每年获得首次被引的OA论文开始多于nOA论文,在论文发表后的第11年至第22年,共343篇OA论文、116篇nOA论文被首次引用。在统计的结果中最后5年才被首次引用的OA论文有89篇,nOA论文有16篇。OA论文完成首次被引的情况整体滞后于nOA论文,峰值的论文数也与nOA论文数有较大差距,整体被引速度较为平缓,出现“长尾”现象。
图1 OA与nOA论文首次被引所用时间分布
2.2 论文分类
根据论文的响应时间,将论文分为快速响应论文、普通响应论文和缓慢响应论文3类,分类结果如图2所示。
图2 OA与nOA论文首次响应分类情况
2.2.1 快速响应论文
快速响应论文是指发表后2年之内获得首次引用的论文,nOA论文中有52%是快速响应论文,然而OA论文中快速响应论文占比仅为28%。nOA论文在响应速度方面表现得积极且快速,超一半的论文在两年内完成首次被引,而OA论文的响应速度略显迟缓,同时快速响应论文在OA论文中整体占比最少。可能是因为在OA运动的早期,OA论文在质量与科研学者的认知中有一些缺陷和不足,导致在快速响应阶段获得引用的论文数量较少。
2.2.2 普通响应论文
普通响应论文是在发表后的第3~5年内完成首次被引的论文。普通响应论文在nOA中占比32%,在OA论文中占比38%,两者相差较小。OA论文在发表后3~5年内有较多论文开始被关注和引用。可以看出普通响应论文在OA与nOA论文中的占比约为1/3,这一部分论文在以往只区分快慢被引时经常会被归到其中某一类,其实并不合适。首先,它们数量较大,占总体的三成多,被归到其他类会引起那一类占比虚高;其次,从响应时间角度来看,发表后3~5年内被引并不能达到快速也不构成慢速的条件。所以本文将这一部分单独分类,结果较合理,也可以满足科研评价的需要。
2.2.3 缓慢响应论文
缓慢响应论文是论文在发表后第6年逐渐开始被人引用的论文。一般来说,6年已经超过部分学科的半衰期,所以6年后才被引用在响应速度上较为缓慢。nOA论文中16%是缓慢响应论文,有386篇;OA论文中34%是缓慢响应论文,有843篇,占比较大,远远高于在nOA论文中的占比。结果表明,有超1/3的OA论文在发表6年之后才会慢慢获得引用,对比nOA论文,响应较缓慢。由此,下文将对OA论文的缓慢响应现象展开更深入的研究。
2.3 OA缓慢响应现象特点
843篇缓慢响应的OA论文首次响应时间和论文累计被引次数的气泡图,如图3所示,横坐标为首次响应间隔时间,纵坐标为论文编号,气泡大小表示该论文累计被引次数的多少。结果显示,累计被引次数较高的论文完成首次被引的时间大致集中在论文发表后的第6~10年,占缓慢响应OA论文的59.3%,但是有160篇论文在发表15年后才获得首次被引,且有部分论文被引次数超过10次,即在发表15年后这部分论文依然完成了知识的首次传播与有效输出,这与常规的文献老化规律并不一致。
图3 OA缓慢响应论文首次被引与累计被引次数气泡图
缓慢响应现象在OA论文中有3个主要特点:占比大、分布散以及沉寂久,如图3所示。
(1)占比大。缓慢响应论文在OA论文中的占比较大,达34.18%,且缓慢响应论文的被引次数占OA论文总被引次数的10.63%,这一部分缓慢响应论文数量并不可以被忽视。
(2)分布散。从发表后第6年至第22年缓慢响应论文都有分布,每一年都有论文被引用;且有高被引论文也有仅被引1次、2次的论文,缓慢响应的OA论文从时间和被引次数上的分布都较为分散,但是响应早些的论文数量比响应晚些的论文数量多。
(3)沉寂久。在缓慢响应论文中有许多论文沉寂15年、20年后才被引用的,15年后响应的论文有160篇,其中还有46篇在发表20年后才获得首次被引。这种情况在nOA中较少见,其中原因可能是论文开放获取,使得文章能在被需要的时候还能及时被找到和下载。
2.4 典型OA缓慢响应论文分析
本文选取3篇典型的OA缓慢响应论文进行详细分析,如图4所示。论文1为Khuri在2001年发表的“A laplace decomposition algorithm applied to a class of nonlinear differential equations(《应用拉普拉斯分解算法求解一类非线性微分方程》)”,是属于数学科学领域的一篇论文,该论文提出了使用拉普拉斯分解法有效求解一类非线性微分方程。2006年,论文“Numerical solution of duffing equation by the laplace decomposition algorithm”在研究使用拉普拉斯法求解Duffing方程时引用了论文1,是论文1的首次被引。论文1在发表后的第6年才获得第1次被引,虽然第1次被引用的速度相对较缓慢,但是截至目前已获得147次引用,是1篇高被引文章。论文1发表于2001年,在2006年获得第1次引用,从2010年起,此后两年的被引数量大幅上升,并且2012—2016年保持每年至少10次的被引次数,在2020年达到引文顶峰,当年被引23次。从整体趋势来看,该篇论文的被引数量依然有上涨趋势。虽然缓慢响应的OA论文在发表之后没有立即获得引用,但是也可能后劲十足。
图4 3篇典型OA缓慢响应论文被引情况
Wood在2001年发表的“Adenomyosis: difficult to diagnose, and difficult to treat(《子宫腺肌症:难以诊断,也难以治疗》)”标记为论文2。论文2提出了对于严重的子宫腺肌症的治疗方法有子宫内膜子宫肌术消融、腹腔镜子宫肌术电凝或切除,子宫动脉栓塞是子宫切除术前可尝试的一种新技术。论文2发表于2001年,在发表后的第10年获得了首次被引,目前累计被引34次。论文2在开始受到学者注意的前两年均只被引用1次,2012年首次达到被引顶峰5次,随后每年均有引用,在2019年、2020年、2021年各被引用3次、2次、1次。该论文在发表之初经历完全无人问津的10年之后,逐渐开始引起关注,并不断被学者引用。虽然总计被引次数并不是高被引,但是每年均有引用,在发表20年后依然能为学术界传播它所承载的知识。可以说开放获取为这件事提供了可能,否则可能20年后,学者想用这篇文章时,已经无法快速寻找并且免费下载了。
Pescar等发表的“Univalence of certain integral operators(《某类积分算子的单价性》)”标记为论文3,这篇文章总计被引11次,该论文研究了某些积分算子单价性的条件。论文3发表于2000年,在2019年才完成它的首次被引,在许多研究中“沉寂”20年已经足够使它被当成老化文献去对待,然而它在首次被引当年共被引用5次,在之后的两年,每年分别被引用3次,总被引11次,这篇缓慢响应的开放获取论文已不符合常规的文献老化趋势,OA赋予了它不同的生命。纸质本身会老化,但是上面所承载的知识不会老化,而开放获取给这些知识提供了存储与供人检索、免费使用的方式,使得文献在发表多年之后也有机会能获得引用,虽然响应速度比较缓慢,但是也提升了部分文献的利用率,使得其上承载的知识可以打破以往纸质期刊载体的枷锁,被更多学者看到和传递出去。开放获取或许已经在改变目前期刊的老化规律,值得之后深入研究。
3 结语
论文的首次响应是它被学者们关注的起点,标志着它所承载的知识开始传播。本文根据首次响应时间,将论文分为快速响应论文、普通响应论文和缓慢响应论文。结果显示OA在缓慢响应论文中的占比较大且响应时间分散。对开放获取的首次响应时间进行细化研究,为开放获取的引文周期特征与OA优势的产生原因提供了更具体的分析。
本研究将OA与nOA论文的首次响应时间进行对比。结果发现,nOA论文的响应速度整体较快,nOA论文在发表第5年时已有80%的论文完成首次引用,而OA论文需要在第9年才能达到这一水平。虽然响应速度较缓慢,但是借助OA的优势使得沉寂多年的论文可以获得首次被引。首次响应较缓慢的OA论文中存在高被引论文、多次被引论文、沉寂多年被唤醒的论文等多种情况,凸显了这一现象占比大、分布散和沉寂久的特点,对于OA论文和首次响应的研究具有一定的价值。由于低被引领域以及首次响应与OA的关系这部分还没有系统地研究,本文仅进行了初步的探索,后续还可以进一步探究。