APP下载

基金论文的使用次数是否高于非基金论文?*

2019-01-17李昕洁

图书馆论坛 2019年2期
关键词:使用率转化率次数

李昕洁

0 引言

引用数据的定量分析是计量学领域评估科研影响力的常用方法。作为科研绩效评估最实用工具之一,时间滞后性是引用指标明显的缺陷,即一篇论文引发引用行为通常需要一定的时间积累。为解决这一问题,WoS平台于2015年9月引入使用次数(Usage Count)指标,拟通过使用次数及时体现研究者对论文的兴趣大小。

科研基金作为科学研究的重要组成部分,在推进学科领域的科学研究方面发挥着不可替代的作用[1]。梳理已有论文发现,国内外学者关于科研基金的研究主要集中在三点:(1)不同研究领域或国家的基金政策分析。Fournie等研究了德国基金政策对科研基金和研究前沿的影响[2]。Ebadi等发现科研基金促进了科学研究,并认为国家应加大科研经费的投入[3]。Breschi等[4]定量分析了ICT领域的科研基金数据。郭哲敏[5]统计分析了国内图书馆、情报和文献学2015年基金项目情况,了解到社科基金立项特点与规律。(2)科研基金和科研成果之间的关系。Hoekman等[6]、Costas等[7]分别对科研合作、科研论文等进行分析,探寻科研基金对科研成果的影响力。部分学者注重于国家间基金资助论文的产出差异,如美国和中国[8]、中国和日本[9]。王贤文等[10]研究了主要国家的科研基金及基金论文情况。(3)科研基金与计量指标(如H指数、引用次数)之间的关系。国内外学者尝试将科研基金与不同评估指标结合,并分析二者之间的关系,如H指数[11]、引用次数[12-13]、自引情况[14]、即年指标[15]、影响因子[16]。

综上所述,对科研基金的多维度分析仍然是各学科的研究热点。然而,关于基金对论文使用次数与引用次数的研究较为少见。基金论文的质量必然高于非基金论文吗[17]?基金论文的使用次数一定高于非基金论文吗?基金论文的使用行为更易转化为引用行为吗?为尝试回答上述疑问,在构建评估指标基础上,本研究深入分析了使用次数、引用次数、转化率与基金之间的关系。

1 数据来源与预处理

在SCI-E核心数据库中,本文构造检索式“WC=(Information Science&Library Science)OR(Education,Special)OR(Business,Finance)OR(SocialWork)”AND“语种:English”AND“文献类型:Article”AND“时间:2016”,最后精炼得到16627条论文记录。

WoS提供TC和Z9两种引用次数指标。TC表示WoS核心合集的被引频次,而Z9代表WoS核心合集、BCI、CSCD等数据库中的被引频次合计。为与使用次数统计保持一致,本研究以TC作为论文的引用次数来源。

WoS以FU字段标识一篇论文是否有基金支持。如果一条文献记录有FU字段,则判定为有基金资助;如果没有FU字段,则该篇论文没有基金支持(本研究只探讨论文是否有基金资助,不考虑基金个数)。

WoS提供U1和U2两种使用次数指标。U1为最近180天的使用次数,随统计时间变化而上升或下降;U2表示自2013年以来的累积使用次数,随时间推移而增加或不变,其与引用次数的累积内涵相同。因此,本研究选取U2作为论文的使用次数来源。

2 指标构建与说明

基金论文率(Funding Rate,FR)和篇均论文引用次数(Citation Per Article,CPA)是引文分析中度量基金使用情况的两个常用指标。基于基金论文率和篇均论文引用次数,本研究衍生出论文使用率(UsageRate,UR)、篇均论文使用次数(Usage Per Article,UPA),以及论文引用率(Citation Rate,CR)以衡量论文的使用次数与引用情况。此外,本研究以使用差异(Usage Difference,UD)和引用差异(Citation Difference,CD)研究基金论文与非基金论文之间的使用与引用行为差异。同时,以转化率(Conversion Proportion,CP)评估论文使用次数转换为引用次数的概率[18]。同时,本研究将H指数引入其中,以评估基金论文与非基金论文中高影响力论文数量的差异。各指标计算公式及含义如下:

(1)基金论文率(FR)=(NF/N)*100%,NF和N分别表示基金论文总数和总论文数。

(2)总论文H指数,基金论文H指数,非基金论文H指数。H指数越大,则表明该集合中的高被引论文数量越多。

(3)篇均论文引用次数(CPA)=TC/N,TC表示所有论文被引频次,N表示总论文数。

(4)篇均论文使用次数(UPA)=TU/N,TU表示论文的总使用量,N表示总论文数。

(5)使用率(UR)=(NU/N)*100%,使用次数大于0的论文占总论文数的比例。NU表示被浏览、访问、保存等使用过的论文数量,N表示总论文数。

(6)引用率(CR)=(NC/N)*100%,引用次数不为0的论文占总论文数的比例。NC表示被他人引用过的论文数量,N表示总论文数。

(7)引用差异(CD)=CPAF/CPAN=(TCF/NF)/(TCN/NN),CPAF为基金论文篇均引用次数,CPAN为非基金论文篇均引用次数。如果CD>1,则基金论文篇均引用次数大于非基金论文篇均引用次数,说明基金影响并增加论文的引用次数;反之说明基金不会影响论文的引用次数。

(8)使用差异(UD)=UPAF/UPAN=(TUF/NF)/(TUN/NN),UPAF为基金论文篇均使用次数,UPAN为非基金论文篇均使用次数。如果UD>1,基金论文使用次数大于非基金论文使用次数,说明基金会影响并增加论文的使用次数;反之说明基金无助于论文使用次数的增加。

(9)转化率(CP)=(CPA/UPA)*100%,表示使用次数转换为引用次数的概率,CP值越大表示论文使用次数转化为引用次数的几率越大。转化率由引用与使用之间潜在关系启发所得,即论文的引用行为必然发生于使用行为之后。

上述指标都有特定内涵:基金论文率衡量基金对科学研究的资助程度;使用率说明科研人员对科研成果的关注度;引用率揭示科研人员对学科论文的深度使用;H指数衡量基金论文与非基金论文中高影响力论文的数量;篇均论文引用次数和篇均论文中使用次数描述科研成果的规范化应用情况;引用差异和使用差异衡量基金论文和非基金论文的差异;转化率揭示论文的使用次数有多少可以转化为引用次数。

3 结果分析

3.1 总体情况分析

表1为2016年4个研究领域论文数量、使用次数和引用次数的统计数据,包括基金论文数和非基金论文数。根据表1可知,商业金融领域论文数量最多,其次是图书情报领域,特殊教育领域发文量最少。从基金论文率来看,特殊教育领域占比最高,为39.70%;其次是社会工作领域,为35.68%;商业金融领域最低,仅为30.24%。可以发现,2016年4个学科的基金论文率都介于30%~40%。

表1 不同研究领域论文数量、使用次数和引用次数统计数据

从引用次数看,图书情报领域论文总引用次数最高,最低为特殊教育领域;基金论文引用次数占比最高者为社会工作领域,商业金融领域最低。虽然图书情报领域的基金论文使用次数和引用次数均高于商业金融领域,但其基金论文数量低于商业金融领域。

从使用次数看,特殊教育领域最低,但其基金论文使用次数占比最高。图书情报领域使用次数最多,紧随其后的是商业金融领域,二者总使用次数分别约为特殊教育领域的5倍和4倍之多。

本研究发现,论文数量和引用次数之间的关系与论文数量和使用次数的关系相似,而引用次数、使用次数与基金论文数量表现出较强的正相关性。可以看到,论文数量、引用次数、使用次数三者的变化是一致的,即三者之间必然存在相关性。从基金维度看,论文数量、引用次数、使用次数三者的相关性仍然存在,表明基金因素与论文数量、引用次数、使用次数之间也存在相关性。

3.2 H指数分析

图1为4个研究领域总论文H指数、基金论文H指数和非基金论文H指数统计情况。可以发现,4个研究领域的3种H指数均超过9。总论文H指数和非基金H指数最高的学科为图书情报领域,基金论文H指数最高的学科则为商业金融领域。通过简单的统计发现,基金论文H指数在图书情报、特殊教育、商业金融3个领域3种H指数中都是最小。难道科研基金无助于高影响力论文的产生吗?

图1 不同研究领域H指数比较

为此,本研究进一步统计3种类型H核论文数量的占比情况:图书情报领域(0.41%、0.92%、0.52%),特殊教育领域(0.69%、1.43%、1.04%),商业金融领域(0.29%、0.80%、0.37%),社会工作领域(0.39%、1.00%、0.45%)(依次为总论文H核论文数量、基金论文H核论文数量、非基金论文H核论文数量的占比)。与简单的H指数大小结果不同,4个学科领域的基金论文H核论文数量占比全部高于总论文H核论文数量占比和非基金H核论文数量占比,且图书情报、商业金融和社会工作领域的基金论文H核论文数量占比是其余两种的2倍。因此,本研究认为科研基金对领域内高影响力论文的形成具有显著的推动作用。

3.3 引用次数分析

引用率的统计结果见表2。引用次数>0的论文数量和总论文数量之间相差较为明显,商业金融领域最多(3157篇),最少为特殊教育领域(694篇)。4个研究领域的3种引用率(总论文引用率、基金论文引用率、非基金论文引用率)都在46%以上。结合表2可知,4个研究领域中有较多论文的引用次数为0,原因可能是本研究选取2016年发表的论文,科研人员的引用时间较短。

4个研究领域的基金论文引用率全部高于总论文引用率以及非基金论文引用率。基金论文引用率和非基金论文引用率之间的差值均在10%以上,图书情报领域二者相差甚至达到21.66%。因此,本文认为基金对论文的引用率具有很大影响,即基金论文引用率要高于非基金论文引用率。

表2 不同研究领域引用率(CR)情况

图2为4个研究领域的总论文篇均引用次数、基金论文篇均引用次数,以及非基金论文篇均引用次数。3种篇均引用次数均超过0.98次,即平均每篇论文至少被引用1次。与篇均使用次数相比,篇均引用次数的数值较小。结合“使用次数分析”小节的分析,发现使用次数通常是引用次数的5~10倍,即一篇论文至少在被浏览5~10次之后才会被引用1次。图书情报领域3种类型的引用次数在4个学科领域中都是最高的。

图2 不同研究领域篇均引用次数比较

图书情报领域的总论文篇均引用次数为1.86次,超过1.5次,而其他3个研究领域都处在1.5次之下。社会工作领域的总论文篇均引用次数最低,仅为1.24次。从基金论文篇均引用次数情况来看,图书情报领域的基金论文篇均引用次数远远高于其他3个研究领域,达到2.58次,即图书情报领域的基金论文平均被引用2~3次。其后依次是商业金融领域(1.85次)、特殊教育领域(1.76次)、社会工作领域(1.70次)。

最重要也最明显的是,4个研究领域的基金论文篇均引用次数全部高于其他两类指标,尤其高于总论文篇均引用次数(图书情报领域的基金论文篇均引用次数是总论文篇均引用次数1.39倍)。4个研究领域的基金论文篇均引用次数全部是非基金论文篇均引用次数的1.4倍以上,社会工作领域甚至达到1.73倍。因此,本研究认为基金对论文的引用次数具有重要作用,尤其体现在图书情报领域和社会工作领域。

3.4 使用次数分析

使用率的统计结果见表3。使用次数>0的论文数量和总论文数量之间最多只相差615篇,最少仅71篇。4个研究领域的3种使用率(总论文使用率、基金论文使用率、非基金论文使用率)都在88%以上,可以认为4个研究领域中仅有一小部分的论文没有被浏览、保存,且各领域之间引用率差距也不明显。造成小部分论文没有被使用的原因可能是本研究选取2016年发表的论文,科研人员的使用时间较短。

表3 不同研究领域使用率(UR)情况

4个研究领域的基金论文使用率全部高于总论文使用率以及非基金论文使用率。基金论文使用率和非基金论文使用率之间的差值均在5%左右。因此,本文认为基金对论文的使用率具有一定影响,即基金论文使用率高于非基金论文使用率。

图3为4个研究领域的总论文篇均使用次数、基金论文篇均使用次数,以及非基金论文篇均使用次数。可以看到,3种使用次数数值均超过6.75次,即平均每篇论文至少被浏览或保存6~7次。从总论文篇均使用情况来看,图书情报领域以篇均使用17.98次排在第一位,其后依次是特殊教育领域(10.96次)、商业金融领域(9.59次)、社会工作领域(7.70次)。基金论文篇均使用情况上,图书情报领域最高,达到22.01次,其后依次是特殊教育领域(12.46次)、商业金融领域(12.18次)、社会工作领域(9.42次)。图书情报领域在非基金论文篇均使用次数上仍然最高,为16.19次。

图3 不同研究领域篇均使用次数比较

进一步分析可知,4个研究领域的基金论文篇均使用次数在3种篇均使用次数中数值最高,总论文篇均被引频次处于其余两者之间。特殊教育领域的基金论文篇均使用次数比非基金论文篇均使用次数高出25%,而图书情报领域、社会工作领域均高出35%,商业金融领域更是达到43.80%。综合上述分析,本研究认为基金对论文的使用次数具有明显的促进作用,尤其体现在图书情报领域、商业金融领域。

3.5 引用差异与使用差异分析

结合上述分析可以看出,基金论文的引用次数和使用次数高于非基金论文。但是,论文的引用行为是一个复杂的问题,导致论文获得高引用次数必然是多因素综合作用的结果。然而,本研究主要目的是探讨基金因素对论文引用行为和使用行为的影响作用。因此,为排除其他因素的干扰,本研究将基金论文篇均引用次数与非基金论文篇均引用次数相除来描述二者之间的引用差异。由“引用次数分析”小节可知,4个研究领域的基金论文篇均引用次数均是非基金论文篇均引用次数的1.4倍以上,引用差异将深入解释造成这种现象的原因。结合表4可知,4个研究领域的引用差异全部>1.40,说明基金论文获得更多引用次数,基金对论文的引用次数有重要影响。然而,不同研究领域的引用差异也不尽相同:社会工作领域的引用次数最易受到基金影响,而特殊教育领域相对不易受到基金因素影响。

表4 不同研究领域的引用差异(CD)和使用差异(UD)

为排除非基金因素对论文使用次数的干扰,本研究将基金论文篇均使用次数与非基金论文篇均使用次数相除来描述二者之间的差异,结果见表4。可以发现,使用次数的分布规律与引用次数趋于一致:4个研究领域的使用差异都大于1.20,说明基金论文获得更多的使用次数,基金对论文的使用次数同样有重要影响。商业金融和社会工作领域论文的使用次数较易受到基金的影响,而特殊教育领域受到的影响相对较小。

齐普夫定律和洛卡特定律认为高频词汇、高频作者在某一领域研究中发挥着不可替代的作用。为进一步分析基金对引用差异和使用差异的影响,本研究分别计算4个研究领域Top 10%高影响力论文的引用差异和使用差异大小。结合表4可知,Top 10%论文与总论文的引用差异和使用差异分布规律趋于一致:(1)4个研究领域的Top 10%论文引用差异和使用差异全部>1.00,说明基金同样造成高影响力论文引用次数和使用次数的增加;(2)社会工作领域高影响力论文的引用次数更易受到基金影响,而商业金融领域高影响力论文的使用次数更易受到基金影响;(3)4个研究领域Top 10%论文引用差异全部大于使用差异,说明科研基金不仅影响论文的使用行为,更重要的是影响论文的引用行为,即科研基金扩大了论文的传播范围,也提升了论文的影响力。

总论文和Top 10%高影响力论文的引用差异和使用差异的主要区别在于,前者计算过程涉及更多论文数量,而后者集中讨论小部分高被引用论文。尽管如此,4个研究领域中二者的计算结果却依然较为相似。因此,本研究认为不同学科特征、论文数量、引用次数与使用次数差异不会对引用差异和使用差异的结果造成偏差。同时也表明,引用差异和使用差异可以用来衡量科研基金、引用次数、使用次数之间的内在关系。

3.6 转化率分析

与仅仅代表科研人员对科技文献的浏览、保存次数的使用次数指标不同,引用次数可以揭示科研工作者对论文的实际使用和深层次利用。因此,探讨论文使用次数转化为引用次数的概率非常有意义。

根据转化率公式,本研究计算了4个学科领域的总论文转化率、基金论文转化率和非基金论文转化率(见表5)。在“引用次数分析”小节中,我们发现每篇论文的使用次数大约是引用次数的5到10倍,而通过转化率分析,可以更准确地了解使用次数与引用次数的转化比例。结合表5可知,4个研究领域的3种转化率都在20%以下。社会工作领域以总论文转化率16.05%处于第一位,即约1/5的使用行为转化为引用行为;其后依次是商业金融领域(15.03%)、特殊教育领域(13.26%)、图书情报领域(10.35%)。值得注意的是,社会工作领域的总体转化率处在4个领域的第一位,但该领域的其他指标(如使用次数、引用次数)却处于较低水平。

表5 不同研究领域的转化率(CP)情况

分析基金论文转化率和非基金论文转化率可知,4个研究领域的基金论文转化率全部高于其他两种转化率,总论文转化率高于非基金论文转化率。因此,本研究认为科研基金促进了论文使用行为转化为引用行为的过程。

4 研究结论

与引用行为相比,使用行为代表了科研人员对论文的另一种利用方式。本研究将论文使用次数融合到基金论文与非基金论文的影响力差异分析中。结合提出的9个评估指标,本文以WoS数据库中4个研究领域的2016年论文数据,多维度分析了基金对论文引用行为与使用行为的影响。研究发现:(1)基金论文率方面,特殊教育领域最高,商业金融领域最低;H指数方面,4个领域的基金H核论文数量占比全部高于总论文和非基金论文;(2)引用维度方面,4个领域的基金论文引用率和篇均引用次数都高于总论文和非基金论文的引用率、篇均引用次数,基金论文获得更多引用次数;(3)使用维度方面,4个领域的基金论文使用率和篇均使用次数全部高于总论文与非基金论文的使用率、篇均使用次数,基金论文更易被使用;(4)转化率方面,4个领域的基金论文转化率全部高于总转化率和非基金论文转化率,基金促进了使用行为转化为引用行为过程。综上所述,本研究认为基金资助论文更易发生使用行为与引用行为,但各学科之间存在差异。

猜你喜欢

使用率转化率次数
我国全产业领域平均国际标准转化率已达75%
机场航站楼年雷击次数计算
2020年,我国汽车召回次数同比减少10.8%,召回数量同比增长3.9%
一类无界算子的二次数值域和谱
依据“次数”求概率
曲料配比与米渣生酱油蛋白质转化率的相关性
透视化学平衡中的转化率
胃肠外科围手术期合理使用抗菌药物的探讨
微量改性单体与四(偏)氟乙烯等共聚的组成及转化率模拟
吓死我了