3种引文规范化指标RCR、CNCI和JNCI的相关性研究
2023-12-18郝若扬
郝若扬
关键词: 引文规范化评价指标; 相对引用率; 学科规范引文影响力; 期刊规范引文影响力; 论文影响力评价
DOI:10.3969 / j.issn.1008-0821.2023.12.012
〔中图分类号〕G250.252 〔文献标识码〕A 〔文章编号〕1008-0821 (2023) 12-0133-10
近年来, 伴随着科学技术的迅猛发展, 学科领域的划分越来越精细, 不同学科之间的交叉、渗透和融合也越来越深入。在这样的大背景之下, 如何对科研成果(特别是学术论文) 进行科学、公正、客观地评价, 已经成为文献计量领域面临的一个亟待解决的关键问题。特别是随着一些新兴的交叉学科领域的出现, 如何对这些交叉领域的成果进行跨学科评价, 也成为了文献计量领域的关键问题之一。早先的文献计量方法主要通过分析论文的被引频次及其所在期刊的影响因子等较为简单指标对论文的影响力进行评价, 这在很大程度上导致了期刊影响因子等计量指标被错误使用或被异化的问题[1-2] 。此外, 早先的文献计量指标由于没有充分考虑学科领域、文献类型、引用环境、文献出版时间等因素的影响, 很难对不同学科领域的论文(特别是跨学科领域的论文)进行客观、公正的评价, 而且这些指标在对跨学科领域论文的影响力评价时展示出较大的局限性[3] 。
为了解决以上问题, 实现对不同学科领域论文的合理评价, 文献计量研究人员提出了引文規范化指标, 也被称为“相对指标”。这类指标充分考虑了学科领域、文献类型、引用环境、文献出版时间等对论文引用的影响, 主要采用归一化算法对相关引文指标进行了规范化处理, 使得不同学科领域、不同发表时间、不同文献类型的论文的引文指标具有一定的可比性[3] 。1983 年, Schubert A 等[4] 提出了第一个相对计量指标(即相对引文率)来测度期刊论文的影响力。相对引文率被定义为平均引文率与平均影响因子的比值。2010 年, 荷兰莱顿大学Waltman L 等[5] 基于所有论文在指标计算中应具有相对权重(即规范化)的思想, 提出了“平均规范化引文分数” (Mean Normalized Citation Score, MNCS)。MNCS 指标被定义为每篇论文的被引频次除以其学科平均引文率所得比率的算术平均值。通过一系列实证分析, Waltman L 等[5] 发现, 在期刊出版年份标准化的情况下, MNCS 指标很大程度上会受到最近出版期刊和被引频次较高的单一文献的影响。2010 年, Moed H F[6] 进一步发展了Eugene Garfield定义的学科领域“引用潜力” 的概念, 提出了单篇文献的“数据源归一化影响力指数” (Source Nor?malized Impact per Paper, SNIP)。SNIP 指标被定义为某期刊每篇论文的被引用次数与该期刊的被引用潜力的比率。SNIP 指标反映了期刊的上下文对引用的影响, 充分考虑了学科主题领域的特征, 特别是引用成熟度和用于评估的数据库涵盖该领域文献的程度[6] 。SNIP 指标基于引文规范化处理, 使得不同学科领域的期刊可以公平地进行比较, 而不受到学科领域引文行为的影响。同样基于规范化的思想, 近年来科睿唯安(Clarivate Analytics)在其开发的InCites 平台上推出两个重要的规范化指标, 即“学科规范引文影响力” (Category Normalized Cita?tion Impact, CNCI) 和“ 期刊规范引文影响力”(Journal Normalized Citation Impact, JNCI)[7] 。CNCI指标被定义为论文的实际被引频次除以具有相同文献类型、出版年份和主题学科领域的论文的预期被引频次, 而JNCI 指标被定义为论文的实际被引频次除以同一期刊中论文的平均被引频次。从这两指标的定义来看, CNCI 指标是对论文所属学科领域进行规范化, 可用于对比不同学科领域的论文影响力; 而JNCI 指标对发表论文的期刊进行规范化,可用于对比同一期刊上不同论文的学术影响力。基于CNCI 和JNCI 指标的计算, 可以在一定程度上消除不同学科领域或不同期刊之间引文模式和引用行为的差异, 使得不同学科领域或不同期刊之间的论文可以进行较为直接的比较。
2015 年, 美国国立卫生研究院(National Insti?tutes of Health, NIH)在对论文共引网络(Co-cita?tion Network)计算和分析的基础上, 提出了一种新的规范化指标, 被称为“相对引用率” (RelativeCitation Ratio, RCR)[8] 。RCR 指标被定义为论文的实际引用频次除以基于共引网络分析获得的期望引用次数。RCR 指标是以NIH 的R01 项目资助的论文为基准, 其中R01 项目为“R01 Research Pro?ject Grant”, 它代表了NIH 的原始资助项目, 主要鼓励跨学科和多学科研究。RCR 指标是基于论文共引网络来确定论文所属的学科领域, 而不是基于论文发表的期刊所属学科进行归一化的, 因此, RCR指标相对于早先的规范化指标具有较为突出的创新性, 同时其算法也得到了显著的改进[9] 。为了计算论文的RCR 指标, NIH 开发了一个Web 应用程序, 即iCite[8] 。该程序可以根据相关的算法为具有PubMed ID 的论文计算RCR 指标。关于RCR 指标的优点和具体计算方法将在下一小节进行介绍。
上述介绍的指标(包括MNCS、SNIP、CNCI、JNCI、RCR)都是基于引文规范化思想设计的评价指标。相对于早先基于绝对引文数据进行计量的指标而言, 引文规范化指标考虑了学科领域、出版时间、文献类型等因素对指标的影响, 并采用特定算法对论文的引文数据在学科领域和发表时间内进行了归一化处理, 因此, 这些引文规范化指标在对跨学科领域的论文影响力评价方面体现出了极大的优越性。一些引文规范化指标已经被出版商、科研资助机构、学术研究机构等应用到学术成果评价和研究绩效考核中。
近些年, 由于引文规范化指标充分考虑了学科领域和文献类型对引文的影响, 具有一定的先进性,所以规范化指标得到了较多的关注和研究。特别是RCR 指标由于其具有独特的创新性和改进的算法,得到了国内外研究人员的关注。Hutchins B I 等[9]计算并分析了NIH 获奖者在2003—2010 年发表的88 835篇论文的RCR 指标发现, 这些论文具有较高的RCR 值, 与学科领域专家对这些论文的评价相一致。同时, Hutchins B I 等[9] 将RCR 指标与其他规范化指标(包括MNCS、SNIP 等)进行了对比研究, 研究结果表明, RCR 指标是基于论文共引网络进行学科分类的, 不同于早先的规范化指标是基于期刊的学科属性或预设的分类进行学科分类的。因此, 早先的规范化指标通常是一种先验定义学科分类, 而RCR 指标是一种后验定义学科分类的方法[9] 。这是RCR 指标与早先规范化指标最根本的区别之一。Bornmann L 等[10] 研究了F1000 数据库中16 557篇关于生物医学论文的RCR 指标及与其对应的MNCS 指标、F1000 分数之间的相关性,结果表明, 这些论文的RCR 指标与MNCS 指标具有较高的相关性(相关系数达到0.88), 且与F1000 分数相关性较低(相关系数仅有0.23 ~0.31)。陈斯斯等[11] 在InCites 数据库中选取了2016 年22 个ESI 学科期刊文献、8 种交叉学科期刊文献和ESI的8 个不同学科领域中被引频次最高的单学科期刊文献, 分别计算这些文献的RCR 与CNCI 数值,并进行了相关性检验。结果表明, 对于不同学科期刊文献、交叉学科文献及单学科期刊文献, RCR指标与CNCI 指标均展示了显著的正相关性, 交叉学科文献的相关系数低于单学科文献[11] 。陈斯斯等[12] 利用RCR 指标与CNCI 指标对2009—2018 年PLoS One 期刊所发表论文的学术影响力进行了定量评价发现, RCR 指标与CNCI 指标具有一定的相关性, 但是RCR 指标对于非生物医学领域论文的学术影响力评价具有一定的局限性。宋丽萍等[13]选取了F1000 和InCites 数据库中的29 850篇细胞生物学论文和30 326篇生物技术论文, 对这些论文的CNCI 指标与被引频次进行了相关性分析和研究,结果表明CNCI 指标与被引频次呈现高度正相关,并且CNCI 在跨学科比较方面具有一定的优越性,可以代偿执行引用统计的信息过滤与学术影响力归誉的功能。陈斯斯等[14] 还选取干细胞领域的学术论文作为研究样本, 对这些论文的RCR 指标、Scopus 数据库的FWCI 指标(Field Weighted CitationImpact) 和F1000 分数进行了相关性分析和研究。研究结果表明, RCR 指标与FWCI 指标具有较强的相关性, 而RCR 指标与F1000 分数之间相关性较低[14]。
由 于引文规范化指标采用了归一化算法, 其计算方法和计算过程相比早先常用的引文指标(如被引频次等)复杂很多, 导致规范化指标的推广过程相对缓慢, 加之引文规范化指标(如RCR、JNCI 和CNCI 指标等)大都是近年来提出的新颖的引文指标。从目前的研究现状来看, 国内外学者对于规范化指标(特别是RCR 指标)的研究处于初期阶段,因此关于RCR 指标的研究相对较少。目前已有的研究主要采用实证分析的方法, 研究某单一科学领域中论文的RCR 指标与其他规范化指标(包括MNCS、SNIP 等指标)或早先传统引文指标之间的相关性。值得注意的是, 论文的学科领域主要局限在生物学和医学领域, 对于非生物学和医学领域的论文并没有进行较为深入的研究。这可能与RCR指标早期主要是起源于iCite 平台中的生物类和医学类论文有关。近年来, 随着学科交叉的不断发展,iCite 平台中也囊括了部分非生物学、医学领域的论文, 使得RCR 指标可以推广到生物学、医学领域以外的领域。因此, 本文将选取2018—2022 年在InCites 数据库中的10 种不同学科领域内的论文作为研究样本, 对这10 种科学领域(包括多个自然科学和社会科学领域)论文的RCR 指标、CNCI 指标和JNCI 指标进行相关性分析, 并选取3 个具有代表性的学科领域中的论文进行深入分析, 计算并分析论文发表国家和研究机构的平均RCR 指标和CNCI 指标。通过这些研究, 揭示不同学科领域RCR指标、CNCI 指标和JNCI 指标评价论文学术影响力的差异和关联性, 为深入理解引文规范化评价指标、建立科学评价体系提供一定的指导。
1 3种引文规范化评价指标的对比
1.1相对引用率(RCR)
通过分析不同学科领域论文的共引网络, 计算论文引文率(Article Citation Rate, ACR)与预期引文率(Expected Citation Rate, ECR), 然后将这两者(ACR 与ECR)相除即可获得论文的RCR 指标。其中, 论文的ACR 代表论文的年平均被引频次,而ECR 的计算过程则较为复杂, 其大致流程为:首先将目标论文共引网络中每一篇论文的期刊引文率(Journal Citation Rate, JCR)的年平均值作为该篇论文的领域引文率(Field Citation Rate, FCR), 然后选取NIH 的R01 项目资助的论文为基准, 调整ACR 与FCR 的比值, 通过ACR 与FCR 线性拟合,计算其回归系数即可获得ECR。在RCR 的计算过程中, 生成论文的共引网络是非常重要的环节。图1展示了一篇论文的引用网络示意图。图中红色点代表了目标论文, 橙色点代表了引用目标论文的相关文献, 绿色点则代表橙色点所引用的相关文献, 紫色点代表了目標论文所引用的相关文献。在图1 中,橙色点所代表的论文集合构成了目标论文的引文网络, 绿色点所代表的论文集合构成了目标论文的共引网络, 紫色点所代表的论文集合构成了目标论文的被引用网络。RCR 指标的计算主要是基于对论文的共引网络分析而获得的。随着论文出版年限的增长, 论文的引用次数会逐渐增多, 使得论文的共引用网络发生动态的变化, 进而使得论文的RCR 数值同时也发生变化。在NIH 建立iCite 平台的早期,平台中数据主要是关于医学、生物学等领域的论文,因此, 早期RCR 指标仅适用于医学、生物学等领域的论文评价。近年来, 随着iCite 平台囊括了更多学科领域的论文数据, 使得RCR 指标逐渐拓展到其他学科领域, 特别是交叉学科领域。
1.2学科规范化引文影响力(CNCI)
CNCI 指标是通过将论文的被引频次除以同出版年、同学科领域、同文献类型论文的平均被引频次而获得的。与RCR 指标不同, CNCI 指标主要是基于期刊的学科分类体系对论文进行分类和统计分析。科睿唯安根據期刊的学科分类对期刊发表的所有论文进行学科分类。当一篇论文被划归到单个学科领域时, 其CNCI 指标的计算公式如式(1) 所示:
其中,f代表学科领域,t代表出版年,d代表文献类型,p为划归的该学科领域的论文数量。根据CNCI 的计算公式, 不难看出CNCI 指标是一种基于期刊级别的先验定义学科分类的相对指标。自从科睿唯安提出CNCI 指标以来, 由于其消除了出版年、学科领域和文献类型对论文被引频次的影响,可以对不同出版年、学科、文献类型的论文的影响力进行较好的评价, 因此CNCI指标得到较为广泛的认可。但是, 在使用CNCI 指标时, 科睿唯安指出了3点需要注意的事项: ①当待评价的样本量较小时, 一篇高被引论文的被引频次将会对CNCI 的数值带来较为显著的影响; ②CNCI 指标是一种基于平均值的度量, 因此, 即使待评价的样本量足够大, 少数高被引论文也可能对CNCI 的数值产生较大的影响; ③由于论文出版当年的基准值通常很低,因此, 出版当年的CNCI 数值可能高于预期的波动。
1.3期刊规范化引文影响力(JNCI)
JNCI 指标与CNCI 指标较为类似, 其主要区别在于CNCI 指标是基于学科领域进行规范化, 而JNCI 指标是基于论文所发表的期刊进行规范化。JNCI 指标被定义为论文的实际被引频次与该发表期刊同出版年、同文献类型论文的平均被引频次的比值。对于出版社或期刊编辑部来说, JNCI 指标是一种重要的评估工具, 可以帮助他们判断所发表的论文对学术界的影响力水平, 揭示那些超越平均水平并显著提高了期刊被引频次的研究工作。表1展示了科睿唯安提供的CNCI 和JNCI 指标在作者层面的一个应用示例。科研工作者D 和E 的总论文数量和总被引频次都非常接近, 他们的引文影响力几乎相同, h 指数也相同。仅用表1 中的前4 个计量指标, 无法区分两位研究人员的学术影响力。然而, 这两位研究人员实际上是在不同的学科领域进行研究, 并且有不同的论文发表历史。使用CNCI和JNCI 指标可以更好地区分和评价他们各自在主题、文献类型和出版时间方面相对于同行的表现。从表1 可以看出, 科研工作者D 的CNCI(1.32)和JNCI(1.86)的数值都超过了平均值1, 而科研工作者E 的CNCI(0.45)和JNCI(0.72)的数值都低于平均值1。这表明科研工作者D 发表论文的学术影响力高于全球平均水平, 并高于其工作领域期刊论文的平均水平; 而科研工作者E 发表论文的学术影响力低于全球平均水平, 且低于其工作领域期刊论文的平均水平。
1.4 3种指标的总体对比
尽管RCR、CNCI 和JNCI 指标都是基于规范化的思想提出的, 但是由于它们的定义不同, 导致这3 种指标在数据覆盖范围、学科领域分类、文献类型、指标算法及指标意义等方面存在一定的差异。从数据库覆盖范围来看, RCR 指标来源于iCite 平台, 绝大多数论文是与生物学和医学领域相关的;而CNCI 和JNCI 指标数据来源于包含Web of Sci?ence(WoS) 数据库, 学科领域覆盖面更广、更全面。从学科领域分类来看, RCR 指标是根据论文的共引网路分析进行学科分类的, 每篇论文的共引用网络会随着论文被引频次的增加而动态变化, 因此每篇论文的学科领域也是不断变化的; 而CNCI和JNCI 指标是基于WoS 数据库中期刊的学科属性进行学科领域划分的, 因此每篇论文的学科领域是相对固定的, 不过考虑到学科交叉, 一篇论文也可以被分配到1 个或多个学科领域。从文献类型来看, RCR 指标将文献类型划分为Article 或非Arti?cle 两种, 而CNCI 和JNCI 指标则将文献类型划分为Article、Review、Proceeding Papers 和Books 等200 多种。从指标算法来看, 由于RCR 指标计算涉及论文共引网络的形成和分析, 所以RCR 指标的算法比CNCI 和JNCI 指标的算法更为复杂。从指标意义来看, RCR 指标是以NIH 的R01 项目资助的论文为基准, 当RCR 指标大于1 时, 说明论文的影响力高于NIHR01 项目资助论文的影响力平均水平; 而CNCI 指标反映了论文在同一学科领域的实际被引频次与期望被引频次比值的平均值, 当CNCI 指标等于1 时, 说明论文在该学科领域的学术影响力与全球平均水平相当; 当CNCI 指标大于1 时, 说明论文的学术影响力高于全球平均水平;当CNCI 指标小于1 时, 说明论文的学术影响力低于全球平均水平。JNCI 指标主要反映了发表在同一期刊中论文的学术影响力, 因此, 当JNCI 指标等于1 时, 说明论文的学术影响力与该期刊论文的平均水平相当; 当JNCI 指标大于1 时, 说明论文的学术影响力高于该期刊论文的平均水平; 当JN?CI 指标小于1 时, 说明论文的学术影响力低于该期刊论文的平均水平。
2 近5年不同学科领域文献的规范化指标相关性研究
为了研究在不同学科领域中规范化指标的相关性, 本文从科睿唯安InCites 数据库平台下载了2018—2022 年WoS 在10 个不同学科领域中收录的所有论文的相关信息( 包括WoS 编号、DOI、Pubmed ID、论文题目、作者、出版期刊、学科领域、文献类型、出版年、被引频次、发表研究机构、发表国家、CNCI、JNCI 等)。从这些论文中选出有Pubmed ID 的论文, 然后利用Pubmed ID 通过iCite 平台计算获得论文的RCR 指标。随后进一步对具有Pubmed ID 的论文的CNCI、JNCI 和RCR 指标进行统计分析。在本文数据收集和研究中, 所涉及的10 个学科领域涵盖了自然科学和社会科学的多个分支, 包括信息与图书情报、经济学、生物学、遗传学、内科医学、细胞生物学、凝聚态物理、有机化学、机器人技术和交叉科学。需要指出的是, 数据中论文所对应的学科领域、发表国家和发表研究机构的界定都是科睿唯安InCites 数据库直接给出的。对于给定的一个学科领域, 在InCites数据库中使用“分析” 模块, 在其中选择“国家”或“研究机构” 就可以对这个学科领域的论文进行相应的统计分析。
表2列出了2018—2022 年研究的10 个学科领域中论文的数量和所有具有Pubmed ID 论文的RCR、CNCI 和JNCI 指标的平均值, 其中3 种指标的平均值是将所有具有Pubmed ID 论文的RCR、CNCI 和JNCI 指标进行相加求和然后除以PubmedID 论文总数获得的。从表2 中的数据可以看出,对于生物学、医学等领域, iCite 数据库平台涵盖了85%以上的WoS 论文; 对于社会科学领域(如信息与图书情报、经济学等)、物理学、化学、工程技术科学、交叉科学等, iCite 平台收录的论文数量低于WoS 论文数量的50%。这是由于iCite 平台本身主要是针对生物学、医学领域的论文评价而建立。近年来, 随着交叉学科的发展和RCR 指标的广泛应用, iCite 平台逐渐扩展到了生物学和医学领域之外的学科方向, 并收录了很多相关学科领域的论文。对比表2 中不同学科领域中论文的RCR和CNCI 指标的平均值发现, 遗传学、内科医学、细胞生物学、经济学、凝聚态物理等领域中论文的RCR 和CNCI 指标的平均值较高, 这说明从平均意义上而言, 这些领域中的论文相比其他领域的论文具有更高的学术影响力。
对上述10 种学科领域中具有Pubmed ID 论文的RCR、CNCI 和JNCI 指标进行Pearson 相关性分析, 所获得的相关系数在表2 中列出。从表2 中相关系数的数值来看, 对于这10 种学科领域, 论文的RCR 指标与CNCI、JNCI 指标呈现正相关, 且CNCI 指标与JNCI 指标也保持正相关。对于其中大多数学科领域而言, RCR 与CNCI 指标之间以及CNCI 与JNCI 指标之间的相关系数均较大, 而RCR与JNCI 指标之间的相关系数相对较小, 表明这些学科领域论文的RCR 与CNCI 指标之间以及CNCI与JNCI 指标之间保持高度的正相关, 而RCR 与JNCI 指标的相关度较低。值得注意的是, 遗传学论文的RCR 指标与CNCI、JNCI 指标之间的正相关系数仅有0.21~0.22, 展示了低度的正相关。这表明RCR 指标与CNCI、JNCI 指标在论文评价方面出现了不一致, 这可能与3 种指标的来源数据库覆盖的引文范围差异有关, RCR 指标来自于NIH 建立的iCite 数据平台, 而CNCI 和JNCI 指标来源于科睿唯安的InCites 数据库。
近年来, 规范化指标不仅被用于评价学术成果的影响力, 而且也被应用于评价个人、研究机构以及期刊的学术水平和学术影响力[11,15] 。在随后的小节中, 本文从10 种学科领域选择了3 个具有代表性的学科领域(包括信息与图书情报、遗传学和交叉科学), 对这3 种学科领域中论文的发表国家和研究机构的平均RCR 指标和CNCI 指标进行分析, 进而研究不同学科领域中论文的发表国家和研究机构的学术水平。3 个代表性学科领域中, 信息与图书情报作为社会科学类的代表领域, 遗传学则是近年来生物医学类自然科学领域中较为积极活跃的学科领域之一, 而交叉科学则反映了多个自然科学领域的融合。
2.1信息与图书情报领域论文的发表国家和研究机构的规范化指标
表3和表4 分别给出了2018—2022年信息与图书情报领域论文发表国家和研究机构情况及其对应的传统引文指标(论文总数和总被引频次)和规范化指标的平均值。这两个表格中的数据都是根据总被引频次进行排名的, 分别给出领域中排名前十位的国家和研究机构的情况。这两个表格中的RCR和CNCI 指标的平均值是将对应国家或研究机构在领域内发表的所有具有Pubmed ID 论文的RCR 和CNCI 指标进行统计平均而获得的。从表3 和表4的数据可以看出, 尽管一些国家(如美国、西班牙、德国等)或研究机构(如美国加州大学、美国宾夕法尼亚联邦高等教育系统)的论文总数和总被引频次较高, 但是它们所对应的RCR 和CNCI 平均值却相对较低。这说明尽管这些国家或研究机构所发表的论文数目较多, 但是其高被引论文的数目相对较少, 或其论文的学术影响力相对较低。同时也进一步表明了国家或研究机构所对应的RCR 和CNCI平均值与总被引频次呈现较弱的相关性。图2(a)和2(b)分别展示了表3 和表4 中排名前十的国家和研究机构对应的RCR 平均值与CNCI 平均值之间的线性相关性。从图中可以看出, 这些国家和研究机构所对应的RCR 平均值与CNCI 平均值具有显著的線性相关性。根据规范化指标的定义和内涵, RCR 和CNCI 平均值越高的国家和研究机构,其发表论文的学术水平越高, 学术影响力越大。结合表3 的数据可以看出, 在信息与图书情报领域,相比其他国家, 我国发表论文的RCR 和CNCI 平均值较高, 说明近些年我国在该领域具有较高的学术影响力。结合表4 的数据可以看出, 在信息与图书情报领域, 中国科学院和武汉大学在国际上具有较高的学术水平。值得注意的是, 在表4 中, 英国斯旺西大学的论文总数仅有74, 但其论文的总被引频次高达5 478, 其原因是74 篇论文中有10 余篇论文是高被引论文。这些高被引论文使得英国斯旺西大学论文的RCR 和CNCI 平均值高于其他9 所研究机构。这反映出规范化指标的一个局限性: 当待评价的样本量较小时, 少数高被引论文的被引频次将会对规范化指标带来较为显著的影响。
2.2遗传学领域论文的发表国家和研究机构的规范化指标
表5 和表6 分别给出了2018—2022 年遗传学领域论文发表国家和研究机构情况及其对应的引文指标和规范化指标。从表5 和表6 的数据可以看出:被引频次排名前十的国家或研究机构所对应的RCR和CNCI 平均值与总被引频次保持较弱的相关性。对表5 和表6 中的RCR 平均值与CNCI 平均值进行相关分析发现, 不同国家对应的相关系数仅有0.248,而不同研究机构对应的相关系数高达0.951。不同国家所对应的相关系数较低是由于在遗传学领域不同国家发表论文的RCR 平均值非常接近造成的。从表5 的数据中可以看出, 在遗传学领域, 尽管我国发表的论文总数和总被引频次均居世界第二位,但是其RCR 和CNCI 平均值与其他国家相比较低,说明我国在遗传学领域的高被引论文相对较少, 学术影响力与其他9 个国家有一定差距。结合表6 的数据可以看出, 在遗传学领域, 位于世界前十的研究机构均为欧美发达国家, 并且都是世界知名的研究机构, 而我国未有研究机构进入世界排名前十的位置。
2.3交叉科学领域论文的发表国家和研究机构的规范化指标
表7 和表8 分别给出了2018—2022 年交叉科学领域论文发表国家和研究机构情况及其对应的引文指标和规范化指标。从表7 和表8 的数据可以看出, 被引频次排名前十的国家或研究机构对应的RCR 和CNCI 平均值与总被引频次呈现低度的相关性。对表7 和表8 中的RCR 平均值与CNCI 平均值进行相关分析发现, 不同国家和研究机构对应的相关系数分别高达0.975 和0.991。这表明在交叉科学领域, 排名前十的国家和研究机构对应的RCR平均值与CNCI 平均值呈现高度的相关性。从表7的数据不难看出, 在新兴的交叉科学领域, 尽管我国发表的论文总数与总被引频次居于世界第二位,但其RCR 和CNCI 平均值相比表7 中的多数国家偏低, 这说明我国在交叉科学领域论文的学术影响力有待进一步提高。结合表8 的数据可以看出, 在交叉科学领域, 中国科学院的论文总数与总被引频次居于世界第三位, 其RCR 和CNCI 平均值也处于表8 中的中上水平, 这说明中国科学院在交叉科学领域中具有较多的高被引论文, 其学术水平相对较高。
3结论
本文选取InCites 数据库中2018—2022 年10种不同学科领域的论文作为研究对象, 对这些论文的RCR、CNCI 和JNCI 指标进行了相关性分析。研究结果表明, 在10 种学科领域中, 论文的3 种规范指标之间均保持正相关; 对于其中大多数学科领域, RCR 与CNCI 指标之间以及CNCI 与JNCI 指标之间相关程度均较高, 而RCR 与JNCI 指标之间的相关程度相对较低。同时, 本文也选取了3 个具有代表性的学科領域, 对其中的论文发表国家和研究机构的规范化指标进行较为深入的分析。分析结果表明, 在不同学科领域中, 被引频次排名前十的国家或研究机构所对应的RCR 均值和CNCI 均值具有较高程度的相关性, 且对应的RCR 和CNCI 均值能够反映其在学科领域中的学术水平和学术影响力。目前, 本文的研究仍存在一定的不足之处, 如在研究中没有分析规范化指标随时间的演化、研究中选取的学科领域仍较少等。在今后的研究中, 将深入分析规范化指标随时间的演化, 并关注规范化指标在不同学科领域中评价论文学术影响力的差异, 同时将持续挖掘规范化指标的特点, 验证规范化指标评价学术影响力的一致性和有效性, 并考虑将规范化指标与其他引文指标相结合, 从而建立多元化、多维度的科学评价体系。