期刊单元下参考文献与论文被引频次间的关系<br/>——以Web of Science凝聚态物理学科为例

期刊单元下参考文献与论文被引频次间的关系
——以Web of Science凝聚态物理学科为例

2018-07-17康旭东徐庆富张春博

中国科技期刊研究 2018年6期

■康旭东　徐庆富　张春博

1)大连理工大学技术研究开发院，辽宁省大连市甘井子区凌工路2号　1160242)大连理工大学科学学与科技管理研究所，辽宁省大连市甘井子区凌工路2号　116024

继承性、发展性和积累性是科学活动最基本的性质，几乎所有的科研成果都是对前人工作的继承和拓展[1]。这就决定了参阅和引用别人的文献，借助和吸收已有的研究成果是科学家的基本行为、科学知识生产的基本过程和科学研究活动的基本特征，因此在文末著录参考和引用的文献已经成为学术界的基本规范。参考文献具有重要意义：对于科学学科而言，文章之间的引证关系体现了科学主题纵向上知识的继承与发展和横向上学科间的差异与联系；对于科研人员而言，引用前人文献可以为自己论文提供有说服力的证据，并通过引证关系将自己嵌入科学知识网络；对于科学研究成果而言，作为其他文章的参考文献，体现了科学研究成果的价值，而引用其他参考文献，则是通过吸收有价值的知识来提升自身价值。因此参考文献是论文价值的重要影响因素，是科学研究的知识基础。

论文的被引频次可看作是对论文学术价值和影响力的测度[2]。虽然被引频次存在引用动机复杂和时滞性等问题，并且近些年受到新兴替代计量学的挑战，但是鉴于指标的客观性和易获取性等，被引频次依然是学术界最常用的论文质量测度指标。阅读、梳理和总结高质量的参考文献是科学研究的基础性工作，并影响论文的价值，那前人的研究成果在多大程度上影响后来者的研究？更确切地说，参考文献的各个指标与论文被引频次之间是否存在相关关系？假如参考文献影响论文的被引频次，那么不同的期刊载体之间，这种影响是否存在差异性？以上问题正是本文的研究内容。

1　理论分析

1.1　研究假设的提出

在已有的研究成果中，相关的参考文献指标主要包括参考文献的数量、质量、时间，以及跨学科性等。

在数量方面，简琳等[3]分析了6个学科的455篇论文被引的文本因素，发现参考文献数量对英文文献的被引存在显著影响；姜磊等[4]以《期刊引证报告》(JournalCitationReports,JCR)中3个学科的论文为数据来源，研究了参考文献数量对论文被引频次的影响，发现两者之间的相关关系并不显著；王海涛等[5]则对JCR中2013年影响因子排名前20的经济类期刊在2011—2014年发表的论文进行回归模型分析，发现参考文献数量对论文被引频次具有显著影响。目前，对参考文献数量与论文被引频次之间是否存在相关关系的结论并不一致，支持两者存在相关关系的学者认为，参考文献数量越多，说明作者可能经过广泛的资料收集和前期调研，有利于提升科研成果的质量；而反对者则认为参考文献的数量与期刊的要求相关，是可操控的，并且有些相关的参考文献并没有被全部列出，两者存在的相关关系不合乎常理。基于此，提出假设H1：参考文献的数量与论文的被引频次呈正相关关系。

在质量方面，目前的研究大多选用参考文献的被引频次来表征参考文献的质量。比如Didegah等[6]选取基本科学指标(Essential Science Indicators,ESI)数据库中3个学科2000—2009年刊载的论文为研究对象，发现参考文献的篇均被引频次与论文被引频次之间存在显著的相关关系；而Bornmann等[7]借助百分位指标，分析了生命科学等4个学科的1年发文数据，验证了牛顿假说，即高被引论文也更倾向于引用被引频次较高的参考文献。一般来说，参考文献的质量越高，说明该项研究建立在较高质量的前人研究成果之上，正所谓“站在巨人的肩膀上”，科研的基础较好，因而有可能产出高质量论文。基于此，提出假设H2：参考文献的质量与论文的被引频次呈正相关关系。

在引用时间方面，早在20世纪60年代，Price[8]指出不同学科引用文献的新旧程度不一样，并且提出“普赖斯指数”这一指标，作为划分科学“软硬程度”的标准。随着文献年龄的增长，除特别经典的文献以外，大多数文献的研究主题、技术方法、成果结论等都变得陈旧过时，逐渐失去利用的价值，因此建立在这些陈旧文献基础上的研究成果的质量可能也不高，导致论文的被引频次偏低。Peters等[9]和Onodera等[10]的研究结果均表明，表征参考文献新旧程度的一些指标，比如普赖斯指数、引用半衰期等，与被引频次之间存在明显的相关关系，并且参考文献越老，论文的被引频次越低。基于此，提出假设H3：参考文献越新，论文的被引频次越高。

现在的科学研究正迈入大科学时代，学科间的相互交叉和渗透成为发展趋势。一篇论文的跨学科程度可以用论文引用的参考文献的跨学科程度来衡量。有关跨学科性、学科交叉的研究一直是文献计量学领域的热点，比如Porter等[11]从文献施引的角度研究了过去30年间跨学科程度的变化，发现跨学科引用的比率一直在增加。那么，论文参考文献的跨学科程度与其被引频次之间是否存在相关关系？Lariviere等[12]以Web of Science(WoS)数据库2000年收录的论文为数据来源，采用ESI划分学科的标准来研究论文参考文献的跨学科程度与其被引频次之间的关系，研究结果表明，参考文献的跨学科水平与论文被引频次之间的关系因学科而异，但是所有的学科都有一个共同特点，那些单一学科和高度跨学科的论文的被引频次都不高。基于此，提出假设H4：参考文献的跨学科程度越高，论文的被引频次越高。

此外，Didegah等[13]基于参考文献所在期刊的发行国家集中度测量了参考文献的国际化程度，但笔者认为该指标过于间接，并不能有效表征参考文献的国际化程度，而且国际合作使得单篇参考文献的国际度衡量标准存在争议，所以本研究没有采取该指标。Glanzel等[14]考察了参考文献中专利文献等对论文被引频次的影响，考虑到多数学科领域的论文引用专利并非普遍现象，所以本研究也没考虑该指标。

1.2　研究单元探讨

绝大多数论文被引频次影响因素的研究都是对某一个或者多个学科的多种期刊的论文进行统一的统计分析或者建立一个回归模型等，但这种做法并不合理，因为发表在不同期刊上的论文存在多方面的差异。(1)虽然外在因素可能影响论文的被引频次，但是被引频次是由论文的内在质量决定。而不同等级的期刊对论文的质量要求不同，发表在高等级期刊上的论文往往要经过更加严格的同行评议，论文的质量和创新性等能够得到保证，同时为了扩大论文影响力和增大论文的可见度，作者会将高质量论文投向受关注程度高、声誉好的高等级期刊，因此高等级期刊集中了绝大部分高质量论文，这就决定了不同等级期刊上的论文被引频次可能存在“先天”差异，只有控制期刊这一变量，才能在一定程度上控制论文质量这一最重要但是难以测度的因素。(2)不同期刊的排版和印刷方式不同，论文篇幅等指标则存在比较大的差异。要想研究各个因素对论文被引频次的影响，则需要控制期刊这一变量，将期刊作为研究的最小单元来比较同一期刊内的论文，而非大多数研究采用的学科单元。

综合以上文献可以看出，目前学术界对于参考文献各个指标与论文被引频次之间是否存在相关关系的研究结论并不相同，并且大多数研究都是以学科为单位，需要对此进一步验证，进行以期刊为单位的多期刊间的对比研究；另外，国内外大多数文献只分析和参考文献相关的一两个指标，鲜有大数据量、系统地研究参考文献各个指标与论文被引频次之间的关系，因此本研究具有一定参考意义。

2　研究设计

2.1　样本选择和数据来源

选择合理的数据样本是研究的重要基础。本研究的所有数据来源于WoS数据库，采用Onodera等[10]遴选学科的标准。Onodera等[10]选择了JCR中的6个学科，鉴于指标的易获取性以及数据处理的复杂性，本研究选择凝聚态物理(Condensed Matter Physics)这一学科。

期刊的选择标准是期刊应当仅属于JCR中的1个学科，这是由2个原因决定的：(1)期刊所属的学科范围不同(1种期刊可能属于多个学科)也会影响论文的被引频次[15]；(2)若1种期刊属于多个学科，不方便计算跨学科性。此外，应当选择发表论文数量比较大的期刊，以便建立回归模型。Onodera等[10]只选择了每个学科的4种代表性期刊，为了更好地进行期刊间的对比，本研究扩大了研究范围，将凝聚态物理学科内符合上述标准的期刊都挑选出来作为研究对象。

在时间的选定上，既应该离现在“充分远”，使论文被引频次达到比较稳定的状态，也应该离现在“足够近”，以保证研究结论的时效性[13]，因此选择学科内各期刊的被引频次基本达到峰值的年份。当然，各期刊的被引频次达到峰值所需的时间有所不同，高影响因子的期刊要比低影响因子的期刊更晚达到引文峰值，因而只能选取各期刊间相对平衡的年份。

根据以上原则，本研究遴选2013年WoS数据库中凝聚态物理学科下的12种期刊刊载的研究论文(Article)，相关信息如表1所示，下载时间为2017年3月31日。

2.2　变量设定与测量

2.2.1因变量

本研究的因变量是论文的被引频次，论文被引频次是表征论文质量的指标。虽然被引频次并不能完全反映论文质量，但是这一指标相对而言比较客观、公正,并且易于获得，仍是当前最普遍的论文质量测度指标。每篇论文的被引频次可以直接在WoS中获取。

表1　12种期刊的名称、研究论文数量以及当年JCR分区

2.2.2自变量

(1) 参考文献的数量指标。每篇论文的参考文献数量可以通过WoS数据库直接获得。

(2) 参考文献的质量指标。已有文献采用的指标大多是参考文献的平均被引频次，但是平均被引频次极易受到某些极值的影响，并不能真正反映参考文献的被引频次分布情况，因此本研究选用篇均参考文献被引频次的中值来表征参考文献的质量。利用自编程序采集每篇参考文献的被引频次，数据量非常庞大，8847篇论文样本引用的参考文献有数十万篇。参考文献的被引频次理论上应当在施引论文的具体引用时间采集(论文的发表时间，甚至是撰写时间)，但是鉴于易获取性，参考文献被引频次的统计时间截至本研究的数据采集时间。

(3) 参考文献的时间指标。常用来衡量参考文献新旧程度的指标包括参考文献的引用半衰期和普赖斯指数等。参考文献的引用半衰期是指较新的那一半参考文献距论文发表时的时间，普赖斯指数是指最近5年的参考文献所占的比例，这2个指标可以通过Excel和Bibexcel软件提取。本研究采用普赖斯指数作为衡量指标。

(4) 参考文献的跨学科性指标。采用JCR的学科分类来研究参考文献的跨学科性，首先从参考文献中提取所在的期刊，再根据JCR中期刊的学科分类确定该参考文献所属的学科，并对其中有更名、分裂或者合并的期刊做出相应处理。需要说明的是：①在JCR中，一种期刊可能属于n(n≥1)个学科，为了避免引用学科数量膨胀，统计学科数量时，每个学科都获得1/n的权重，以保证引用学科数量与参考文献数量相等[16]；②参考文献中有部分文献未被WoS数据库收录，例如图书、专利、网络文献、会议论文和除科学引文索引(Science Citation Index, SCI)、社会科学引文索引(Social Science Citation Index, SSCI)、艺术与人文索引( Arts & Humanities Citation Index, A&HCI)收录期刊以外的论文等，按照Porter等[17]的建议，测度“跨学科性”时这部分数据不列入统计范围。

跨学科引证指数是研究论文跨学科性常用的指标[16]，该指标将参考文献分为隶属本学科和隶属其他学科2类，引用其他学科论文的数量占总引用量的比例即为跨学科引证指数。但是该指数无法区分所涉及的其他学科数目的多寡，无法衡量学科交叉的广度以及被引频次在各个学科中分布的均匀性。为弥补跨学科引证指数的不足，采用香农(Shannon)指数[18]来表征论文的跨学科性，计算公式为

(1)

式中：fShannon为香农指数；Pi为参考文献所隶属的学科数量i占所有学科总数N的比例，数值越大说明跨学科性越高，所有的Pi值之和为1。

2.2.3控制变量

许多研究证明，除参考文献以外，其他一些因素也有可能影响论文的被引频次[13-14]。为了尽可能排除这些因素对本研究的影响，选取了一系列控制变量，包括作者数量、机构数量、国家数量、论文篇幅以及有无基金资助等，其中有无基金资助是引入的虚拟变量。此外作者的科研能力也是影响论文质量的重要因素，但是由于本研究的论文样本数量太大，和作者科研能力相关的指标，例如作者的h指数、已发表论文数量、总被引频次等极难采集，因此只能放弃这部分数据。

2.3　模型设定

研究的因变量——论文的被引频次——为非负整数，属于典型的离散型数据。对于这类数据进行一般的线性回归可能产生有偏和无效的系数，通常采用计数模型来避免这些问题。典型的计数模型包括泊松回归模型和负二项回归模型，泊松回归模型要求因变量的均值与方差相等，当方差明显大于均值，即存在“过度分散”的现象时，考虑使用负二项回归模型。此外，当数据中含有大量0值时，考虑使用零膨胀泊松回归模型或零膨胀负二项回归模型。

3　实证分析

3.1　整体分布情况

在分析各期刊的论文数据之前，首先从期刊这一层面研究了期刊等级与期刊内论文的参考文献各个指标之间的关系。图1所示为各期刊的篇均参考文献数量、篇均参考文献的普赖斯指数、香农指数和被引频次中值，横坐标与表1中期刊序号相对应，体现期刊是按照影响因子从大到小的排序。

由图1可知，参考文献的4个指标与期刊等级之间并不存在十分显著的相关关系，但是随着期刊影响因子和JCR分区的降低，篇均参考文献数量、篇均参考文献被引频次中值以及篇均普赖斯指数这3个指标大体上呈现递减趋势。

3.2　单篇论文角度——以Physical Review B为例

PhysicalReviewB是凝聚态物理学科的著名期刊，JCR分区一直处在Q1区，在该研究领域内影响力较大，并且该期刊的发文数量较大，可以为本研究的模型提供充足的数据样本。下面以PhysicalReviewB2013年刊载的4774篇研究论文为例，详细说明实证分析过程。

3.2.1描述性统计与相关系数

表2所示为所有变量的描述性统计和相关系数。由表2可知，各个变量之间并不存在严格意义上的多重共线性；在实证分析的过程中，进一步检测了方差膨胀因子(Variance Inflation Factor, VIF)，发现最大的VIF不超过3，说明多重共线性在本研究中不显著，可以将其纳入同一回归模型进行实证检验。此外，论文被引频次的方差明显大于均值，因此需要采用负二项回归模型。

3.2.2模型结果分析

表3所示为模型回归分析的结果。模型1为基础回归模型，显示的仅为控制变量对论文被引频次的影响，模型2～5分别为加入了与参考文献有关的4个自变量，模型6则纳入了所有自变量。

图1　12种期刊参考文献的指标。(a)篇均参考文献数量；(b)篇均普赖斯指数；(c)篇均香农指数；(d)篇均参考文献被引频次中值

表2　描述性统计和相关系数

注：①虚拟变量未列入表中；②***、**、*分别表示在1%、5%、10%的水平下通过显著性检验，下同。

表3　模型估计结果

注：括号内数值为标准误差。

从模型1的估计结果可以看出,作者数量和论文篇幅对被引频次有显著的正影响，其余控制变量与被引频次之间的关系均不显著。从理论角度分析，作者数量越多，说明论文越集思广益，可以为科研项目提供更丰富的研究思想、方法和资源；作者数量较多也有助于扩大论文的影响力，增加论文被引用的可能性。而论文篇幅越长，说明问题可能被讨论得越充分，论文含有的信息量越多。这2个变量与被引频次之间存在正相关关系具有其合理性，但是如果需要进一步确认，还需要更多模型间的对比分析。

从模型2～6的估计结果可以看出，和参考文献相关的4个指标均与论文的被引频次存在正相关关系，并且都在1%的水平上通过显著性检验，即参考文献的数量越多、篇均被引频次的中值越高、普赖斯指数和香农指数越大时，论文的被引频次就越高。特别是普赖斯指数和香农指数这2个指标，其相应的回归系数分别为2.1173和1.0531，影响作用非常大。各个模型的结果均充分支持了原假设H1～H4。

3.3　不同期刊间参考文献对被引频次的影响差异

只对PhysicalReviewB进行回归分析并不能得到完整的结论，需要对其余11种期刊逐一进行回归分析。鉴于论文篇幅，这一系列过程不再一一列出，表4所示为各个回归模型的简略结果。

表4　12种期刊回归模型的简略结果

注：①+++、++、+分别表示在1%、5%、10%的显著性水平下通过检验，并且系数符号为正；②---、--、-分别表示在1%、5%、10%的显著性水平下通过检验，并且系数符号为负；③空白表示未通过显著性检验。

由表4可知，和参考文献相关的4个指标与论文被引频次之间的关系基本上可以分为3种类型。

(1) 表征参考文献新旧程度的普赖斯指数，在12种选定期刊中都对被引频次呈现出正影响，并且基本都在1%的显著性水平下通过检验，即最近5年的参考文献所占的比例越高，论文的被引频次就越高，这也与假设H3相符。参考文献越新，论文被引频次越高，这可能是因为：①新文献在研究技术、方法以及结论等方面都比较新颖，有利于产出高质量的研究成果；②新文献所研究的内容是新兴的热门领域或者新的学科增长点，其成果极容易受到学界关注，这也有可能促使论文的被引频次增加。

(2) 参考文献的数量和表征参考文献跨学科性的香农指数在大多数期刊中都与被引频次有显著的正相关关系，即参考文献的数量越多、跨学科性越高时，论文的被引频次就越高，基本符合假设H1和H4。根据Haslam等[19]的分析，参考文献的数量越多，论文被引频次越高，这可能是因为：①作者对研究课题做了广泛而深入的前期了解和准备，因而提高了科研质量；②该领域是一个成熟广泛、或者众多科研工作者正在研究的热点领域，因此论文所涉及的研究成果容易受到其他研究人员的关注及引用；③参考文献数量越多，反映出该研究的综合性越强，先前的众多研究成果在这里汇总。而参考文献的跨学科性越高，论文的被引频次越高，一方面可能是因为学科间的交叉融合更容易产生较高质量的成果，另一方面也有可能是因为跨学科的研究容易吸引多个学科的研究人员的关注，论文的可见度增加，因而被引用的可能性也得到显著提高。

(3) 表征参考文献质量的被引频次中值与论文被引频次之间的相关关系并不明显。在多数期刊中，参考文献被引频次的中值与论文被引频次之间不存在相关关系，即使在有相关关系的期刊中，这种关系的方向性也并不一致，该结论与假设H2并不相符。当然这一结论并不是否定引用前人高质量论文的重要性，只是说从整个“大科学”层面，前人的研究成果很有可能会影响后来者的研究质量，但是从单篇论文角度分析，前人的高质量论文并不会过多影响施引论文的质量。当然，这是基于本研究的数据而言，高影响力科研成就到底如牛顿所说的“站在巨人肩膀上”，还是像奥尔特加所说的“更多地由科学大众推动”，还需要更大范围数据的检验。

4　结语

研究结果表明，在对期刊影响因子进行人为控制(即选择同一期刊内的论文比较)的前提下，在2013年凝聚态物理学科领域12种专业期刊的8847篇研究论文的4个参考文献指标中，12种期刊的普赖斯指数都与论文被引频次存在显著正向相关关系，大部分期刊的参考文献数量和香农指数则与论文的被引频次存在显著的正相关关系，而篇均参考文献的被引频次中值则与论文被引频次之间不存在显著的相关关系。

本研究结论对于科研工作者开展科研活动、撰写学术论文等也具有一定的参考意义：(1)在研究之前，要充分和广泛地收集已有资料，认真阅读前人文献，从中总结出有用的结论、方法等，进而制定合理的科研计划和科研目标，争取产出高质量的科研成果；(2)要主动出击，及时地关注和跟踪当前科技前沿，了解科技热点，学习并且使用最新的技术方法，找准科研“处女地”；(3)要注重学科融合和交叉，打破学科界限，多与其他学科领域的研究人员交流，注重其他学科领域研究方法、技术、结论等在本领域的应用。

当然，本研究依然存在需要扩展的地方：(1)鉴于某些指标获取和处理的复杂程度，所选的学科只有凝聚态物理，后续需要改进数据采集和处理的方法，研究更大的样本，获得更为普遍的结论；(2)参考文献与论文被引频次之间的理论关系和具体机制上的探讨需要进一步挖掘。通过较大样本的回归模型，验证了参考文献的某些指标与论文被引频次确实相关的结论；然而这种相关和影响机理需要深入探讨，不但可以深化二者关系的理论认识，也为更深入的计量实证(例如突破传统的引文著录分析，进入全文层面的引用内容分析，进而进行微观知识引用和创新研究)提供参考。

致谢感谢辽宁重大装备制造协同创新中心在本研究数据来源方面提供的支持。

作者贡献声明：

康旭东：完善研究设计，撰写论文；

徐庆富：获取与分析数据，参与论文的撰写与修订；

张春博：提出研究设计，修改论文。