“王子”对“睡美人文献”引用的动机分析

2018-07-11宋维翔

现代情报 2018年5期

宋维翔

〔摘要〕在科技研究的过程中，“睡美人文献”很有可能是意义重大的里程碑式文献，不少诺贝尔奖获得者的早期论文亦是“睡美人文献”。本文通过邮件访谈的方式访问了若干“睡美人文献”和“王子文献”作者，对于零被引论文的情况以及唤醒“睡美人文献”的过程等问题进行调查，试图揭示两者之间的内在关系，得出了形成“睡美人文献”的原因主要有作者的谦虚性、团队的不稳定性等因素；“王子文献”多为具有高影响力的高被引论文等结论，为今后科研工作者识别优秀论文提供参考依据。

〔关键词〕睡美人文献；王子文献；引用动机；邮件访谈

DOI：10.3969/j.issn.1008-0821.2018.05.005

〔中图分类号〕G250252〔文献标识码〕A〔文章编号〕1008-0821（2018）05-0032-05

〔Abstract〕The“Sleeping Beauty Paper”is likely to be a significant milestone sometimes in the process of scientific research.Many of the Nobel Prize winners early papers were also the“Sleeping Beauty Paper”.In this research，several authors of the“Sleeping Beauty Paper”and“Prince Paper”were interviewed by e-mail about the citation of the zero-cited papers and the process of awakening the “Sleeping Beauty Paper”.This research was trying to reveal the inner relationship between the two and provide reference for identifying the excellent papers.The main conclusions included：reasons for the“Sleeping Beauty Paper”were the authors modesty，instability of the team and other factors；the“Prince Paper”was mostly a highly cited paper.

〔Key words〕Sleeping beauty paper；Prince paper；motivation of citation；E-mail interview

“睡美人文献”即一篇论文如果在发表后的相当长一段时期内处于零被引或低被引状态，仿佛睡美人在沉睡，而在之后的某段时间几乎是非常突然地高被引，就像睡美人被唤醒了一样。被唤醒的睡美人文献称为“王子文献”（Prince）。对于“睡美人文献”的识别问题，不少学者也做过相关研究，杜建等[1]引入时间因素，从文献引文轨迹特征和累积被引速率快慢的角度验证诺贝尔化学奖得主Stefan Hell的代表性论文是否为睡美人文献，并分析其唤醒机制；梁立明等[2]分析了LJRomans 1986年发表的一篇超弦理论论文沉睡与唤醒的过程，提出睡美人文献沉睡的一个重要原因是该文发布的是一项早熟的科学发现，而在睡美人文献被唤醒的过程中起到至关重要作用的原因是该研究成果毗邻科学权威。

潘云涛等[3]曾统计了中国作者在1997-2001年发表的国际论文在2002年的被引情况，发现凡单篇论文被引用率排在前10位的论文，他引率都达到了98%以上。由此可以得出一个结论：被引用次数越多的论文，其影响力也就越大，作者自引量占被引用总量的比例越低。挪威学者Dag WAksnes统计了1981-1996年挪威作者发表的46 849篇论文的640 710篇引文，发现挪威作者的平均自引率为21%，且高自引率往往伴随低被引次数；多个作者合著的论文自引率较高，许多自引是在发表论文后的第一年内发生的[4]。郭斐等[5]对“睡美人”文献的形成要素进行了归纳：学术水平超前、自我“营销”欠佳和科研壁垒。

国内外对于引用动机的研究已有不少，以理论研究居多。但论文的引用过程中，施引者的引用动机和引用情境非常复杂，尤其针对睡美人文献，在数量极少的情况下来分析整个引用过程：“谁”引用（王子文献作者）的？“为什么”引（引用动机）？睡美人文献作者为什么没有“自引”？本文作者对睡美人文献和王子文献的作者分别进行邮件访问，以探究两者之间的关系。

1睡美人文献及王子文献筛选

本文定义“睡美人”文献的具体计量标准为：论文发表后前3年被引频次为零，而在此后几年引用频次激增，且在统计时间窗口该论文的总被引频次居当年发表所有论文被引频次前20%的论文[6]。

在Web of Science数据库中，选取天文学和天体物理学领域1994-2003年发表的论文作为样本，根据以上标准，获得1994-2003年睡美人文献共48篇，1995年产生的睡美人文献数量最多，约占当年文献数的千分之一。这48篇文献中的45篇文献类型为Article，2篇为Note，1篇Review；被引次数最高为265次，最低39次，平均被引次数66次；作者数最多的為24人，平均作者数36人；参考文献数最多为105篇，最少8篇，平均参考文献数266篇。

48篇文献分布在16种期刊中：其中13篇发表在Physical Review D（JCR分区Q2），7篇发表在Astrophysical Journal（JCR分区Q1），7篇发表在Journal of Geophysical Research-Space Physics（JCR分区Q1），此3种期刊产生的睡美人文献占了总数的56%。

笔者以这48篇论文的第一作者及首次引用这些论文的作者（王子文献）为研究对象进行邮件访谈，共对睡美人文献作者发出问卷25份，收回5份，回收率20%；对王子文献作者发出问卷18份，收回4份，回收率45%。由于所有作者均为国外研究人员，且论文发表年份时间较早，查找作者的邮件地址难度较大，致使问卷的回收率不高。虽然回收率不高有些遗憾，但是，这些回复了的少数邮件都非常珍贵，就像“孤儿病”一样，虽然罕见，但研发治疗孤儿病的药物仍然有非常重要的价值和作用。

2睡美人文献作者调查和分析

21调查思路设计

对于自引问题，有观点认为可能反映出部分著者自我吹嘘，提高被引次数等不严肃态度[7]，然而另一种观点认为，著者在撰写论文过程，出于引证发展和继承自己以前的学术观点，把自己以前的论文列于自己新撰写论文后的参考文献中，便于读者核对和跟踪，这也是实事求是的，而且是必不可少的工作[8]。潘云涛等[3]认为在科学界，作者自引是不可回避的，就连诺贝尔奖得主们都有一定的自引。尽管其自引量占总被引次数的比例不高。正常的自引，也是将科学研究工作脉络交代清楚的一个必然要求，怕别人批评自己自我吹嘘而不作必要的自引，致使研究的来龙去脉不清楚，反而对不起读者。只要不是人为地为彰显自己的工作成就而将本人以往的论文不必要地加入参考文献，都属于正常自引[9]。

本次调查排除了首次被引为自引的论文，对发表多年后仍为零被引的睡美人文献作者进行了邮件调查。我们假设多年未自引可能会有两个原因：①发表该论文后不久，该作者不再从事本领域研究；②该作者处于“谦虚”的目的而没有自引。

针对以上情况，笔者对睡美人文献作者设计了3个问题：①是否了解该论文的情况，以及自发表以来的被引次数？②认为该论文发表后多年未被引的原因是什么？③为何不自引？

22调查结果

对于第一个问题“是否了解该论文的情况，以及自发表以来的被引次数？”，5份问卷回复见表1：

23结果分析

通过5名作者对3个问题的回复内容可以看出：

1）超过半数的作者明确指出关注并了解自己论文多年来的低被引情况，首先认为，论文引用次数较少是自以为论文质量并不是特别高；其次，对自己的论文被引用情况不是非常介意或认为不该介意。这个结果从一个侧面印证了本文之前的假设，即睡美人文献的作者有相当部分属于“谦虚型”作者。

2）论文发表后多年未被引的原因之一是研究内容为开山之作或属超前领域，直到成为主流研究后才成为高被引论文。

3）5份问卷对于“为何不自引”的问题回复如出一辙，都是因为各种原因不再从事该论文所属的研究领域。科研的传承和连续性是促进科技发展的重要因素，如果一项研究，尤其是前沿领域的科学研究一旦被搁置，则需要很长一段时间来“恢复元气”。

3王子文献作者调查和分析

31调查思路设计

关于引用动机的研究很多，马凤等[10]分别以《中国科技期刊研究》作者和中国情报学核心作者为研究对象，作了两项关于文献引用动机的调查，了解到科研人员的引用动机，以及文献引用的相关问题。除了理性的、正面的引用动机外，马凤等指出“引用实质上也属于行为，受社会因素的影响，加上参考文献的定义、界限、标注方式等没有得到统一，不免出现诸如‘被迫引用、‘假引、为特殊目的而敷衍了事的引用、二次或多次参考文献的引用等问题。”

唤醒睡美人文献的那些作者首次引用睡美人文献的动机是什么？这是本调查问卷关注的主要问题。在引用论文时，①是否在意它以往的被引次数？②认为该论文发表后多年未被引的原因是什么？③您认为自己的引用对这篇论文的高被引结果是否有重要影响？

对于能够唤醒睡美人文献的王子，本文有两个假设：

1）王子文献本身是一篇高被引论文；

2）王子文献作者是该领域“资深”或“知名”研究人员。

32调查结果

33结果分析

通过4名作者对3个问题的回复内容可以看出：

1）所有作者均明确表示，参考文献的以往被引情况不是决定其是否引用的主要考虑因素。

2）4名作者中有3人认为睡美人文献的产生是由于研究领域的超前性，这个结果与前文中对睡美人文献作者的访问结果不谋而合。

3）4名作者中有3人认为自己的王子身份对唤醒睡美人文献产生了一定的作用。

4结语

本文通过调查问卷，从一个侧面了解睡美人文献的引用动机及文献引用的相关问题，虽然样本量不大，但问卷的回复仍能说明一些问题。目前国内尚无人用直接询问作者的方法来研究睡美人文献的被引行为，特别是询问作者的引用动机。实际上，对“王子”文献的研究可以加速我们对“睡美人”文献唤醒机制的掌握，从而培养更多的“王子”文献，直接询问的方法不仅可以了解作者引用文献的动机，也为今后科研人员对类似睡美人文献的优秀论文的发掘、推荐提供依据。

睡美人文献的成因有很多，结合相关参考文献的归纳总结，本文调查访问直接从双方作者的角度得到一些印证：虽然很多作者一直关注自己论文的被引情况，但多数睡美人文献的作者不会自我“营销”（自引），这是睡美人文献形成的因素之一；前沿研究领域中认识比较超前的论文更可能成为睡美人文献，而科研的断层和团队的不稳定性是导致零被引论文形成的重要原因之一。

睡美人文献当然是货真价实的高质量论文，但在别人对文章质量没有认识的情况下，仅靠作者自引和别人的偶然引用，一般并不能成为高被引论文[11]。“酒香也怕巷子深”、“千里马还需伯乐引”，对睡美人文献的唤醒和识别机制還需要进一步研究，具有一定学术地位的“王子”对睡美人文献的早期引用，对其日后成为高被引文献往往是至关重要的。本次调查中的“王子”文献最高被引频次为338次，最低被引频次为35次，平均被引频次为82次。由此可以看出，“王子”文献几乎无一例外都是具备相当高影响力的高被引论文。这一结果也直接证明了Braun T等[12]提出的“王子”文献的一般性界定标准：“王子”文献存在于第一批引用“睡美人”文献的文献中，具有高被引频次或相当数量的被引而且与“睡美人”文献有大量的共引。

情报人员若能精准地识别出潜在的睡美人文献并推荐出来，也许是对科学事业的重要贡献。为了精准识别，除了考察历史上睡美人文献的共性外部特征外，仍有必要从王子文献作者那里挖掘一些有价值的东西，将其个人判断力转化为群体性的判断力。此时，仍需要对王子作者进行问卷调查甚至是深度访谈，这将是我们后续研究的课题。

参考文献

[1]杜建，武夷山.文献引文轨迹：分类及测度[J].情报理论与实践，2015，（7）：52-58.

[2]梁立明，林晓锦.迟滞承认：科学中的睡美人现象——以一篇被迟滞承认的超弦理论论文为例[J].自然辩证法通讯，2009，31（1）：39-45.

[3]潘云涛，武夷山.自引、他引：说不尽的故事[J].科技导报，2014，25（24）：85.

[4]Aksnes D W.A Macro Study of Self-Citation[J] Scientometrics.2003，56（2）：235-246.

[5]郭斐，鄢小燕.“睡美人”文献研究综述[J].图书馆建设，2016，（5）：40-45.

[6]王海燕，马峥，等. 高被引论文与“睡美人”论文引用曲线及影响因素研究[J]. 图书情报工作，2015，（16）：83-88.

[7]武夷山.千万不能忽视文献“睡美人”现象[N].科学时报，2008-02-29.

[8]杜建，武夷山.睡美人与王子文献的识别方法研究[J].图书情报工作，2015，（19）：84-92.

[9]李江. 科学中的“睡美人”与“昙花一现”现象评述[J]. 大学图书馆学报，2016，34（3）：38-43.

[10]马凤，武夷山. 关于论文引用动机的问卷调查研究——以中国期刊研究界和情报学界为例[J]. 情报杂志， 2009， 28（6）：9-14.

[11] Glnzel W， Garfield E. The Myth of Delayed Recognition[J]. Scientist， 2004， 18（11）：8.

[12]Braun T， Glanzel W， Schubcrt A.On Sleeping Beauties，Princes and Other Tales of Citation Distribution[J].Research Evaluation，2010，19（3）：195-202.

（責任编辑：郭沫含）

现代情报

2018年5期

“王子”对“睡美人文献”引用的动机分析

杂志排行

现代情报的其它文章