发表时滞与论文影响力关系研究<br/>——以图书情报学中文核心期刊为例

发表时滞与论文影响力关系研究
——以图书情报学中文核心期刊为例

2016-03-24韩牧哲李秀霞

中国科技期刊研究 2016年7期

关键词：情报学期刊论文时滞

■韩牧哲李秀霞王冬刘超

1）华中师范大学信息管理学院，湖北武汉珞瑜路152号 430079

2）曲阜师范大学传媒学院，山东日照烟台路80号 276826

3）武汉大学测绘遥感信息工程国家重点实验室，湖北武汉珞瑜路129号 430079

1 引言

论文发表时滞，又称发文时滞、出版周期，是指期刊论文的收稿时间与发表时间的时间差［1］。通常，一篇文献定稿之时其情报价值已经形成，新的显性知识产生，象征着该文献生命周期的开始。知识的时效性从知识形成之日算起，文献会随着其所承载知识的时效性的流失而不断老化，当文献的使用量最终为零，则宣告该文献生命周期终止。论文发表后才能开始其知识扩散，知识接受者通过知识吸纳，融合创造新的知识，完成知识的再生产环节，即象征着该论文情报价值的一次实现。因此，从知识转移的视角来看，发表时滞即为知识形成和知识扩散开始的时间差。

发表时滞是评价期刊学术质量与水平的一项重要指标，国外学者最早在20世纪60年代就已经关注期刊论文的发表时滞问题，并进行过相关的统计分析工作［2］。此后一直有学者跟进关于发表时滞的研究，较有代表性的研究有：Mason等人通过对经济学期刊发表时滞问题的剖析，提出了相关的解决对策［3］。Luwel和Moed对期刊论文发表时滞及其引证文献的年代分布进行分析，发现论文发表后2-3年间的引证文献对其发表时滞最为敏感［4］。Egghe和Rousseau发现直接观察到的论文老化分布是“未被扰动的”真实老化分布与发表时滞分布的卷积［5］。随后，Ray等人［6］和 Marchi等人［7］分别证实了论文发表时滞与期刊影响因子之间存在负相关关系。Amat指出发表时滞与同行评议的过程关系密切［8］。Luwel结合出版现状对其1998年成果进行了修正和扩展，发现在接近25年间，期刊论文的发表时滞缩短了接近50%［9］。

国内编辑学、计量学和情报学学者们一直关注期刊论文发表时滞的研究：早在1986年刘永胜先生就首度对21种期刊所载论文的发表时滞进行了统计研究［10］。早期研究成果多见定性地分析发表时滞的成因、时滞过长可能造成的不利影响以及缩短发表时滞的意义及相关举措［11-12］。也有部分学者将发表时滞作为一种统计量纳入对某种期刊的评价体系中进行应用，进而对目标期刊现有的工作流程提出改进建议［13-14］。随着国内科技期刊出版的规范性不断提高，越来越多的学者尝试用定量实证分析的方法对期刊论文的发表时滞问题进行了较深层次的剖析：高养淑、赵福来根据排队论理论，提出了一种能够确定任一期刊论文发表时滞的概率分布的仿真算法［15］。刘雪立［16］、颜巧元［17］等人分别依据不同领域的数据探讨了期刊发表时滞与期刊影响因子和期刊质量的相关关系，认为缩短发表时滞有利于吸引高质量论文，提高期刊的学术影响力。赵树庆等［18］根据遴选出的20种科技期刊2010年的时滞数据进行分析，认为科技文献的寿命与发表时滞密切相关，指出优先数字出版使科技论文普遍实现“超短”时滞发表的重要途径。贺晓丽［19］等人对当前国内图情类核心期刊的发表时滞与作者的期望值之间的符合度进行比对分析，从作者的心理接受程度方面对图情类期刊的编辑人员提出建议。哈尔滨工业大学的于光教授（Guang Yu）对期刊论文的发表时滞展开了一系列研究并相继发表在Scientometrics等杂志上，先后对期刊论文发表时滞的数学模型［20］、发表时滞对期刊影响因子的影响［21］、发表时滞对期刊排名的影响［22］等问题进行了定量分析，并设计了一种发表时滞控制系统［23］。

此前学者以期刊为基本单位描述发表时滞对期刊影响力的影响。众多学者也都倡导通过提高编辑工作效率、控制稿件库存数量、增加出版频次等措施来尽量缩短发表时滞。发表时滞可分为必要发表时滞和非必要发表时滞，必要发表时滞是指“三审”审阅过程的编、审、校、印等有效工作所占用的时间，必要时滞虽然会影响论文的时效性，但是属于保障论文质量不可或缺的环节；非必要时滞是指由于论文作者、审稿专家和编辑工作者的工作效率低以及稿件积压、刊行周期等原因造成的延迟，非必要时滞会占用论文有效的知识扩散时间，还可能直接使论文的情报价值受损。已有研究多是研究必要时滞和非必要时滞的“最短”时滞，忽视了时滞的“最优”性，本文认为在编审流程和出版环境不发生革命性变化的情况下，发表时滞并非越短越好，应是在保证论文质量最优的情况下对发表时滞进行压缩。基于这个假设，本文拟通过构建合适的数学模型，刻画目标领域论文的发表时滞及其影响力的相关关系，进一步找到能使该领域论文影响力最大化的时滞区间，从而为编辑工作者和论文作者提供决策依据。

2 研究设计

2.1 数据来源

为保证所采集论文编审流程的规范性，并能获取到有效的被引频次数据，本文选择《中文核心期刊要目总览（第六版）》收录的图书馆学情报学核心期刊在2013年公开发表的学术论文为来源进行数据采集，数据采集时间为2015年12月。

初步调查显示，2013年图书馆学、情报学中文核心期刊共19种，其中《图书馆工作与研究》月刊、《图书馆学研究》半月刊两种期刊未标注论文“收稿时间”，《图书馆》月刊的论文“收稿时间”只到月份，因此排除这3种期刊。其余16种核心期刊在2013年共刊载论文3785篇，采集并统计每篇论文的“收稿时间”和当年每期的“发表时间”（数字优先出版的论文以CNKI网络出版时间为准），两者做差，得到每篇论文的发表时滞，精确到天。其后从CNKI数据库检索并统计以上3785篇论文的被引频次；由于CNKI数据库没有收录《情报学报》月刊2013年的数据，故采用百度学术汇总的“被引频次”进行数据补全。统计得到图书情报学16种核心期刊的时滞和被引频次，见表1。以此作为本文研究的数据基础。

2.2 数据处理与模型拟合

由表1可见不同期刊的发表时滞各不相同，平均发表时滞为半年，其中《图书情报工作》半月刊和《现代图书情报技术》月刊的发表时滞最短，从收稿到发表平均不到3个月，《图书馆理论与实践》月刊和《情报科学》月刊发表时滞偏长，平均接近一年。其中原因，已有学者做过详细的分析和阐述，本文不再赘述［24］。以期刊为单位进行观察，国内图书情报学16种核心期刊的影响力与其当年的平均发表时滞之间并没有显著的相关关系，可以说明发表时滞并非期刊和论文质量的主要影响因素。

本文主要以论文为单位考察发表时滞与论文被引频次之间的关系。将每一篇论文的发表时滞和被引频次数据对应组合，得到3785组数对，其中有很多论文的发文时滞相同，进一步统计得不同的发文时滞数据共542个，其中最短5天（0.014年），最长884天（2.422年）。这些数据要根据分析所需进行一定的统计和处理，因此有必要对一些参数进行符号定义和说明。

表1 图书情报学核心期刊的发表时滞与被引状况概览

表2 参数设定和符号说明

2.2.1 发表时滞分布函数的拟合

观察发现，大量论文的发表时滞相同，其中发表时滞为137天的论文数量最多，有32篇，且在其周围的时滞区间内论文数量明显集中；另外发表时滞极长或极短的区间内通常论文数量较少，且存在不连续现象，说明发表时滞过长或过短的现象都具有一定的偶发性。

为了保证数据的连续性，本文将每组10个数据划为一个时滞区间，以每个闭区间的上界数字为该区间的代表，整理出一组包含54个数据的发表时滞数列，单位为年，统计时保留后3位，由此统计得到的数据如表3。

将这组数据导入专业的统计软件M initab17中进行拟合，发现与双参数威布尔分布的拟合效果较好（图 1）。

威布尔分布（Weibull Distribution）是瑞典物理学家W·威布尔教授在其1951年的《一个具有广泛适用性的统计分布函数》［25］一文中首次阐述的一种随机变量分布，通常用于描述机械电子类产品的磨损累计失效率，经过数十年的发展与应用，威布尔分布已经成为可靠性分析和寿命检验的理论基础，被广泛应用于各个领域解决实际问题。本文拟合发表时滞的双参数威布尔分布是一种单峰偏正态分布函数，其概率密度函数表达式为：

式中k是形状参数，c是尺度参数，自变量T为发表时滞数据。利用M initab17的参数估计功能，根据本文的发表时滞数据，估算出式中k=1.595，c=0.9385，拟合所得的概率密度函数曲线记为L1。

表3 主要参数数据表

图1 发表时滞的概率拟合与参数估计

2.2.2 发表时滞-被引频次函数曲线拟合

以时滞区间Tj为横坐标，与之对应的论文影响力Ij为纵坐标，绘制包含54个坐标点的散点折线图，记为L2。

观察发现代表发表时滞与论文影响力之间相关关系的折线图L2的走势与此前拟合的概率密度函数曲线L1类似，因此以双参数威布尔分布的概率密度函数方程为范本对L2进行曲线拟合，以便对两条曲线进行比较，并最终找到能使论文影响力最大化的发表时滞区间。利用式（3）对该拟合曲线的参数进行初步估计［26］，再通过微调使曲线获得最好的拟合效果：

反复实验发现在式（1）中的 k=1.675，c=0.538时拟合效果较好。为该式添加常数系数b2=0.560后即可与上文生成的两条曲线在同一坐标系中进行展示，由此而得本文发表时滞与论文影响力相关关系方程，记为L3。

为了方便比较分析，用Matlab17将L1、L2、L3三条曲线绘制于同一个直角坐标系上，展示效果如图2。

图2 发表时滞的概率密度曲线及其与论文影响力关系曲线图

3 结果分析

3.1 实验结果分析

曲线L12是2013年图书情报学中文核心期刊发表时滞的概率分布曲线，用于描述连续随机变量取值的密集程度。横轴数据为发表时滞，以年为单位；纵轴数据为发表时滞分布的概率密度，其现实意义是不同发表时滞区间内论文的分布概率。

曲线L2的峰值出现在T=0.506时，对应的发表时滞约为185天；概率密度函数值在0.6以上的发表时滞在51～320天之间，该区间长度约占时滞区间总体的30.4%，说明大多数论文的发表时滞在这个区间之内，且发表时滞在半年左右的论文数量最为集中，统计数据显示在51～320天内发表的论文共计3024篇，占总数的79.9%，对总体样本有很好的代表性。

曲线L3是根据折线L2拟合而得的发表时滞与论文影响力的关系曲线，能够大致拟合出折线L2的整体走势。横轴数据为发表时滞，以年为单位；纵轴数据为不同发表时滞论文的影响力，根据论文的被引频次计算而得。曲线L3的峰值出现在T=0.295时，对应的发表时滞约为110天；影响力在0.6以上的论文的发表时滞区间主要在31～210天之间，该区间长度约占时滞区间总体的20.2%，在此时滞区间发表的论文，篇均被引在3次以上且每个以天为单位的时滞区间内所包含的论文数量平均不少于10篇。统计可知这个区间内的2551篇论文累计被引9024次，在总体被引量中占比75.2%，被引频次均值高于总体平均水平。

统计可得2013年图书情报学核心期刊的论文发表时滞数据符合双参数威布尔分布，有80%的论文的发表时滞集中在51～320天之间。对发表时滞与论文影响力的关系曲线拟合结果显示，发表时滞在31～210天之间的论文占据了总体被引频次的75%，是当时能使论文影响力最大化的理想时滞区间。通过比对分析可知2013年图书情报学核心期刊有一多半的论文分布在理想的时滞区间内，不过现实中涵盖论文数量最多的时滞区间与理想中使论文影响力最大化的时滞区间仍存在较大差距。

3.2 讨论

通过对上文实验结果的阐述和分析，基于16种图书情报学中文核心期刊2013年的相关情况，提出以下观点：

3.2.1 论文影响力与发表时滞存在相关关系

发表时滞和论文的影响力有一定的相关关系，可以通过模仿双参数威布尔分布的概率密度函数进行曲线拟合。发表时滞过短，有可能会压缩必要的发表时滞，影响正常编审程序的严谨性而造成论文质量不过关；时滞过长，则会损失论文的时效性，从而导致论文知识扩散时间的相对缩短并进而可能降低论文的影响力，这种影响对于一些以突发性研究热点和实证研究为主题的论文表现尤其明显。

能使发表时滞和论文影响力同时达到最优化的理想状态是曲线L1和L3向左趋同，最终使绝大多数论文分布于影响力最大的时滞区间内。就本文而言，使论文影响力最大化的理想时滞区间为31～210天。从当前的统计结果看，发表时滞在31～50天之间的论文共229篇，累计被引915次，篇均被引超过4次，说明这个时滞区间中不乏高水平论文，且零被引率较低。不过这部分论文数量仅占总体的6%，其发表时滞也短于总体一般水平，说明在2013年，国内图书情报学期刊中仅有很小的一部分能在保证论文质量的前提下高效完成编审流程，意味着当前目标领域的发表时滞还存在进一步缩短的空间。发表时滞在211～320天之间共有论文702篇，累计被引1718次，篇均被引2.45次，这部分论文零被引率明显偏高，且被引频次均值低于整体平均水平，由于各核心期刊刊发的论文均要求符合一定的质量标准，因此不能片面地认为这部分论文的影响力偏低是单纯由论文水平导致的，造成这种规律性差异的原因可能是发表时滞过长。因此，如何缩短在这个区间内发表的论文的非必要时滞，是当前环境下促使论文影响力趋向最大化的关键所在。

3.2.2 使论文影响力最大化的理想时滞并非最短时滞

就国内的期刊出版编辑现状而言，论文的发表时滞与其影响力之间并不呈现单调的反比关系，两者呈类偏峰正态分布的函数关系，因此“最短”时滞在当前并非理想时滞。

2013年图书情报学核心期刊论文的发表时滞集中在51～320天，从整体来看，发表时滞超过一年的论文数量明显较少，这种时滞超长的论文可能是因某种特殊情况所致。发表时滞最短的仅有5天，少量论文的发表时滞在30天以内，这些论文绝大多数是期刊针对某个专题或研究热点进行的定题约稿。约稿论文在现实中通常直接由期刊主编进行终审把关后即优先刊出。由于这类论文的作者通常是领域内知名的专家学者，作者群水平普遍很高；且这类论文选题一般非常新颖，有一定的标杆性质和导向作用，所以这类作品中不乏超高被引论文。不过对于普通的学术论文而言，科学严谨的编审流程仍是保障论文质量的必要程序，由此而产生的发表时滞属于必要时滞，在编审流程和出版技术没有进行科学改进时，压缩必要发表时滞对论文影响力的作用可能会适得其反。因此就当前而言，国内期刊论文的发表时滞并非越短越好。

2013年图书情报学中文核心期刊的最优发表时滞应该在31～210天之间，在这个时滞区间内发表的论文影响力普遍较高，在各期刊保持当年的审稿流程、出版周期和载文量水平大致不变的情况下，这个区间既可以使必要的发表时滞不被压缩，保证论文质量，又不会因为过分影响论文的时效性而造成影响力下降。

3.2.3 期刊论文发表时滞有进一步缩短的趋势

由于当前数字出版、网络出版等新的出版技术的采用，加之互联网环境下各种自媒体平台带来的新的学术交流平台的兴起，当前发表时滞的“理想区间”并非稳态。在期刊编、审、校、印、发之中的任一流程发生改变都有可能造成论文发表时滞和影响力同时发生变化。而且这种变化的趋势将是发表时滞的整体缩短和论文影响力的进一步提升。

优先数字出版可以跳过传统纸质期刊出版流程中的刊印和发行环节，效率更高。据徐云峰等学者的统计，优先数字出版相比于传统纸质出版能将论文的发表时滞平均提前100天左右，且能够提高约42.5%的网络下载量，并认为这种新的出版模式在将来极有可能彻底取代传统科技期刊纸质出版［27］。在2013年，本文采集的16种期刊中仅《中国图书馆学报》双月刊的部分论文在CNKI数据库中试点进行了优先数字出版，随着这项技术的普及，在2015年，上述16种期刊中已有11种采用了优先数字出版。因此，在可预期的未来，随着新的出版形态、编审流程以及各项新技术的采用和推广，国内期刊论文的必要发表时滞将会进一步缩短。

4 结语

相较于此前诸多以期刊为单位对发表时滞进行探讨的成果，本文在数据处理阶段既已打破期刊范围的禁锢，以论文为单位研究发表时滞与论文影响力之间的相关关系，并成功模仿双参数威布尔分布的概率密度函数对发表时滞-论文影响力关系曲线进行了拟合，这种方法可以精准确定能使论文影响力最大化的理想时滞区间，直观地展示某一领域在某个阶段的发表时滞与理想状态之间的差距，能为期刊编辑工作者的工作改进提供科学的目标和依据。

需要注意的是，本文是以2013年图书情报学核心期刊论文做示例，所得的数据性结果是否具有普遍性尚待进一步的研究。另外，发表时滞对论文被引量的影响力是否能够计量？不同领域和类型的论文对发表时滞的敏感程度分别如何？这些都是值得思考的问题。

［1］吴伟民.我国图书情报学期刊编辑现状述评［J］.图书馆理论与实践，1993（1）：20-23.

［2］Pings C J.Publication delays in the chemical engineering literature［J］.Journal of Chemical Documentation， 1967， 7（3）： 179-181.

［3］Mason PM，Steagall JW，Fabritius M M.Solving publication delays in econom ics［J］.Academe， 1992， 78（1）： 30-32.

［4］Luwel M， Moed H.Publication delays in the science field and their relationship to the ageing of scientific literature［J］.Scientometrics， 1998， 41（1-2）： 29-40.

［5］Egghe L， Rousseau R.The influence of publication delays on the observed aging distribution of scientific literature［J］.Journal of the American Society for information science， 2000，51（2）： 158-165.

［6］Ray J， Berkwits M， Davidoff F.The fate of manuscripts rejected by a generalmedical journal［J］.The American journal ofmedicine， 2000， 109（2）： 131-135.

［7］De MarchiM，Rocchi M.The editorial policies of scientific journals： Testing an impact factor model［J］.Scientometrics，2001， 51（2）： 395-404.

［8］Amat C.Editorial and publication delay of papers subm itted to 14 selected Food Research journals.Influence of online posting［J］.Scientometrics， 2007， 74（3）： 379-389.

［9］Luwel M，van W ijk E.Publication delays revisited： 1998-2012［C］//Proceedings of the 17th International Conference on Science and Technology Indicators.2012（2）： 569-577.

［10］刘永胜.科技论文发表过程中的时滞［J］.情报业务研究，1986，3（4）：293-296.

［11］吴伟民.期刊发文时滞及其控制［J］.图书馆建设，1993（4）：65-66.

［12］于国艺.科技学术期刊缩短论文发表时滞的若干措施［J］.编辑学报，2003，12（4）：249-250.

［13］李军纪，马艳霞，阮爱萍.《山西医科大学学报》缩短科技论文发表时滞的策略［J］.中国科技期刊研究，2010，21（4）：518-520.

［14］钱进，吴开明，徐川平.2000～2011年《重庆医学》杂志发表时滞调查分析［J］.中国科技期刊研究，2013，24（2）：304-306.

［15］高仰淑，赵福来.科技论文发表时滞的随机模拟［J］.情报学报，1997（S1）：357-360.

［16］刘雪立，董建军，周志新，等.我国医学期刊出版周期与影响因子关系的调查研究［J］.中国科技期刊研究，2007，18（1）：43-45.

［17］颜巧元，张亮，王菊香，等.我国科技期刊的出版频率问题与对策［J］.中国科技期刊研究，2010，21（2）：177-180.

［18］赵树庆，刘永胜.20种科技期刊2010年论文发表时滞调查［J］.编辑学报，2011，22（6）：491-493.

［19］贺晓利，张薇，郝艳红.国内图情类核心期刊发表时滞与作者期望的符合度研究［J］.情报杂志，2014， 33（12）：99-102.

［20］Guang Y， Daren Y， Yihong R.The mathematical models of the periodical literature publishing process［J］.Information processing&management， 2000， 36（3）： 401-414.

［21］Yu G，Wang X H，Yu D R.The influence of publication delays on impact factors［J］.Scientometrics， 2005， 64 （2）：235-246.

［22］Yu G，Guo R， Yu D R.The influence of the publication delay on journal rankings according to the impact factor［J］.Scientometrics， 2006， 67（2）： 201-211.

［23］Yu G，Yu D R.Design and simulation on the publication delay control system［J］.Scientometrics， 2008， 76（3）： 407-427.

［24］施振宏.期刊发文时滞统计分析与思考——以图书馆学情报学核心期刊为例［J］.现代情报，2004， 24（10）：25-26.

［25］WeibullW.A statistical distribution function of w ide applicability.［J］.AsmeTrans.j.appl.mech， 1951， 18（2）：293-297.

［26］包小庆，刘志强，吴永忠，等.双参数威布尔分布函数的确定及曲线拟合［J］.能源与环境，2007（4）：8-9.

［27］徐云峰，徐红星，陆海燕，等.优先数字出版影响发表时滞和下载量的定量分析［J］.编辑学报，2013， 25（6）：607-608.