学术出版模式转变对文献引用时滞的影响调查
2017-04-14李莘于光
李莘 于光
[摘 要] 以Web of Science收录物理学科数据为样本,分别收集1995年、2000年、2005年、2010年、2015年该学科的出版数据,选取各年度被引前10%的论文作为研究对象,分析期间学术期刊刊载容量(能力)的变化、编辑出版发行方式的变化并统计计算上述数据的引用时滞。结果表明:引用时滞逐年下降,尤以2015年显著,仅4.65%的文献在发表当年未被引用。而1995—2015年间该学科期刊的刊载容量(能力)并未显著增加、刊均发文量在500篇左右,其引用时滞的缩短主要源于该学科70%的学术出版机构在2010年之后推行论文直发,待刊论文(Article in Press)单篇论文优先数字出版或放宽开放获取条件等改进编辑出版发行的策略,从而减少论文的发表周期。
[关键词] 学术出版 开放存取 优先数字出版 刊载容量(能力) 引用时滞
[中图分类号] G237.5 [文献标识码] A [文章编号] 1009-5853 (2017) 02-0068-05
Investigation of the Effect of the Change of Academic Publishing on Citation Delay: a Case Study of Physics
Li Shen Yu Guang
(Library, Harbin Institute of Technology, Harbin, 150001)
[Abstract] Data samples of physics in Web of Science were collected in 1995, 2000, 2005, 2010, 2015, the top10% papers were selected each year. The change of publishing capacity, editing and publishing changes were analyzed. At the same time, we calculated the citation delay of the data above. The results showed that the citation delay was decreased year by year, especially in 2015, and only 4.65% of the published articles were not cited that year. But the publishing capacity did not significantly increase in 1995—2015, each journal average issued about 500 articles. The decrease of citation delay is mainly due to 70% academic publishing institutions began to publish articles directly, publish “article in press” or relax open access conditions to improve the editing and publishing strategy, so as to reduce the cycle of publication.
[Key words] Academic publishing Open access Digital publishing Publishing capacity Citation delay
作為知识传播主要媒介的科技期刊是知识传播的重要途径。科技文献的出版与被引用一般经历构思、查资料/写作、投稿、审稿、录用、校印、纸质出版、电子发布、信息机构存储、检索、下载、引用等过程[1]。于光等将这一过程简化[2]。知识传播的受众只有在科技文献出版后才能真正对科技文献的作者(知识传播者)传递的知识选择是否接受。而直到知识传播的受众将该科技文献作为参考文献在自己的知识成果中使用才真正意义上完成了知识的一次传播。在这个知识传播体系中,科技文献的编辑、出版、发行、获取与阅读模式直接影响其被引用。因此,本文以Web of Science数据库中的物理学科数据为样本,分别收集1995年、2000年、2005年、2010年、2015年该学科的出版数据,选取当年被引用排序前10%的论文作为研究对象,统计计算上述数据的引用时滞,分析影响引用时滞的编辑、出版、发行、获取与阅读全过程中各相关因素,以确认学术出版模式的转变是否会影响引用时滞并促进知识传播。
1 引用时滞的定义
“如果论文B中含有使用并描述论文A的书目注释,那么论文B就含有参照论文A的参考文献,而论文A具有来自论文B的引文”,上述过程中,B被称为引用文献,而A被称为被引用文献[3]。文献引用的过程反映了科技文献的知识传播过程。引用过程受到文献A作者声望、期刊声望、作者被科学共同体认可程度、B文献作者引用动机及所处时代科技发展水平等影响。文献被引用的时间也被称为引用时滞、引用延迟或被引用时滞等。
韩志伟认为引用时滞的适宜度难以精确描述,其包括单个作者对某文献的单次或多次引用、单篇文献被多个作者引用产生的多个时滞、单篇文献被多个作者引用产生不同的引用时滞、单(多)篇文献被多个作者多次引用的平均时滞等,且引用时滞受到期刊的声誉、被引文献的时效性、出版、发行和阅读时滞等时滞的影响[4]。考虑上述因素,我们将文献引用过程定义为从A文献出版到首次引用A文献的B文献出版的过程,为便于计算,仅统计A文献与B文献的出版年数据,记为:
T=Tb-Ta (1)
(1)式中:T为引用时滞,Tb为首次引用文献A的文献B的出版年,Ta为文献A出版年。
2 数据采集及分析
Web of Science作为综合性、多学科、核心期刊的引文索引数据库[5],包括科学引文检索扩展版(Science Citation Index Expanded,SCIE,共8854种期刊)、社会科学引文索引(Social Sciences Citation Index,简称SSCI,共3242种期刊)、艺术与人文科学引文索引(Arts & Humanities Citation Index,简称A&HCI,共1779种期刊)等,以Web of Science作为检索平台[5]。由于Web of Science收录了学科中较高质量的期刊,采用该平台数据可以适当规避由于考虑期刊声望等引用动机导致的引用偏离。因此,本文选择以Web of Science数据库中的物理学科数据为样本,以SU=physics and PY=(相应年份)为检索式,在Web of Science核心合集中(SCI-E,SSCI,A&HCI)进行检索,收集1995年,2000年,2005年,2010年,2015年该学科的出版数据及被引用数据,提取当年被引前10%的论文作为研究对象,文献检索时间为2016年5月20日。
考虑科技出版模式在20世纪90年代后出现了开放存取、优先数字出版等模式,在统计引用数据时统计了论文出版当年(含出版前两年)及之后的数据。
由于优先数字出版及开放存取等数字出版模式的存在,在论文正式刊出的前两年会有部分论文被引用,但其数量不及样本总体的2%,因此,在引用时滞计算过程中暂不考虑上述文献。采用公式(1)计算文献的引用时滞,结果引用时滞为零的文献在1995年为3641篇(占当年发表文献的44.05%),2000年为4672篇(占当年发表文献的50.07%),2005年为6071篇(占当年发表文献的54.03%),2010年为8167篇(占当年发表文献的66.09%),2015年为13249篇(占当年发表文献的95.35%)。由此可见,引用时滞逐年下降,尤以2015年显著,仅4.65%的文献在发表当年未被引用。文献在分析科技论文运动过程中产生的时滞后认为,编辑、出版、发行与论文获取的及时性决定了阅读与引用时滞的长短[6]。因此,要确认引用时滞显著下降的根源,需要考虑物理学科期刊的编辑、出版、发行与论文获取等相关影响因素。
3 物理学科期刊编辑出版发行方式分析
3.1 刊载容量(能力)分析
统计该学科各年度全部论文发表的期刊种数如下:1995年293种期刊,2000年345种期刊,2005年357种期刊,2010年384种期刊,2015年403种期刊。192种期刊在考察的20年区间均有出版文献,部分期刊从2005年始收录的论文超过100篇,另外有些新兴研究领域的期刊论文激增,如《纳米级》(NANOSCALE)2010年仅收录367篇论文,到2015年收录了2286篇论文,同时部分研究领域的期刊则出现论文锐减的情况,如《物理C -超导及其应用 》(PHYSICA C SUPERCONDUCTIVITY AND ITS APPLICATIONS)2010年收录903篇论文,到2015年仅收录了194篇论文。
物理学科年收录在100篇论文以上的期刊收录了该学科全部发表论文的90%以上,这些期刊的分布为1995年164种(发表论文78621篇)、刊均发表480篇,2000年184种(发表论文88657篇)、刊均发表482篇,2005年204种(发表论文106673篇)、刊均发表523篇,2010年228种(发表论文116685篇)、刊均发表511篇,2015年254种(发表论文132010篇)、刊均发表520篇。总体而言,近十年该学科收录论文较多的期刊种数相对稳定,平均刊载容量(能力)比较接近。
3.2 编辑出版发行模式调查
为了解决20世纪90年代出现的“学术期刊出版危机”,开放存取的出版模式出现了,使得科研成果能够在互联网上自由传播,加快了学术信息的交流与出版,提高了科学研究的公共利用程度并在一定程度上保障信息的长期保存。开放获取期刊检索系统(Directory of Open Access Journals,DOAJ)从2003年仅包括375种同行评议的开放存取期刊[7],到2016年6月的8918种开放存取期刊,见证了开放存取出版的发展。2004年,优先数字出版模式(Advance Online Publication,AOP)诞生,该出版模式将印刷出版的内容提前通过优化选择、编辑及数字化处理,在没有正式排定卷期页码前,优先刊载在互联网上,供讀者在线浏览、阅读、下载使用[8]。同时,优先数字出版领域又出现了待刊论文(Article in Press)形式的单篇论文优先数字出版模式,该模式下论文确定录用后即在线出版,在印刷版中完整出版其原始研究内容,目的是令作者的论文最快被引用[9]。国内也将该出版模式翻译为在线预先发行或优先数字出版[10],指印刷型版本出版发行前先通过数据库平台预先出版图书和期刊的电子版。单篇论文优先数字出版模式改变了传统出版模式中集满一期后出版的方式,加速了论文的出版,更大程度地促进了学者对文献的获取与利用[11]。学者刘立营等的研究表明,学术出版模式向优先数字出版、开放获取出版等方式的改变几乎令发行与论文获取没有时滞甚至提前出版[12]。由此可见,引用时滞的变化应该主要由学术出版的编辑出版环节决定。
梳理相关文献的报道发现:开放存取出版模式和优先数字出版模式主要在近十年取得了迅猛发展,并且两种学术出版模式正在融合,尤其是单篇论文优先数字出版的模式更加被出版商推崇。出版巨头爱思唯尔(Elsevier)公司在2010年起推行单篇论文优先数字出版模式,将被接收通过同行评审的论文直接发布在平台上并标注卷期[13],使文章的发表周期平均提前7周[14];斯普林格(Springer)作为最早实行开放存取及优先在线出版(online first)的出版商将其开放存取出版模式中实施的预出版版本向公众开放的延时缩短为0天,大大缩短了论文的出版时滞[15],在2015年又推出与学术机构进行积极合作,通过免期刊订阅费来换取学术界对其开放获取期刊的支持的新开放获取策略[16];威利(Wiley)国际业务发展副总裁安东尼(Anthony)在2013年提出“学术出版业在过去2—3年和未来5—6年,是转型的一个重要时期,数字化程度将会更高。”并认为一般的PDF、HTML等格式的文件未来都可以实现开放获取;医学文献检索系统(PubMed)收录的优先数字出版(AOP)文献在2008—2012年间数量增长快速,从文献总数的39.92%提高到53.63%,而且还在持续增长,优先数字出版期刊数量也在快速增加,90%的期刊出版时滞可以缩短至1—6个月,极个别期刊的出版时滞缩短至1年左右[17];2011年,美国物理学会建立了开放平台,实现来稿直发[18]。笔者进一步深入分析2015年物理学科学术期刊的出版模式发现,爱思唯尔出版的期刊除两三种外全部支持开放获取或者待刊论文,斯普林格出版的期刊主要采用开放获取和优先在线出版,英国皇家化学学会(RSC)、自然出版社采用了预先出版(Advance article)和优先数字出版的出版方式,IEEE采用提前获取(aearly access)出版,威利采用预览(early view)出版,SIAM、IOS采用进展专刊(Issue in progress)出版方式,欣达维(Hindawi)和泰勒(Tayler)则主要采用开放获取出版方式,美国化学会(ACS)则主要采用提前在线出版(published online ahead of issue)的出版方式。403种期刊仅126种期刊未采用开放获取或者优先数字出版的方式。出版机构对编辑出版过程的改进直接减少了论文的出版时滞亦即缩短论文的被引用时滞,使得2015年发表的期刊论文绝大多数在发表当年即被引用。
综上所述,学术期刊出版模式向开放获取、单篇优先数字出版等方式的转变是减少论文引用时滞的根本原因。2016年,荷兰规划了一项覆盖整个欧洲的迫使学术出版商转向开放获取商业模式的计划,必将进一步推动学术期刊出版模式的巨变,缩短论文编辑出版的周期,减少论文发表时滞,即同时减少被引用文献A与施引文献B的发表周期进而减少论文的引用时滞。
4 结 论
通过选取Web of Science物理学科1995年,2000年,2005年,2010年,2015年被引前10%的论文的出版数据作为研究对象并计算上述数据的引用时滞,分析期间期刊刊载容量(能力)的变化及学术出版编辑、出版、发行等模式的转变以确定影响引用时滞的因素。结果表明:1995年—2015年,引用时滞逐年下降,尤以2015年显著,仅4.65%的文献在发表当年未被引用。而学术期刊的刊载容量(能力)没有较大幅度的变化,刊均发文量保持在500篇左右;文献引用时滞的缩短主要源于70%的学术出版机构在2010年之后推行论文直发,单篇论文优先数字出版或放宽开放获取条件等改进编辑出版发行的策略。编辑出版发行流程的再造,缩短了论文的发表周期即同时降低了被引用文献与施引文献的发表周期,从而减少了论文的引用时滞,加快了知识传播的速度。
注 释
[1]马费成,刘向. 学术期刊论文生产利用的时间分布:以我国管理学期刊为例[J]. 情报理论与实践,2010,33(9):4-8
[2]于光,李一军. 科技领域内期刊出版延时对文献老化的影响[J]. 科学学研究,2005,23(4):444-448
[3]梁永霞.引文分析学的知识计量研究[D]. 大连:大连理工大学,2009
[4]韩志伟.科技期刊相关时滞分析[J]. 编辑学报, 2004(5):316-318
[5]語花菲. Web of Science[EB/OL]. [2015-05-28]. http://baike.baidu.com/link?url=oH3ng2hLJ1D29UkGagI0CFonq5Ffoa_YbVPXuY44osmr8Bn8fgLPj4jUw8qVV3ZE3BnM11bKJUuP7IocllT69a
[6][12]刘立营,李婧,程煜华. 数字化出版模式对期刊评价的影响:第九届全国核心期刊与期刊国际化、网络化研讨会[C].太原:2011
[7]韩健,张鲸惊,黄河清. 2010年SCI收录的药理—药学专业期刊的开放存取状况分析[J].中国科技期刊研究,2012(5):763-766
[8][17]高燕,黄成,杜志银. 基于PubMed的期刊优先数字出版研究[J]. 中国科技期刊研究, 2014(3):389-393
[9]Sanfilippo J S. Get It in Print Or At Least Online-ASAP: "Articles in Press"[J]. Journal of Pediatric and Adolescent Gynecology, 2008,21(6):303-304
[10]叶红波. 学术期刊的优先数字出版对科学知识生产方式的革新作用:基于科学知识生产和传播的视角[J]. 科技传播,2015(1):9-11
[11]张红燕. CNKI和SpringerLink学术期刊全文数据库的比较分析:以经济管理文献检索为例[J].现代情报,2011,31(7):153-155
[13]陈丹,董鑫,张玉洁.爱思唯尔期刊运营模式及数字出版研究[J].科技与出版,2013(2):10-14
[14]Elsevier采用单篇论文出版模式提高出版速度[J]. 现代图书情报技术, 2010(11):23
[15]陈丹,程小雨,齐媛媛.施普林格期刊运营模式及数字出版策略分析[J].科技与出版,2013(2):15-19
[16]魏凯. 2015年国际数字出版年度总结[J]. 出版广角,2015(Z1):22-26
[18]徐雅雯. U-时代:学术期刊出版方式的转型与创新[J].大连海事大学学报(社会科学版), 2015(6):125-128