开放获取对科技期刊的影响
——基于论文被引频次的探讨
2014-04-14付雅静钱俊龙
■付雅静 钱俊龙
1)中国科学院上海应用物理研究所联合编辑部,上海市800-204信箱 201800,E-mail:fuyj@sinap.ac.cn2)中国科学院自然科学期刊编辑研究会上海分会,上海市双山路167弄11号2008室 200065,E-mail:junlong-qian@126.com
开放获取(Open access,OA)是一种公益性出版模式,科技论文发表后(或是以在线出版状态)全文放到开放空间,给予用户最大的使用权限,包括免费阅读、下载、复制、传播、打印和检索等[1]。开放获取提高了用户获取阅读资源的便利性和经济性,能够加快科技成果的传播时效,是科技期刊数字出版的发展方向,在国际上已成为主流出版模式,DOAJ网站发布的OA期刊已有133个国家的9721种[2]。我国的期刊出版者正在积极促进OA在期刊界的普及和发展,并取得了一些进展[3-7],2014年5月14日,国家自然科学基金会和中国科学院宣布开放获取政策,规定所有国家自然科学基金项目和中国科学院的论文,在发表后1年全部向读者免费公开。这是参照美国NIH的类似政策,另外,中国科技部的研究经费也可能会参照类似开放政策。这意味着中国正式加入国家层面的开放获取俱乐部[8]。有研究表明,开放获取出版可以提高科技期刊的影响因子;也有观点认为OA期刊的影响因子与非开放获取(non-OA)期刊相差无几,甚至要低一些[7,9-10]。这些研究的关注点多在期刊的学科领域、OA期刊与非OA期刊之间。但是,在期刊之间的比较不能客观地反应出OA出版期刊的优势,期刊之间的差异性可能会抵消OA带来的优势。在同一种期刊发表的科技论文水平上研究OA对期刊的作用相对要客观公正。本文以发表在某期刊的科技论文为例,通过分析论文被引频次的变化来探讨开放获取通过何种方式影响科技期刊。
1 研究方法
1.1 对象和工具选取
选取2007-2012年发表在某中文期刊的449篇科技论文为研究对象,在互联网上能够检索到论文全文的,即视为实现了OA。该中文期刊为非OA期刊,近年平均被引半衰期为6。本研究拟通过对论文被引频次的影响来讨论OA对期刊的影响,因此,选择近6年发表在该刊的论文为研究对象。公开的文档均为出版后版本,属于绿色OA方式。论文OA的平台是普通的中文网站,在百度搜索和谷歌搜索中检索论文全文的OA版本。论文被引频次选用中国知网提供的综合被引频次。
1.2 数据收集和处理
以论文的篇名作为检索短语,在百度搜索和谷歌搜索中进行检索,能够检索到任何格式的完整全文,并能够浏览、下载的论文即视为实现了OA。目标论文主要被公开发布在在线论文分享平台,截至2014年4月,各平台统计的公开论文版本分布见图1。论文是由网站注册的用户上传。对于有多于一个公开版本的论文不做特别处理,因为对于用户而言,能够检索到全文即实现了目的,具体在一个或是几个网站获取并不重要。OA论文和非OA论文的数量和被引频次见表1。
目标论文发表和实现开放获取的时间不同,因此将结果处理成以“次/年”为单位的数据,使其具有可比性。统计数据采用EXCEL处理,OA与非OA数据组间的比较采用t检验验证,p<0.05时认为数据组间有统计学差异。
图1 各网站可获取的论文分布
表1 OA论文和非OA论文数量和被引频次
从图1和表1中可知,449篇论文中,实现OA的有191篇,占论文总量的42.54%。OA论文主要发布在豆丁网、道客巴巴网和百度文库等在线文档分享平台上,其中以豆丁网居多,占到 OA总量的67.53%。
2 数据分析与讨论
2.1 OA论文有较高平均被引频次
统计中发现,6年间每年实现OA的论文数量没有一定的规律,2009年最多。影响OA论文数量的因素很多,期刊论文发表后到被中国知网数据库收录发布,有一定的时滞;第三方获取并公开发布这些论文也有一个正常的时滞;再者,第三方虽然不顾版权问题,但应该有一些忌惮,因此,并不是相对较近期发表的论文实现开放获取的数量较多,反而2012年是OA论文数量最少的。更早期的论文时效性较差,因而也没有被公开发布更多。科技论文的专业领域也会影响公开发布数量,比如医药领域、涂料化工领域的科技论文更受网络用户所关注,这些领域的企业众多,并对新科技比较敏感。我们关注的是这些科技论文被公开发布后,对其被引频次有何影响。
OA论文和非OA论文的被引频次随着发表时间的增加而增加,2007年论文的被引频次最多,2012年最少,并且变化明显。表1数据处理结果见表2。由表2可知,平均被引频次OA论文为0.33次/年,高于非OA论文(0.25次/年)34.27%,统计差异显著(p=0.018)。如果将这种影响转化到期刊的计量指标,则期刊的影响因子和总被引频次也会有相应幅度地提高。
表2 期刊论文平均被引频次
2.2 OA状态能提高论文被引频次
从理论上讲,判断OA对科技论文被引频次的影响,需要考察发表于同一期刊相同时段的论文,从发表之日起,一部分OA,一部分非OA,若干年后可以明确地比较出OA对论文被引频次的影响。然而这种理想状态很难实现,本研究中统计的OA论文是由不同的网站注册用户和机构随机发布,没有统一的时间,每篇论文均经历了非OA期和OA期的过程。而从某种意义上讲,同一篇科技论文在非OA期和OA期被引频次的变化,能够更公正客观地体现出OA对论文被引频次的贡献。本文统计了截至2014年4月,191篇OA论文所历经非OA期和OA期的时长和两个时段内的被引频次,具体数据见表3。OA论文历经的OA时长从7月到53月不等。由表3可知,同一篇科技论文,在相同的时间里,OA时期的被引频次明显高于非OA期,OA时期平均被引0.38次/年,高出非OA期(0.24次/年)58.33%,统计差异非常显著(p=0.006)。
表3 同一篇OA论文在非OA期和OA期的被引频次
2.3 OA对低被引论文有更大优势
为探讨OA对期刊的作用方式,对占OA论文总被引频次67%和83%以及1次被引OA论文的数据进行了统计学分析,结果见表4。由表4可知,OA对较高被引频次论文的优势相对较弱,对Top23%论文的优势没有统计学差异(p=0.375);对Top36%论文的优势较非OA期提高48.43% (p=0.020),但仍低于总体的58.33%;对1次被引论文的优势较非OA期提高113.25%,远高于总体论文数据和较高被引论文的数据,并且统计差异非常显著(p=0.003)。说明OA对该期刊的优势是通过提高低被引论文的被引频次来实现的。
一个不容忽视的现象,本研究中有43.21%的论文被引0次,其中实现OA的论文中有35.60%零被引,少于非OA论文中的48.84%零被引(见表5)。说明论文实现OA后能够相对减少零被引论文的数量。
表4 OA论文中高被引论文和1次被引论文的统计分析
表5 目标论文中零被引情况
近年来,关于OA对科技论文被引频次带来优势的观点逐渐出现不同的声音[11],但仍以支持这一观点的研究居主流,OA优势范围8%-480%[12]。OA不能直接决定论文的被引频次,但是论文被浏览是被引用的先决条件,被浏览的机会越多,论文被引用的机会就越大。OA对科技论文而言,带来了可获取的便利性,能够使其获得潜在的被引用可能。当OA时间足够长,使论文潜在的被引用的可能释放出来,就能够提高科技论文的被引频次。这可能是用户在自由获取与强制订阅之间自己选择的结果[13]。
本研究中,对于同一篇论文,OA状态较非OA状态可以带来58.33%(p=0.006)年被引频次的提高,转化到期刊上,则会提高期刊的总被引频次和影响因子等相关计量指标。数据分析可知,OA对本文期刊的优势在一定程度上是通过提高低被引论文的被引频次和减少零被引论文体现的。这可能提示期刊存在显示度和传播度较低的情况。被引用过的论文可以通过文献追溯和人人传递等方式传播,而零被引论文只有当潜在的引用者直接获取原文后才有机会被引用。本文期刊与某数据库的独家收录协议实施4年多,期刊网站开通不足1年,数字出版还有很大的发展空间。Antelman[10]指出,OA与较低影响因子期刊之间的关联度可能更大,较低影响因子的期刊由于机构订阅和发行的限制,使得科研人员不那么容易获取;Evans[14]指出OA论文更容易被相对贫穷的国家引用。而对于OA论文,在互联网环境中脱离了期刊封面封底的束缚,成为独立的出版单元时[15],没有了核心、高影响因子等限制,能否被引用便取决于论文本身的学术价值。
本研究的OA论文中,有35.60%的零被引论文,对于这些论文,即使消除了获取障碍,也可能只是增加了无效阅读次数。Davis[16]的研究指出OA对论文被引频次的优势在逐年递减,因而当OA成为期刊出版常态后,论文的质量仍是科技期刊出版的核心竞争力。
3 结论
国内网络环境中,非OA中文科技期刊部分地实现了开放获取。开放获取出版通过提高论文被引频次,对科技期刊的影响因子和总被引频次等计量指标有正面作用。OA作用的大小和实现方式视期刊的具体发展状况而定:对于显示度和传播度相对较低的期刊,OA带来的优势在初始阶段可能会较明显,并且通过提高低被引论文的被引频次来实现;但对于某些零被引论文,OA在某种程度上只能增加无效阅读次数。预示着当开放获取成为出版常态后,科技期刊之间的竞争核心仍然是论文质量。本文提供了OA对科技期刊优势的一种可能实现方式,普遍性仍待更多数据支持,期待能为同行的工作带来些许思考。
1 任胜利.开放存取(Open Access):现状与展望.中国科技期刊研究,2005,16(2):151-154
2 Directory of open access journals(DOAJ) [EB/OL].[2014-05-14].http://doaj.org/
3 程维红,任胜利.中国科技期刊开放存取出版现状.编辑学报,2007,19(3):196-198
4 程维红,任胜利,王应宽等.中国科协科技期刊开放存取(OA)出版现状.中国科技期刊研究,2008,19(4):554-560
5 李武,杨屹东.开发存取期刊出版的发展现状及其影响分析.图书情报工作,2006,50(2):25-30
6 光明日报.受公共资金资助科研项目论文实行开放获取[EB/OL].2014-05-16.[2014-05-29].http://news.gmw.cn/2014-05/16/content-11332244.htm
7 程维红,任胜利,路文如等.2007-2011年中国科协科技期刊开放存取出版进展.中国科技期刊研究,2012,23(5):710-714
8 孙学军.国自然和中科院将执行强制开放获取新政[EB/OL].[2014-05-20].编辑之家,2014,190期.http://www.editorhome.cn/openaccess/17896/d2cfa529-95b1-4067-95cc-c9e52793fbe3.aspx
9 王珏,方卿.开放存取期刊学术质量评价(二)——基于影响因子视角的分析.出版科学,2011,19(6):70-74
10 Antelman K.Do open-access articles have greater research impact?.College&Research Libraries,2004,65(8):372-382
11 Gargouri Y,Hajjem C,Larivière V,et al.Self-selected or mandated,open access increases citation impact for higher quality research.PLoS ONE,2010,5 (10):e13636.doi:10.1371/journal.pone.0013636
12 Wagner B.Open access citation advantage:An annotated bibliography.Issues in Scienceand Technology Librarianship,2010,(60):2
13 Davis PM,WaltersW H.The impactof free access to the scientific literature:a review of recent research.Journal of the Medical Library Association:JMLA,2011,99(3):208
14 Evans J A,Reimer J.Open access and global participation in science.Science,2009,323 (5917):1025.DOI:10.1126/science.1154562
15 杜秀杰,赵大良,葛赵青等.数字出版时代如何提高科技论文的显示度.中国科技期刊研究,2012,23(1):126-128
16 Davis PM.Author-choice open-access publishing in the biological and medical literature:a citation analysis.Journal of the American Society for Information Scienceand Technology,2009,60(1):3-8