APP下载

非开放获取的引文劣势
——一项针对反向翻转期刊的因果推断研究

2022-06-11明蔚刘凯恒赵镇岳

图书情报知识 2022年2期
关键词:影响力学术期刊学术

明蔚 刘凯恒 赵镇岳

(1.南京大学信息管理学院,南京,210023;2.武汉市汉阳市政建设集团有限公司,武汉,430050)

1 研究背景

开放获取运动作为国际学术交流模式的关键性变革,旨在解决传统订阅期刊存在的多种问题,如价格持续提高、文献获取壁垒、版权许可危机等[1]。开放获取运动最早可以追溯至多个学术组织发布的三大公共宣言,分别是布达佩斯开放获取倡议组织在2002年颁布的《布达佩斯开放获取宣言》、美国霍华德 · 休斯医学研究所在2003年颁布的《贝赛斯达开放获取发表宣言》、德国马普学会在2003年发起的《柏林科学人文知识开放获取宣言》[2]。哈佛大学前开放获取项目主管Suber根据上述宣言,将“开放获取”的核心理念归纳为“用户可以通过网络不受价格障碍和大多数的许可障碍就可以获取研究性文献”[3]。

从实现途径上看,目前开放获取(Open Access,OA)有绿色开放获取(Green OA)、金色开放获取(Gold OA)、青铜开放获取(Bronze OA)、钻石开放获取(Diamond OA)等模式。从开放程度上看,有免费OA和自由OA。目前,开放获取已经涉及到重构整个科学交流体系的核心层面,即商业学术出版的传统订阅模式需要完全转变为机构或作者付费的金色开放获取模式[4]。

提高学术影响力如拓宽传播范围、增加受众数量、增强传播效果等是学术期刊主办方的核心使命。影响因子和引用数量直接决定了该期刊是否能覆盖更多的读者群体。开放获取对于作者而言,能解决数据开源、文献获取、即时发布等问题;对于读者而言,能提供免费学术信息、开放数据下载等便利条件。这种双赢结果,很难被学术期刊出版商采纳,最根本的原因在于利润。

对于学术期刊而言,无论是编辑、出版还是发行,都需要大量人力、物力的投入。虽然传统订阅模式弊端重重,但读者的订阅费用是保证期刊工作系统正常运转的重要保障。具体到有关学术期刊出版的开放获取商业模式中,Hinchliffe将其划分为四类,分别是:转换协议模式(transform agreements)、纯粹出版模式(pure publishing agreements)、订阅开放模式(subscribe to open)、会员出版模式(membership publishing)[5]。转换协议模式是指一个联盟(如学术机构、图书馆等)与出版商建立合作伙伴关系来实现向开放获取的大规模转换。它使参与机构的科研人员可以无限制地阅读该出版商发行的期刊,并拥有足够的资金来支付开放获取的文章处理费(article processing charge)。纯粹出版模式是指作者签订付款协议后,可以在OA期刊上发表文章。订阅开放模式是图书馆进行集体订阅,使当年或下一年内容保持永久开放获取状态。会员出版模式就是适用于各类出版商和学会内部的出版模式,这些机构根据获得的捐款为会员提供开放获取内容。从资金来源维度上看,这四大模式目前都只是转移了原有期刊投入的固定成本,而并没有彻底解决OA期刊的资金问题。不少OA期刊需要向作者收取文章处理费,从而支付编辑工资、印刷发行或其他生产成本。这一措施对没有充足研究经费的研究人员,如经济欠发达地区学者及青年学者来说是一个沉重的负担。

因此,在开放获取运动如火如荼的推进过程中,学术期刊领域仍然出现了反向翻转现象。“翻转”是英文动词“flip”的直译,在国际期刊研究领域中,完成由传统订阅模式转换到开放获取模式的期刊通常被称为“flipping journals”,这一过程被称为“OA Flipping”。“反向翻转”由Matthias等提出[6],即期刊由开放获取模式反向翻转回订阅模式。学术期刊出现“反向翻转”现象的原因主要为自身运营所需。本文通过对出现过反向翻转现象的学术期刊进行研究,解释反向翻转与论文的学术影响力(用被引次数测度)之间的因果关系,对未来开放获取运动的开展与推进具有重要理论和现实意义。

2 文献综述与研究假设

1987年1月,成人教育领域下的期刊New Horizons创刊,它是世界上第一本OA期刊,具有同行评议机制,仅以线上形式发行[3]。进入1991年,世界上第一个学术论文存档库arXiv成立。这两座里程碑的出现,标志着开放获取运动中金色之路和绿色之路的开端[7]。随着时间推进和技术完善,有关OA期刊和论文学术影响力的研究也迅速增多。例如,Davis等评估了开放获取对发达国家和发展中国家学术参与主体的行为的影响[8];Moed研究了开放获取出版是否会增加引用或下载率[9];Björk等比较了OA期刊和订阅付费期刊的学术影响力[10]。

正是因为开放获取带来的巨大影响,针对学术期刊从订阅模式转换为开放获取模式的相关研究也开始涌现。在出版方式优化维度中,Laakso等回顾了基于订阅的学术期刊转变为开放获取的方式,并将相关方式分为两大类,一类依赖文章处理费,另一类不依赖作者方支付费用[11]。Haux等通过细分领域,对各类别订阅型期刊的相关标准进行整理,探索学术期刊从订阅模式转换成开放获取模式的多种可能性[12]。

在模式转变后的影响力计量维度中,Copiello试图找到OA期刊模式获得更高引用的具体机制,如开放索引数据库的推动等,来进一步区分订阅模式和开放获取模式[13]。Basson等则通过实证研究,指出单就期刊内容的开放状态来说,几乎不能解释一篇文章累积的引用次数的变化[14]。Holmberg等则从可见度和接受度两个指标来评判OA期刊内容的社会影响力,特定的领域和平台会出现显著差异[15]。Bautista-Puig等人发现了学术期刊翻转后获得了OA引用优势的证据[16]。

这一系列研究的热潮一直持续到现在,并形成了开放获取领域的独有理论――开放获取引文优势(Open Access Citation Advantage,OACA)。OACA理论主要由四部分组成:第一是曝光优势,越容易被读者发现阅读的文章,越容易被引用;第二是发布优势,发布范围越大的文章,越容易被引用;第三是选择优势,作者更愿意选择自己优质的文章进行开放获取模式发布,越容易被引用;第四是质量优势,质量越好的文章越容易在开放环境中脱颖而出,越容易被引用[17]。OACA理论的出现意味着学术论文在开放获取的模式下,其学术影响力和社会影响力都会显著增加。对此理论,大型出版集团也都纷纷表态,如Elsevier集团声称开放获取能让作者的论文被更多读者看到,引文量也会显著提升[18];Springer集团同样指出OA出版能给作者带来真正的益处,如提高引用量、下载量,提升整体影响力等,他们将持续推动开放获取的发展[19]。

上述已有研究显示,针对学术期刊在模式转换后的学术影响力和社会影响力的研究在近两年已经成为研究热点。但是以翻转期刊作为研究主体的成果目前主要集中在由订阅付费模式向开放获取模式的转换,即OA Flipping,如Shin发现将老牌期刊转为OA期刊比推出全新的OA期刊更具吸引力,这些老牌期刊在经过翻转后发表的文章数量与影响因子均有所增加[20];Momeni等发现期刊在完成开放获取后,标准化影响因子和平均相对引用均有所提高,为期刊发展带来了积极影响[21];Bautista-Puig等探索了期刊管理人员对翻转过程的具体看法与相关态度,指出尽管开放获取具备很多优势,但在资金需求与技术支持上仍存在较大问题[22]。而以反向翻转现象为研究主题,当前最受关注的是Matthias等的研究,他们于2019年开始收集从OA模式转换为订阅模式的期刊数据,并将这些反向翻转置于更大的学术出版背景中,促进大众对反向翻转的理解[6]。

根据OACA理论提供的逻辑,我们可以推断出期刊在经历反向翻转之后其学术影响力将发生的变化。文章以OA模式发表需要支付处理费,非OA论文则不需要,因此,期刊在反向翻转之后,稿源的质量可能发生结构性变化;另外,期刊在反向翻转后新发表的论文与类型、水平等相近的OA期刊所载论文相比,会不可避免地损失可见度,被引用的机会会减少。基于此,本研究提出如下研究假设:

反向翻转后,学术期刊上论文的学术影响力会显著降低。

3 研究设计

3.1 数据来源

本研究的样本来自于2019年Matthias团队在开放数据平台Zenodo上公开发布的反向翻转期刊名单[23]。该团队从Ulrich's web: Global Serials Directory、Directory of Open Access Journals(DOAJ)、 Open Access Directory(OAD)等多个数据库收集了在2005—2020年期间从开放获取模式转变为付费订阅模式(即发生了反向翻转)的期刊。该名单共包含152本期刊,其中有108本被Web of Science 收录。本研究于2021年3月至6月,从Web of Science 平台上收集了这108本期刊所发表文章的题录数据(包括逐年被引数据)作为本研究的数据集。

3.2 研究方法

本研究以论文为分析单元,考察反向翻转期刊上的研究型论文(即Web of Science数据库中的“Article”类文章)在期刊翻转前后被引量的整体性变化。分析发现,在Matthias团队列出的108本期刊中,并没有任何一本期刊进行了“完美”的反向翻转,即在翻转前后所发表的OA文章占当年总文章比例分别为100%和0。也就是说,在反向翻转后,这些期刊仍然接受作者以OA的模式发表论文。因此,为了观察反向翻转对于期刊学术影响力的影响,本研究在这一期刊集合中筛选出在翻转之后OA文章占比发生了急剧下降的期刊。急剧的下降意味着OA文章占比降低并不是在正常状态下的自发波动,而必然是期刊发布通告或采取其他措施进行干预的结果,也意味着期刊在事实上将会承受论文主体由开放获取转变回订阅所引起的后果。

经过对大量OA和非OA期刊的OA文章占比波动情况考察,本研究最终确定将OA文章占比从翻转前一年的80%或以上降低至翻转当年的20%及以下的期刊作为后续分析的样本。经过筛选,在108本期刊中只有12本期刊满足了这一相对苛刻的条件,这12本期刊就构成了本研究所要考察的实验组。这些期刊的名称和反向翻转年份如表1所示。

由于本研究所要考察的是期刊被引量的变化,我们希望尽可能地消除期刊反向翻转这一事件相对于期刊被引量的内生性,一个较为便捷和直观的方法是挑选在翻转前被引量相近的期刊作为控制组。因此,我们为每一本实验组期刊选择了属于同一个Web of Science学科分类并且影响因子相近的四本期刊(2本高于实验组期刊,2本低于实验组期刊,并且排名连续相邻)作为控制组以进行对照。最终本研究的数据集包括18,615篇论文。

表1 反向翻转期刊列表及翻转年份Table 1 List of Reverse Flipping Journals with Flipping Years

检验匹配效果的方法之一是考察两组期刊在反向翻转时间点之前一个时间段内被引量的变化趋势。若在这一时间段内两组期刊的被引量变化存在“平行趋势”,则可认为在我们的样本中,反向翻转相对于期刊被引量具有外生性,即期刊并非受到被引量异常变化的影响而选择反向翻转。在这一前提下,我们考察反向翻转对于期刊被引量的影响是有意义的。本研究设计模型(1)来检验两组期刊的被引量在反向翻转前第五年至翻转前一年这一时间段内的平行趋势:

Yjt=β0+β1×Yeart+β2×flipj+β3×flipj×Yeart+εjt(1)

其中,Yjt指期刊j在年份t发表的论文的平均被引次数;Yeart指年份t,在实际操作中包含五个0-1变量,分别对应期刊翻转前第五年至翻转前一年,为了分别考察每一年的情况,我们在每次进行模型估计时仅加入其中一个表示年份的变量;flipj是0-1变量,如果该期刊j属于实验组则取1,否则取0。我们考察其中交互项的系数β3,若该系数在翻转前五年内的每一年均没有统计学意义上的显著性,则可认为两组期刊的被引量在翻转前至少五年具有较好的平行趋势。

进一步地,由于下文的分析将以论文为分析单元,本研究也进行了论文层面的平行趋势检验,使用的模型(2)如下:

ln(Yijt+1)=β0+β1×Yeart+β2×flipj+β3×flipj×Yeart+εijt(2)

其中,Yijt指代期刊j上的论文i的被引次数,其发表的年份被记为t,其他变量含义均与模型(1)中的变量对应。类似地,我们考察其中交互项的系数β3以确定两组期刊上的论文被引量在翻转前五年是否具有较好的平行趋势。

在验证两组期刊在被引方面具有较好的平行趋势之后,本研究以对数处理之后的论文逐年被引量为因变量,建立双重差分模型来考察反向翻转对于论文学术影响力的影响。模型(3)如下:

ln(Yijt+1)=β0+β1×flipj×Tt+γj+ηt+β2Xijt+εijt(3)

在上述表达式中,Yijt指代期刊j上的论文i的被引次数,其发表的年份被记为t;flipj是0-1变量,如果这篇论文所在期刊j属于实验组则取1,否则取0;Tt是0-1变量,如果这篇论文的发表时间t在对应实验组期刊翻转时间点之后则取1,否则取0;γj指代期刊固定效应;ηt指代时间固定效应;Xij指代与论文特征有关的一系列其他控制变量,在本研究中包括作者数量、是否国际合作、参考文献数量、标题长度和摘要长度,如表2所示。

表2 控制变量说明Table 2 Illustration of Control Variables

尽管本研究已经限定了实验组期刊在翻转前后年份OA文章占比的范围,但每本实验组期刊的这一数值仍有较小的差异。因此,本研究进一步地以两种方式测度了实验组期刊翻转的“彻底程度”,即因果推断方法中常见的“处理强度”。第一种测度方法直接以期刊在翻转前一年的OA文章占比为处理强度;第二种测度方法以期刊在翻转前后的OA文章占比下降量为处理强度。本研究以处理强度替换了实验组期刊flip变量的取值(原取值均为1),并且重新估计了回归模型,比较几种处理方法得到结果的差异,以检验结论的稳健性。

4 研究结果

4.1 样本描述

表3展示了本研究所使用到的18,615篇文献在不同窗口长度时引文量的描述性统计结果。由于论文发表于多个年份,部分论文截止数据收集时仍未有足够长的时间窗口用来计算多年被引。本研究所使用的逐年被引量为截至当年末的累计被引量。

表4和表5展示了对两组期刊被引量平行趋势的检验结果。我们使用五个指标来衡量期刊在某个年份所发表的论文的被引量,即当年被引(论文发表当年的平均被引量)至五年被引(论文发表五年内的平均被引量)。表4与表5中每一列展示其中一个指标在期刊翻转前第五年至翻转前一年期间每一年的组间差异。期刊层面的比较结果显示,两组期刊的被引量在这五年内的每一年均不存在显著差异(p>0.05),用每个指标来衡量期刊的被引量均能得到这一结论。论文层面的比较结果显示,在翻转前第三年至翻转前一年期间,尽管部分回归系数有显著性,但从系数的正负性来看,反向翻转期刊相比控制组期刊并不存在被引量劣势;在翻转前第五年和第四年,部分回归系数有显著性,但整体来看并不稳健且不一致,无法认为两组期刊中的某一组具有被引量优势。这说明在匹配之后,反向翻转这一事件相对于期刊被引量的内生性问题得到了较好的排除。在后续的分析中,如果我们发现实验组期刊的被引量相对于控制组期刊以及相对于翻转前的自身出现了显著且稳健的变化,这一差异就可以被认为是由反向翻转这一外生冲击导致的。

表3 样本描述性统计Table3 Descriptive Statistics of the Sample

表4 期刊层面被引量平行趋势检验Table4 Check of Parallelism of Citations at Journal Level

表5 论文层面被引量平行趋势检验Table5 Check of Parallelism of Citations at Article Level

4.2 模型估计结果

表6展示了反向翻转对累计的逐年被引量的影响,也即双重差分模型的估计结果。根据模型定义,flip与T两个变量的交互项的系数,即flip×T变量的系数代表的就是反向翻转对于论文被引量的影响。可以发现,这一系数在因变量为当年至五年被引的情况下均显著。对于当年被引来说,反向翻转使得文章的被引量下降了约5%[exp(-0.0525)=0.9489],这一下降幅度对于单篇论文来说影响较小,但对于期刊整体来说影响相对可观。此外,通过对比当年至五年被引对应的系数大小,可以发现反向翻转的影响呈现单调的逐年递减趋势,这说明这一影响随着时间的推移会逐渐减弱。对于五年被引来说,反向翻转使其降低的幅度仅为1%[exp(-0.0140)=0.9861],几乎可忽略不计。

表6 反向翻转对逐年被引量(累计)的影响Table6 Influence of Reverse Flip on Accumulative Citation Counts

表7 反向翻转对逐年被引量(累计)的影响(考虑第一种处理强度)Table 7 Influence of Reverse Flip on Accumulative Citation Counts(Considering Treatment Intensity Type I)

表8 反向翻转对逐年被引量(累计)的影响(考虑第二种处理强度)Table 8 Influence of Reverse Flip on Accumulative Citation Counts(Considering Treatment Intensity Type II)

表9 反向翻转对当年被引量的影响Table 9 Influence of Reverse Flip on Citation Counts in the Year of Publication

在原模型的基础上,本研究分别使用上文中提到的第一种和第二种处理强度测度结果来替换flip变量的取值,并且估计了相同的回归模型。表7和表8分别展示了两次回归的结果。可以看出,在考虑处理强度之后,回归估计出的反向翻转效应大小有了整体上的小幅度提升,这更印证了上文的发现,说明本研究的发现较为稳健。

表9展示了当因变量为当年被引时,控制变量对于因变量的影响以及对于反向翻转效应的影响效果。可以发现,在增加控制变量之后,反向翻转的效应变化不大,说明本研究的发现具有较好的稳健性。在5个控制变量中,是否国际合作、参考文献数量及文章摘要长度对因变量及反向翻转效应存在较为明显的影响;作者数量、标题长度的影响相对不明显。

5 讨论与结论

5.1 本研究的理论贡献与不足

在OACA这个成熟的理论框架下,本研究的贡献包括两个方面:(1)发现了非开放获取与引文劣势之间的因果关系,即未开放获得的论文具有引文上的劣势,是对OACA理论的补充;(2)“非开放获取的引文劣势”的效应会随着时间推移逐渐减弱,即在反向翻转期刊上发表论文,其当年的被引量下降趋势最明显,随着时间推移逐渐减弱。“非开放获取的引文劣势”的效应随时间减弱的现象进一步说明:反向翻转后,期刊上论文短期内的被引次数降低只是反向翻转的瞬时效应,长期来看,论文的被引次数仍然取决于论文质量等因素。同时,这一现象也提醒我们:开放获取的引文优势可能只是短期的,而非长期的。

对于出版商来说,必须要立足于自身发展的实际情况,确定未来的发展目标,因时、因地制宜,才能在激烈的市场竞争中占有一席之地。如大型出版集团,在经济基础良好,读者众多的背景下,应该大力推动开放获取运动;而小型出版集团或者冷门学科期刊出版商,如果考虑较为保守的发展路径,付费订阅模式仍然是一个不可避免的选择。对于作者来说,同样需要根据自身所处的发展阶段,在扩大作品影响力和合理使用科研经费之间进行抉择。

反向翻转并不是随机发生的现象,所以从因果推断方法对样本需求的随机性来说,本研究的样本并不能充分满足要求。例如,有些期刊是因为自身运营能力和市场倒逼才选择反向翻转,那么如果反向翻转后期刊的影响因子降低了,真正导致影响因子降低的原因可能是这些期刊的运营问题导致学术界的认同度降低。值得注意的是,这种情形并不能影响本研究结果的整体情况,因为本研究发现反向翻转期刊有能力较快地消除负面影响。

5.2 翻转与反向翻转的动机

在过去的二十年中,学术出版经历了较大的变化。以Elsevier、Springer Nature等为代表的大型学术出版集团通过合并和收购单个期刊以及体量较小的出版商完成对学术出版市场的垄断,同时由于纸张原材料价格的上涨,环保要求的提高以及通货膨胀等多种因素共同作用,学术期刊的订阅费用也因此开始上涨。这使得大量高校、科研院所等学术共同体发布声明或开始以实际行动(例如取消订阅某出版集团的学术期刊)来抵制出版集团对学术出版行业的控制,也促使OA运动开始在世界各地加速推进。在这一背景下,部分期刊开始“翻转”,即从传统订阅期刊翻转为OA期刊或混合OA期刊(Hybrid OA journal);很多新创办的期刊也直接选择了OA出版模式。

对于学术期刊而言,出版模式翻转的最大收益是开放获取带来的引文优势。Bautista-Puig等人基于DOAJ和OAD两个数据集中的翻转期刊证实了这一观点[16]。另外,翻转之后,尚没有证据表明学术期刊是否存在发文优势,即发文量显著增加;同时,由于作者需要承担文章处理费,期刊将损失部分未受资助的优秀稿件。因此,作者来源会受文章处理费的影响而发生结构性的变化,即资助OA发表的国家或地区的稿件更多,而不资助OA发表或资助受限的国家或地区的稿件更少。

Matthias等认为,反向翻转的决定可能与期刊运营的可持续性有关[6]。尽管从OA模式反向翻转为订阅期刊意味着免费获取结束了,论文的可见度降低了,但这种变化可能会带来其他好处,例如,降低运营期刊的成本,或者通过与知名出版社合作来提升期刊的声望。付费订阅模式使得作者不需要面临高昂的文章处理费,降低了投稿门槛。未受到OA发表资助以及经费受限的研究者将更加倾向于向此类期刊投稿。因此,选择订阅付费模式同样可能会使作者来源发生结构性的变化,使期刊损失一部分更在意研究成果的传播范围、或者支持开放科学的作者的稿件。

本研究所关注的12本反向翻转期刊在学术影响力、出版机构、创刊模式等外部特征上并不存在明显的共性。因此可以推断,不同水平、类型的期刊都可能在面对是否选择OA出版模式这一问题时承受一定压力。对于创刊不久、影响力不足的新生期刊以及存在已久但影响力较低的期刊而言,OA模式下的文章处理费用使得他们不可避免地损失了一部分原本较为重要的作者群体。由于自身影响力不足,它们在吸引受到充足资助并且能产出较高水平成果的作者时存在一定困难,因此很可能面临缺少优质稿件的危机。这促使它们反向翻转,回到原来的付费订阅模式。对于影响力较大的期刊而言,为了保证内容的质量、维持期刊声誉,它们每年所发表的文章数量通常较少。以期刊Annals of Mathematics为例,其在反向翻转前一年仅发表了46篇学术论文,而增加发文量以获得更多收入大概率将加大质量控制的难度。因此,影响力较高、声誉较好的期刊在OA出版模式下也可能面临困境。

6 结论

本研究基于已有的OACA理论,提出了“反向翻转后,学术期刊上论文的影响力会显著降低”的研究假设,并且收集了出现过反向翻转的12本样本学术期刊中的18,615篇文献,利用因果推断中的匹配与双重差分模型,最终证明研究假设成立,即非开放获取的论文存在引文劣势。另外,本研究进一步发现:反向翻转之后发表的论文当年的被引量下降趋势最明显,下降的幅度随着时间推移逐渐减小。这意味着非开放获取的引文劣势效应随着时间推移逐渐减弱。

作者贡献说明

明蔚:提出整体研究思路与框架, 数据收集、清洗与分析,论文起草及修改;

刘凯恒:论文起草及修改;

赵镇岳:数据收集、清洗分析,论文起草、修改及最终版本确定。

支撑数据

支撑数据由作者自存储,E-mail:njujack@163.com。

1.明蔚,赵镇岳.Reverse Flipping Journals List.xlsx.期刊样本名单.

2.赵镇岳.Results.txt.分析结果.

猜你喜欢

影响力学术期刊学术
学术期刊引证指标
学术期刊引证指标
如何理解“Curator”:一个由翻译引发的学术思考
对学术造假重拳出击
天才影响力
河海大学学术期刊创办百年
黄艳:最深远的影响力
3.15消协三十年十大影响力事件
传媒不可估量的影响力
学术