Nature系列期刊在中国农业科学院科研中的利用效益分析
2019-09-18卢垚马鑫王鸑飞颜蕴郭洋董越
卢垚 马鑫 王鸑飞 颜蕴 郭洋 董越
(1.中国农业科学院农业信息研究所,北京 100081;2.上海施普林格信息咨询服务有限公司北京分公司,北京 100080)
Nature系列期刊涵盖科学、技术和医学领域的最前沿研究,为各个领域的科研工作者提供高影响力的研究成果。中国农业科学院(以下简称“农科院”)从2005年开始进行电子文献资源建设,2006年开始订阅Nature及其系列刊物,随后十年内订阅的期刊种数一直维持在10种上下,2016年之后大幅增加新刊,订阅的Nature期刊数量达到20种,2018年再新增2种,截至2019年7月共订阅22种Nature期刊,包括研究型期刊17种、综述型期刊5种(见图1)。一方面,随着Nature期刊的不断发展,Nature系列新增期刊越来越多,其系列期刊涉猎各学科前沿热点领域、新兴领域和交叉领域;另一方面,Nature期刊采用每种期刊单本定价的订购方式并且单本价格高昂,因此无论是以新增还是续订为目的,研究建立科学的循证分析方法,对订阅Nature期刊的利用情况、使用成本及其在科研产出中的效益进行评估都具有十分的必要性。
图书馆数字资源的评估借鉴图书馆价值评估,目前常用的方法大多数建立在成本效益分析(Cost Benefit Analysis)的基础上,结果以投资回报率(Return on Investment,ROI)的形式予以表示[1-3]。但“收益”往往难以衡量,目前收益评估的方法主要是条件价值评估法(Contingent Valuation Method)、消费者剩余法(Consumer Surplus Method)和时间成本法[4-7]。国内外学者利用这些方法建立了一系列评估模型[8-12],但指标难以量化,一般需要通过调查问卷等形式来收集数据。本文利用期刊使用统计数据和用户引文数据,进行循证分析,借助引文分析、相关分析、回归分析和复相关系数赋权法等,证明Nature期刊的使用、引用等文献利用行为与科技论文发表、项目申请等科研活动具有关联性;并通过使用成本、产出论文质量、转化率、相对投资回报率ROI等一系列指标,实现资源利用效益的比较和评估。
1 数据来源与分析方法
图书馆数字资源的效益评估,除考虑资源成本之外,核心就是如何量化其“收益”。Nature期刊作为电子文献资源能够带来的“收益”,主要体现为其在用户科研活动中产生的利用价值,既反映在用户对科技文献资源的下载阅读、引用等利用行为中,也反映在与文献利用相关的科技产出中。其中论文发表是最主要的产出形式,是文献利用带来的直接“收益”。因此本文通过收集农科院用户利用Nature期刊的相关全文下载、引用、论文发表三个环节的客观数据来综合评估资源利用效益。其中,农科院2016—2018年Nature期刊的全文下载数据来自数据库Journal Report1使用统计报告;相关论文发表数据,即引用Nature期刊文献产生的发文(下称“施引文献”),采集自Scopus数据库,采集发文时间区间为2016—2018年;引用数据,即用户发表论文时引自Nature期刊的参考文献(下称“引文”),来自上述论文发表数据中的参考文献;此外,2017年自然科学基金项目申请和获批数量采集自国家自然科学基金委官方网站。
本文利用引文分析法对农科院用户利用Nature期刊的相关引文和发表的施引文献进行分析,并结合使用统计数据,利用相关分析和回归分析的方法,揭示Nature期刊的使用、引用等文献利用行为与科技论文发表、项目申请等科研活动相互间的关联;通过对使用成本、施引文献质量、转化率等各类指标的分析,比较用户对不同Nature期刊的利用特征和规律;利用复相关系数赋权法综合全文下载量、引文量、发文量、发文质量4个变量计算资源利用收益,与使用成本相比后经归一化,得到相对投资回报率ROI,来比较各Nature期刊的利用效益。
图1 农科院Nature期刊订阅数量变化(2006—2019年)
2 分析结果
2.1 Nature期刊使用、引用、发文相关分析
对2016—2018年农科院订阅的22本Nature期刊的全文下载量、引用上述期刊的引文数量,以及对应的引用Nature期刊的发文数量的相关分析结果表明(见表1),三者具有很高的相关性。选取发文量作为因变量,由于全文下载量和引文量之间存在相关关系,所以仅选择全文下载量作为自变量,做一元回归分析,得到置信度高于99.99%的回归模型方程如公式(1)。
可以看出全文下载量与发文量之间呈线性正相关关系,这22本期刊每一种的全文下载量越多,利用该刊产生的发文数量就越多,说明这些期刊文章的阅读和利用对相关科研论文的产出有正面的促进作用。
表1 Nature期刊使用、引用与发文相关分析(2016—2018年)
2.2 Nature期刊使用与自然科学基金申请相关分析
对2017年农科院各直属研究所Nature期刊全文下载量与各所2018年(申请截止时间为2018年3月)自然科学基金申请项目数量(包括面上项目和青年基金项目)和获批项目数量的相关分析结果表明(见表2),全文下载量与各所申请项目数量的相关系数为0.74,与获批项目数量的相关系数为0.73,说明各所对Nature期刊文献的利用,与其自然科学基金项目的申请和获批项目数量有一定的相关性,能够一定程度上支撑科研项目。
2.3 2016—2018年单篇下载成本分析
单篇下载成本(Cost Per Download,CPD),指该刊当年订阅价格与用户全年对其全文下载数量的比值,22本Nature期刊的CPd分析结果(见表3)表明,除去2018年新增的Nature Ecology&Evolution和Nature Sustainability,其余期刊单篇下载成本在10元以下的有11种,10~20元的5种,余下的Nature Chemical Biology、Nature Reviews Drug Discovery、Nature Geoscience、Nature Materials单篇下载成本较高,尤其是NatureMaterials这3年单篇下载成本平均为133.43元。
就成本变化趋势而言,除去2018年新增的两本刊,这3年间Nature等9种期刊由于利用状况良好发展、全文下载量持续增加,其单篇下载成本下降。11种期刊单篇下载成本上升,其中Nature Reviews Genetics等3种期刊全文下载量增加,是由于期刊价格涨幅造成成本上升;Nature Biotechnology等8种期刊的单篇下载成本上升则是由全文下载量减少和价格上涨两方面原因造成的。随后我们分析了这8种期刊的载文数量是否稳定,载文量明显下降的有3种,2018年Nature Structural&Molecular Biology的载文量相对于2016年减少9%,而其全文下载量减少21%;Nature ReviewsDrug discovery2018年载文量相对于2016年减少23%,而全文下载量减少38%;Nature Materials2018年载文量相对于2016年减少9%,而全文下载量减少55%,所以下载量的减少并不完全是因为期刊载文量减少造成的。
表2 农科院各分所Nature期刊使用与自然科学基金申请获批情况(2017—2018年)
表3 农科院订阅Nature期刊单篇下载成本(2016—2018年)
2.4 2016—2018年引用分析
22种Nature期刊的引用分析结果(见表4)表明,除去不涉及引用的3种期刊Nature Microbiology、Nature Ecology & Evolution和Nature Sustainability,余下的期刊中Nature Reviews Genetics、Nature Cell Biology的引用量略有波动,其余17种期刊的引文量都是呈现上涨趋势,尤其是Nature Plants、Nature Climate Change、Nature Geoscience、Nature Reviews Microbiology这4种刊的引用量上涨显著,其中2016年新增的Nature Plants引文量在3年内增长715.38%。
如果按照CPD的思路来测算各刊的引用成本(Cost Per Citation,CPC),即某一时间窗口内期刊订阅价格与用户引用该刊文献次数的比值,测算出22种Nature期刊中CPC较低的期刊是Nature、Nature Genetics和Nature Biotechnology,单篇引用成本不超过40元。
表4 农科院订阅Nature期刊引用情况(2016—2018年)
2.5 2016—2018年引用Nature期刊文献发文分析
对引用22种Nature期刊文章的农科院发文进行分析(见表5),结果表明,除去不涉及农科院施引文献的3种期刊Nature Microbiology、Nature Ecology & Evolution和Nature Sustainability之外,Nature Cell Biology过去3年的农科院施引文献量略有波动,引用其余18种期刊的相应发文量都有所增加,尤其是引用Nature Plants、NatureClimate Change、Nature Reviews Microbiology、NatureGeoscience这4种刊的发文量上涨迅速,参考Nature Plants上载文的农科院发文在3年增加609.09%。
同理,若按照CPD的思路来测算各刊的单篇发表成本(Cost Per Publication,CPP),不考虑引用这些期刊所发表的文章质量仅考虑数量的情况下,计算某一时间窗口内期刊订阅价格与用户引用该刊文献发表文章数量的比值,测算出22种Nature期刊中CPP较低的期刊是Nature、Nature Genetics和Nature Biotechnology,分别为53.99元、56.39元和62.84元。
表5 农科院引用Nature期刊的发文情况(2016—2018年)
2.6 2016—2018年引用Nature期刊文献发文质量分析
利用引文影响力指标对2016—2018年农科院引用Nature期刊文献的发文的质量进行分析,从表6可以看出除去3种刊(2018年新增的2种,2016年新增的1种但无引用发文),引用Nature Biotechnology等10种期刊文献的发文,超过80%发表于Q1区期刊,引用Nature等8种期刊文献的发文,发表在Q1区期刊上的占70%~80%,只有引用Nature Materials的发文的Q1文章占比略低于70%,但仍高于2016—2018年农科院全部发文的Q1文章占比(62.7%)。就篇均被引频次而言,引用各系列Nature期刊的发文的表现均高于2016—2018年农科院全部发文的篇均被引次数4.4次,尤其是Nature Geoscience和Nature Climate Change表现突出。而考虑到施引文献分属不同学科造成的引文影响力的偏差,进一步采用学科规范化的引文影响力(Field Weighted Citation Impact,FWCI)来比较各刊相应施引文献的发文质量,结果表明:只有引用医学领域期刊Nature Medicine和Nature Immunology的发文的FWCI值低于农科院2016—2018年发文平均值1.06,其余期刊的施引文献都有较强的影响力,特别是引用Nature Geoscience、Nature Plants和Nature Climate Change的发文表现优异。总体而言,虽然引用的不同期刊的发文表现有所差异,但大部分期刊的施引文献各项指标都高于农科院发文平均水平,表现出较强的引文影响力。此外,也对Nature期刊的影响因子、期刊的使用成本CPD、CPC、CPP值和表6中引文影响力指标进行了相关分析,在期刊水平、使用成本和产出论文质量各项指标间并未发现有显著相关。
2.7 2016—2018年Nature期刊利用效益比较
从2.1的分析结果可知,全文下载量和引文量、发文量呈一元回归线性正相关,因此从Nature期刊的引用率和发文影响转化率的角度来比较各期刊的利用效益。引用率,即引文量与全文下载量的比值,反映在期刊的全文下载量中,有多大比例的下载行为能够转化为引用;同理,发文影响转化率,即发文量与全文下载量的比值,同时引入FWcI值来反映有多大比例的全文下载行为能够转化为论文产出并造成一定的引文影响力。结果可以看出(见表7),引用率较高的期刊有Nature Geoscience、Nature Materials和Nature Methods,发文影响转化率较高的期刊有Nature Geoscience、Nature Methods和Nature Protocols。
但利用引用率和发文影响转化率来比较期刊利用效益,直接受全文下载量多少的影响,全文下载量少的期刊,容易有较高的转化率,因此这两项指标参考作用有限。为了综合比较农科院订阅的Nature期刊的利用效益,用全文下载量、相关期刊引文量、对应的发文量以及发表论文的引文影响力FWcI作为4个变量来衡量Nature期刊利用的“收益”,再除以使用成本,得到投资回报率ROI,如公式(2)所示。
其中a、b、c分别代表各指标的权重,由复相关系数赋权法计算而得。将全文下载量、引文量、发文量作为3个变量进行复相关分析,依据指标的独立性确定其权重,指标与其他两项指标的复相关系数越大、共线性越强、重复信息越多,越容易由其他两个指标的线性组合表示,该指标的权重就应当越小,反之亦然。因此本文取指标各自与其他两个指标的复相关系数的绝对值的倒数作为权重。
但这样计算的收益并未和成本一样量化到金额,而是各期刊间用于比较的归一化值,所以称之为相对ROI。计算2016—2018年农科院Nature期刊使用收益和成本的比值并进行归一处理,得到相对ROI以比较Nature期刊的使用效益(见表7)。结果表明,在农科院订阅的19本Nature期刊中(除去2018年新增的2种,2016年新增的1种但无引用),使用效益最好的是Nature Genetics,其次是Nature、Nature Biotechnology、Nature Plants。
表7 农科院Nature期刊利用效益比较(2016—2018年)
3 讨论
学术期刊的文献资源建设及其利用与科研活动有着密切的联系,尤其是Nature期刊这类高质量、高影响力的学术资源。本文证明农科院Nature期刊资源建设及相关利用与用户科技论文发表、项目申请等科研活动的具有相关性。通过分析期刊的使用成本对农科院订阅Nature系列期刊的建设策略提出建议,针对利用状况发展良好的期刊,采取稳定建设的建议;对利用成本较高的期刊,需进一步培育用户的利用需求,密切监控其利用情况;对下载量下滑、成本持续上升的期刊,则需要进一步深入分析用户对其利用规律、挖掘潜利用的“收益”,再考虑使用成本计算投资回报率ROI,是各期刊间用于比较的归一化值。这种方法虽不能将具体收益量化到金额,计算出绝对投资回报率,但其完全依靠使用统计数据和引文相关数据,数据来源客观,能够有效地对不同资源的利用效益进行简单对比和评估,是对循证分析方法和成本效益分析方法的创新结合,能够对资源建设工作起到参考和指导作用。