bioRxiv自存档的期刊论文多维度影响力优势实证研究
2022-09-24刘春丽盛南洪
刘春丽 盛南洪
(1.中国医科大学图书馆,沈阳,110122; 2.中国医科大学健康管理学院,沈阳,110122)
1 引言
科学论文经常需要耗费数月,甚至数年时间,经过严格的同行评议和编辑,才能最终在学术期刊上发表,进而得以在学术共同体内传播。预印本服务器是作者先于同行评审之前,将研究结果以预印本论文的形式通过相应服务器发布的学术交流媒介。近年来,生命科学领域推出了bioRxiv、medRxiv、ChemRxiv等多个预印本服务器,吸引了该领域内科学家对预印本论文的大量使用。
2020年新冠疫情爆发后,COVID-19预印本论文的激增,引发了全球关于预印本对信息传播的影响[1]、控制预印本论文质量[2]、提高预印本论文发布标准[3-5]的争论与反思。在疫情刚刚爆发不久的2019年年末至2021年年初,科研人员、临床专家及政策制定者亟需COVID-19的最新研究成果和病例报道,虽然生物医学领域的几大顶刊如《Lancet》《New England Journal of Medicine》等[6]为COVID-19研究加快审稿速度和出版周期,但仍然无法满足学者们大量、迫切的学术交流需求,预印本服务器成为早期研究者发布科研论文草稿的首选。虽然批评人士批评预印本论文缺乏严格同行评议,但毫无疑问,预印本论文加速了科技传播与交流,在学术交流系统中与传统期刊论文互为补充,扮演了重要角色[7-8]。
目前,大多数基础科学期刊,包括《Science》杂志[9]表示,他们接收预印本论文,甚至许多期刊直接通过bioRxiv界面接受投稿。期刊《Lancet》也认为,预印本平台的使用不会影响之后在同行评议期刊上的发表。《Lancet》杂志推出了自己的预印本专区[10],可以有更多机会听取其他学者意见,不断完善稿件;有的开放存取期刊直接让作者在预印本平台提交论文,再根据arXiv编号获取论文进行同行评审,即先公开、再评议;也有期刊允许作者将论文提交到预印本数据库,编辑部根据社区评议结果决定是否采用[11-13]。那么,论文在期刊上正式发表前作者将其于预印本平台提前公开分享,是否对论文今后学术影响力或社会影响力有一定促进作用值得探讨。
2 研究现状
2.1 预印本存档的期刊论文被引优势研究
在预印本上提交或分享论文是否会带来更高或更广的影响力,国内外已有学者效仿“开放获取引用优势”进行了“预印本引文优势”和“预印本社会关注度优势”的探索性研究。
早期大部分研究集中在以arXiv预印本为样本,主要研究预印本论文的引文优势及影响因素。如有实证研究发现,arXiv预印本论文相比同期刊的非预印本论文获得了更多引文[14-19]。导致预印本论文引文优势的影响因素[14,20]主要包括预印本因为有更广的可获得性,增加了读者人数,进而引发“开放存取效应”;由于论文可以被早期获得而累积了更多引文,即“早期访问效应”;作者偏好将高质量论文存储到预印本数据库中,即“自我选择效应”。
Moed[15]分析1992—2005年期间24种凝聚态物理领域的arXiv预印本论文发现,arXiv预印本论文相对于同期刊发表的非预印本论文具有引文优势,但在控制早期浏览效应和杰出作者导致的质量偏倚效应下,可消除大部分的引文优势。但也有研究跟踪arXiv论文引文率的纵向改变发现,当论文出版五年后,早期获取效应较少能支持引文优势[16,21]。有作者认为引文优势源自质量效应,由用户自我选择他们的高质量论文存储到预印本数据库,进而驱动的质量偏倚[14,20],或者高质量论文更可能被选择可获取、进一步促进被引用[22]。
2.2 预印本存档的期刊论文社会关注度优势研究
近两年来有学者开始尝试基于bioRxiv预印本为样本的研究,除引文优势外,也证实存在Altmetrics社会关注度优势。如Serghiou等[23]抽取bioRxiv中2013—2017年的30%的预印本论文作为样本(776篇),选同一时期出版的同一本期刊的最多5篇非预印本论文作为配对样本(3647篇),采用Friedman检验发现,预印本论文的Crossref引文及Altmetrics分数均显著高于非预印本论文。Fraser等[24]对2013—2017年出版的7087篇bioRxiv预印本论文,选取同一种期刊,在同时期出版的7087篇非预印本论文作为对照组(实验组和对照组均满足文献类型是article或review,参考文献数大于0),负二项回归分析表明,在控制影响因子、开放存取类型、作者数、文献类型(是否是综述)因素情况下,预印本论文与非预印本论文相比有显著的Scopus引文优势和推文提及、博客提及、Mendeley保存优势。
2.3 关于论文临床影响力的研究
关于临床影响力的评价或预测,比较有代表性的是Grant等[25]考察出版物与临床实践指南的引文链接,并假设被临床实践指南引用的出版物对健康领域产生影响力。也有学者利用医学主题词来测量基础研究与应用研究之间的科学转化交互活动,进而反映基础研究的临床转化程度。如Weber[26]将PubMed论文投射到一个被称为“生物医学三角”的图上,将论文集从“动物”或“分子/细胞”类型向“人类”类型的移动定义为“临床转化(translation)”;Hutchins等[27]通过机器学习方法提取包含上述三类主题词及化学/药物、疾病和治疗/诊断方法的论文比率、论文每年被引率等多种指标,预测未来被临床试验或临床实践指南引用的概率,即临床转化潜力(Approximate Potential to Translate,APT)。由于APT指标开发时间较短,目前还较少被应用于生物医学论文临床影响力评价相关研究。相比较而言,Hutchins开发的APT指标无论在计算方法、效度及开放共享上都具有较强的先进性。
2.4 问题的提出
关于预印本影响力优势的定量测度,基本上围绕以被引次数为代表的学术影响力、以Altmetrics分数为代表的社会关注度两个维度。其中,研究预印本引文优势的稍多,而研究预印本社会关注度优势的较少。Serghiou等[23]和Fraser等[24]发表的有关bioRxiv存档的期刊论文影响力优势研究中分别使用了Friedman非参数检验和负二项回归方法。我们认为前人的研究还存在以下问题:
一是现有研究缺乏更多维度的预印本影响力优势检验。英国卓越研究框架[28-30](the Research Excellence Framework,REF)指出,科研评价不仅要考察以知识促进为主的科学影响力,也应评价科研产生的社会影响力,即科研对经济、社会、文化、公共政策或服务、健康、环境或生命质量的作用、改变或收益。而Altmetrics测量的更多是公众对学术研究的“讨论”或“关注”程度,并不是真正意义上的社会影响力[31-32]。对生物医学领域研究而言,除了建立学术知识基础外,是否在卫生健康领域产生收益,或者说是否将基础医学研究转化到临床应用则是科研成果对该领域产生社会影响力的重要评价内容。但到目前为止,国内外未见研究预印本论文临床转化潜力优势的文献报道。
二是生物科学不同子领域可能对预印本影响力优势检验存在影响,在以往研究中未被重视。是否不同子领域的预印本存档后发表的期刊论文影响力优势表现不同,或者不同子领域的预印本存档后发表的期刊论文影响力优势更侧重在某个影响力维度,都是值得研究的问题。
三是关于预印本论文影响力优势的检验方法多使用线性回归模型(一般线性模型或广义线性模型)[23-24],而论文被引次数,特别是社会关注度(Altmetric Attention Score,AAS)和临床转化潜力指标属于非正态分布,不适合做线性回归分析;更重要的是线性回归无法揭示预印本存档对被引次数、社会关注度的影响趋势的变化过程,但分位数回归则可以很好地解决这个问题。到目前为止,未见应用此方法研究预印本期刊论文影响力优势的中外文文献。
鉴于此,本文以bioRxiv预印本平台为例,选取神经科学、生物信息学、遗传学三个子领域,通过分位数回归方法验证bioRxiv预印本平台存档的期刊论文是否具有引文、社会关注度及临床转化潜力多维度影响力优势,为生物医学专家及学者积极选择预印本进行知识分享行为的潜在收益提供实证依据。
3 研究样本与研究方法
3.1 研究样本
bioRxiv是生命科学领域预印本的免费在线存档和发布服务平台,又细分为25个子类别,我们以生物信息学、神经科学和遗传学三个子学科领域为例进行实证研究,借鉴陈悦等[19]的样本选取方法,依据预印本论文量选取每个子学科领域五种期刊论文为实验组论文研究对象。
为了检验同一本期刊中,曾在bioRxiv自存档的期刊论文与未曾在bioRxiv自存档的期刊论文相比较是否有多维度影响力优势,我们借鉴了Serghiou等[23]的配对方法,为每篇bioRxiv自存档的期刊论文(实验组论文),选取同一期刊、发表日期或发表月份或发表卷、期相同的论文作对照(对照组论文)。相匹配的实验组和对照组论文的期刊分布情况见表1。
表1 三个子学科领域代表性期刊及实验组论文与对照组论文数(篇)
3.2 数据来源
利用bioRxiv提供的API(https://api.biorxiv.org/),获取三个子学科领域2014—2018年间已在期刊出版的预印本论文目录,根据“published_doi”字段,在WOS核心合集数据库中检索bioRxiv自存档的论文所发表期刊名称、出版时间(出版年、卷、期)、作者所属国家、隶属机构、论文被引次数等全记录信息。对照组论文按照同一种期刊、相同发表年、月的匹配方法在WOS核心合集数据库中获取数据。除在WOS核心合集中检索两组论文的被引次数外,在Altmetric.com平台获取AAS指标;在iCite平台获取临床转化潜力APT指标;用DOI来获取Altmetric指标信息,于是删掉了无DOI的论文;此外,仅保留实验组和对照组中文献类型是article或review的论文;通过参照预印本存档时间和论文发表时间,删除极少量的后印本论文。相关数据的检索日期为2021年4月15日。
3.3 控制变量
在回归分析中,实验组和对照组论文合为一个样本,通过对“bioRxiv”变量标注“是”与“否”来区分。参考相关文献[33-41],筛选了10个论文内、外部特征作为控制变量(如表2所示),检验在控制论文内、外部特征情况下,期刊论文曾在bioRxiv预印本平台存档是否对论文被引次数、社会关注度和临床转化潜力产生的影响。
表2 控制变量名称及数据来源
3.4 研究方法
首先,借鉴Moed[15]和Fraser等[24]的计算公式,分别计算在bioRxiv自存档的三个子领域期刊论文的引文优势、社会关注度优势及临床转化潜力优势。
其次,在控制论文内、外部特征等影响因素情况下,应用分位数回归方法验证bioRxiv预印本存档对论文多维度影响力的影响。传统的线性回归分析主要关注均值,但当样本数据中存在较多异常值,线性回归模型的估计值可能会存在较大偏差。由于本研究涉及的因变量均为非正态分布,用中位数描述更为合理。因此,本研究选择分位数回归来检验因变量在不同百分位数下受自变量的影响,可描述因变量的全局特征,通常不受离群点的影响,结果更为稳健。
4 研究结果
4.1 在bioRxiv自存档的期刊论文多维度影响力优势
4.1.1 引文优势
借鉴荷兰莱顿大学Moed[15]基于arXiv存档预印本的期刊论文篇均引文影响力计算引文优势的方法,引文优势(Citation Impact Differential,CID)的计算公式为:CID=100*(CPPb-CPPnb)/((CPPb+CPPnb)/2)。其中,CPPb代表bioRxiv自存档的期刊论文的篇均被引量,CPPnb代表非bioRxiv自存档的期刊论文的篇均被引量,其数值范围是-200(CPPb=0)到200(CPPnb=0)。如果CPPb和CPPnb的值都为0,则此时CID的值定义为0。计算结果见表3。
表3 三个子学科领域代表性期刊逐年引文优势分布
4.1.2 社会关注度优势
借鉴Fraser等[25]提出的预印本平台自存档的期刊论文的社会关注度优势计算方法,社会关注度优势(Altmetrics Impact Differential,AID)计算公式为:AID=100*(APPb-APPnb)/((APPb+APPnb)/2)。其中,APPb代表bioRxiv自存档的期刊论文的篇均AAS分数,APPnb代表非bioRxiv自存档的期刊论文的篇均AAS分数,AID数值范围是-200(APPb=0)到200(APPnb=0)。计算结果见表4。
表4 三个子学科领域代表性期刊逐年社会关注度优势分布
4.1.3 临床转化潜力优势
为了考察bioRxiv自存档的期刊论文临床转化潜力优势,本文提出论文临床转化潜力优势(APT Impact Differential,简称PID)的概念及计算公式:PID=100*(PPPb-PPPnb)/((PPPb+PPPnb)/2)。其中,PPPb代表bioRxiv自存档的期刊论文的篇均APT预测值,PPPnb代表非bioRxiv自存档的期刊论文的篇均APT预测值,PID数值范围是-200(PPPb=0)到200(PPPnb=0)。计算结果见表5。
表5 三个子学科领域代表性期刊逐年临床转化潜力优势分布
总体上,2014—2018年bioRxiv自存档的期刊论文引文优势、社会关注度优势及临床转化潜力优势计算结果见表6。
表6 2014—2018年bioRxiv自存档的期刊论文多维度影响力优势汇总
4.2 神经科学领域的论文多维度影响力优势检验
4.2.1 被引次数的分位数回归
表7列出了自变量在因变量被引次数各设定分位数(q=0.1、0.25、0.5、0.75、0.9)的影响参数估计值。结果表明,在控制10个论文内、外部特征情况下,期刊论文在bioRxiv平台存档对被引次数的各分位数是正向影响,且均有统计学意义(p<0.01)。但在不同的被引次数分位数下,期刊论文在bioRxiv平台存档对被引次数的影响程度不同。在被引次数较低水平(0.1分位数)时,bioRxiv存档的期刊论文被引次数是未存档的0.855倍;而在被引次数中等水平(0.5分位数)时,bioRxiv存档的期刊论文被引次数是未存档的3.101倍;到被引次数较高水平(0.9分位数)时,bioRxiv存档的期刊论文被引次数是未存档的9.169倍。总之,随着论文被引次数的增加,bioRxiv存档对被引次数的正向影响逐渐加大,当论文被引次数处于相对高水平时,bioRxiv存档对论文被引的影响是论文被引次数相对较低水平的影响参数的近8.1倍。
表7 被引次数的不同分位数参数估计——神经科学领域
4.2.2 社会关注度(AAS)的分位数回归
表8列出了自变量在因变量AAS各设定分位数(q=0.1、0.25、0.5、0.75、0.9)的影响参数估计值。结果表明,在控制10个论文内、外部特征情况下,期刊论文在bioRxiv平台存档对AAS的各分位数是正向影响,且均有统计学意义(p<0.01)。但在不同的AAS分位数下,期刊论文在bioRxiv平台存档对AAS的影响程度不同。在AAS较低水平(0.1分位数)时,bioRxiv存档的期刊论文AAS是未存档的1.250倍;而在AAS中等水平(0.5分位数)时,bioRxiv存档的期刊论文AAS是未存档的7.294倍;到AAS较高水平(0.9分位数)时,bioRxiv存档的期刊论文AAS是未存档的27.990倍。总之,随着论文AAS的增加,bioRxiv存档对AAS的正向影响逐渐加大,当论文AAS处于相对高水平时,bioRxiv存档对论文AAS的影响是论文AAS相对较低水平的影响参数的近22.4倍。
表8 社会关注度(AAS)的不同分位数参数估计——神经科学领域
4.2.3 临床转化潜力(APT)的分位数回归
表9列出了自变量在因变量APT各设定分位数(q=0.1、0.25、0.5、0.75、0.9)的影响参数估计值。结果表明,在控制10个论文内、外部特征情况下,期刊论文在bioRxiv平台存档对APT的0.1、0.25分位数是负向影响,而对APT的0.5、0.75和0.9分位数是正向影响,且均有统计学意义(p<0.01)。在APT较低水平(0.1分位数和0.25分位数)时,bioRxiv存档的期刊论文APT低于未存档的期刊论文,但影响系数非常小;而在APT中等水平(0.5分位数)时,bioRxiv存档的期刊论文APT是未存档的0.181倍;在APT中等水平(0.75分位数)时,bioRxiv存档的期刊论文APT是未存档的0.304倍;到APT较高水平(0.9分位数)时,bioRxiv存档的期刊论文APT是未存档的0.156倍。可见,只有当期刊论文APT水平处于接近中等水平时,bioRxiv存档正向影响APT,且影响参数随APT水平升高逐渐增加,到0.75分位数时影响参数最高(0.304),接下来,bioRxiv存档对APT的影响参数又逐渐下降。
表9 临床转化潜力(APT)的不同分位数参数估计——神经科学领域
4.3 生物信息学领域的论文多维度影响力优势检验
4.3.1 被引次数的分位数回归
表10列出了自变量在因变量被引次数各设定分位数(q=0.1、0.25、0.5、0.75、0.9)的影响参数估计值。结果表明,在控制10个论文内、外部特征情况下,期刊论文在bioRxiv平台存档对被引次数的0.5、0.75、0.9分位数是正向影响,且有统计学意义(p<0.01),但在0.1和0.25分位数的影响无统计学意义。在被引次数中等水平(0.5分位数)时,bioRxiv存档的期刊论文被引次数是未存档的2.411倍;在被引次数的0.75分位数时,bioRxiv存档的期刊论文被引次数是未存档的9.549倍;到被引次数较高水平(0.9分位数)时,bioRxiv存档的期刊论文被引次数是未存档的19.864倍。可见,从被引次数中等水平开始,随着论文被引次数的增加,bioRxiv存档对被引次数的正向影响逐渐增大。
表10 被引次数的不同分位数参数估计——生物信息学领域
4.3.2 社会关注度(AAS)的分位数回归
表11列出了自变量在因变量AAS各设定分位数(q=0.1、0.25、0.5、0.75、0.9)的影响参数估计值。结果表明,在控制10个论文内、外部特征情况下,期刊论文在bioRxiv平台存档对AAS的各分位数是正向影响,且均有统计学意义(p<0.01)。但在不同的AAS分位数下,期刊论文在bioRxiv平台存档对AAS的影响程度不同。在AAS较低水平(0.1分位数)时,bioRxiv存档的期刊论文AAS是未存档的0.750倍;而在AAS中等水平(0.5分位数)时,bioRxiv存档的期刊论文AAS是未存档的4.582倍;到AAS较高水平(0.9分位数)时,bioRxiv存档的期刊论文AAS是未存档的12.133倍。总之,随着论文AAS的增加,bioRxiv存档对AAS的正向影响逐渐加大,当论文AAS处于相对很高水平时,bioRxiv存档对论文AAS的影响是论文AAS相对较低水平的影响参数的近16.1倍。
表11 社会关注度(AAS)的不同分位数参数估计——生物信息学领域
4.3.3 临床转化潜力(APT)的分位数回归
表12列出了自变量在因变量APT各设定分位数(q=0.1、0.25、0.5、0.75、0.9)的影响参数估计值。结果表明,在控制10个论文内、外部特征情况下,期刊论文在bioRxiv平台存档对APT的各分位数均是正向影响,且均有统计学意义(p<0.01),但在0.1、0.25和0.5分位数的参数估计值非常小;在0.75分位数和0.9分位数时,bioRxiv存档的期刊论文APT分别是未存档的0.063倍和0.117倍。
表12 临床转化潜力(APT)的不同分位数参数估计——生物信息学领域
4.4 遗传学领域的论文多维度影响力优势检验
4.4.1 被引次数的分位数回归
表13列出了自变量在因变量被引次数各设定分位数(q=0.1、0.25、0.5、0.75、0.9)的影响参数估计值。结果表明,在控制10个论文内、外部特征情况下,期刊论文在bioRxiv平台存档对被引次数的各分位数是正向影响,且均有统计学意义(p<0.01)。但在不同的被引次数分位数下,期刊论文在bioRxiv平台存档对被引次数的影响程度不同。在被引次数较低水平(0.1分位数)时,bioRxiv存档的期刊论文被引次数是未存档的0.955倍;而在被引次数中等水平(0.5分位数)时,bioRxiv存档的期刊论文被引次数是未存档的2.437倍;到被引次数较高水平(0.9分位数)时,bioRxiv存档的期刊论文被引次数是未存档的22.759倍。总之,随着论文被引次数的增加,bioRxiv存档对被引次数的正向影响逐渐加大,当论文被引次数处于相对高水平时,bioRxiv存档对论文被引的影响是论文被引次数相对较低水平的影响参数的近23.8倍。
表13 被引次数的不同分位数参数估计——遗传学领域
4.4.2 社会关注度(AAS)的分位数回归
表14列出了自变量在因变量AAS各设定分位数(q=0.1、0.25、0.5、0.75、0.9)的影响参数估计值。结果表明,在控制10个论文内、外部特征情况下,期刊论文在bioRxiv平台存档对AAS的各分位数是正向影响,且均有统计学意义(p<0.01)。但在不同的AAS分位数下,期刊论文在bioRxiv平台存档对AAS的影响程度不同。在AAS较低水平(0.1分位数)时,bioRxiv存档的期刊论文AAS是未存档的1.070倍;而在AAS中等水平(0.5分位数)时,bioRxiv存档的期刊论文AAS是未存档的4.791倍;到AAS较高水平(0.9分位数)时,bioRxiv存档的期刊论文AAS是未存档的26.437倍。总之,随着论文AAS的增加,bioRxiv存档对AAS的正向影响逐渐加大,当论文AAS处于相对高水平时,bioRxiv存档对论文AAS的影响是论文AAS相对较低水平的影响参数的近24.7倍。
表14 社会关注度(AAS)的不同分位数参数估计——遗传学领域
4.4.3 临床转化潜力(APT)的分位数回归
表15列出了自变量在因变量APT各设定分位数(q=0.1、0.25、0.5、0.75、0.9)的影响参数估计值。结果表明,在控制10个论文内、外部特征情况下,期刊论文在bioRxiv平台存档对APT的0.25、0.75和0.9分位数均是正向影响,且均有统计学意义(p<0.01),但参数估计值极小。在0.75分位数和0.9分位数时,bioRxiv存档的期刊论文APT分别是未存档的0.066倍和0.085倍。
表15 临床转化潜力(APT)的不同分位数参数估计——遗传学领域
5 讨论
本研究发现,神经科学领域bioRxiv自存档的期刊论文具有年均40.19%的引文优势、年均68.80%的AAS优势和年均21.74%的临床转化潜力优势;生物信息学领域bioRxiv自存档的期刊论文具有年均67.92%的引文优势、年均23.43%的AAS优势和年均5.06%的临床转化潜力优势;遗传学领域bioRxiv自存档的期刊论文具有年均57.91%的引文优势、年均74.53%的AAS优势和年均15.54%的临床转化潜力优势。
上述结果中,引文优势在40.19-67.92%之间,均低于陈悦等[19]发现的图书情报领域arXiv论文108.95%和机器人领域arXiv论文83.56%的引文优势。而AAS优势这一结果与Serghiou 等[23]的结果一致,并在一定程度上支持了Fraser等[24]报告的bioRxiv自存档的期刊论文在tweets、Blog Feeds、Mendeley上有显著优势的结论。但Fraser研究的是部分Altmetrics指标,不是AAS总分,还是有不同之处。此外,我们通过分位数回归方法揭示了随着论文被引次数、AAS水平的提高,bioRxiv存档对被引次数及AAS的影响参数的变化趋势,对以往研究结果提供了更丰富的信息和更细致的补充。
更重要的是,本研究提出了“临床转化潜力优势”这一概念,并参考引文优势和AAS优势公式计算,通过分位数回归检验发现,不同学科领域存在略微差异。对生物信息学而言,期刊论文在bioRxiv存档对APT的各分位数均是正向影响;但对神经科学和遗传学而言,当APT水平较低时,影响可能是负值或无统计学意义,而APT到了较高水平时,影响均是正值。但bioRxiv存档对APT的参数估计值要远远小于对被引次数和AAS的参数估计值。这从临床转化的维度评价了bioRxiv自存档期刊论文的影响力优势,是一个较新的尝试。
在回归分析中,我们在控制论文内、外部特征的情况下检验预印本存档的影响力优势。Fraser等[24]曾在对预印本论文引文优势和推文、博客提及以及Mendeley保存等优势的检验中,使用负二项回归方法,控制了影响因子、OA、作者数、文献类型、美国国籍第一作者、美国国籍通讯作者、第一作者学术年龄、通讯作者学术年龄、女性第一作者和女性通讯作者等10个影响因素。在我们的研究中,除影响因子、文献类型和作者数以外,其余7个控制变量均与Fraser等的研究不同。在本研究中,作者性别、国别和语种对被引次数、AAS的影响[42-43]未被控制,与临床转化潜力密切相关的影响因素还未明确发现,需要在后续研究中予以完善。
6 结论
通过对2014—2018年间bioRxiv自存档的期刊论文在被引次数、社会关注度和临床转化潜力方面的影响力优势进行研究,得出如下结论:
一是bioRxiv自存档的期刊论文在被引次数、社会关注度和临床转化潜力方面具有多维度的影响力优势,其中,临床转化潜力优势稍弱。
二是在bioRxiv自存档的不同学科子领域期刊论文影响力优势表现不同。三个学科间相比较而言,神经科学子领域更侧重于社会关注度和临床转化潜力优势;生物信息学子领域更侧重于被引次数和临床转化潜力优势;而遗传学子领域更侧重于被引次数和社会关注度优势。
三是bioRxiv自存档对不同水平的论文被引次数、社会关注度和临床转化潜力的影响程度不同。具体来讲,在三个学科子领域中,随着论文被引次数或社会关注度的增加,bioRxiv存档对被引次数或社会关注度的正向影响逐渐增大。但对临床转化潜力而言,在较低水平时,影响程度非常小,甚至存在负向影响的情况;而在较高水平时,随着论文临床转化潜力的增加,bioRxiv存档对临床转化潜力的正向影响逐渐提高。
当前,科技评价改革是国家关注的重要领域之一,全面准确评价科技成果的科学、技术、经济、社会、文化价值被列为主要工作措施之首。如何评价科技成果的多元价值至今仍然是亟待突破的难题。本文在前人研究基础上,选取了生物信息学、神经科学、遗传学领域的预印本论文为研究对象,正是在新冠疫情的社会背景下,尝试探索性评价包括被引次数、社会关注度及临床转化潜力在内的预印本论文多元价值优势,具有一定的学术开拓性和实践应用价值。在未来工作中,将进一步探索对不同学科领域论文及其他类型科技成果的多元价值评价及影响因素分析,呼吁科技评价真正回归多元价值导向,为我国科技评价体系改革提供实证依据。