生物医学预印本平台的出版历史与现状的多维评价*
2022-12-06徐倩陈璐
徐 倩 陈 璐
2019 年底,新型冠状病毒肺炎(coronavirus disease 2019,COVID-19)疫情暴发[1]。随着疫情蔓延,世界卫生组织(World Health Organization,WHO)正 式 宣 布COVID-19 为“全球大流行病”(pandemic)。疫情暴发至今,在各大预印本平台在线发表的相关学术论文已多达上万篇,发表内容包括从治疗药物的临床试验到诊断测试、个人防护设备和流行病学建模等方面。本文梳理了预印本出版模式的历史和发展现状,辩证地探讨了在COVID-19 疫情下国内外几个重要生物医学预印本平台的文章发表情况和发挥的作用,并从多维度分析了预印本出版的优缺点,最后基于中国预印本平台的现状和发展方向提出了建议。
1 国内外预印本平台的出版历史和发展现状
1991 年,量子物理学家Paul Ginsparg 创建了基于电子邮件的预印本平台arXiv,开启了电子预印本时代[2]。1994年,社会和人文科学的预印本平台(social science research network,SSRN)面世。经历了近30 年的发展,这种以开放存取、免费发表和公开透明的评议方式等为主要特点的出版模式得到了学术圈的广泛关注和传统出版商的认可,也给许多学科发展带来了革命性的变化。一方面,传统的预印本平台不断扩展领域,转型发展,其中arXiv 已涵盖了计算机科学和经济学等重要领域[3]。SSRN 被Elsevier 收购后成功转型,向生物学预印本平台和化学预印本平台等领域的“科研网络”扩张。另一方面,新兴的预印本平台在各学术领域中不断涌现,预印本出版模式逐渐兴盛[4]。2003年11 月,美国冷泉港实验室推出了生物学领域的预印本平台bioRxiv,其目的是对arXiv 未涉及的学科领域进行补充[5]。bioRxiv 借鉴了社交媒体的互动功能和“迭代”模式,一方面作者可以实时得到同行评议反馈,另一方面根据反馈意见,作者可以不断修改和完善文章,打破了期刊出版内容“不可更改”的定律[6]。2017 年底,以bioRxiv 为代表的“生物学预印本的兴起”入选Science当年的十大科学突破,这标志着预印本出版模式在学术交流中的重要作用已经得到了学术界的高度关注[7]。截至2022 年1 月27 日,bioRxiv 已成为了生物学领域重要的学术交流平台,已在线发表了146 657 篇论文,见表1。数据分析显示,bioRxiv发文量呈指数增长,其发表率、使用量、浏览量较高,已具有一定的影响力,且呈繁荣发展的态势,但尚未到达成熟稳定的发展阶段[8]。继成功运营了bioRxiv,美国冷泉港实验室携手British Medical Journal和耶鲁大学联合运营的医学类预印本服务平台medRxiv 于2019 年6 月25 日正式上线。临床研究人员可以在medRxiv 在线提交研究论文,同时medRxiv 会对文章标注免责声明,表明其未经同行评审,不能作为临床治疗或健康相关措施方面的指导,也不能作为既定信息在新闻媒体上报道。medRxiv 评审原则要求作者须声明文章中伦理审查、临床试验登记、病人知情同意书、资金来源和利益冲突等信息。目前medRxiv发表范围覆盖了51 个医学子学科。最初,medRxiv 的稿件吸收的速度很慢,但在COVID-19 疫情期间,medRxiv 发表文章数量猛增[9]。
表 1 国内外三个预印本出版平台基本情况比较
国内目前主要有三个预印本平台,分别为中国预印本服务系统、中国科技论文在线和中国科学院科技论文预发布平台(ChinaXiv)[10]。中国预印本服务系统于2004 年3月开通,该系统由中国科学技术信息研究所与国家科技图书文献中心联合建设,目的是为学术交流提供平台。中国科技论文在线由教育部科技发展中心主办,针对科研人员反映的论文发表困难,学术交流渠道窄等问题而创建的科技论文网站。2016 年6 月,国内首个按国际模式规范运营的预印本平台ChinaXiv 正式上线。ChinaXiv 是中国科研论文开放仓储库,由中国科学院文献情报中心维护和运营,由ChinaXiv 科学咨询委员会和用户咨询委员会提供服务指导,接收中英文科学论文的预印本存缴和已发表科学论文的开放存档。ChinaXiv 上线至今,得到了许多科研人员和出版同行的支持与关注。目前一共有29 本国内期刊,其中有5 本英文期刊与该平台合作,建立了稿件双向推送机制。截至2022 年1 月27 日,ChinaXiv 累计发表文章15 653篇,涵盖31 个学科领域,其中生物学、物理学、地球科学、计算机科学、医学/药学是论文发表量排名前五的学科,见表1。
目前国内外预印本平台已超过100 个,学科覆盖范围广泛[11]。2022 年1 月,arXiv 宣布其平台论文发表量达200万篇[12]。随着开放科学在全球推广,预印本平台正作为无障碍、透明化的学术传播渠道不断扩展与繁荣,其快速便捷的传播优势使得预印本出版模式不仅被学者青睐,还受到了政府、科研机构、项目资助机构的关注和支持[13]。2017 年,美国国立卫生研究院和英国医学研究理事会均宣布受资助者在基金申请书中可以引用预印本平台发表的论文,并鼓励他们在传统期刊上发表研究成果之前,先将其研究成果提交到预印本平台,表明预印本平台逐步被科研评价体系认可[14]。同时,为了进一步提升平台品牌认可度与影响力,预印本出版平台通过扩大合作期刊范围,规范稿件审核流程,提升开放同行评议质量,进一步得到了学术生态圈的认可。
2 预印本出版模式在COVID-19 疫情中发挥的作用
COVID-19 疫情发生以来,全球学术出版界联动起来,第一时间作出应对,把新型冠状病毒有关的研究数据和发现信息共享,确保科研成果快速、广泛地交流,以告知疫情现状、治疗指南以及相关科研进展。预印本出版平台在COVID-19 疫情期间,展示出了其在公共卫生危机等紧急情况下的信息传播速度和优势,同时也促进了预印本平台加速走向公众。尤其是疫情暴发初期,预印本平台助力了COVID-19 相关实验数据、临床病例特征、流行病学统计数据等研究成果的开放共享和广泛交流,不仅为指定临床诊断方法提供了数据支撑,还为疾病防控策略的制定和及时调整提供了重要参考。例如,英国政府在其第一个COVID-19 行动计划中引用了一篇在预印本平台发表的文章[15]。
截至2022 年1 月27 日,bioRxiv 已在线发表COVID-19相关论文5 047 篇,占其发文总数的3.4%,而medRxiv 已在线发表COVID-19 相关学术论文16 465 篇,占所发文总数的57.7%,见表2。据统计,在COVID-19 疫情暴发前,medRxiv 每天的投稿量中位数为6 篇,然而疫情暴发后,medRxiv 每天的投稿量上升至51 篇[9]。在ChinaXiv 以“新冠肺炎”或“新型冠状病毒”或“SARS-CoV-2”或“COVID-19”为关键词检索,截至2022 年1 月27 日,共发表40 篇文章,占总发文数的0.2%,涵盖生物学、医学、药学、心理学等7 个学科,其中第一篇相关论文提交于2020年1 月27 日,见表2。
2020 年2 月9 日,钟南山院士带领的研究团队在医学类论文预印本平台medRxiv 上发表了一篇题为Clinical Characteristics of 2019 Novel Coronavirus Infection in China的临床回顾性研究论文[16]。文章纳入了1 099 例COVID-19患者,总结了患者的临床表现,分析了疾病潜伏期、诊断准确率、预后相关因素等内容,进一步为疫情防控提供了有力的数据支撑。文章研究表明新型冠状病毒传播途径广泛,在唾液、胃肠道分泌物、尿液、粪便中都能检测到新型冠状病毒,并进一步确认了病毒可能存在粪-口传播途径,因此需更加严格执行疫情的防控措施。另外,文章结果表明,早期患者仅43.8%存在发热症状,核酸检测假阴性率较高,影像学检查约76.4%的患者表现出肺部毛玻璃状病变或双侧斑片状阴影的异常,单一检查容易出现漏诊,因此结合患者临床症状、影像学报告、核酸检测,将大大提高诊断准确率。该论文于2020 年4 月在New England Journal of Medicine上正式发表。2020 年2 月15 日,德克萨斯大学奥斯汀分校Jason S. McLellan 研究团队在bioRxiv发表题为Cryo-EM Structure of the 2019-nCoV Spike in the Prefusion Conformation的研究论文[17]。冠状病毒的刺突糖蛋白(spike glycoprotein,S 蛋白)是疫苗、治疗性抗体的关键靶点。该研究揭示了新型冠状病毒传染性强的主要原因,为新型冠状病毒疫苗设计以及抗病毒药物研发提供了重要的结构生物学基础,促进了对于新型冠状病毒相关医疗对策的快速研发和评估。该论文于2020 年2 月正式发表在Science杂志上。在COVID-19 大流行期间,预印本的文章数量成倍增长,反映了人们对最新信息的迫切需求和渴望[9,18]。预印本出版平台为人们了解COVID-19 对全球卫生系统的威胁提供了早期的窗口,临床医生使用预印本出版平台分享他们的治疗策略,例如,患者清醒俯卧位通气和共享通气方面的早期经验,以应对疫情大流行期间呼吸机供应不足的窘境[19]。然而,预印本出版开放、便捷的特点也导致了预印本平台上发表文章质量参差不齐,甚至会有潜在的负面影响和应用风险。2020 年1 月31 日,印度理工学院和德里大学研究团队在bioRxiv 上在线发表题为Uncanny similarity of unique inserts in the 2019-nCoV spike protein to HIV-1 gp120 and Gag的研究论文[20]。文章比对了新型冠状病毒和SARS 病毒的刺突蛋白(spike protein)序列,结果发现新型冠状病毒的刺突蛋白有4 个独特的插入片段。数据库比对结果显示,这4 个插入片段的氨基酸残基与艾滋病病毒的包膜蛋白gp120 和衣壳结构蛋白Gag 具有相似性。文章强调新型冠状病毒4 个特有的插入片段在自然界进化中不太可能偶然发生。文章的推论经部分媒体和科研人员的引导和解读,最后发酵为“阴谋论”。虽然medRxiv、bioRxiv 等预印本出版平台在2020 年4 月紧急增设了发表内容初筛的措施,然而其筛查的范围仅限于“作者是否认真参与了研究”,并没有检查预印本的数据、结论等内容,难以避免低质量的文章出现[21]。2020 年5 月11 日,Benjamin Davido 团队在medRxiv 发表题为Hydroxychloroquine plus azithromycin: a potential interest in reducing in-hospital morbidity due to COVID-19 pneumonia (HI-ZY-COVID)?的研究论文,研究显示羟氯喹/阿奇霉素对于治疗COVID-19 病人有显著疗效。但作者于5 月20 日,以该研究为回顾性研究为由宣布撤稿[22]。2020 年6 月15 日,美国食品和药品监督管理局撤销了对羟氯喹/氯喹治疗COVID-19 的紧急使用授权。由此可见,除了arXiv 的用户认可制度,bioRxiv 的筛选过程等预印本平台现有的审核机制,预印本出版模式需要进一步完善其审核和准入机制,以提高所发表研究成果的科学性和严谨性,尽量降低和避免发布和传播不可靠证据所带来的潜在危害。
表 2 国内外三个预印本出版平台在COVID-19 疫情期间发文情况比较单位:篇
3 多维评价预印本出版模式的优缺点
相对于传统学术期刊,预印本出版模式在科学传播与交流方面具有明显优势。首先,预印本出版时效性强,发布方式便捷,传播范围广。COVID-19 疫情暴发初期,临床医生和科研人员、政府和公众前所未有地需要获得强有力的数据以及时地采取相关措施和决策。经过同行评议的公开发表文章是一个可靠的研究成果来源。然而,在过去十年中,同行评审的有效性饱受争议。研究表明,同行评审过程会极大地延迟研究成果的公开发表,且审稿和修改的次数与论文的引用次数并无关联[23]。虽然这些延迟对于确保研究的质量和完整性至关重要,但在公共卫生危机诸如COVID-19 疫情这样的紧急而复杂的环境中,这种时滞与对数据的迫切需求相冲突。尽管传统的同行评议期刊制定了应急方案来应对和管理大量COVID-19 有关的投稿,但仍然不能满足医疗卫生系统对最新研究发现和临床经验的渴求。例如,潜在的审稿人忙于临床一线的工作,可能无法及时评估待审稿件。这种僵局必然会阻碍相关临床数据的传播,这使得临床医生在某些情况下的操作证据有限,这也可能存在隐患[18]。相反的,由于预印本平台发表门槛较低,快速便捷,在线发表文章一般仅需要通过两级审核:第一阶段,文章由预印本平台内部人员审核其完整性以及原创性;第二阶段,主要由研究人员或学科专家对文章的科学性以及是否存在健康或者生物安全风险的内容进行审核[23]。文章在线发表后,预印本平台会开放对文章的在线评论-一种“众包”的同行评审形式。例如,声称新型冠状病毒和艾滋病病毒之间有相似之处的研究团队,在收到百余条在线评论后决定撤回稿件并重新分析数据,以避免由于社交媒体和新闻平台渲染,作出不同的解读,而对社会舆论造成歪曲以及引发社会恐慌情绪等负面影响。这说明了预印本出版平台在线评论这一非正式的同行评审模式的快速性和有效性[24]。如果是发表在传统杂志上的误导性文章,撤稿的时间会更长。第二,预印本出版模式把发表文章和进行学术交流的权利还给了作者,并且其开放获取的模式,缩小了“数据鸿沟”,不仅促进了学术交流与共享,还提升了研究成果的影响力[12,25-26]。在预印本出版平台上,无论是顶尖大学的知名教授,还是发展中国家缺乏研究经费的学者,所有研究者的最新成果都可以被看到,同时所有学者也都可以评审他人的研究,在一定程度上体现了学术研究的公平性[12,25]。预印本出版模式在满足科研人员抢先发布研究成果的同时又能在一定程度上避免研究工作的重复,其开放透明的评审制度,不仅提高了论文的质量,加速期刊同行评议进程,同时高质量的论文也有助于提升期刊声誉。研究结果表明,arXiv 论文在Web of Science、Scopus 和Google Scholar数据库中均具有显著的引用优势[13]。同一本出版物中,arXiv论文相比非arXiv 论文具有明显的引用优势,说明预印本提升了研究成果的传播效率,增加了论文的学术影响力[27]。
然而,预印本出版平台繁荣发展的背后也面临着诸多挑战:(1)由于预印本出版平台对文章的评议方式缺乏统一衡量标准,现有审核机制还存在不足,因此平台对上线文章的质量很难进行严格的把控[28],尤其是生物医学类文章,在研究内容科学性、可靠性、伦理问题、利益冲突等方面还需要更严谨的审核和监督措施来平衡发表效率和论文质量之间的矛盾[25-26],以尽量降低潜在的负面社会影响和临床应用风险;(2)由于预印本平台上发表的文章,从最初上线到最终在学术期刊上发表,这个期间作者根据实验进展和评审意见不断地修改,这个过程可能会更新多个版本的文章,因此可能会在后期造成错误版本的引用甚至是错误结论的引用以及进一步扩散[22,29];(3)预印本出版平台论文版权争议、长期保存许可协议等问题,也是影响其可持续发展及知识服务功能的阻碍,需进一步健全与完善[26];(4)预印本出版平台相关知识服务功能还有待完善,这方面与传统出版商相比存在一定差距,需要进一步拓展服务范围,通过信息的深度挖掘和关联,形成符合科研人员需求的知识产品,通过多元化、个性化的知识服务,才能为学术领域提供更广泛意义上的支持,助力开放科学进程[30]。
长远看来,信息的快速共享是利大于弊[31]。目前,学术出版界对于预印本这种发表模式已广泛接受,同行评议的期刊对于在预印本平台上出现过的稿件也表示欢迎,甚至一些著名的传统生物医学期刊也允许或鼓励作者将稿件提交给预印本平台,以加速知识的传播[32]。预印本出版平台和同行评议并非竞争或对立,相反的,预印本出版是对经同行评议的期刊出版的有效补充。
4 结语
学术成果的开放共享和多元化的发表模式是未来学术交流发展的趋势。预印本平台作为一种出版模式,是科技出版生态系统的重要组成。尽管现阶段预印本出版模式尚有不足,但这种出版形式在COVID-19 疫情期间,大大促进了研究成果的实时发布和即时反馈,同时也提高了其自身的利用率与接受度,巩固了预印本发表模式在学术交流和公共卫生危机中的地位,并加速了预印本出版与传统期刊出版工作流程的融合[32-33]。
我国的预印本平台还处于发展的初级阶段。表2 的数据显示,在COVID-19 大流行中,国内预印本平台发表相关文章寥寥可数,主要原因是由于平台自身影响力有限,在学界认可度低。在此背景和趋势下,国内预印本平台要借鉴国际预印本平台的发展经验:(1)构建规范的运营管理模式,完善论文审核与评价机制,提升学界的认可度;(2)优化平台体验,提升自身影响力和用户关注度,并进一步加强国内外预印本平台与国内外期刊之间的交流合作,促进期刊更快更好地吸引高质量稿件,实现合作共赢;(3)增强主体意识,制定和出台应对突发公共事件应急预案,提高传播门槛,避免误读式传播;(4)加强政策支持,接轨科研评价体系,进一步提升平台的学术服务功能。