当前国际预印本平台主要创新功能研究
2022-11-21张智雄
赵 旸 张智雄*
1)中国科学院文献情报中心,北京市海淀区中关村北四环西路33号 100190
2)中国科学院大学经济与管理学院图书情报与档案管理系,北京市海淀区中关村北四环西路33号 100190
预印本平台是指为科研人员提供预印本出版传播渠道并促进论文交流的学术平台。自1991年保罗·金斯帕(Paul Ginsparg)在美国洛斯阿拉莫斯(Los Alamos)国家实验室建立第一个预印本平台arXiv以来,预印本平台主要围绕论文的提交、发布、检索、浏览等功能展开服务,并不断改进与更新稿件内容筛选、稿件评议、稿件版本管理等功能机制,旨在提升处理效率,加速论文的发布与交流。
近年来,随着开放获取、开放科学的兴起,基于预印本的学术交流在科研学术交流中的作用得到了科学界的高度关注。很多预印本平台除了提供传统的稿件提交、存储、发布功能之外,也在不断进行功能创新,提出了一些富有创意与新意的预印本平台功能,例如arXiv与第三方机构合作,创建开放创新社区,将第三方工具嵌入arXiv平台的文章记录界面,进而从不同方面展示该篇文章的相关内容,以提升稿件影响力[1]。秉持着加速研究成果传播的核心理念,多个预印本平台(如Research Square)为在预印本学术交流建设中发挥更大的作用,与国际学术出版界就预印本与传统期刊的衔接与过渡,合作开展了形式多样、各具特色的探索性实践[2]。这一举措冲击了传统的学术交流模式,也为出版行业的发展与改革提供了示范。预印本平台的创新功能可以更好地服务于科研、学科与社会团体,促进了科研工作者之间的学术交流。
目前鲜有研究对预印本平台新兴功能的发展趋势进行系统梳理,基于此,本文梳理了国际预印本学术交流平台不断涌现的创新功能,与这些平台的常规功能形成对比。国际预印本平台的5个创新方向值得我国平台借鉴,包括与第三方机构合作构建开放创新社区、推出支撑科学讨论和评阅的评论面板、帮助作者提升论文水平、推动论文开放评审,以及构建支撑科研评估的评估体系。
本文主要对5个功能创新方向进行研究分析,重点阐述它们的新颖之处。希望本文能够为我国预印本平台的未来发展提供参考借鉴,同时也为科技期刊的发展转型、出版机制的改善与出版服务创新提供启示。
1 研究对象及研究方法
综合考虑平台规模、运营组织、影响力、收录学科等方面,选取5个具有行业代表性的平台——arXiv、bioRxiv、Research Square、F1000 Research和SSRN(Social Science Research Network)进行研究。其中,arXiv是国际上第一个预印本平台,也是当前国际上最重要的预印本平台。2001年开始,arXiv由康奈尔大学运营。arXiv提供物理学、数学、计算机科学等8个领域的预印本论文存缴、检索、发布和交流共享服务。bioRxiv是美国冷泉港实验室于2013年11月推出的生命科学领域的预印本平台。bioRxiv在生物学界的大力推动下得到了快速发展:2017年,以bioRxiv的发展为标志的“生物学预印本交流兴起”入选Science的“年度十大科学突破”[3]。F1000 Research是Taylor & Francis收购的生命和生物医学研究预印本平台;同时,它是一个创新的开放获取出版平台,能够提供快速出版和开放同行评议服务,支持数据存储和共享。Research Square是Springer Nature投资的多学科预印本平台,SSRN是Elsevier收购的多学科预印本平台。
笔者分别访问这5个平台的官方网站, 重点关注预印本论文介绍界面。通过对比分析这些平台的常规功能(如在线提交/投稿、阅读浏览、检索、下载[4]),梳理每个平台的创新功能,以及平台间共有的创新发展趋势。
2 国际预印本平台主要创新功能
2.1 构建创新合作社区,加强个人与组织的创新协作
为扩大预印本的传播和应用范围,预印本平台邀请学术社区共同开发可以使科学界受益的工具,以期为平台发展与预印本学术交流作出贡献。例如,arXiv积极融入学术社区,面向个人与组织开放创新合作,于2020年9月推出了一个新的、正式的程序框架——arXivLabs[1]。该框架支持合作者将其开发的新功能分享到arXiv平台,并支持合作者将这些新功能嵌入arXiv文章记录页面,以帮助用户发现更多与文章相关的知识内容,并且该框架会随着新功能的推出而不断更新。arXiv已经通过arXivLabs集成了一些创新功能,包括论文引用功能、相关论文发现功能与数据代码链接功能。
目前论文引用功能集成了3个工具——Bibliographic Explorer、Litmaps和Scite(Smart Citation),它们分别以不同的形式展现了与论文相关的引文信息。Bibliographic Explorer以用户友好的论文引用导航树的形式来呈现arXiv 论文的施引文献和被引文献,这些信息由Semantic Scholar、Prophy数据库提供,用户可按照论文发表年份、第一作者、题目、影响力4个字段对相关论文进行排序和筛选,具体的界面如图1所示。Litmaps将arXiv论文的参考文献之间的关系进行可视化处理,并且用户可以利用其重点关注某一篇参考文献的引用关系和引文网络[5],具体的界面如图2所示。Scite是一个智能引文平台[6],它记录了每篇论文的引用情况。Scite不仅显示论文的被引频次,还提供该篇论文在施引文献中的具体引用内容,并对引用内容进行智能分类,以揭示施引文献的引用态度(包括支持、提及和对比)。读者可以通过相应的Scite报告查看每篇预印本是如何被讨论或引用的,还可以查找共引文献、按引用态度筛选施引文献等[7]。
图1 Bibliographic Explorer中的论文引文信息
图2 Litmaps中的论文参考文献可视化分析
相关论文发现功能可为读者推荐相关论文,提供阅读参考;该项功能目前集成了CORE Recommender和Connected Papers 2个工具。CORE Recommender[8]将arXiv等1万余个开放获取数据提供者的开放论文资源聚合在一起,可在全球研究存储库网络中筛选与预印本相关的开放获取论文。Connected Papers[9]可帮助研究人员查找和探索与其工作领域相关的论文。具体而言,Connected Papers的数据库与Semantic Scholar连接。根据用户需求,Connected Papers首先在Semantic Scholar中获取50000篇与预印本相关的论文进行分析,随后筛选出几十篇与预印本联系最紧密的论文。Connected Papers还将相关论文可视化,用户可更便捷地关注高被引论文。
数据代码链接功能由Papers With Code提供支持,用以推进研究进程。Papers With Code[10]为arXiv上发布的机器学习领域相关论文提供了一种关联相关代码的简单便捷的方式。除论文中可能提到的官方代码之外,Papers With Code还将其他人员发布的与论文相关的社区代码关联起来,使研究人员能够快速、便捷地使用和借鉴他人的工作。同时,数据代码链接功能提供了论文数据集的链接,并显示其他使用这一数据集的论文,为研究人员提供参考。此外,为使论文数据的可用度更高,arXiv将集成的170万篇预印本托管到Kaggle数据平台上供用户免费使用[11],且每周进行一次更新。Kaggle数据平台提供论文的标题、作者、类别、摘要、版本信息等元数据字段,用户可通过调用API(Application Programming Interface)接口批量访问全文信息。这一arXiv数据集为CORE Recommender等工具以及自然语言处理等技术的发展提供了丰富的语料资源。
2.2 推出评论窗口,促进学术交流讨论
预印本发布后,良好的学术交流与反馈可以促使作者进一步完善研究内容,为此,许多预印本平台在预印本界面开发了评论板块,以收集来自多方学术团体和社区的评论意见并公开展示。例如,bioRxiv开发了能够便捷访问多方评论的评论集成面板(Dashboard)[12],倡导读者对预印本进行评论和讨论,并支持读者以不同的方式向作者提供反馈。评论集成面板可集成读者评论、同行评议、社区讨论,以及社交媒体和传统媒体中提及预印本的评论内容,并可链接到评论源处,进一步提高了预印本的可发现性,也使读者更容易找到和访问评论信息(图3)。用户可通过bioRxiv文章摘要界面上方的启动栏(Launch Bar)打开评论集成面板,启动栏中不同的图标代表不同的预印本讨论或评论来源,且显示评价或互动的数量;点击其中一个图标就会打开一个显示该部分条目详细信息的评论面板。评论集成面板中提供的信息来自Hypothesis、Disqus、Altmetric、Sciety等第三方平台和各种社区。
图3 bioRxiv评论集成面板
评论集成面板中的“Comments”展示读者对bioRxiv预印本的评论。读者可以在 bioRxiv 网站进行评论,也可以通过评论服务平台Disqus 提交自己的评论。评论主要讨论文章的科学内容,包括预印本的研究方法、结果、数据和/或具体问题;评论必须以英文发布,并且只能提交一次。任何具有冒犯性,与预印本内容不相关或质疑作者的性格、能力或动机的评论都会被屏蔽。所有评论都要经过审核,以确保它们符合bioRxiv的评论政策。审核通常在24~48小时范围内完成。
评论集成面板中的“TRiP Peer Reviews”显示的是参与“预印本透明审查”(Transparent Review in Preprints,TRiP)试点的期刊和其他同行评议服务机构提交的评论。TRiP是bioRxiv与其他组织用以促进学术出版生态系统发展的一个新试点项目[13]。该项目由网络评论工具 Hypothesis提供支持,鼓励参与机构在 bioRxiv上发布评审意见。作者在向eLife、Review Commons、Peerage of Science等参与机构投稿时,可以选择加入TriP,这使得期刊和同行评议服务机构能够在提交预印本的同时公布评审意见。
评论集成面板中的“Community Reviews”展示的是社群对预印本的评论,这些评论内容并未经过bioRxiv平台或预印本作者的审查。bioRxiv也正在开发用于筛选和评估预印本的自动化方法,此功能将在“Automated Evaluations”中发布。为了让读者了解社交媒体和传统媒体对预印本的看法,bioRxiv 还在评论集成面板中加入了“Blog/Media”栏目,栏目中包括博客、报纸和其他媒体对预印本的评论。评论集成面板中的另外2个链接可跳转至预印本的相关视频(Videos)及其在Twitter上的讨论页面。
除了bioRxiv之外,其他预印本平台(如Research Square、SSRN、F1000 Research)也都开发了相应的评论板块供平台用户进行学术讨论。同时,用户亦可通过Hypothesis、Disqus等第三方工具对预印本进行评论与讨论。
2.3 帮助作者提升论文水平
为帮助预印本在拟投期刊上发表,预印本平台提供了一系列新的知识服务,以期最大限度帮助作者提升论文水平。Research Square通过提供作者服务功能,帮助作者进一步完善预印本、提升论文质量,并对预印本进行宣传推广,以提升预印本的影响力。作者服务功能包括编辑服务、推广服务和认证服务3种形式。
编辑服务专注于论文内容质量的提升,具体包括4种服务方式[14]。(1)英语编辑(English Editing):相关领域专家对论文语言进行编辑,仔细纠正拼写、语法、措辞和标点符号中的错误;在保持作者原意、原文结构和逻辑的基础上,对论文进行优化。(2)数字编辑[15](Digital Editing):利用智能技术对论文进行自动编辑。该工具可以在不影响论文内容的前提下改善论文的写作风格,以修订模式纠正论文的语法、措辞和参考文献中的错误,以便作者对修改建议进行判断。同时,该工具还可自动评估论文的写作质量,并给出语言质量分数。(3)稿件编排(Manuscript Formatting):根据拟投期刊要求编排稿件格式,包括页面布局、文本格式、参考文献格式等;检查参考文献的准确性,并对标题、摘要、正文和图例提出修改意见。(4)图表服务(Figure & Table Services):生成符合拟投期刊规范的图例和表格,修改图例的文件格式、分辨率、色彩、字体、比例、线宽和布局,以提高图片可读性和可观性;改进表格的布局、字体等,以准确、有效地传达信息。
推广服务可促使研究论文产生一定的影响力,清晰而准确地传播研究工作,具体包括3种服务类型[16]。(1)视频服务(Video Services):为论文制作准确的介绍视频。视频可以是标有关键词、简短标题、简要描述的时长1分钟的视频字节(Video Byte),用以概述研究及其影响;也可以是2~3分钟的视频摘要(Video Abstract),用以向有一定专业基础的观众解释研究方法、研究发现,以及该研究对所属领域的贡献;还可以是包括GIF 动画、宣传片等在内的自定义视频(Custom Video)。(2)总结服务(Summary Services):以新闻风格展现研究工作要点,帮助作者向广大读者传达研究成果。该服务包括由专业团队提供的研究推广(Research Promotion)服务,以及形成简要书面总结的研究亮点(Research Highlight)服务。(3)信息图表服务(Infographic Services):通过图表凸显最重要的研究点,来展示作者的研究,包括以简洁、醒目且易于理解的方式描述研究的自定义信息图表(Custom Inforgraphic),以及包括研究背景、方法和主要发现在内的视觉摘要(Visual Abstract)。
认证服务为发布在Research Square上的预印本提供徽章认证,以保障文章质量:获得徽章认证表明预印本符合科学报告的既定标准[17]。徽章认证具体包括2种类型。(1)方法报告徽章(Methods Reporting Badge):检查论文的具体细节、研究设计,以及数据收集和分析、数据软件/代码的合理性,确保研究方法的公开透明与可重复;(2)数据报告徽章(Data Reporting Badge):评估统计分析信息与实验结果数据的严谨性。
2.4 采用开放同行评议模式,推动论文开放评阅
为使预印本快速正式发表,预印本平台积极探索新型出版模式:通过与国际学术出版商开展不同模式的合作,连接投稿系统和预印本平台,推进稿件评审进程。Research Square、SSRN等预印本平台纷纷推出期刊预印本专区[2],提倡投稿至期刊的稿件率先发布在预印本平台上。同时,预印本平台可根据期刊要求,不同程度地公开同行评审意见与审稿过程。此外,预印本平台打通期刊间的稿件转投通道,以更加开放透明的方式加速预印本的交流与传播。
F1000 Research充分结合预印本资源和期刊资源,采用公开透明的同行评议模式,并借助作者驱动模式进行论文评审与出版[18],进而推动论文的开放同行评议。在F1000 Research中,论文发布后首先被标记为 “Awaiting Peer Review”(等待同行评议)的状态;该状态附在标题旁,并在文章HTML界面和PDF文件中的开放同行评议摘要框中显示。F1000 Research要求论文作者推荐至少5名其领域内的专家作为审稿人,并要求审稿人在平台上发布至少2份同行评议报告。确定审稿人后,审稿人会收到针对不同文章类型的评阅指南,用以评估研究是否科学合理,具体包括以下4个方面:是否在现有文献资料的基础上对研究工作进行了适当的讨论;是否采用了适当的方法;是否提供了足够的信息和源数据以保证研究的可重复性;是否得出能够支撑结论的研究结果。对于某些类型的文章,例如案例报告或综述文章,审稿人被要求对文章所使用的事实和方法进行评论,而不一定要表述他们是否同意作者的观点。
除了评审意见外,审稿人还需对论文给出明确答复,具体包括以下3种审批状态[19]。(1)通过评审(Approved):审稿人认为论文不需要修改或只需要作少量修改;(2)有保留地通过评审(Approved with Reservations):审稿人认为论文有学术价值,但要求对论文进行一些小的修改,或进行具体的、一些关键部分的修订工作;(3)不通过评审(Not Approved):审稿人认为论文的质量很差,并且存在严重破坏研究结果和结论的根本性缺陷。论文经过评审后,审稿人的相关信息、评审结果以及具体评审意见将随论文一同展示出来。如果作者决定修改论文以回应审稿人的意见,所有审稿人将被邀请为修改后的论文提供补充报告。如果审稿人最初给出的是 “Approved with Reservations”或 “Not Approved”,F1000 Research将鼓励他们进行重新审查。
F1000 Research支持修改和多次提交,文章的同行评议结果会随着文章内容的修改而不断更新,并且无论同行评议结果如何,F1000 Research都会完整地发表该结果。一旦一篇文章收到2个“Approved”或2个“Approved with Reservations”和1个“Approved”,它将被PubMed和其他数据库收录。文章的所有版本以及任何相关的数据集和评审报告都被存储在PubMed Central中。如果作者在一段时间之内无法邀请到审稿人,则文章可能会被标记为“Peer Review Discontinued”(同行评议停止)。
2.5 构建评估体系,支撑科研评估
为了进一步提升预印本的影响力,预印本平台引入了各种类型的指标体系,从不同角度对论文进行评估评价。例如,SSRN结合相关指标统计平台论文、作者和组织的相关数据形成评估体系,从多个方面对预印本进行价值评判,以支撑科研评估。SSRN从3个方面衡量一篇论文的影响力:论文统计数据、排名情况和 PlumX 指标(PlumX Metrics)[20]。论文统计数据可以在每篇论文的摘要页面中查看,包括文章浏览量、下载量和其他论文级统计指标(如被引频次等)。排名情况则是SSRN根据一些相关的衡量标准,对平台中的论文、作者和组织的排序。其中,论文排名主要是论文下载量的排名,包括历年下载量最多的10篇论文(历年Top 10论文),以及在过去60天内SSRN电子期刊发布的各类论文中下载量排名前10的论文(近期Top 10论文)。参与作者排名的作者必须在SSRN上发表过公开的学术性论文全文,参与排名的组织必须满足SSRN的特定标准。PlumX指标主要评估网络环境中各项研究成果(文章、会议记录、书籍等)的传播效果,其为各类学术研究成果制定了合适的研究指标,包括被引频次(Citations)、使用情况(Usage)、捕捉量(Captures)、提及量(Mentions)和社交媒体(Social Media)互动量[21]。
除SSRN提供的影响力指标外,其他预印本平台也在论文界面提供了各自制定的计量指标。bioRxiv的Metrics界面记录了该篇论文的使用情况,并可显示其当月或近6个月内的浏览量、下载量和Altmetric指标;Research Square的Engagement功能展示了论文在平台上的浏览量与下载量,以及Altmetric、Dimensions指标;F1000 Research中的Metrics数据记录了论文在平台上的浏览量与下载量,以及其在PubMed Central中的浏览量与下载量(每个月更新一次)。同时,F1000 Research的Metrics数据记录了论文在Scopus数据库以及PubMed数据库中的被引频次,以及论文的Altmetric、Dimensions指标。
3 总结与启示
基于当前不断进行功能创新的预印本平台,本文归纳了以下几种功能创新方向。
(1) 融入社区,进行开放创新协作。通过与外部机构关联、合作,提升预印本在整个学术交流生态中的影响力,促进学术成果的早期传播与交流,并为相关领域的科研人员提供研究思路。
(2) 引入各类科学讨论与评论渠道支撑论文的开放评审,有效推动预印本学术交流与预印本的正式发表。
(3) 通过预印本平台增值服务帮助作者进一步完善论文内容,打造高质量论文,推进论文发表进程。
(4) 有效结合传统引文计量指标,提供多维度的评估指标,以提升预印本的影响力。更多元的内容指标数据有助于读者理解研究论文对科学和社会的潜在影响,可帮助读者快速发现高质量论文。多元化的指标也可帮助作者评估个人成果的影响力。
(5) 围绕论文内容展开的数据、资料等学术成果的多样化发布途径逐步被打通。除了研究论文外,预印本平台也为其他形式的研究成果提供发布渠道,如:F1000 Research发布学术海报、幻灯片和文档,主要涵盖生命科学和医学领域;Research Square可发布视频内容与实验室手册[22],具体包括实验过程、计算模型、设备操作方法等,为文章提供客观的、具有说服力的实验证据。SSRN通过集成Mendeley Data,允许研究人员在提交论文时或论文提交后上传研究数据[23],并在文章页面中显示。
国际预印本平台的各种特色功能对我国预印本平台的未来发展具有很强的启示作用,需要引起各界的广泛关注。我国的预印本平台亦可借鉴上述平台功能创新的成功案例,具体举措包括:与科研团体与学术社区开展有效的合作,如开发预印本评论板块、邀请专家公开提出评审意见、链接到社交媒体平台(微博、知乎、豆瓣等)等;引入各类统计指标评估预印本在各平台中的影响力,从而进一步扩大预印本的影响范围;与第三方合作,开展稿件编辑、润色与推广等服务,切实满足作者需求。良好的服务功能将带给用户更好的体验感,并可进一步提升预印本及平台本身的影响力;在吸引更多潜在用户的同时,使更加广泛的群体受益。
4 结语
经过对五大预印本平台功能创新方向的梳理可以发现,平台的功能创新强化了预印本在学术交流中的主导作用,使预印本平台能够更好地融入学术环境。本文选取相应的预印本平台,对每个创新功能进行了分析;总结当前功能创新的发展方向,对我国预印本平台的功能开发提出初步建议。国外预印本平台的功能创新对我国学术出版的各个环节具有良好的启示作用,可为日后学术期刊引入预印本模式,推动出版流程改革,以及提供增资服务提供参考和借鉴。