APP下载

国内外预印本系统比较研究与展望*

2021-01-18康宏宇孙月萍孙良龙

医学信息学杂志 2020年11期
关键词:印本科研人员论文

康宏宇 钱 庆 李 姣 王 青 孙月萍 孙良龙 侯 丽

(中国医学科学院/北京协和医学院医学信息研究所 北京 100020)

1 引言

1.1 预印本概念及作用

随着开放获取、开放研究、开放数据、开放创新不断发展,重要科技大国陆续推出国家开放科技政策,以预印本交流为代表的新型学术交流模式正不断冲击传统学术出版模式。预印本(Preprint)是指科研工作者的研究成果尚未正式在学术期刊上发表,出于和同行交流的目的,自愿先在学术会议上或通过互联网发布的科研论文、科技报告等[1]。基于开放获取和开放透明评议的预印本交流不仅可以快速、广泛地传播研究成果,避免正式出版中论文发表时滞问题,帮助科研人员确立个人科研成果首发权,还可以让作者提前了解读者评论,有效提高论文质量和交流效果,同时对于提升研究主体学术声誉,争取国家在领域内科技学术话语权具有重要意义。

1.2 预印本发展概况

近些年在开放获取、开放科研等大潮影响下,借助计算机网络技术迅猛发展,预印本和基于预印本平台的学术交流得到科学界高度关注[2]。美国物理学家保罗·金斯帕(Paul Ginsprarg)创立的首个预印本数据库arXiv发展至今已成为典范。面向不同学科领域的预印本平台不断推出,包括生物科学领域的bioRxiv、农业领域的AgrXiv、化学领域的ChemRxiv、心理学领域的PsyArXiv以及图书情报学领域的e-LIS等。2016年由中国科学院国家科学图书馆建设的中国科学院科技论文预发布平台ChinaXiv上线运营,旨在鼓励我国科研人员将科研成果第一时间发布在国内预印本平台上。2020年初新型冠状病毒肺炎(COVID-19)爆发期间,各大预印本系统发挥重要作用,对有关流行病学、临床实验、传播趋势、治疗方案和临床结局等方面的科研成果进行及时、快速的发布和报道。本文对包括arXiv、bioRxiv、ChinaXiv在内的国内外知名预印本系统进行详细介绍,从其系统功能、投审稿机制、政策声明、合作模式等方面进行对比分析和进一步思考。

2 arXiv预印本平台

2.1 概况

1991年8月美国物理学家保罗·金斯帕在美国洛斯阿拉莫斯国家实验室创立arXiv,现由康奈尔大学运营维护。最初arXiv仅面向物理领域公开征稿,随着开放获取发展,已经扩展到物理、数学、计算机科学、定量生物学、定量金融学、统计学、电气工程和系统科学、经济学8个学科领域[3]。截至2020年5月27日arXiv共收录学术论文1 706 814篇。在新型冠状病毒肺炎爆发期间,arXiv平台以其涵盖的计算机、物理学、统计学等领域为起点,快速发表与COVID-19相关的疫情传播、流行病管理、趋势预测、干预成效等研究内容,借助人工智能、深度学习、数据建模等方法助力疫情防控。

2.2 功能介绍

2.2.1 在线提交[4]论文提交过程中,除需要填写论文基本信息外,作者可以(La)TeX、AMS(La)TeX、PDFLaTeX、PDF以及带有JPEG/PNG/GIF图像的HTML等多种格式对科研成果进行上传和提交。需注意系统不接受除a-z A-Z 0-9 _ + -., =字符外的其他字符出现在文件名中,文件名之间需要区分大小写。为达到科研成果快速交流的目的,arXiv允许作者更新论文内容,但更新版本时需明确指出新版本在哪些地方进行完善和更新,如添加参考文献、更改错别字或修改某节内容的论点。作者可以撤销未发布的论文,但已在系统发布的论文不可撤回。

2.2.2 阅读浏览 用户可以按照学科分类浏览系统发布的论文,也可按照提交时间(近1日、近5日、近1月、指定之间范围提交)进行筛选浏览。同时arXiv论文浏览页面提供该篇论文作者、摘要、引用格式、提交及修订记录;如果论文内容是对前期研究的改进但内容变化较大、需要作为单独论文出现时,浏览页面提供前期研究论文arXiv ID,便于用户进行追踪性阅读。

2.2.3 检索下载 arXiv允许用户对论文进行多角度检索,方便用户快速、准确找到感兴趣的论文,具体包括题名,作者(姓名、ORCID),摘要,评论,DOI,arXiv ID,期刊信息,美国计算机协会(Association for Computing Machinery,ACM)知识点分类,数学文献分类法(Mathematics Subject Classification,MSC),全文,发表时间等多种类型的检索。PDF是arXiv论文下载的主要格式,根据每篇文章提交内容和格式不同,网站也提供PostScript、HTML、源文件等其他格式下载链接。

2.3 审稿机制

随着预印本提交数量增多,arXiv论文审核机制从先期“自动提交,文责自负”逐渐转变成“推荐提交、审核发表”并引入审核认可双重机制,即先认可作者后审核论文,要求不活跃的研究者在提交预印本时得到该领域活跃研究者的认可[5]。双重审核机制于2004年1月建立并实施至今,保证论文内容基本质量。

2.4 政策声明

根据预印本系统定义及功能,论文在arXiv上发布后,作者本人仍然独立拥有论文版权,可根据其共享意愿授权论文发布后的共享范围,具体是指知识共享许可协议(Creative Commons License,CC协议)中的多项条款,目前arXiv支持的共享范围包括CC BY 4.0、CC BY-SA 4.0、CC BY-NC-SA 4.0 3类。另外为顺应开放共享大环境,arXiv鼓励作者以知识共享公共领域贡献协议(Creative Commons Public Domain Dedication,CC0 1.0)的形式对论文元数据进行公开和发布。作者需要授权arXiv以非排他性且不可撤销的许可进行论文分发与共享。已经提交至预印本系统的论文可以在期刊继续发表和转让给第3方,已提交到系统的论文一经发布不可撤销。

2.5 合作运营模式

目前arXiv由康奈尔大学负责维护与管理,由康奈尔大学图书馆和美国国家科学基金会中的西蒙斯基金会共同提供经费支持,其中康奈尔大学图书馆提供其预算的37%。为了arXiv 的稳定性和持续发展,康奈尔大学图书馆制定一个多方筹措经费的可持续发展规划。2010年起arXiv在各学术机构、研究中心和政府图书馆中实行会员制,根据近3年平均下载文章数排名收取会员费用。2010 年共有11个国家的123家机构成为会员,获得36万美元收入, 2020年这项收入预计有55万美元。

3 生物医学领域预印本平台:bioRxiv 及medRxiv

3.1 概况

3.1.1 bioRxiv 目前生物医学领域各项技术发展迅速、成果显著,每年科研产出在所有学科领域中发文比例最高。2013年11月美国非营利性研究和教育机构冷泉港实验室借鉴arXiv预印本系统的建设经验,推出专门面向生物学领域的预印本平台bioRxiv[6],旨在促进生物学领域科研成果快速交流与共享。涉及学科包括动物行为与认知、微生物学、生物化学、分子生物学、病理学等在内的25个一级学科。截至2020年5月27日共发布83 701篇论文。为确保发布论文的科学性和专业性,bioRxiv邀请近140名领域科学家对提交的论文进行审稿。

3.1.2 medRxiv bioRxiv 只针对生命科学领域,不涉及医药领域。因此临床实验和其他与医学相关的研究无法发表预印本[7]。2019年6月由美国冷泉港实验室、耶鲁大学和《英国医学杂志》(BritishMedicalJournal,BMJ)共同创立medRxiv,面向全国医学、临床、健康相关领域的科学人员公开征稿。其中冷泉港实验室负责全面经营和维护medRxiv平台及预印本服务器;BMJ凭借其在临床研究发表和论文审查方面的长期经验,对医学领域科研成果出版过程中的开放获取出版、数据共享、伦理道德、利益冲突等进行研究;耶鲁大学Harlan Krumholz和Joseph Ross则作为临床研究人员给予预印本服务极大的支持。medRxiv涉及急诊医学、心血管医学、肿瘤科学、老年医学、卫生经济学、卫生政策研究、医学教育、医学伦理学、健康信息学等51个医学相关的学科分类。从2019年6月发布第1篇论文至2020年5月27日的1年时间内,medRxiv共收录1 811篇医学领域论文,平均每月收录并发布180篇论文;在新型冠状病毒肺炎爆发期间,medRxiv收录与COVID-19相关论文共3 448篇,可见medRxiv的出现及时为医学领域科研论文的快速交流与传播提供服务保障与支撑,为应对公共卫生领域突发事件提供学术交流平台。

3.2 功能介绍

3.2.1 投稿 由于生物学及医学领域科学研究的特殊性,系统只接受相应学科领域中的研究性论文、系统评价及分析、临床实验方案/计算方法及数据类文章,不接受病例报告、叙述性评论、社论、信函、片断性观点/缺少实验论证的假设、实验室章程、学位论文和教科书摘录等类型的文章[8]。当投稿论文涉及临床试验或前瞻性研究时,作者需要先在clinicaltrials.gov完成注册,在论文中提供该中心的注册编号,或说明所在国家/地区/机构的伦理委员会的道德标准,提供该委员会的标准文件。提交稿件时,文本文件需为Word、WordPerfect或PDF格式, TeX文件(包括LaTeX)需要转换成PDF格式才可提交,图片和表格支持GIF/TIFF/EPS/JPEG格式的提交。

3.2.2 检索浏览 系统主页设计以简约为主,主页检索仅支持单一输入检索,不支持作者、关键词、DOI等分类检索,分类检索功能集成在高级检索功能中。用户可以在以下范围进行限定检索:时间范围、学科分类、文章类型;作者、题目、摘要、全文;DOI;时间顺序排序/相关度排序。高级检索功能支持用户在bioRxiv和medRxiv之间相互检索,为用户获取领域内的知识服务提供便利。

3.2.3 下载 论文一经接受就以PDF格式进行发布并供用户下载,同时技术部门会进行PDF到HTML和XML的格式转换,PDF发布两天内会显示全文的HTML和XML格式,为更广泛的文献挖掘奠定基础。

3.3 政策声明

bioRxiv和medRxiv都采取免费发表方式, 但开放程度与arXiv有所不同。bioRxiv和medRxiv为用户提供CC BY、CC BY-NC、CC BY-ND、CC BY-NC-ND、CC0或不重用等多种知识共享许可方式。在隐私政策方面二者共同遵守冷泉港实验室隐私政策[9],对个人身份数据、汇总信息、网站Cookies信息等的收集和使用进行详细说明。

3.4 合作期刊及基金支持

目前bioRxiv与medRxiv与多家期刊合作,形成"B2J(bioRxiv to journal)"[10]和"M2J(medRxiv to journal)"[11]合作模式,预印本发表后直接推荐到期刊接收同行评议,极大减轻作者在预印本发表后仍需寻找合适期刊并再次进行论文投稿的工作量,进一步推动科研成果的快速交流和传播。其中bioRxiv拥有包括《临床科学》(ClinicalScience)、《欧洲分子生物学组织杂志》(TheEMBOJournal)、《微生物学》(Microbiology)、《科学》(Science)在内的近180种合作期刊;medRxiv的合作期刊包括《英国医学杂志(开放获取版)》(BMJOpen)、《公共科学图书馆·医学》(PLOSMedicine)、《医学互联网研究杂志》(JournalofMedicalInternetResearch)、《细胞、组织、器官》(CellsTissuesOrgans) 等30种。另外bioRxiv于2017年获得陈扎克伯格基金会(Chan Zuckerberg Initiative, CZI)的资助,保障平台长期稳定发展。

4 ChinaXiv预印本平台

4.1 概况

ChinaXiv(http://chinaxiv.org)于2016年6月正式上线提供服务,平台由中国科学院国家科学图书馆维护和运营,是一个面向科研人员、规范的自然科学领域的中国科研论文开放仓储库,接收中英文科学论文预印本存缴和已发表科学论文开放存档[12]。截至2020年3月14日平台接收论文13 501篇,涵盖物理学、生物学、地理科学、天文学、计算机科学、能源科学、材料科学等29个学科领域。

4.2 功能及政策声明

系统建设方面,ChinaXiv支持PDF/WORD/ WPS Office/ Latex等多种论文提交格式,音频、视频文件可以rar、zip压缩包形式上传。提交到系统的论文会通过自动检查和关联匹配辅助论文管理人员进行审查管理,确保论文质量。论文提交过程中,作者可在CC BY 4.0、CC BY-SA 4.0、CC BY-NC-SA 4.0、CC0 1.0中选择一种许可协议,使ChinaXiv有相应的权限对论文进行分发和共享。另外ChinaXiv鼓励作者在提交论文手稿同时提交“论文责任者(论文作者)研究身份识别材料”,有利于平台快速识别作者研究身份,进而及时公开论文手稿。ChinaXiv为用户提供最新提交、热门论文、学科分类等多维度论文浏览,便于用户快速追踪到关注的主题和文章。系统可根据用户关注的学科分类、主题词等提供个性化的定制推送服务。

4.3 合作期刊及机构

目前ChinaXiv已与《中国科学院院刊》、《金属学报》、《生态学报》、《工程热物理学报》、《中国生物工程杂志》等22家期刊合作,建立优秀稿件的双向推送机制[13],合作期刊可从ChinaXiv遴选优质论文稿源,向论文提交者推荐其论文合适发表的期刊。同时在征得作者同意情况下,合作期刊可将优质论文预印本推送提交到ChinaXiv平台。ChinaXiv与中国科学院心理研究所、中国生物工程学会、中国科学院武汉岩土力学研究所、北京大学中国语言学研究中心4家单位分别合作共建4个预印本子库,拓展国内预印本交流学术领域,分别是中国心理学预印本平台PsyChinaXiv、中国生物工程预印本出版平台、ChinaXiv岩土力学预印本平台和中国语音乐律预印本平台。

5 预印本系统比较分析

预印本系统相比于传统期刊评审速度快、发表周期短,且作者能够第一时间将学术成果与领域学者进行分享并快速得到反馈,大大缩短科学成果交流周期。这些优势使得预印本系统能够快速发展,在科研人员中的影响力也逐渐提升,在提高学术交流时效性的同时促使科学研究模式向着开放科学和开放学术交流体系不断发展。虽然各大预印本系统所面向的学科领域不同,但近些年都根据发展需要对系统可接受的学科分类进行扩展或建设分领域预印本子平台,形成成熟的论文审核机制。预印本系统建立目的是向科研人员提供快速交流研究成果的渠道,使用开放著作权许可协议有助于加速这种交流[14]。目前国内外预印本系统均使用知识共享许可协议,除共通的CC BY 4.0(署名)共享方式外,不同预印本系统为作者提供不同限定的开放协议,使开放程度略有差异,如arXiv和ChinaXiv支持CC BY-SA 4.0(署名-相同方式共享),而bioRxiv和medRxiv支持CC BY-NC署名-非商业性使用)和CC BY-ND(署名-禁止演绎)。对现有国内外预印本系统在功能、学科领域、投审稿机制、政策等方面进行对比,见表1。

表1 国内外预印本系统对比

6 总结与展望

6.1 概述

预印本服务在本质上鼓励科研人员公平竞争,近年来其发展迅速且稳定,已经成为科技领域重要的资料来源之一,影响力不亚于领域内任何一种重要期刊[15]。以arXiv为代表的预印本系统通过可持续发展模式,不断探索,为预印本服务发展奠定基础;之后以bioRxiv、medRxiv为代表的领域预印本系统相继推出,为不同学科科研成果的精准交流提供支撑。与此同时,大型出版机构及学协会对预印本投稿都采取积极政策,科研人员将科研成果在预印本平台发布后无需顾虑是否可以再次在期刊上刊登,更有《公共科学图书馆·医学》等期刊与预印本系统形成固定合作机制,为预印本刊登提供捷径。鉴于此本文就预印本服务未来发展进行思考与展望。

6.2 加速知识开放共享是未来学术交流的主流趋势[16]

近年来预印本服务凭借其发布速度快、便于学术交流、及时获得反馈意见等优势迅速发展,也在一定范围内获得不同学科领域科研人员的认可。预印本服务在为学术研究成果向全球科学界传播提供重要渠道的同时,还为科研人员确立科研成果首发权。在开放科研大背景下,以学界自治为基础的预印本学术交流模式正在改变传统以期刊为主体的单一学术交流模式[2],成为全周期公开透明科研模式中重要的一种。

6.3 亟待建立面向我国生物医学领域的预印本系统

新型冠状病毒肺炎的全球大流行,bioRxiv、medRxiv发挥了重要作用。此前我国一直缺乏面向生物医学领域的预印本服务平台。2020年1月科技部发布《科技部办公厅关于加强新型冠状病毒肺炎科技攻关项目管理有关事项的通知》,指出为确保高效率、高质量完成新型冠状病毒肺炎防控科技攻关任务,各项目承担单位及其科研人员要坚持国家利益和人民利益至上,把论文“写在祖国大地上”。由此可见,此次疫情的暴发更加突显出建立我国生物医学领域预印本仓储平台的紧迫性与必要性,让最新的科研成果第一时间发布在国内学术交流平台上,加速研究成果本土传播。同时也对预印本服务平台提出更高要求,面对疫情快速发展必须做到快速响应,同时保证稳定服务和严格质控,确保论文科学性、合理性和正确性。

6.4 预印本服务发展需要社会各界的共同支持与参与

我国开放获取的多项技术与服务正处于发展阶段,预印本服务正是其中的一项公益性、基础性、长期性的事业,需要社会各界共同支持和参与。借鉴国际预印本服务发展经验,政策先行可以充分引导预印本服务发展方向并提高其认可度。在我国若能获得各部委及各级研究机构自上而下的政策支持,包括科研项目管理办法等对预印本的采纳,可以极大提高科研人员对预印本服务的认知度,进而营造更加自由、开放、和谐和国际化的学术交流环境。加强与领域学会、出版机构、杂志社的合作,形成稳定合作模式,为预印本正式发表提供捷径。作为预印本系统主要服务对象,科研人员是其最大服务群体也是最大受益者,只有充分提高科研人员对预印本服务的认知度和认可度,才能保证预印本系统长期稳定发展。

猜你喜欢

印本科研人员论文
2021年版ICMJE推荐规范的更新内容
预印本学术交流体系参与主体权益调研与启示
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
科研人员揭示油桃果实表皮不长毛的奥秘
科研人员破译黑猪肉特征风味物质
开放融合环境下预印本发展态势分析*
我国科研人员揭秘银杏古树长寿机制
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登