国内外预印本系统调研与启示
2021-07-09周阳
周 阳
(中国药科大学图书与信息中心,江苏 南京 211198)
预印本(Preprint)一般指科研成果正式出版前,本着自愿原则,出于同行交流目的,先通过互联网发布的文章。预印本的优势主要体现在:1)可避免因审稿人偏见导致成果无法被广泛知晓;2)传播速度快;3)可获得修改建议,使作者完善成果,提高发表率;4)提供首发证明,保护首创权益。
1 研究方法
本研究主要采用网站调研的方式,选取当今国内外10个较为知名且覆盖多个不同学科的预印本系统作为调研样本进行调研:arXiv、ChemRxiv、bioRxiv、medRxiv、engrXiv、SocArXiv、PsyArXiv、LawArXiv、MDPI Preprints、ChinaXiv。此次调研内容主要包括:运营管理、资金来源、平台软件、组织检索、资源内容、使用统计、存储政策、共享政策、质量控制、学术服务、人员配置、宣传推广等方面。ChinaXiv是目前我国较知名的预印本系统,它代表了我国预印本系统目前的状况,将其与国外预印本系统放在一起调研比较,能够将我国预印本系统目前的优劣处更凸显出来,对提出我国预印本系统进一步发展的策略参考更有帮助。
2 调研结果
2.1 运营管理与资金来源
运营管理关乎预印本系统的顶层设计,资金来源又是预印本系统的构建基石,这是预印本系统最不可或缺的两个方面。调研样本的运营管理与资金来源情况详见表1。
表1 预印本系统运营管理与资金来源情况
续表1
arXiv运营管理主要有4个团队:1)科学委员会,由科研人员组成,提供政策建议;2)成员委员会,由成员机构组成,就业务规划等问题投票表决:贡献组织(至少7个)、高贡献组织(最多5个)、西蒙斯基金会(1个),此外还有5名无表决权成员;3)技术委员会,负责审查和讨论技术决策;4)康奈尔行政工作人员。bioRxiv顾问委员会委员主要来自Cold Spring Harbor Laboratory、Google、American Society for Microbiology、Harvard、HighWire Press等机构。ChemRxiv、engrXiv、SocArXiv、PsyArXiv、LawArXiv、MDPI Preprints也是如此,可见,设顾问委员会(科学委员会或指导委员会)是当下预印本系统较普遍的管理方式,且委员多来自学科内权威机构,包括高校、图书馆、实验室、公司、研究机构、出版社、联盟协会等,数量从几人到上百人,职责是为预印本系统决策提供建议。由表1可知,预印本系统的主要资金来源有:运营机构、基金会、会员机构、捐赠、公司企业、合作组织等。
运营管理上,ChinaXiv和大多数受调研的系统一样也设科学咨询委员会和用户咨询委员会,且委员也是来自中国科学院、国内知名高校和图书馆的专家。资金来源上,ChinaXiv是唯一一个靠政府拨款运营的预印本系统,其优势是资金来源稳定可靠,但资金来源过于单一、广泛性不强,社会其他机构的参与度也较低,且政府拨款的资金在使用灵活度上有一定的制约。
2.2 平台软件与组织检索
平台软件是预印本系统重要的“硬件配置”。调研样本中除了LawArXiv和ChinaXiv,其余8个都涉及GitHub平台。GitHub是一个基于Git的代码托管平台,于2008年4月正式上线,目前在GitHub上托管的代码包已超1亿个。10个受调研的系统中还有4个是基于Open Science Framework Preprints平台构建的,如engrXiv、SocArXiv、PsyArXiv、LawArXiv。Open Science Framework Preprints的主要推动者是Center for Open Scinece组织,该平台可提供免费存储空间,且无容量限制,还自带版本控制,可实现多人远程协作,如创建一个project可添加多人编辑权限,还可关注其他project,也可与其他平台对接。ChemRxiv基于 Figshare平台构建,英国Macmillian出版公司的分支机构Digital Science负责对Figshare提供资金、技术支持与功能优化,开放的存储空间不设限,且为注册用户提供20GB个人存储空间,单个文件最大支持5GB,支持科研成果快速被引用、共享与发现。
组织检索是预印本系统重要的“软件配置”。调研样本中engrXiv、SocArXiv、PsyArXiv、LawArXiv使用的是较常见的检索途径:学科主题、题名、关键词、日期;ChemRxiv与前面4个预印本系统相比,将学科主题替换成开放许可;arXiv检索途径最多,除了上述4种常用途径,还有作者、评论、参考文献、文章号、arXiv标识符、数字对象唯一标识符(DOI)、开放研究者与贡献者身份识别码(ORCID)、arXiv作者ID;bioRxiv、medRxiv也有DOI检索,除常用的4个途径,还新增作者、摘要、全文检索和资源格式;MDPI Preprints 也有DOI检索,除了上述常用的4个途径,还新增作者、摘要、文献类型和匹配度。
ChinaXiv的构建平台是EPrints。EPrints由南安普顿大学开发,是目前国际上存储库构建的主要系统平台之一,其团队也提供软件的托管、培训与咨询等相关服务,最新版本为EPrints3.4。EPrints平台的OAI兼容性较强,ChinaXiv基于OAI协议支持第三方在遵循CC BY 3.0许可的前提下,提供有效的OAI-PMH 2.0(开放存储先导计划元数据收割协议)开放接口,将ChinaXiv平台文章的OAI-DC元数据及应用嵌入第三方平台,如中科院文献情报中心集成检索平台等。检索途径上,ChinaXiv在4种基本检索途径的基础上还增加了作者、摘要、分类和论文号。此外,为方便用户实现多途径检索,ChinaXiv还可以继续增加检索途径,如DOI、ORCID等。
2.3 资源内容与数据统计
如果系统平台是“骨架”,那资源内容就是“血肉”。资源内容的调研主要从学科范围、存储数量和资源类型三方面着手(涉及数据截止日期为2020年9月16日)。
资源的学科划分:1)“主学科+细分学科”或研究主题,如arXiv的“物理学+天体物理学”等13个细分学科或研究主题;MDPI Preprints的“艺术与人文+语言学”等15个细分学科或研究主题。2)学科分类和研究主题混合组织在一起,如ChemRxiv主要是化学学科的无机化学等24个细分学科或研究主题;bioRxiv主要是生物学的古生物学等27个细分学科或研究主题;medRxiv主要是医药学科的成瘾药物等51个细分学科或研究主题;SocArXiv主要是社会科学类的教育类等4个细分学科或研究主题;PsyArXiv主要是心理学的临床心理学等10个细分学科或研究主题;LawArXiv主要是法学的商法等10个细分学科或研究主题。3)按研究主题组织,如engrXiv涵盖研究主题如建筑工程等22个。
资源数量百万级的只有arXiv(1 762 888 份);资源数量万级的有4个:bioRxiv(96 838 份)、MDPI Preprints(16 286 份)、PsyArXiv(11 476 份)、medRxiv(10 977 份);资源数量千级的有4个:SocArXiv(6 269 份)、ChemRxiv(6 060 份)、LawArXiv(1 319 份)、engrXiv(1 233 份)。资源类型主要是尚未发表的学术论文,而 SocArXiv还存储一些工作论文、已发表论文、数据和代码;ChemRxiv还存储一些数据集和在线资源。
数据统计是对资源内容建设情况的一个考核指标,主要从“资源上传”和“资源使用”两个方面进行统计(涉及数据截止日期为2020年9月18日)。“资源上传情况统计”是以“作者”为切入点,主要包括作者发文统计、作者机构统计、作者提交时间及作者发文主题等:1)统计发文作者的系统有1个:MDPI Preprints 有作者数量统计 61 193 人;2)统计作者提交时间的系统有4个:arXiv有每月提交总量统计,bioRxiv和medRxiv可选择不同年份或月份查看上传资源,MDPI Preprints有最新上传的3篇文章展示。“资源使用情况统计”是以“用户”为切入点,调研的10个系中有7个系统提供用户使用资源情况统计:arXiv有日使用统计、月下载统计、每年会员机构使用量排名;ChemRxiv每篇文章都有点击、下载和引用量统计,默认提供一周点击和下载量统计,也有月和年下载量统计、总点击和总下载量统计,还有点击量最高的前10篇论文展示,以及从哪个网站链接到本站次数排行;engrXiv、SocArXiv、PsyArXiv、LawArXiv每篇文章都有下载量统计;MDPI Preprints有月点击量统计。
ChinaXiv的学科划分虽然没有“‘主学科+细分学科’或研究主题”那么细致,但是将学科分类和研究主题分成两个组织方式,学科方式主要有生物学等28个学科分类,研究主题方式主要有核物理学等17个研究主题。将“学科”与“研究主题”分开,而不是混合组织在一起,不但增加了用户浏览的途径,也让资源呈现更清晰。ChinaXiv的资源数量也达到万级(14 002 份),在所有调研样本中排第四,与排第一达百万级的arXiv相比,其存储量上还有很大的提升空间。和大部分调研的系统一样,ChinaXiv的资源类型的存储都是学术论文预印本,为吸收更多的学术资源,也可适当放宽资源类型的要求。“资源上传情况统计”方面,ChinaXiv是最全的,涵盖:1)作者发文统计:列出前99位的作者发文数量;2)作者机构统计:列出前99个机构发文数量;3)作者提交时间:有最新提交统计;4)作者发文主题:有每个主题的资源量统计。用户“使用情况统计”方面,ChinaXiv的每篇文章都有点击、下载量统计,可根据点击、下载量排序,ChinaXiv还侧重在对“资源使用”的统计,并没有对“用户行为”进行统计,可参考arXiv增加对用户的统计,如年下载量机构排名、地区排名等,亦可参考ChemRxiv统计用户从哪个网站链接到ChinaXiv,通过分析用户行为,优化自身平台设计。
2.4 存储政策与共享政策
存储政策与共享政策是从“资源提交”和“资源共享”两个方面对系统存储的预印本资源进行规范。
存储政策主要是从提交格式、提交时间、提交方式、提交要求、修改删除和版权政策进行规范:1)提交格式。arXiv要求PDF、JPEG、PNG、GIF格式;bioRxiv、medRxiv、engrXiv、SocArXiv、PsyArXiv、LawArXiv要求存储的手稿为一个包含文本、图表的PDF、Word、Latex或WPS文件,补充数据单独提交;ChemRxiv要求PDF格式,英文语种且文件大小不超过5GB;bioRxiv、medRxiv也明确要求英文语种。2)提交时间。arXiv规定标准时区14:00前提交的文档,当天20:00可公开,也可能审核延迟,周五、周六不公开。3)提交方式。arXiv要求作者自行提交,如由第三方提交须是在作者书面确认的前提下。4)提交要求。arXiv、ChemRxiv、bioRxiv要求提交的文档真实准确,符合学术交流公认标准的主题性和可评审性,不得侵犯任何实体的任何权利;engrXiv、SocArXiv、PsyArXiv、LawArXiv要求不得上传有害计算机代码。5)修改删除。bioRxiv、medRxiv、SocArXiv、PsyArXiv、MDPI Preprints规定可提交修改版,但修改版与原版使用相同DOI号,都可公开,补充资料必须随附于每一个版本;所有调研的系统都要求如文档有冒犯性言语、非科学内容、剽窃材料、不符合伦理标准以及用于非法目的就会被删除。6)版权政策。预印本版权一般归作者所有,只要不与系统的开放许可冲突,作者可与期刊签订出版协议,很多期刊也允许研究成果出版前在预印本系统发布,因此,作者可使用SHERPA/RoMEO查询期刊相关政策,以保证研究成果在期刊的正式出版。而在此次调研的10个系统中,bioRxiv、medRxiv可直接从预印本系统传输手稿到同行评审系统或投稿期刊。
10个受调研系统共享政策的相同部分主要有:作者必须同意在非排他性、不可撤销和免版税的许可下再去使用其他知识共享许可,且作者需证明自己有权授予此许可。在知识共享许可的选择上,除绝大部分都使用创作共用署名许可(CC BY 4.0)或直接使用Creative Commons Public Domain Dedication (CC0 1.0)许可,样本还分两个流派:1)创作共用署名——相同方式共享许可(CC BY-SA 4.0),创作共用署名——非商业——相同方式共享许可(CC BY-NC-SA 4.0),如arXiv;2)创作共用署名——非商业许可(CC BY-NC 4.0),创作共用署名——不可衍生许可(CC BY-ND 4.0),创作共用署名——非商业——不可衍生许可(CC BY-NC-ND 4.0),如ChemRxiv、bioRxiv、medRxiv。
存储政策主要的6个要求里,ChinaXiv较明确的有5个:在“提交格式”上有对文件格式和补充数据的要求:要求存储的手稿为一个包含文本、图表的PDF、Word、Latex或WPS文件,补充数据单独提交,但是没有对语种和文件大小有要求;在“提交时间”上目前没有明确要求,可参考arXiv设置提交和公开时间;在“提交方式”上较灵活多样:ChinaXiv接受用户自行提交,用户也可将论文、许可协议、身份识别等发至工作人员邮箱,工作人员批量提交;“提交要求”较明确:要求提交的文档真实准确,符合学术交流公认标准的主题性和可评审性,不得侵犯任何实体的任何权利,也可以补充对有害代码上传的要求;在“修改删除”上缺少对修改版的提交要求,可增补;在“版权政策”上可借鉴bioRxiv、medRxiv直接从预印本系统传输手稿到同行评审系统或投稿期刊。在共享政策上,ChinaXiv主要使用CC BY-SA 4.0和CC BY-NC-SA 4.0两种许可,还另设了一些规定如“第三方若出于非商业目的将ChinaXiv内容转载,应在作品显著位置注明‘内容源于ChinaXiv’,并给出ChinaXiv网站链接,若需对内容进行修改或用于商业目的,应联系ChinaXiv单独授权,按授权方式使用”,还规定“除提交者或预印本系统与出版商达成协议外,提交者不应向预印本系统提交从出版商网站下载的论文PDF版本,出版商拥有论文PDF版本的著作权和版式权”,总的来说ChinaXiv的共享政策趋保守。
2.5 质量控制与学术服务
存储政策的“提交要求”,主要是对提交文档内容的真实准确性提出要求,文档内容质量控制主要体现在对文档学术性的评估,体现在几个方面:1)文档分类。审核员需对文档进行学科或研究类型分类,如arXiv会对作者提交文档的学科分类进行审核,不合适的进行调整,交叉学科会被归类到主学科,在涉及的其他学科设置关联检索;bioRxiv将文档分为新研究、实证性研究与矛盾性结果研究。2)文档删除。在学术规范与内容质量审核不过关时才会删除,如arXiv对不可检索、重复、非学科收录范围,及同一作者单日提交超3篇的论文进行删除;ChemRxiv、bioRxiv、medRxiv要求必须是独立存在的研究性论文,教学材料等可能会被删除,但medRxiv允许临床研究设计方案和数据分析类文档存储,但不能侵犯患者隐私。3)作者上诉的权利及处理。arXiv规定作者有权对审核员的操作进行上诉,科学委员会进行复核,如复核结果维持原判,且作者无法提供额外信息,则不可重复上诉。4)审核人员的来源与要求也是质量控制的重要保证。arXiv的审核人员来自各学科的专家志愿者,由科学委员会批准,审核员不可私下与被审核作者联系。
预印本系统不仅要为用户提供学术资源,还要为用户提供学术服务,此次10个调研系统提供的学术服务主要有:1)学科资源订阅,如arXiv需按学科主题订阅;bioRxiv、medRxiv、SocArXiv都可通过电子邮件订阅感兴趣领域论文推送。2)开放评论及引用,bioRxiv、medRxiv、SocArXiv、PsyArXiv、MDPI Preprints能评论和通过DOI引用预印本,如一篇文章有多个版本,由于DOI号相同,则需添加特定版本的URL来引用。3)可向系统提供反馈意见,MDPI Preprints允许用户对预印本系统因性别、种族、宗教等致使歧视的问题提出上诉。
在质量控制上,ChinaXiv并没有明确可查的成文规定,因此可广泛借鉴其他国际预印本系统,在文档分类、文档删除、作者上诉的权利及处理、审核人员的来源与要求等方面形成规范化、成文版且公开可见的对提交的预印本资源的质量控制方面的明确规定。ChinaXiv提供的学术服务较全面,与其他调研的系统相比除了尚未提供预印本引用服务,学科资源订阅、开放评论、提供首发证明、推荐合作期刊、向系统提供反馈意见等学术服务均已提供,特别是ChinaXiv与《材料研究学报》等22家期刊建立的优秀稿件双向推送机制,可以让ChinaXiv向论文提交者推荐合适发表的期刊,其合作期刊也可从ChinaXiv遴选优质论文稿源,且合作期刊征得作者同意后,还可将投稿的优质论文预印本推送到ChinaXiv系统先OA,这是切实惠及论文作者与学术期刊,也切实推动预印本持续发展的好方法。
2.6 人员配置与宣传推广
预印本系统构建完成并顺利运营不仅需要有资金、技术、资源三大主要组成部分,还要有一个重要的组成部分,就是人员。维持预印本系统正常运营的人员主要涉及技术、审核、管理、服务、宣传等,各预印本系统根据自身建设规模来配置人员数量以及确定聘用人员的方式,人员配置较复杂的是运营管理团队,此内容已在前文“运营管理”部分详细介绍,不再赘述。
预印本系统除了构建运营,还有一个重要任务就是宣传推广,此次调研的系统的宣传推广方式主要有:1)利用社交平台进行宣传和互动。arXiv有Blog和Twitter,Blog主页展示最新上传内容,还可按主题浏览,并有各主题博文的数量统计;bioRxiv有Twitter,新论文会在Twitter上同步更新,bioRxiv存储论文的不同学科也都有自己的Twitter,各学科新论文也会在不同学科的Twitter发布;medRxiv也会在Twitter同步新论文;SocArXiv有Twitter、Facebook和YouTube;PsyArXiv也有Blog。2)利用新闻宣传栏宣传推广。如bioXiv、medRxiv都有新闻宣传页面。3)被知名网站索引。bioRxiv、medRxiv、SocArXiv的预印本被Google Scholar等索引。
目前,ChinaXiv在宣传推广上只有新闻宣传页面,可增加社交平台和被知名网站索引等宣传途径,提高知名度。
3 结论与启示
在分析总结10个预印本系统调研结果,特别是在比较分析ChinaXiv与其他调研系统的基础上,充分结合我国国情,为我国预印本系统的进一步发展提供启示和参考。
3.1 逐步构建多学科预印本系统联合平台,多渠道拓宽资金来源
虽然我国构建的预印本系统ChinaXiv涉及生物学、物理学、天文学、数学、化学、心理学、管理学、医学药学等28个学科,是多学科综合型预印本系统,但目前国外预印本系统主流还是从单个学科构建,因此本研究认为我国预印本系统也可以以单个学科进行构建。虽然ChinaXiv目前也有合作共建的预印本子库,如ChinaXiv岩土力学预印本平台、中国图情档预印本平台(试用)、贵州省学术预印本平台(试用)等,但既有学科性又有地域性,略显杂乱,且子库建设基本都处于初始阶段。因此,为防止日后我国预印本系统建设中人力财力的过度消耗与浪费,同一学科应极力避免重复构建,而是集中合力共同构建一个高质量的预印本系统。以药学为例,可由国内某个药科大学为主导,以“集中存储模式”构建药学学科预印本系统,其他想参与的药科大学或大学的药学院、药学类科研院所都可在此系统存储预印本,参与机构可从资金、技术、人员、资源等多个途径给予其支持。待多个学科都已构建预印本系统后,还可构建一站式检索的联合平台,综合检索多学科甚至全学科预印本资源,用户如需检索某一特定主题,特别是交叉学科的预印本,如若不清楚文章的具体学科归类可在联合平台进行检索,联合平台会直接跳转到存储资源的预印本系统。联合平台内各参与机构还可增进跨学科学术交流,吸引国外的高等学校、科研机构参与,将本机构学术成果预印本存储到我国相应学科的预印本系统,推进我国预印本系统的国际化发展,让中国学术更多地参与国际学术交流,逐步构建国际学术共同体。
此外,还需确定预印本系统的运营管理模式。单学科预印本系统的运营可参照ChinaXiv等系统设顾问委员会,委员来源也可选自参与机构和学科内的知名专家,为发展决策提供参考建议和方案评估。若系统规模较大,还可借鉴arXiv设置分工更细致的各指导委员会,如技术支撑委员会、资金筹集委员会、资源建设委员会,统筹各个方面,其委员选拔方式可与顾问委员会类似。委员会人数可根据参与机构的规模灵活确定,一般在10—100人之间。构建多学科预印本系统联合平台后,还需组建联合委员会,由各单个学科预印本系统的顾问委员会派1—2人胜任联合委员会委员,负责协调处理联合平台内各预印本系统之间的问题。
资金来源方面,ChinaXiv不同于其他调研系统,是唯一一个靠政府拨款运营的预印本系统,虽然资金来源稳定可靠,但渠道过于单一,且资金使用灵活度较低,也降低了预印本系统与其他机构组织交流合作的机会。因此我国需进一步拓宽预印本系统的资金渠道,借鉴国外预印本系统的资金来源。首先,可增加参与构建和运营机构的出资。可以参考表1的7个预印本系统依靠构建运营机构提供资金支持;其次,可增加与基金会、公司企业、合作组织在资金上的合作。表1中有3个预印本系统靠基金支持,SocArXiv的资金就来源于多个合作组织,此外表1中由公司企业提供资金的预印本系统主要有3个;再次,接受捐赠也是相对重要的资金来源。表1中有4个预印本系统接受捐赠,接受的捐赠形式包括现金、股票、基金、证券甚至遗产。
3.2 加强托管平台的利用,检索途径条理化
ChinaXiv的构建系统是Eprints,它是国际存储库构建的老牌系统之一,独立性和兼容性都很强,平台对接可继续使用OAI-PMH 2.0开放接口,OAI-PMH是一项简单灵活的元数据互操作协议,因此用Eprints来构建我国各学科预印本系统及联合平台也是不错的选择。但调研发现,除了ChinaXiv,其他国际预印本系统都已开始引入集成平台托管,构建代码也引入代码托管平台,这体现了预印本系统的一个发展趋势。OSF Preprints使用SHARE来聚合各种预印本系统的搜索结果,并建立索引。用户可直接在OSF Preprints平台存储,也可通过Dropbox、AmazonS3、Box、GoogleDrive、ownCloud等连接服务存储。目前,基于OSF Preprints构建托管的预印本系统有AfricArXiv、MindRxiv等26个之多,存储资源总量达 2 293 487 份(数据截止日期为2020年10月8日),从OSF Preprints平台可以直接链接到各托管预印本系统,大大增加了新预印本系统资源的利用率。目前,Figshare共有超过 30 000 篇内容被引用,合作机构有高校、科研院所、出版商、基金、会议、政府机构、实验室,如卡内基梅隆大学、卡里生态系统研究学院、施普林格·自然、威康基金会、《美国科学院院报》、美国环境保护署计算毒理学中心、生命科学实验室等约142个,为3个预印本系统TechRxiv、ChemRxiv和Advance提供支持托管(数据截止日期为2020年10月12日)。如果构建我国预印本系统及联合平台的终极目标是推进我国学术交流的国际化,那么直接利用已发展成熟的国际集成开放平台构建托管完全可以起到事半功倍的效果。构建和修改代码还可以利用GitHub进行代码托管,GitHub不仅是代码托管平台,也是开发者的社交网络平台,在GitHub进行代码托管的项目可以通过Pull Request形式吸引众多软件开发人员参与系统修复与优化。
资源组织检索方面,ChinaXiv在10个调研系统中处于中等水平,除了增加检索途径,还需要将检索途径条理化。综合调研情况及我国其他检索系统惯例分析,我国预印本系统或联合平台检索途径可采用一般、高级和个性化检索相结合的方式。一般检索可使用常见检索途径如分类、学科、题名、日期、关键词、作者、机构;高级检索可使用DOI、ORCID、参考文献、开放许可、文献类型、匹配度等不常用的检索途径;注册用户还可使用个性化检索,保存使用过的检索策略,或自主设置优先检索字段,还可提供评论检索,通过用户本人或他人评论内容关键词进行检索,或通过本系统文章标识符、作者ID实现内部检索。多种检索途径组织条理化,可凸显系统的人性化与个性化。
3.3 资源建设兼顾学科、数量和类型,数据统计兼顾作者与用户
预印本系统资源的建设主要从学科、数量和类型三方面进行讨论。资源的学科划分可参照ChinaXiv将预印本按照“学科”和“主题”两大方式进行独立的分类导航,这样“学科”归属存在交叉与争议的资源可通过“研究主题”类目进行存储。鉴于前文提出我国预印本系统可从单学科开始构建,因此学科内容可进一步细分,可参照arXiv、MDPI Preprints以“主学科+细分学科”进行资源划分,确保细分学科能够被充分体现,如药学学科下设很多二级学科如药物制剂、药物化学等,二级学科下还有分支学科,如药物制剂的分支学科有医院药剂学、生物药剂学等,这样可使预印本资源的学科归类更细致、准确。
资源数量方面,调研系统万级的有5个,百万级的有1个,而ChinaXiv排第四。我国预印本系统资源存储可尽量多,只有切实建成我国各学科最新科研成果展示库,才能使中国科研在国际学术界产生更大的影响力。研究表明,OA资源的引用影响已逐渐超过非OA资源,因此,我国预印本系统要避免小区域或小机构零散重复构建,同学科的机构应合力构建一个预印本系统,再在预印本系统或联合平台设“机构”的检索途径凸显各参与机构的科研能力。
资源类型方面,我国预印本系统应当如ChinaXiv一样主要存储学术论文预印本,还可将作者原稿、修改稿及无版权争议的刊发稿同时存储,使用同一个DOI不同URL实现版本的关联与区分。当然,除了学术论文,还可适当放宽存储类型以增加存储量,如准备出版的图书手稿、临床报告、实验报告都可发布,提高科研人员的积极性,总的来说应把控好两点:一是未出版,二是学术性。
在数据统计中,ChinaXiv的“资源上传情况统计”相较于其他调研系统处于领先地位。我国预印本系统可参考ChinaXiv在“提交时间统计”里设置“最近提交统计”,还可参考arXiv、bioRxiv、medRxiv增加“按年份或月份查看提交资源”。从这些统计数据中进一步挖掘学术价值,分析不同学术机构、科研团队的研究方向、学科发展及研究的冷热点等形成分析报告,为科研人员提供参考。在“资源使用情况统计”上,ChinaXiv还是侧重对“资源使用”的统计,我国预印本系统可以结合arXiv、ChemRxiv对“用户行为”进行统计,如下载机构、下载地区和引导网站的统计,并结合不同用户的资源需求,析出用户的兴趣需求和行为模式,从而优化系统平台的功能设计。这些“用户”关乎着预印本系统庞大的“作者群”和“潜在作者群”,他们既是资源的使用者,又是资源的提供者,而“平台质量”对用户的自存储行为有着显著而直接的影响。
3.4 存储政策应细致全面,共享政策应结合实际
存储政策主要包含的6个方面arXiv全部涉及,ChinaXiv已涉及5个,因此,我国预印本系统可着重参考arXiv和ChinaXiv,尽量细致全面地制订好存储政策:1)提交格式。预印本宜以PDF、WPS、Latex、JPEG、中英双语种、大小不超过5G为首选,成果的科研数据、图表需单独提供。2)提交时间。作者可随时提交,审核需1—3个工作日。3)提交方式。可采用作者自行提交、工作人员代交和第三方提交相结合的方式以方便作者的不同需求,若第三方提交需提供作者书面许可。4)提交要求。预印本须以学术研究为基础,可评审、可刊发,不侵犯任何实体的任何权利,不得上传有害代码。5)修改删除。作者可上传修改版,且每个修改版都需随附补充资料,如用户举报或审核人员在已发布的预印本中发现剽窃或不符合研究伦理等内容将有权删除。6)版权政策。预印本版权归属几乎都是作者,作者在论文投稿时需与期刊签订协议,允许论文初稿在预印本系统继续公开,受期刊评审并修改后的版本需等期刊刊发并经过期刊允许才可将刊发版公布在预印本系统,且需提供刊发期刊的稿件链接;但有一些期刊不允许发表前在预印本系统发布,因此,作者需在SHERPA/RoMEO查询各期刊相关政策,目前Elsevier、Springer、EMBOpress、IOP Publishing等知名出版机构都采取积极的预印本投稿政策,PLOS等开放获取的出版机构对预印本更是持欢迎态度;还可借鉴bioRxiv、medRxiv从预印本系统传输手稿到同行评审系统或投稿期刊,期刊可查看预印本系统中用户对该文章的评价,增加预印本系统与期刊的交流,有利于期刊支持投稿文章原稿先在预印本系统开放。
调研可知,ChinaXiv、arXiv、ChemRxiv、bioRxiv、medRxiv的共享政策都趋保守。预印本系统存储政策的“趋开放”与“趋保守”是预印本系统建设的两种思路。在我国现阶段,特别是各学科预印本系统尚未被广泛建设与利用的前提下,采用趋保守的共享政策如CC BY-NC-SA或CC BY-NC-ND,可以提高作者的“安全感”这也许更有利于作者选择使用预印本系统提前公布正式出版前的科研成果。
3.5 质量控制把握适度原则,学术服务形式多样
存储政策中的“提交要求”主要从作者角度思考,希望作者对预印本的科学性、严谨性进行核查,而“质量控制”是从系统角度,对已上传的预印本进行内容质量的审核。此次调研中,ChinaXiv并没有明确可查的有关“质量控制”方面的规定,因此,我国预印本系统可参考arXiv、bioRxiv、medRxiv等增加相关规定,但要注意把握适度原则,预印本系统并非学术期刊,不经同行评审,审核人员无权判断一篇论文的学术价值,不能因为学术观点而将其删除。质量控制需把握2个标准:1)符合收录范围都可在平台发布;2)审核人员只就规定内容进行审核或调整归类,学术观点正确与否不由平台评估。日内瓦大学一位量子物理学家就质疑过arXiv存在偏见,其学生关于黑洞的文章就被arXiv拒稿,该物理学家虽然也认为该论文存在一些不够严谨的问题,但预印本系统并非需要经过层层审核的期刊发文,学术观点不能成为拒稿理由,还有作者指责arXiv将其论文分类调整到冷门分类,影响其论文的点击下载量。因此审核人员身份需要获顾问委员会批准,且不可与被审核作者私下联系。为确保民主性,作者还需要有上诉权,顾问委员会对上诉内容进行审核,并给出最终结论,作者如无新的证据,不可重复上诉。
ChinaXiv提供的学术服务较全面,从调研可知,预印本系统一般需提供基本的学术服务包括学科资源订阅、开放评论和引用功能、为作者提供首发证明等。在此基础上还可以参考ChinaXiv与多家期刊建立的优秀稿件双向推送机制,为作者推荐投稿期刊,也为期刊遴选优质稿源。当然,还可以积极接受用户反馈,根据用户建议提供针对性的学术服务,如开设讨论版,推动跨机构、跨学科的学术交流等。
3.6 人员配置需分工明确,宣传推广要结合我国国情
在网站调研中只能查到负责运营管理的委员会的人员配置,但整个预印本系统顺利运转还需设置以下岗位:1)技术人员,负责系统架构维护和软件模块嵌入,可采用公司外包、线上远程与线下驻场相结合的配置方式;2)审核人员和学术服务人员,负责对预印本格式、类型与内容的审核,以及为用户提供学术服务,可由参与机构具有学科背景的科研人员兼职;3)行政人员和宣传推广人员,负责行政业务和宣传推广,这部分工作内容较烦琐、工作时间较固定,需专职招聘。
在宣传推广上,ChinaXiv目前只设有新闻页面进行宣传,我国预印本系统可参考其他调研系统,增加宣传推广渠道,但要注意与我国国情相结合:1)利用社交平台与用户互动时,由于国内无法登陆Twitter、Facebook、YouTube等网站,可开设微信、微博、短视频App账号,利用好国内社交软件;2)被其他知名网站索引或导航,国内无法使用Google Scholar,可使用百度学术建立索引,联合平台需制作各学科预印本系统名录,且在各合作期刊网站设预印本系统的导航链接。
4 结 语
本文利用网站调研的方法,通过分析国内外10个较知名预印本系统现状,提出进一步发展我国预印本系统的建议,即“构建各学科预印本系统及联合检索平台”,并从资金、技术、资源等方面提出具体策略参考。当然,本文所提出的策略参考只是鉴于10个调研样本分析提出的,存在一定的局限性和片面性,在后续研究中,会进一步扩大样本量,以期作出更为全面的调研分析。