来自多方的声音:构建中国开放科学创新生态
——第十届中国开放获取推介周(China OA Week)会议综述
2022-02-27黄金霞刘静羽张智雄刘细文
黄金霞,汪 煊,杨 恒,刘静羽,张智雄,刘细文*
(1.中国科学院文献情报中心,北京 100190;2.中国科学院文献情报中心智能情报重点实验室,北京 100190;3.中国科学院大学经济管理学院图书情报与档案学系,北京 100190)
1 引言
1.1 China OA Week 发展历程
中国开放获取推介周(China OA Week)是国内最具影响力的开放获取研讨平台,2021 年,该平台主题正式转向为 “开放科学”。China OA Week 与国际OA Week 活动同步,于2012 年由中国科学院文献情报中心(以下简称 “文献中心”)创立并主办,以 “开放获取、开放知识、开放创新” 推动开放知识服务模式[1,2]。早期的China OA Week 侧重于推介国内外的开放获取实践,2017 年开始,涉及整个研究生命周期的开放科学要素,例如开放数据、基础设施、开源代码等,逐渐成为China OA Week 讨论主题[3]。历经10 年发展,China OA Week 主题不断丰富(图1),影响范围持续扩大,成为国内外科技界、文献情报界、出版界、科研管理机构共同讨论开放获取、开放科学的主要论坛,也是中国向世界展现开放科学最新进展的重要窗口。
图1 China OA Week10 年主题演进图Fig.1 Thematic evolution of China OA week in the past ten years
China OA Week 主办者文献中心,是国内开放获取理念和行动的先行者与推动者、国际开放获取活动的参与者。2010 年,中国科学院与德国马普学会联合举办第八次开放获取柏林国际会议。自2012 年以来,文献中心主办China OA Week,组建中国机构知识库联盟,建设开放学术资源,建立预印本平台,资助中国科学院作者发表OA 论文,参与SCOAP3联盟,签署OA 2020 倡议,试点数据库订购开放转换模式,组织中国合理使用周活动研讨知识产权问题[4]。在新形势下,文献中心秉承开放式学术服务理念,尝试构建开放学术信息服务生态系统[5],并且成立开放科学研究室,全力推进开放科学的研究和实践。
1.2 第十届China OA Week 概况
2020 年以来,新冠疫情流行与百年世界变局相交织,对深化世界科技合作、构建全球开放创新生态提出了更加迫切要求。作为一种新的科研范式,开放科学有可能成为领域关键问题、全球可持续发展的解决方案。契合开放科学发展态势,第十届China OA Week 在2021 年11 月18—19 日举办,邀请了顶尖科学家、联合国教科文组织(UNESCO)代表,来自国内研究机构、科技信息机构、国家科学数据中心、一流高校、国际知名出版社等多领域专家,以及全国170 多个机构的300 余名参会者,共同探讨 “开放科学的意义和影响” 主题,展望开放科学在中国的发展,与会代表发出“中国开放科学” 的声音。
2021 年,UNESCO 在11 月底通过了 《开放科学建议书》[6],全球达成开放科学共识,中国在12 月底颁布修订的 《中华人民共和国国家科学技术进步法》[7],明确推进开放科学发展。本文尝试凝练本届会议报告专家探讨的开放科学相关问题、实践、建议,以期明晰开放科学意义与影响,为中国建立自主可行的开放科学实施路径提供参考。
2 会议主要议题、案例分享以及专家建议
2.1 开放科学的发展现状
开放科学已经被学界接受,进入到实施路径的热烈讨论阶段。国际上,UNESCO 开放科学建议书为全球开放科学推进提供了指导原则;国际出版社提出出版商是与各科学共同体联系较为紧密的活跃力量,从多个方面推进开放科学发展,包括着力增加期刊类型、推进大规模的开放获取转换、提供内容的可见性、建设研究可重复性和科研诚信、探索开放科学的社会影响力。其中,开放科学目的与定义被继续探讨。国际上,开放科学被定义为一种新的范式[8],支持普遍获得知识,包括科学知识、公共资金产生的知识;被定义为一种破环性现象[9],改变文化规范、准则和激励措施;被定义一种新的 “信任技术”[10],支持专业和非专业参与者之间的信息流动、协作和对话;被定义为“研究加速器”[11],加快学术知识周期,缩短 “发现时间”,实现方法和过程的共享;被定义为一种寻求外部投入和公众参与的各种策略总称[12]。联合国17 个可持续目标中有10 个需要依赖于开放共享的科学研究成果,因此开放科学可能是全球问题的解决办法。
在中国,开放科学围绕着相关政策、实践、理论、期刊建设等方向推进:开放获取已经被推介10 年,OA 概念被广泛了解[13],空间科学、地球领域、基因组学、微生物学、高能物理、农业科学、医学领域等领域数据开放共享及其应用生态建立,学术知识出版行业、学术信息服务行业试图与开放科学互促互利,区域从科技创新角度推出开放科学行动计划,高校从支持学术交流创新角度提出开放科学支持计划,文情机构着手分析开放科学政策,设立 “数据馆员” 岗位来助力开放科学发展。与会专家提出,开放科学对中国学术交流体系变革起到推动作用,首先体现在学术信息的生产和科研产出的传播上,具体为知识的开放和行为的透明。开放科学也在赋能中国开放资源体系建设与出版服务新发展。中国开放数据逐渐成为开放科学实践层面的主要支柱。
2.2 中国开放科学发展中存在的问题
开放科学在中国的继续推进面临一系列问题和挑战。本届会议专家提出了中国开放科学发展现状中存在的4 个重要问题。
2.2.1 开放获取价格博弈抬高中国参与开放科学门槛
近年来,中国学者的学术产出处于快速上升趋势,已经形成和美国、欧盟大致相当的局势。但是中国本土期刊建设相对国外具有一定的滞后性,导致很大一部分优质稿源 “借船出海” 而流向国外,此问题在中国参与开放科学过程中更加尖锐地凸显出来,究其原因,在于学术交流模式在向适应开放科学环境转变过程中遭遇一系列价格博弈。
杨卫院士提出,中国参与开放科学过程中尚存在3道实施门槛:一是主体。从订阅模式转向OA 模式过程中,团购主体发生转变,存在 “谁组团?谁付钱?”的问题。在传统订阅模式主导的学术交流中,各学协会联盟、图书馆、学术机构等分别负责谈判、订购、付款等任务,各司其职,为作者和用户提供服务。而在开放科学环境中的OA 模式主导下,个体的作者直接支付论文处理费(APC)给出版商集团,谈判联盟的缺位直接导致个体作者处于绝对劣势地位。二是价差。目前OA 论文的APC 价格基于世界均价制定,而中国既是发展中国家又是学术大国,存在 “如果渐近地弥合价差?” 的问题。目前,中国所付的各种出版费用(订阅费、APC)、在2020 年所发表的WOS 论文数多年持续增长,其中存在的巨大价差既是学者学术产出的负担,也是国家科技经费的损失。三是国刊。如果进行简单的开放转换,5 000 种国刊或将面临稿源短缺的 “灰犀牛” 危机,存在 “如何稳住国刊?” 的问题。从订购模式转为OA 模式,在诸资助者联盟与出版平台谈判达成团购协议后,中国主要学术机构将获得相应出版平台科学数据的阅读权与限量发表权(在商定份额内免APC),这可能会引起部分作者为了抢占免费份额而优先向国外平台投稿的现象,从而导致大部分高质量稿源流向国外影响力大且开放度高的出版平台,造成中国期刊建设水平与国外差距持续拉大。
2.2.2 科学数据从开放到重用之间存在障碍
专家们认同开放科学为数据开放共享带来机遇,同时提出开放科学对科学数据管理与服务带来一定挑战,主要体现在科学数据的开放动机与科学数据的重用目的不适配问题上。究其原因,在于从数据开放到数据重用之间的中间过程尚未被全部打通,存在可互操作的壁垒。
首先,科学数据的开放共享障碍仍然存在。Springer Nautre 与文献中心合作发布的 《中国数据共享面临的挑战和机遇》 白皮书表明,比起公开共享数据,研究人员更倾向于通过USB、Email 等一对一方式在私人之间共享数据[14]。形成共享障碍的两个主要原因:一是科研环节的一些不可抗因素,例如,在医学领域工作的科研人员,为了保护患者的隐私,而不能泄露他们的具体信息;二是在科学出版环节的相关措施不到位,导致科研人员的共享意愿相对较低,并进一步形成回声室效应(Echo Chambers),信息的选择性传播与科学研究本身的开放性相悖。
其次,科学数据开放共享的实现并不意味着重用目的达成,仍存在开放数据可互操作壁垒,包括技术层面转化障碍、制度层面保障欠缺。从科学出版关联角度出发,科学数据的开放共享面临FAIR 化转型、知识产权保护以及怎样更好的与科研活动(如地学领域的遥感观测)进行互动[15]3 方面的挑战。
再次,开放科学环境下,数据论文可借助OA 期刊不断扩大影响力,这对数据集的开放无疑产生了正面影响,但是对数据集的重用却造成了一定阻碍。在数据出版的3 种机制中,从作为数据文档自存储发布,到作为学术论文辅助数据文档发布,再到作为专门数据论文发表[16],实际上是一个对数据集的描述不断丰富、不断详细的过程。数据论文对数据集的描述与揭示越丰富详细,人类用户的阅读效率就越低,反而阻碍了数据驱动的知识发现,限制了数据重用目的的达成。
最后,数据管理机构的数据重用能力欠缺。中国科学数据管理机构由于起步较晚,在综合能力方面与世界一流机构差距明显。当前,数据中心的基础设施和数据服务能力亟需提升、具有国际影响力的特色数据资源需要进一步整合、生物信息大数据挖掘技术能力需要重视与加强,同时,数据中心的可持续稳定发展还面临着经费短缺、经费来源驳杂且不稳定的挑战。
2.2.3 开放基础设施利用率较低
开放科学基础设施由企业实验室、大科学装置、科研数据中心、科研信息化平台、分布式网格科研设施逐渐演化而来,打破了科研生态系统中的时空、学科、知识产权和设施障碍[17]。目前中国开放科学基础设施利用率较低,与会专家主要提出两个现状:一是中国开放基础设施建设正处于低潮期,具有影响力的关键基础设施少。以中国开放科研知识云(CORC)为例,在平台建设之初收录的284 家机构知识库(IR)中,目前仅有149 家平台可以访问,135 家平台已不可访问,导致用户粘性较差,无法发挥应有作用;二是各基础设施之间关联度较低,无法形成集群效应,无法为用户提供高效服务。当前各种平台层出不穷,如文献平台、数据平台、面向学科领域的专题平台、IR、自建数据库等,但这些平台与数据生产、科研过程脱离,导致文献、数据、科研过程并未达到一个理想的融合状态,造成了平台之间的 “服务真空”。与会专家们呼吁加强科学论文出版界与科学数据开放共享的关联,为科研人员公开论文关联数据提供便利途径[18]。
2.2.4 开放科学目标、实施路径与方法有待明晰
中国开放科学相关政策发布集中于2015 年、2016年,主要集中在开放出版物、开放科技报告、开放科学数据、开放科学工程、开放科研基础设施、开放科技创新合作等领域。目前还缺乏国家开放科学的中长期规划、行动计划。
针对中国迈向开放科学的实施路径,中国的开放科学目标是达成各领域、行业的共识,还是各领域各司其职?开放科学方式,是对原有资源的共享汇聚、加上开放机制的创新?还是面向未来进行变革?开放科学内容如何确定?具备的开放科学能力有哪些?有必要将开放科学置于更远大的科技创新愿景里对其发展目标与任务进行解构。
另外,开放科学鼓励更多人参与到科研中,不仅包括科研人员,还包括公民科学家等群体,让公众有机会参与到科研进程和结果中[19]。这需要为开放科学发展提供较好的社会文化环境。
2.3 专家所在机构开展的开放科学实践案例分享
针对上述关键问题,会议专家从各自的专业领域出发,分享所在团队或机构开展的实践,提供一些问题的解决方法。
2.3.1 以重用为目标来激发数据开放共享
科学数据的开放与重用的主动权掌握在科研人员手中。如何激发科研人员数据开放共享意愿、降低科学数据重用门槛,专家们提出两个主要措施。
一方面是数据成果产品化。除非科学家在数据方面的科学贡献能够得到科技界的认可和回报,或者能有商业回报价值,否则,他们不愿意科研数据拿出来共享,科学数据开放共享的问题也难以从根本上得到解决[20]。国际上一些成熟的数据中心都有自己的有影响力的数据产品。中国多个领域的数据平台开发了内容丰富、形式多样的数据产品:一是增强优秀数据成果的揭示与宣传。可持续发展大数据国际研究中心每年根据用户对数据集的关心程度,开展优秀数据集的评选优秀数据库的选编。二是加大数据成果的增值服务。国家微生物科学数据中心基于全球科研人员提交的微生物模式菌株数据,成立细菌遴选、真菌遴选等国际工作组,引领全球万种微生物模式菌株测序计划的开展[21]。三是快速响应国家重大需求,开发针对性强、影响力大的数据产品。国家基因组科学数据中心于2020 年1 月22 日上线了2019 新型冠状病毒信息库,每日更新,服务全球[22]。
另一方面是科学数据FAIR 化。科学数据的FAIR化是提高数据可互操作性的重要举措[23]。国家空间科学数据中心在面向开放科学的可持续发展探索中,第一项任务就是空间科学数据的FAIR 化,并且已经率先提出了从理念到技术路径的落地措施,围绕FAIR 原则设计了空间科学数据全生命周期管理模型。该模型从数据提供者与数据使用者两种用户角色出发,贯穿数据汇交、数据制备与管理、数据共享3 个环节和数据注册、数据提交、数据审核、数据集制备、数据评估、数据卷制备[24]、数据存储与备份、数据远程灾备、数据发布、数据服务10 个模块,并配套访问控制、运行监管、配置管理、策略与标准4 个系统为用户提供基于数据全生命周期的管理与服务。
2.3.2 加强更多知识系统的融合与互操作,打造更具活力的开放科研基础设施
在开放科学的影响下,不同知识系统正发生融合、互操作,产生较好的资源融合效果、学术交流效果、服务嵌入效果。
开放科学环境下,科学数据的开放共享并不只涉及科学数据本身,还需要挖掘科研用户的各种计算需求、设计互联互通的多模式协同服务,形成集数据、计算、服务一体化的科学数据共享模式。地球大数据科学工程于2018 年立项,2019 年1 月15 日上线。基于 “数据中心” 的定位,该工程围绕 “地球大数据云服务平台” 开展,针对数据体量大、学科交叉多、融合程度高的数据集特点,设计了设计多模式协同服务的数据汇聚和共享服务机制,打破各系统之间的数据壁垒,提供覆盖数据全生命周期的管理与一体化服务。这种高效便捷的数据共享模式目前取得了良好的效果,地球大数据云服务平台2021 年度页面访问量达3 449万次,用户量达20 万人次,均超2019—2020 年度访问量、用户量之和。
学术交流平台作为基础设施之一,不同平台的融合模式有多种类型,可以以出版集团为牵引、以学协会机构为牵引、以文献情报工作为牵引,也可以以学界自治为牵引[25]。这些平台将自身优势资源作为主要建设内容,吸引各方科研主体的广泛参与。基于手稿的预印本交流是一种先出版后评议的模式,能够极大提升创新科研知识的开放效率,但是它并不希望取代传统的同行评议机制,相反二者正体现出一种相互融合的趋势,成为期刊较能接受的一种新型审稿用稿模式[26]。中国科学院科技论文预发布平台ChinaXiv 正在与科学数据银行系统(Science Data Bank,ScienceDB)、科学出版社平台Sci-Engine 进行系统和数据对接。
服务无缝嵌入是科研基础设施要达到的理想融合状态。中国农业科学院农业信息研究所正在着力构建融合科研与服务的新型平台[27]。其中,将云基础设施、分布式计算框架、存储策略和安全策略作为底层支撑,并构建由N 个数据源形成的科研数据中心。在此基础上,构造模型算法库和通用服务组件,将模型和算法形成工具封装成面向N 个应用场景的个性化服务,如知识发现、分析工具、实验、模拟、共享等,构建数据驱动的协同创新,实现资源建设转型与服务嵌入。
最后,工具和方法的融入让基础设施提效。国家空间科学数据中心的一站式共享服务平台,集成空间科学领域专业分析工具与模式41 个,形成iSpace 空间科学大数据分析挖掘环境,为用户提供包括数据汇交管理、数据发现访问、数据应用计算以及重大任务支撑等集 “数据-计算-服务” 一体化的数据共享服务,提升科学数据共享效率,催生更多科学发现。Elsevier旗下的CELL 出版社发布了STAR 方法,STAR 代表结构化(Structured),透明性(Transparency),可获取(Accessible)和报告制(Reporting),这已经被证实为非常成功的方法,并被推行到很多期刊。为支持开放科学环境下的科学写作与发表,Wiley 为科研用户提供一款为开放科学而构建的、免费的创作工具Manuscripts,支持研究数据与代码之间的互操作,简化了撰写和提交文章的过程,进而提高科研人员之间协作性,也提高用户黏性与忠诚度。
2.3.3 发挥图书馆在开放科学素养教育中的阵地作用
作为联结科学界与社会界的重要枢纽,作为科研群体获取文献资源、发文培训的支撑者,图书馆积极参与开放获取,也正在投入开放科学事业中。
清华大学图书馆的 “十四五” 规划中明确提出了开放科学支持计划,开放科学素养教育作为该计划中的4 项主要任务之一,拟通过梳理开放科学的知识体系,提高馆员能力,为师生在开放科学背景下的科教活动提供一些切实可行的支持。该计划也将作为 “促进科技开放合作” 的子计划列入清华大学2030 创新行动计划。作为开放科学素养教育的主要抓手,北京大学已连续举办3 届 “全国高校数据驱动创新研究大赛”,通过挖掘学术信息资产体系的 “数据效益”,凝聚高校力量服务社会,在提升学生数据素养和技能的同时,逐步培养学者的开放科学素养。中国科学院文献情报中心已经在其 “十四五” 规划中提出 “数据馆员” 内容,从数据管理的能力、数据伦理的交流、数据增值的业务3 个方面着手,助力中国科技创新。文献中心也建立了开放科学研究室,着力研究开放科学理论、开放科学政策,构建中科院高端学术交流平台,设计开放科学素养及技能培训课程,参与培养适应开放科学的人才,提供开放科学实践案例。
2.3.4 探讨中国开放科学相关政策、开放科学实施策略
对中国开放科学政策进行梳理统计,发现中国的开放科学相关政策建设已经取得一定成效,主要集中在开放出版物、开放科技报告、开放科学数据、开放科学工程、开放科研基础设施和开放科技创新合作等方面,这些先期成果已经为开放科学的全面到来搭建了良好的基础。在实施策略方面,2019 年北京CODATA 大会上提出“全球开放科学云” 倡议(Global Open Science Cloud Initiative,GOSC),旨在探索建立一种有效的合作机制,共同制订全球遵循的政策、标准规范与治理体系,共同建立开放的系统框架与技术体系,实现跨洲际间开放科学云资源与服务的充分共享及互操作。为促进GOSC 健康可持续发展,“全球开放科学云大科学培育计划(2021—2025)” 由中科院国际合作局资助,并已与CODATA 达成协作,作为CODATA Decadal Program 重要合作项目开展密切合作,共同提升GOSC 国际影响力。目前,GOSC 政策研究已处于起步阶段,通过对全球开放科学平台进行调研,发现差距与不足,进行相关总结及实验校验,最终形成指导意见[28]。2021 中关村论坛期间,北京科学技术研究院携手13 家国内外机构成立 “开放科学国际创新联盟”,并向全球科学界发出倡议[29],以推进北京国际科技创新中心建设为共同目标,共同营造良好的开放科学环境,共同搭建开放科学国际共享平台,共同搭建开放科学国际交流平台等具体举措。
UNESCO 《开放科学建议书》 成为本届中国开放获取推介周的关注焦点,联合国教科文组织驻华代表处代表Shahbaz Khan 教授在会上介绍了该全球建议书的起草过程、总体政策、目标、意义及下一步行动计划,指出开放科学是一场旨在使科学更加开放、可及、有效、民主和透明的运动。建议书从国际层面定义了开放科学的4 个核心价值:①质量和诚信;②集体利益;③公平公正;④多样性和包容性。并提出实施开放科学的6 项指导原则:①透明度、审查、批判和可再现性;②机会均等;③责任、尊重和问责;④合作、参与和包容;⑤灵活性;⑥可持续性[30]。UNESCO 资助的 《开放科学与数字包容》 中国项目是本届会议的支持方,该项目旨在探索中国面临的开放科学的机遇与挑战,增强人们对开放科学的认知,进一步推动中国开放科学。
2.4 中国开放科学发展建议
与会专家呼吁,一方面,我们应面向未来的科学发展开放需求,通过政策法规支持的方式明确开放科学的重要地位;另一方面,立足中国开放科学推进过程中面临的一些挑战,在国际现行开放科学框架下,积极主动采取相应措施,使开放科学成为中国科技腾飞的助力因素。
2.4.1 中国开放科学目标、实施路径与方法需清晰明朗
杨卫院士提出,构建开放科学的中国路径,要形成购置开放科学数据的复合型主体,形成 “基价+资助补贴” 的价格策略,建立国际一流的学术数据运营和服务平台,高水平国内科技期刊的开放科学团购等对策。
“中国还停留在研究探讨阶段,尚未形成清晰明确的开放科学演变理念和政策路径,各类开放实践形式发展速度和程度差异较大。” 文献中心主任刘细文说,中国要推动开放科学,当下的任务是推动资源开放,如推动开放出版、预印本、开放存储、开放数据、开放基础设施等,将来还要推动科研全过程的开放,推动理念的开放。
2.4.2 不同开放科学要素需要建立协同发展策略
开放科学需要国际组织和各国政府、科研资助机构、科研教育机构、出版机构、科学家与科学共同体、图书馆和采购联盟、企业、社会公众等各利益主体以不同形式、不同程度地参与和推动实现开放科学,避免形成以自我为中心,向外层层递减的 “差序格局”,而应通过扁平化的联盟形式,打造交叉融合、跨界协作、平等互补的 “团体格局”,激发群体智慧,促进科技创新。
围绕科学数据的管理与服务,形成集数据、计算、服务一体化的科学数据共享模式。中科院地理所地球数据科学与共享研究室王卷乐研究员认为,这种模式是在公民科学的大数据时代下,快速发展起来的一种公众多元参与的社会化数据汇聚模式,更多是和应用联系在一起,不以单纯的数据汇聚为目标[31],可以借鉴快速发展的Google Earth Engine、亚马逊云平台等计算平台。
中国迫切需要建设和培育自己的论文关联数据出版生态体系。中国科学院计算机网络信息中心周园春副主任介绍,ScienceDB 以开放数据为抓手,鼓励和号召更多的科研人员公开论文关联数据[32],与国家科学数据中心、中国人工智能学会等构建了数据社区,积极发动会员汇交及共享数据,推动开放科学事业发展。
2.4.3 开放科学理论与方法需要尽快开展研究
杨卫院士在谈到开放科学的包容性和参与度时,提出开放科学的维度-动力学模型:从某一点出发,可以画出另外两个维度,一个维度,是代表价值的增加;另一个维度,是代表通用性,或者抽象高度的升华。此时就有8 个可能的方向:1-Generalization、2-Synergy、3-Ascend、4-Overstate、5-Duplication、6-Downslide、7-Application、8-Innovation Chain(图2)。
图2 开放科学包容性和参与度的维度-动力学模型示意图Fig.2 Schematic diagram of dimension dynamics model of open science inclusiveness and participation
其中,正向的过程:1-Generalization:理论高度并没有增加,但是通过跨界协作的使用,应用到了不同领域,实践价值有所增加;2-Synergy:在跨界推广时,起到1 加1 大于2 的效果,整体得到综合性提升,即实践价值升高的同时,理论高度也随之升高;3-Ascend:随着理论研究的深入,抽象高度的不断提升;7-Application:理论成果的实践应用;8-Innovation Chain:理论成果在实践应用的同时,汲取从实践中得来的经验,形成创新链。负向的过程:4-Overstate:把理论问题拔高,使得在抽象程度上虚高而并无实际价值,甚至实际价值反而下降;5-Duplication:由于大量的复制仿制,导致成果价值的丧失;6-Downslide:下行式发展,成果质量降低,同时水平也低。该模型描述了增加跨界协作、理论成果的实践应用等在开放科学中的价值,提出理论虚高、大量复制仿制、成果低质量等不利于开放科学发展。
曲建升研究员将开放科学置于科学学视域下,结合元科学理念对开放科学目标与任务进行解构[33],认为在元科学研究流程中,开放科学存在发现和传播真理、加强科学研究的透明度与可重现性、推动开放创新合作、支持人类可持续发展的4 个目标,并提出开放科学在推动人类科学进入新时代进程中,需要肩负起推动科学发展与人才培养、促进社会进步与发展、增进人类福祉的3 个未来使命。
借鉴国际开放科学路线图方法,针对中国迈向开放科学的实施路径,黄金霞研究员分析了能力成熟度模型在开放科学规划中的价值,提出通过制定国家或机构的开放科学发展成熟度指标来确定开放科学具体实施内容,在评估开放科学现状成熟度后,设计下一步开放科学发展框架,包括开放科学愿景、原则、效益与风险、发展方式、试点项目、具体内容、全程评估等[34]。
3 会议形成的主要成果
3.1 成果一:呼吁构建开放科学创新生态
正如新华社等主流媒体报道的,本届会议积极探讨了开放科学的意义和影响:构建开放创新生态,实现知识信息开放共享的可持续发展。
自20 世纪末,科学界发起了一系列体现 “参与、包容、分享、合作、公开、透明” 理念的开放科学运动,包括开源软件、开放获取、开放数据,以及开放基础设施和平台等,以克服传统封闭科学模式所造成的种种弊端,比如过高付费墙造成的知识鸿沟与不平等,科学数据不及时公开造成的科学结论可检验性困难,生产工具过于集中造成的知识附加费用高涨等。当前,新冠疫情流行与百年世界变局相交织,对构建全球开放创新生态提出了更加迫切要求。积极推进中国开放创新生态,也是本次研讨会发出的呼声。
“开放科学是全球科技发展的重要趋势,借助大数据、云计算、人工智能、区块链等技术,不仅促使科研范式发生深刻变革,也对经济和社会发展产生重大影响。” 中国科学院发展规划局局长翟立新说。中国科学院作为国家战略科技力量,一直积极推动学术论文与科学数据的开放获取。早在2004 年,中国科学院和国家自然科学基金委员会在国内率先签署 《开放获取柏林宣言》,支持公共资助科研论文开放共享[35]。
文献中心主任刘细文表示,从 “开放获取” 迈向“开放科学”,已经成为全球共识。“开放获取” 要求科研资助产生期刊论文的开放,即最终成果的开放,而 “开放科学” 则鼓励从科学发现之初到科学实验、验证、产出、传播、应用和创新的开放,即整个科学生命周期的开放,并对科学主体、客体、主观、客观层面都提出了更高的开放要求。
3.2 成果二:勾画中国开放科学发展现状
(1)学术交流载体由科技期刊转为高端交流平台。党的十九届五中全会审议通过的 《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》 中提出 “构建国家科研论文和科技信息高端交流平台”,这项建设任务要求是在充分分析了科技强国建设的信息服务需求、科技信息安全、数字化科研模式变革、全球网络化学术信息交流变革、国际科技合作趋势等基础上,结合了中国科技信息保障与服务的核心能力 “短板” 而提出的[36]。开放科学环境下,数据驱动的科学知识发现需求增强[37],学术交流与交易模式发生变化,基于开放数据的学术交流载体需要由传统的科技期刊为载体转向集数据、知识、工具、交流、协作、互操作、共享于一体的开放协同的科研平台,多个科研平台集群发展,构建垂直领域高端学术交流社区,依托智能技术提供智慧型知识服务,实现高起点、高质量、高效率、可信赖、开放型的学术交流。
(2)开放对象由数据成果转变为科研全流程。开放科学鼓励整个科学生命周期的开放,将开放对象从学术论文,拓展到科研全链条,包括:实验方案、开放数据、开放软件、开放硬件、开放基础设施、开放教育资源、开放社区等。在科学工作的各个阶段促进提升开放性,实现科学研究的可再现性和可复制性,促进科学的包容、合作和透明性。中国科学院文献情报中心通过各类OA 平台重塑开放科研流程,建设中国科学院科技论文预发布平台ChinaXiv 实现科技论文预发布;通过OAinONE、GoOA 等平台将学术成果开放出版,包括论文、科技课件、图书、报告等资源;在出版后的传播与保存阶段,文献情报中心协助建设中国科学院机构知识库服务网络,实现机构知识存储与共享服务。
(3)以数据复用驱动的科研基础设施成为中国现阶段开放科学实践的核心。现阶段,开放科学实践主要是围绕数据资源的共享与复用。以不同类型的基础设施支持数据流、支撑科研工作流(图3)。这契合开放科学生态与大数据时代的关系:大数据技术需要开放科学带来的数据、方法以及重要科技问题、全球可持续发展问题。下一个开放科学阶段,将是围绕智力资源的集智社区建设。
图3 中国现阶段开放科学实践核心示意图Fig.3 Core diagram of open science practices in China at the present stage
需要说明的是,本届会议设置4 个专题,邀请的专家并未覆盖到更多开放科学要素,例如开放教育资源、科技合作、公民科学等,以上的开放科学架构可能存在偏颇,希望能在今后的研讨中能够完善。
3.3 成果三:China OA Week 平台顺势转型与影响力提升
在会议闭幕时总结,文献中心张智雄副主任提出本次会议的圆满成果也体现在4 个方面:一是中国开放获取推介周会议连续成功举办10 届,充分体现了开放科学在中国的影响力与重要性。二是参与人员范围进一步扩大。会议吸引到自然科学领域的科学家、科研数据界的学者、出版界专家参加,这也反映出开放科学这种新的科研范式已经得到了广泛关注与认可。三是会议的国际合作水平得到了提升。引入UNESCO等国际开放科学的声音,进一步扩大了会议的国际影响。四是得到新闻媒体的广泛关注,国内多家主流媒体同时对本次会议进行了报道。
4 结语:推进中国开放科学的具体行动
2021 年底修订通过、2022 年1 月施行的 《中华人民共和国科学技术进步法》 首次明确提出 “推动开放科学的发展”,这将进一步推进中国开放科学的发展态势。如何更好地发挥开放科学的价值,构建包容性、参与性和可持续的开放科学体系,思考下一步具体行动。
(1)营造有利于开放科学的政策环境,制定国家开放科学中长期规划和实施路线图。
(2)切实推进中国开放创新生态建设,组织解决开放科学发展中遇到的关键问题,包括降低开放获取成本,增强科学研究的本质探索,深化科研与社会的关系,加强开放科学的教育培训,建立数据管理和共享的文化,开发支持内容分析和挖掘的基础设施,调整科研评估方式。
(3)把理论研究转化为实践能力,实现从开放获取、数据共享到开放科学的能力建设,覆盖学术出版、数据原则、科研基础设施、激励、评价、开放科学技能、科研诚信、公民科学。
(4)推广先期的开放科学实践,扩大影响力,以期达成更大范围、更多利益者的共识。在推动开放获取、开发开放科学基础设施建设的基础上,走向更广泛实践的规划,例如推行相关数据基础设施项目的适当治理和融资机制,建立一个更大范围的研究数据基础设施联合机制,从目前数据碎片化的状态转变为易于存储、查找、共享和重复使用的局面。
(5)成立专门机构,例如国家开放科学中心,负责推进中国开放创新生态的理论研究和实践行动,建立开放创新国家平台,汇聚开放科学各要素资源,参与国家开放科学计划,组织开放科学国际研讨会,组织发布国家开放科学发展年度评估报告,推动开放科学研究与实践成果成为国家相关管理部门科研体制改革的重要参考。
致谢:感谢本届China OA Week 的29 位会议报告专家,他们的精彩报告分享与讨论让更多的中国科学家、出版者、管理者、公众了解到开放科学的价值及其带来的影响。他们是杨卫院士(浙江大学)、刘细文研究员(文献中心)、邹自明研究员(国家空间数据中心)、Shahbaz Khan 教授(UNESCO 驻华代表处)、张士运研究员(北京市科技情报所)、李红文女士(中国图书进出口集团有限公司)、张智雄研究馆员(文献中心)、陈刚研究员(中国科学院高能物理研究所)、曲建升研究员(中国科学院成都文献情报中心)、乔晓东先生(万方公司)、窦天芳副馆长(清华大学图书馆)、聂华研究馆员(北京大学图书馆)、周园春研究员(中国科学院网络计算中心)、赵瑞雪研究员(中国农业科学院农业信息研究所)、崔晓莹女士(Spriner Nature)、Eva Victoria 女士(Elsevier)、祝忠明研究员(中国科学院西北研究院)、黄金霞研究馆员(文献中心)、张丽丽高级工程师(中国科学院网络计算中心)、吴燕女士(WILEY)、Rosalia Da Garcia 女士(Sage)、闫冬梅研究员(可持续发展大数据国际研究中心)、鲍一明研究员(国家基因组科学数据中心)、马俊才研究员(中国科学院微生物研究所)、李新研究员(国家青藏高原科学数据中心)、王卷乐研究员(中科院地理所)、吴思竹研究员(中国医学科学院医学信息研究所)、顾立平研究员(文献中心)、肖曼副研究馆员(文献中心)。本文所发表的内容,取材于各位报告人的报告,没有一一征询意见。对各位的鼎力支持、精彩报告与开放态度,再次表示感谢!