APP下载

美国国家实验室开放共享的实践经验及启示

2020-02-19黄廷政蒙绍新黄雨婷

实验室研究与探索 2020年12期
关键词:实验室信息

黄廷政, 蒙绍新, 刘 静, 刘 洋, 张 娜, 黄雨婷

(1.中国电力科学研究院有限公司,武汉430074;2.武汉大学信息管理学院,武汉430072)

0 引 言

2018 年3 月,国务院印发《积极牵头组织国际大科学计划和大科学工程方案》[1],要求综合性国家科学中心实现在国际范围内的资源开放共享。2019 年5月,中央全面深化改革委员会第八次会议强调要“以开放促进发展”[2]。美国联邦政府开发的开放数据交换平台Data.gov 囊括了国家、州、地方等各级各类政府数据资源,其中能源部(Department of Energy,DOE)贡献了近3 000 份能源相关的多主题、多格式数据集。2019 年2 月,我国科学院印发《中国科学院科学数据管理与开放共享办法(试行)》,涉及科学研究和试验数据开放的职责分工、数据管理、开放途径、保障机制和安全保密等方面[3]。

近年学者从现状[4-5]、管理模式[6]、策略[7]、动力分析[8]和影响[9]等角度入手,对科研仪器和科研信息资源的开放共享实践进行了研究,而对欧美科研机构实验研究体系开放共享中的优秀案例研究较少。美国能源部国家实验室历史悠久,实力雄厚,科研成果颇丰[10]。现以DOE及其下属17 所国家实验室为研究对象,调研其开放政策、开放手段、开放内容方面的建设进展,总结国外实验研究体系开放共享经验,为国家电网有限公司开放共享实践提供借鉴。

1 完善的开放共享政策法规

1.1 承上启下的开放共享政策

DOE的开放共享政策上承国家宏观政策,紧密服务于国家发展战略规划,17 个下属实验室贯彻落实上级政策,结合工作实际制定了机构内部的开放共享规章制度。2013 年2 月,美国白宫科技政策办公室(Office of Science and Technology Policy,OSTP)发布《科学技术政策办公室备忘录》[11](Office of Science and Technology Policy Memorandum, OSTP Memorandum)(下称“《OSTP备忘录》”)提出要“改善联邦资助科学研究成果获取”。2014 年7 月,根据《OSTP备忘录》要求,DOE 出台《公共获取计划》[12](Public Access Plan),落实了公共获取对象、利益相关者责任、实施步骤、效果评估等问题,希望“通过该计划中讨论的政策和机制…为增加创新、商机和加速科学突破奠定基础”,为包括17 个国家实验室在内的能源部各级部门开放共享实践提供了政策保障。

一些实验室响应国家及DOE的政策号召,编制了适用于机构内部的开放共享政策,如洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory,LANL)认为开放获取可以满足国家和资助者的需求、提高机构影响力,据此出台了《LANL关于公众获取科学和技术信息的政策》[13](LANL Policy on Public Access to Scientific and Technical Information),规定“由实验室研究产生的、不受限制的学术出版物应向公众开放”。国家实验室在国家政策及DOE 政策的总框架下编制更详细、具体的开放方案,形成层层递进的政策体系,既有利于联邦政府指示精神精准传达到执行部门,又有助于不同部门的个性化发展。然而还有部分实验室尚未建成或公开机构开放共享政策,实验室之间的开放共享法律法规建设进程不统一。DOE 需考虑加快建设和完善实验室一级的开放政策体系,深化开放共享格局。

1.2 多对象的开放共享规定

1.3 审慎的开放共享审核程序

《公开发布数据的程序》[16](Procedures for Public Release of Data)规定了数据开放的审核加工流程。首先数据的不同利益相关人员共同参与数据质量、安全性、敏感性和必要性等方面的初步审查。在诸多联邦和DOE的信息分类、信息隐私、信息质量、记录程序相关的法律规定及行政命令指导下,行政或计划办公室采用统一元数据描述数据,并将规范后的数据提交首席信息官办公室(Chief Information Officer,OCIO)的开放数据主管人员,对数据集的安全性和数据质量进行终审,确保公开数据的安全性、规范性。

DOE在数据开放流程中特别重视数据质量和数据安全两方面的问题。数据质量主要是指来源信息的正确性及元数据的准确性。初审工作人员负责初步评估信息质量,确保标识信息来源准确。终审人员围绕元数据和来源信息的准确性和完整性进行质量审查。DOE在初审环节依据多份政策法规要求,辨别和剔除人员信息、部门信息及国家机密数据,确保DOE 信息不会与其他部门的开放信息结合产生镶嵌效应,保障了数据安全。

规范开放数据流程,有利于保障数据准确程度和质量。国家实验室涉及数据敏感性问题,严格的审核程序有利于保障数据安全。目前DOE 并未对数据审核人员的选拔做出详细规定,但审核人员能力高低一定程度影响了开放数据的质量高低,今后可加强审核人员资质管理,为数据开放实践提供人才保障。

2 复合式的开放共享手段

2.1 依托各级平台开放数据

DOE响应国家政策,在全国统一的政府数据开放平台共享数据。下属实验室还自建了多个特色化的数据共享平台,大大增加了数据的可发现性。

2009 年美国推出政府数据开放平台Data.gov。2013 年美国政府发布了《开放数据宪章》[17](Open Data Charter),规定要及时以尽可能多的格式发布高质量数据。2018 年出台的《基于证据的政策制定法案》[18](H.R.4174 - Foundations for Evidence-Based Policymaking Act of 2018)要求联邦机构使用标准化的开放形式在线发布政府信息及其元数据。DOE 积极响应政府战略规划,在Data.gov 数据开放平台上共享了近3 000 份能源相关数据集[19],主要涵盖了能源基础设施、能源供应、能量转换等主题,包括HTML、PDF、DOC、JPEG 和CSV 等诸多格式的网页、文本、图片、视频和网页。

数个DOE 下属机构自建了机构信息开放平台。能源信息管理局(Energy Information Administration,EIA)是DOE 内部的统计和分析机构,主要负责收集数据并进行分析、趋势预测工作,并将工作成果发布于EIA的独立门户网站[20]。能源效率和可再生能源办公室(Office of Energy Efficiency and Renewable Energy,EERE)建有能源信息开放共享平台:OpenEI[21],为用户提供可再生能源和能源效率方面的原始数据、模型、工具、政策法规和数据分析的访问途径。网站用户可以免费查看数据、进行数据编辑和下载等操作。截至2014 年,OpenEI拥有近63 万名用户,超过4 万个Wiki页面以及数十个项目的众包数据。一些下属实验室也建有开放存取平台,如LANL的“洛斯阿拉莫斯在线研究”(Los Alamos Research Online)开放资料库向公众提供开放获取的学术出版物;劳伦斯伯克利国家实验室(Lawrence Berkeley National Laboratory,LBNL)的电力数据门户(Power Data Portal)提供浏览、下载电力数据集的服务[22]。

科研数据与国家统一政府数据开放平台连接,有利于集中获取科研信息,扩大DOE科研影响力。不同平台的开放方式各具特色,DOE 下属部门建立的专题数据开放平台LANL与LBNL侧重于直接开放原始研究数据,EIA 门户网站则偏重数据分析和趋势预测,OpenEI以共建共享为原则,将公众力量融入网站建设。这些平台在数据、专业化程度方面都各有侧重,有助于目标明确的用户根据信息需求以及知识水平迅速定位合适的资源。但构建多个平台分散了信息资源,且在平台构建过程中容易出现重复建设等问题,维护多个不同平台也需要更大的工作量和运营成本。

2.2 丰富公众科研参与方式

考虑到不同社会群体科学素养水平差异,实验室在活动中细分用户类型,分别就公众和学者设计公共活动,在活动开展过程中强调及时了解用户反馈的重要性,利用电子邮件、社交媒体、GitHub 等交互式的多元通信渠道与用户互动。

近年来,我市各级党委政府在落实国务院《农业保险条例》、贯彻国发〔2014〕29号文件精神、积极探索农业保险工作中,采取先行试点、总结经验、逐步拓展的工作方法,使全市农业保险工作实现了较快发展,取得了明显成效。据统计,2018年全市农业政策性保险已完成381.4万亩,比上年同期增长7.9%。

面向普通公众的活动专注于基础能源科学知识,趣味性强。阿贡国家实验室(Argonne National Laboratory,ANL)成立了“演讲局”(Speakers Bureau)机构,邀请实验人员在“大声演讲系列”[23](Out Loud Lecture Series)演讲会活动向对前沿科学感兴趣的公众提供“城市转型”“土壤科学”“能源创新”等主题的公共讲座。费米国家加速器实验室(Fermi National Accelerator Laboratory,FNAL)面向公众的开展“橙色”座谈会[24],介绍与公众生活息息相关的科学研究。国家加速器实验室(SLAC National Accelerator Laboratory,SLAC)还会开展专门面向公众的“艺术遇见科学”系列讲座和“社区日”活动[25],通过有趣的实验或活动,鼓励公众学习科学知识并从中发现乐趣。

面向有能源科学研究背景的用户,DOE 的活动内容更加专业。与开放数据中心企业(Center for Open Data Enterprise)共同发起“能源开放数据圆桌会议”[26](Open Data Roundtable),召集了约60 名能源数据负责人,探讨开放能源数据的用途、优势及不足。发起“美国能源数据挑战赛”[27](American Energy Data Challenge),展示部门的开放数据资源,向广泛人群征求改进意见。FNAL定期举办专门面向科技工作者的“绿色”座谈会,介绍实验室的研究前沿。

基于浅显易懂科研知识的活动对缺乏科研背景的公众而言更具吸引力,有利于激发大众学习科学知识的热情。与此同时,能源专家也能通过DOE的活动获取前沿和专业的学科信息。因人而异的活动方式扩大了DOE开放共享活动的影响力。

3 多种类型的资源开放共享

3.1 共享科研数据

根据LANL的数据管理政策,研究产生的不受限制的观测和模拟数据、软件和算法、文本以及相关的元数据等以数字形式存储的各种信息都应开放,据此,LANL在研究图书馆内设立了专门的数据工作组,支持对研究数据在数据生命周期内的管理。LBNL 建立了电力数据门户(Power Data Portal)向公众提供了可下载和可视化的电力相关数据集[28],还提供数据可视化分析等服务。实验室工作人员对开放数据持积极拥护的态度,主动推动科研数据的开放进程。2019 年1月,来自LBNL的研究人员在《科学》杂志上呼吁就出版前数据共享制定明确的政策[29]。

3.2 支持开放存取

实验室响应DOE 开放存取政策《公共访问计划》,积极开展个性化实践,采取了将科研出版物纳入DOE统一开放系统、在官网开设科研文件检索入口、自建开放存取平台等特色开放手段。2015 年10 月,LBNL要求与实验室相关的所有出版物都必须纳入DOE的开放访问系统[30],SLAC 则在专门的机构网站为用户提供最新研究成果的PDF 文件[31]。部分实验室建立了独立的开放存取资料库,如LANL 的图书馆开发和维护了旨在提供学术出版物的洛斯阿拉莫斯研究在线(Los Alamos Research Online,LARO)资料库。多样化开放获取手段有效促进了实验室科研成果的快速传播,但各开放存取平台缺乏统一管理规范,开放措施尚不统一。

3.3 开源研究工具

开源软件是DOE 开放共享的重点之一。根据实验室研究重点和优势的不同,实验室公开的开源软件类型也有区别。艾姆斯实验室(Ames Laboratory)在美国政府授权下共享了数个应用于分析网络攻击、量子力学、化学与材料科学等领域的开源软件包[32],公众可免费获取、修改和使用。PNNL 的运动分析(Analysis in Motion,AIM)项目开发了可视化、机器学习、数据挖掘相关的系列开源软件包,在GitHub 上与大众分享[33]。一些实验室还开发了开源软件平台,如PNNL的“VOLTTRON”开源软件平台可应用于建筑物、可再生能源系统和电网系统等众多领域[34],帮助用户快速开发和部署能源控制解决方案。

开源软件的开发和使用应该与社会实际需求紧密结合。例如,针对极端天气破坏电力网络问题,LANL研发了免费开放源代码软件,用以预测飓风等极端事件对公用电网电力输送的影响[35]。在调研社会需求的基础上,可进一步追踪开放资源后续使用,这不仅有利于明确资源的经济、社会价值,还能够帮助实验室反思资源应用,根据实际情况调整后续研发工作。

3.4 共享基础设施

开放共享世界领先的科研设施,既有利于充分发挥设备价值,也给予了机构外科研人员参与前沿研究的机会,由此创造更丰富的科研成果。DOE 国家实验室维护和运营有超级计算机、粒子加速器、大型X 射线光源等26 个实验设施,被全球近3 万名研究人员使用。对执行非专有研究并同意发表研究结果的用户,DOE通常只收取运营和消耗品费用;对不打算出版的专有研究,DOE可以全额收回成本的方式开放。2018年7 月,美国能源部启动了“国家实验室合作伙伴服务”(Lab Partnering Service,LPS)计划[36],为投资者、创新者和机构开放能源部17 个国家实验室统一在线访问网站平台[37],网站平台提供“用户设施协议”(User Facility Agreements)服务,中心目标就是利用能源部国家实验室的技术专长,向大众提供先进实验设施。

3.5 尝试开放科学

鉴于国家实验室的研究活动涉及到机密程度较高的科研内容,实施科研生命周期的全开放存在一定困难,但对于非涉密问题,可以尝试提高研究透明度、提升科研效率。开放科学是指“研究人员可以自由获取研究数据、实验室笔记和其他研究过程,重复使用、重新分配和复制研究、基础数据和方法,进行协作研究的科学实践”[38]。联合国教科文组织(United Nations Educationnel, Scientific and Cultural Organization,UNESCO)认为向研究者及广大市民提供开放可用的在线学术信息有利于促进全球的知识流动[39]。目前在全球范围内,许多机构组织开展了开放科学的实践探索。例如,欧盟着力推动促进公共财政资助科学数据开放共享的“S 计划”[40],以期实现科学出版物免费即时开放;美国开放科学中心(Center for Open Science,COS)6 年间公开了近200 万份科研文档、近6万份科研项目资料及27 000 余份预印本资源[41]。在此形势下,DOE下属的太平洋西北国家实验室(Pacific Northwest National Laboratory,PNNL)率先开展了开放科学实践活动,在2015 年初利用土壤化学和生物学特性方面的研究成果进行“开放实验”,实时在线记录研究工作各个阶段的数据,使用版本控制、问题跟踪和开源统计软件等的软件工具提高数据完整性和研究步骤的透明度。

4 对我国国家电网的启示

4.1 构建完善的政策法规

开放共享实践的顺利推进离不开体系完整的政策指导。目前,国家电网公司在实验室仪器设备共享服务方面进行了一些探索性工作,并将导向性规定纳入公司管理办法,但尚无操作性强的细则出台。公司亟须构建一套由上至下的开放共享政策体系。

科研机构内部开放共享政策要紧跟国家总体发展战略规划。近年来我国相继出台了《教育部、科技部关于加强高等学校科技成果转移转化工作的若干意见》[42]《国家重大科研基础设施和大型科研仪器开放共享管理办法》[43]《国务院办公厅关于印发科学数据管理办法的通知》[44]《国家科技资源共享服务平台管理办法》[45]等政策,从平台建设、成果转化、科研设施、数据、资源共享等角度对科研机构共享实践提出要求。国家电网公司应积极响应国家战略规划,结合公司实际制定专门的开放共享政策和发展路线。构建了国家、公司和基层3 级实验体系,囊括了数以百计的实验室。这些实验室应根据研发活动特点建立规定细则。

国家电网公司开放共享政策主要侧重点是实验仪器设备开放,要求完善实验室基础设施共享机制,提升实验室资源使用率,节省建设成本,为其他有实验设备共享需求的科研单位提供平台,促进科研创新。但开放共享实践仅涉及设备共享还远不够。DOE 分别制定了开放存取、开放数据和设备等领域的政策。2018年国务院办公厅印发的《科学数据管理办法》中明确表示企业等法人单位应建立科学数据管理系统,公布科学数据开放目录并及时更新,积极开展科学数据共享服务[46],国家实验室还需要增加科学数据开放、开放存取等政策建设,全面支撑国家科技创新、经济社会发展。对实验室活动中的保密信息和资源的审查、辨别和处理是政策制定中需要重点考虑的问题,借鉴DOE的多重审查制度,我国电网公司在开放信息过程中,还要特别注重信息安全性和信息质量的审查。

4.2 应用复合式共享手段

建立统一数据开放平台有利于广泛传播开放共享资源。虽然国家电网公司实验室共享平台已上线试运行,但平台稳定性、易用性不足,未形成数据填报信息维护标准,后期平台使用培训推广以及和国家级平台数据对接工作尚未开展。公司可参考DOE 将科研数据上传至data.gov的实践,将科研数据上传至国家级别的政府数据开放平台之中,为全国的利益相关者提供电力相关的科研信息。这对于增加公司及其科研成果的全国影响力、促进科研成果转化有一定帮助。

DOE及其下属实验室都开展了平台建设工作,虽然这些平台各有特色,但也造成了资源分散、不便获取等弊端。在国家电网公司实验室体系的建设过程中,要避免实验室开放平台各自为政,建议国家电网公司进一步完善实验室共享平台,集成各实验室优势资源,整合原始数据和数据分析等功能。各研究部门通过统一的平台发布特色化主题数据集,并提供相应的数据浏览、数据分析、可视化、数据下载服务。

多样化的主题活动有利于唤醒公众科研意识。目前国家电网在官网的电力科普板块为大众讲解用电常识,扩充普通民众电力知识储备,但前沿科研信息资源分享尚不充分、活动形式尚不丰富。可通过圆桌会议、主题讲座等多种活动形式传播科技知识,并注意细分用户群体。面向大众的科普座谈活动的目的主要是分享浅层知识,氛围应轻松愉悦。面向专业研究人员,可以共享前沿科研信息、激发科研灵感。同时也应重视与用户建立良好的双向交流机制,通过电子邮件、社交媒体等畅通交流渠道。

4.3 全面开放科研资源

公司可将数字、代码、图像等多种形式的科研数据开放到国家电网开放共享平台,并进一步连接至国家平台。考虑以开放存取形式出版不涉密的科研出版物。DOE在一些共享平台设置了用户入口,鼓励用户上传自定义的能源信息。国家电网公司可在科研数据和科研出版物的开放平台内开辟专门的用户参与模块,但需严格把关用户共享的数据和元数据质量,建立完善的数据质量审查机制,保证开放共享平台数据的可靠性。在科研活动中开发的软件可以作为开源软件开放到GitHub平台,追踪开源软件的使用情况,并根据反馈改善软件性能。可以推广产生了良好社会影响的开源软件,并将其作为电网公司宣传案例,以期扩大公司影响力。

国家电网公司下属实验室的仪器设备开放共享积极性不高,部分实验室存在仪器设备闲置现象。也有部分实验室进行了有益的尝试和探索,但由于机制约束和人员限制,并没有开展大规模的共享工作。为贯彻《国务院关于国家重大科研基础设施和大型科研仪器向社会开放的意见》,公司可参考DOE 实验设备开放实践,建立统一的实验室科研设备申请平台。在受理开放共享设施的申请时,公司既要考虑申请的科研价值,又要将其社会和经济价值纳入综合考量。

目前开放科学运动在全球范围内展开,PNNL 实验室率先开展了开放科学实践。电网公司可采取试点先行的形式开放部分非涉密实验的代码数据、文件资料,提高开放数据完整性和科研活动透明度,从而提高科研效率,促进创新发展。

5 结 语

探索、建立以公司各级实验室为主体的开放式创新体系,不仅是国家电网创新发展的需要,也是公司各级实验室发展的内生需求。目前,国家电网下属实验室在开放共享的制度、平台、人员建设方面还存在不少问题,急需建立一套较为完整的开放共享机制。美国能源部实验室的开放共享经验对国家电网实验研究体系的优化与调整具有重要意义,将推动公司科技创新与国家开放共享政策的双向良性互动。

猜你喜欢

实验室信息
电竞实验室
电竞实验室
电竞实验室
电竞实验室
电竞实验室
电竞实验室
订阅信息
展会信息
信息
健康信息