FAIR原则如何成为现实?
2022-07-05邢文明陈继丽邱春艳
邢文明 陈继丽 邱春艳
摘要:[目的/意义]FAIR原则作为一套促进和确保科研数据可发现、可获取、可互操作和可重用的原则,推进其实施,对保障科研数据充分共享与重用,最大限度地发挥科研数据的价值具有重要意义。[方法/过程]对FAIRsFAIR项目的背景、运行模式、工作成效进行深度剖析,并总结对我国推进FAIR原则实践的启示意义。[结果/结论]将FAIR原则融入科研数据管理相关政策中、建设支持FAIR原则的科研数据基础设施、把FAIR原则的理念内涵融入研究生教育体系、建立FAIR设施与服务的认证评估机制能够更好地推动我国FAIR原则的落实与实施。
关键词:FAIR原则;FAIRsFAIR项目;科研数据管理;数据密集型科研范式
DOI:10.3969/j.issn.1008-0821.2022.07.012
〔中图分类号〕G203〔文献标识码〕A〔文章编号〕1008-0821(2022)07-0136-11
How the FAIR Principles Became Reality?
——The Operation Mode,Effectiveness and Practical Enlightenment of the FAIRsFAIRXing Wenming1Chen Jili1Qiu Chunyan
(1.School of Public Policy & Management,Xiangtan University,Xiangtan 411105,China;
2.School of Communication,Qufu Normal University,Rizhao 276826,China)
Abstract:[Purpose/Significance]As a set of principles to promote and ensure the findability,accessibility,interoperability and reusability of scientific research data,the FAIR principles are important to promote the full sharing and reuse of research data and maximize the value of research data.[Method/Process]This study made an in-depth analysis of background,operation mode,and effectiveness of the FAIRsFAIR project,and summarized the enlightenment of implementing the FAIR principle practice in China.[Result/Conclusion]Integrating the FAIR principle into research data management policies,building a research data infrastructure that supports the FAIR principle,Integrating the concept and connotation of FAIR principles into the graduate education system and establishing a certification and assessment mechanism for FAIR facilities and services.
Key words:FAIR principle;FAIRsFAIR project;research data management;data-intensive research paradigm
大數据时代的快速发展和海量数据的不断积累,推动着科学研究由“观察实验”“理论分析”“计算模拟”向数据驱动的科研范式转变,科学研究越来越依赖并建立在多源数据的收集获取、集成整合与多视角分析的基础上。然而,与良好的科学数据资源积累态势形成鲜明对比的是,并非所有的科研数据都能被有效保存,即使被保存的数据,由于技术、经济、安全、隐私保护等因素的制约,导致其很难被发现、理解和使用,数据鸿沟仍然无法得到有效解决[1]。为此,国际社会提出了一套旨在促进和确保科研数据可发现(Findable)、可获取(Accessible)、可互操作(Interoperable)、可重用(Reusable)的FAIR原则[2],以实现科研数据的充分利用与共享,最大限度地发挥科研数据的价值,推动开放科学进展。
FAIR原则提出后,得到了多个国家和地区的积极响应。在杭州举办的G20峰会上发表的《二十国集团领导人杭州峰会公报》指出,(各成员国)将基于FAIR原则提高获取公共财政资助的研究成果的便利性[3]。欧盟在地平线2020(Horizon 2020)计划下启动了多个项目,从不同的角度探讨FAIR原则在实践中落实,并为地平线2020计划制定了《FAIR数据管理指南》(Guidelines on FAIR Data Management in Horizon 2020)。欧盟委员会FAIR数据专家组发布了《将FAIR变为现实》(Turning FAIR Into Reality)[4]的报告,提出了包括27项建议和104项具体行动的措施建议。澳大利亚国家数据服务中心(ANDS)举办了4次关于FAIR原则的网络研讨会,深入介绍FAIR原则内涵[5]。2019年11月8日,国际科技数据委员会(Committee on Data for Science and Technology,CODATA)在其官网发布了《科研数据北京宣言》,强调基于FAIR原则推动公共资助的科研数据的开放获取[6]。学术界也积极对该原则进行探讨。Boeckhout M等指出,FAIR原则有助于解决数据共享过程中在道德、方法和组织等方面的挑战[7]。Wise J等分析了基于FAIR的数据管理原则对于生命科学及生物制药研发行业的有效性,认为FAIR原则是数字化转型的重要推动因素[8]。段青玉等考察了人文社科数据出版平台应用FAIR原则的现状[9]。为了促进对FAIR原则的恰当与一致理解,Jacobsen A等介绍了实施FAIR原则应注意的事项,以促进不同主体基于共识推动FAIR原则的实施[10]。杨啸林等基于FAIR原则探讨生物医学数据标准应用服务[11]。刘凤红等考察了国际出版集团推行FAIR原则的具体举措[12]。叶未央等探讨基于FAIR原则的中医药古籍数字化出版[13]。AD5675B3-4B2B-4EAC-A183-C74F532CBF0B
为推动FAIR原则由接受认可向全面实施转变,欧盟资助实施了欧洲开放科学云(European Open Science Cloud,EOSC)计划,旨在基于FAIR原则推进开放科学运动,消除研究数据共享方面的技术、政策和人为障碍。EOSC从一开始就将FAIR原则作为项目的指导原则和实施基础,《EOSC宣言》将“实施FAIR行动计划、建设FAIR数据文化”确立为3个行动指南之首[14]。为了推动EOSC和FAIR原则的实施,欧盟资助启动了为期3年的FAIRsFAIR项目,旨在为FAIR原则的实施提供切实可行的方案,进而促进EOSC的建设与发展。自2019年3月启动以来,FAIRsFAIR项目与相关伙伴密切合作,开展了一系列专题研讨会、专家访谈、头脑风暴和现状调研活动,发布了系列阶段成果和报告,取得了丰硕成果。在项目即将接近尾声的时候,考察该项目的背景、现状、成效及运作方式,探讨其可资借鉴的经验启示,对推动FAIR原则在我国的实施、促进我国开放科学深入发展和科研数据充分共享具有较好的启示意义。本文拟通过对FAIRsFAIR项目的调研与考察,分析其现状、运行方式和经验启示,为我国相关部门提供参考。
1欧盟搭建开放科学的国际合作平台——FAIRsFAIR项目作为推动欧洲FAIR数据实践和EOSC建设与发展的项目,FAIRsFAIR项目的总体目标是探讨并开放共享有关FAIR原则的知识、技能、指南、案例、课程和教育资源,促进EOSC的建设与发展[15]。其具体目标是:①促进符合FAIR原则的数据的产生和使用;②提高FAIR资源的互操作性;③开发一个基于认证的FAIR能力成熟度模型;④建立一个可信的数字存储库网络;⑤为科学界建立FAIR能力中心;⑥将FAIR数据教育融入大学课程中。FAIRsFAIR提供并支持有关数据政策和实践的建议,为语义互操作提供解决方案和支持,支持可信数据存储库的认证和评估,并为高等教育开发FAIR能力框架。最终,FAIRsFAIR将提供一个平台,供欧洲研究数据提供者和数据存储库在日常工作中使用和实施FAIR原则。此外,FAIRsFAIR还将提供参与规则(Rules of Participation,RoP)的基本FAIR维度和参与EOSC的法规遵循。
FAIRsFAIR通过与全球相关组织的广泛合作来实现其目标,目前已有22个合作者[16],其中,核心合作伙伴有6个:欧洲大学联盟(European University Association,EUA)、(荷兰)数据归档网络服务(Data Archiving Networked Services,DANS)、(英国)数字监护中心(Digital Curation Centre,DCC)、Trust-IT Services、(英国)科技设施委员会(Science & Technology Facilities Council)、(芬兰)IT科学中心(IT Center for Science,CSC)。同时,FAIRsFAIR还与RDA、CODATA、WDS、GO-FAIR、the ESFRI-clusters及其他合作者开展战略合作。如2019年,FAIRsFAIR和OpenAIRE、RDA Europe、EOSC-hub共同组织了一个主题为“支持FAIR數据的服务”的系列研讨会(共3个,两个在4月,1个在9月),旨在探讨现有基础设施如何协同工作,以及如何提供服务以支持产生符合FAIR原则的研究成果[17]。在2019年的Open Science FAIR(OSFAIR)会议上,FAIRsFAIR与OpenAIRE、FIT4RRI和EOSCSecretariat.eu共同主办了其中5个研讨会,围绕开放科学、学术交流和FAIR原则的实施等议题展开[18]。
2“金字塔”式的组织执行机构
2.1“3+3”的组织决策与顾问咨询机构
为保障项目的顺利实施,FAIRsFAIR建立了3个组织决策与执行机构:联合大会(General Assembly,GA)、执行委员会(Executive Committee,EXC)和项目协调办公室(Project Coordination Office,PCO)。其中,联合大会(GA)是最高决策机构,负责就FAIRsFAIR项目的目标方向和工作任务进行决策,执行委员会(EXC)负责日常工作的管理,项目协调办公室(PCO)是行政和支持机构。
同时,FAIRsFAIR建立了3个顾问咨询工作组,作为项目的顾问咨询和辅助协调力量:
1)高级咨询委员会(High Level Advisory Committee,HLAC),由FAIRsFAIR的执行委员会任命的一个国际专家组(涵盖研究机构/组织、研究资助者、政策制定者、标准化机构和出版商等利益相关者),负责就项目的战略和实施提供独立的专家建议和咨询,并协助项目的组织决策执行机构(即联合大会、执行委员会和项目协调办公室)确保FAIRsFAIR能够调整其战略并在快速变化的数据环境中保持相关性。
2)欧洲FAIR冠军组(European Group of FAIR Champions,EGFC),是FAIR领域的数据科学专家和实干者。每个EGFC成员代表着一个不同学科领域或利益相关者群体,就FAIRsFAIR运行过程中遇到的挑战提供咨询,同时作为FAIR大使,分享FAIR实施案例,推动相关政策的制定与实施,以促进FAIR原则的采用和对EOSC的支持,并鼓励跨领域参与FAIR运动。
3)同步团队(Synchronisation Force),FAIRsFAIR项目面临的一个重要挑战是如何确保其各项活动与EOSC项目中各项事务的一致性。同步团队的目标即加强EOSC和FAIRsFAIR项目的对话与协调,以最大限度地加强合作,减少重复,共同推进欧盟委员会“FAIR数据专家组”发布的《将FAIR变为现实》(Turning FAIR Into Reality)报告的实施。为了在整个EOSC项目生命周期内跟踪和评估FAIR原则的实施情况,同步团队与FAIR利益相关者一起举办系列研讨会,以促进利益相关者之间的对话,并确定共同的优先事项。AD5675B3-4B2B-4EAC-A183-C74F532CBF0B
2.2基于任务细分的多个专题工作组
为推动项目整体目标的实现,FAIRsFAIR建立了7个专题工作组(Work Package),分别围绕项目的管理沟通、FAIR原则的政策与实践、相关标准认证、教育培训等主题开展工作,如表1所示,为FAIR原则的落实与实施提供指导建议和参考方案。
上述工作组分别承担着不同的角色职责,如工作组1主要负责项目的沟通与协调,确保项目的目标达成与质量保证;工作组2和工作组3聚焦FAIR原则的实践进展和政策优化,为相关部门提供参考建议;工作组4专注于科研数据储存库的FAIR化认证与评估,为推动FAIR原则的实施提供平台保障;工作组5负责项目的宣传推广工作,推动项目成果被相关部门了解、认可和采纳;工作组6和工作组7围绕FAIR原则的教育培训展开工作,使FAIR原则理念得到最大程度的传播与普及。这些工作组各司其职并互相支持配合,共同推动FAIRsFAIR项目目标的实现。
3FAIRsFAIR項目的实践进展
为推动FAIR原则的落实与实施,FAIRsFAIR项目在与相关伙伴广泛合作的基础上,围绕FAIR原则实践现状考察、数据政策、标准规范与认证、教育培训等方面开展工作。目前,工作进展主要包括5个方面:一是建立了供相关人员分享FAIR相关资源的专业知识共享中心——能力中心;二是开发了3款工具软件,为推进FAIR原则的实施提供实践支持;三是基于FAIR原则实践现状的考察,提出相关建议;四是提出FAIR数据能力框架,推动FAIR原则融入高等教育课程体系;五是举办FAIR国家路演,促进对FAIR原则的广泛认知与理解。
3.1建立能力中心,作为FAIR原则的学习、交流与分享平台FAIRsFAIR能力中心(Competence Center)是实施FAIR原则,通过领导、协调和服务以连接不同领域的相关人员、专业指导、学习资源和课程资源的共享中心。作为FAIRsFAIR项目和研究社区之间的纽带,其目标是创造一个网络空间平台,汇集来自不同领域的最佳实践,使能力中心成为FAIR原则的参考交流平台。FAIRsFAIR能力中心围绕3个方面开展工作:①咨询:提供网络空间,便于利益相关者合作交流;②协调:一致地描述与FAIR数据管理相关的资源,在协调政策、工具和资源方面发挥领导作用;③传播:提供培训和课程资料,实现基于最佳实践的共享。为支撑这些目标的实现,能力中心建立了3个功能版块:
1)培训图书馆(Training Library),包含一系列可重复使用的培训资料、指导资源、出版物和其他工具,以帮助数据管理员、政策制定者和研究人员创建FAIR数据和将数据FAIR化。
2)FAIR数据论坛(FAIR Data Forum):供各类用户(个人、机构、组织)发布FAIR相关的问题、答案、评论和相关通知的开放空间。论坛包含一个咨询台,是分享专业知识和向社区学习交流的空间。用户能够访问培训资料、接受指导、分享最佳实践,同时与其他用户互动。
3)出版物(Publications):一个可以找到关于培训的文章和出版物的空间(不限于这些),资源类型包括文章、报告、博客等。
4)培训活动(Training Activities):为高等教育机构编制数据科学课程规划,并将FAIR数据技能融入其中,同时为数据科学家、数据管理员和其他相关专业创造与现有能力框架整合的途径。如开发一个可以集成到不同教育层次的“FAIR数据能力框架”,为大学提供教育和培训材料,并提升大学应用这些材料的能力等。
3.2开发工具与软件,为FAIR原则的实施提供实践支持FAIRsFAIR项目的重要目标之一是为在整个研究数据生命周期实施FAIR原则提供实用的解决方案,为此,FAIRsFAIR从两方面进行努力:一是制定相关评估指标;二是基于这些评估指标开发了3款实用评估工具:
1)FAIR认知自我评估工具(FAIR-Aware):一款由FAIRsFAIR的合作伙伴——DANS、DCC、UniHB共同开发的在线工具,目标是帮助研究人员和数据管理者评估自己对FAIR原则的了解程度,如图2所示。尽管FAIR原则的提出已有数年时间,但对大多数从事科研的人员来说,如何使数据FAIR化仍然是一个陌生的过程。为了帮助研究人员和数据管理员弥补这一不足,FAIR-Aware强调通过教育提高人们对FAIR原则的认识,而不仅仅是评估其数据集符合FAIR原则的程度。该工具为在线免费开放问卷的形式,包括10个精心设计的问题,涵盖了FAIR原则的所有方面,使用者借此可了解自己对FAIR原则的认知度。提交答案后,用户会收到“FAIR意识”分数以及使他们的数据集更加FAIR的建议。在问卷的下面,还列出了对每个问题所包含原理的详细解释,并附以实例。用户在回答问题的过程中可参考这些信息,以提高其对FAIR原则的理解,了解如何使数据FAIR化。
该工具既有助于提升广大研究人员有关FAIR原则的知识与技能,增强FAIR素养,也便于数据管理员将其纳入为研究人员提供的服务中[20]。自2020年6月发布Beta版并开展测试以来,该工具得到持续优化,以更好地符合用户的需求。最新调研结果表明,81%的受访者认为该工具有助于提高他们对FAIR原则的认识和理解,认为该工具清晰、信息丰富且适用于不同研究领域。这有力地证明了向研究界提供此类支持工具的价值。
2)数据对象评估指标(Data Object Assessment Metrics):FAIR原则代表可应用于广泛学术成果的、领域独立的高层次原则[2]。为推动该原则的实施,FAIRsFAIR项目从尽可能广泛和跨所有学科应用的视角出发,提出“领域无关”的指标来评估研究数据的FAIR度。为此,FAIRsFAIR以RDA“FAIR数据成熟度模型工作组”的《FAIR数据成熟度模型规范和指南建议》为基础,制定了一套用于评估研究数据对象和工具的FAIR度的最低指标,以满足研究人员和数据存储库的要求。AD5675B3-4B2B-4EAC-A183-C74F532CBF0B
如图3所示,根据相关反馈(如焦点小组研究、公开咨询和试点存储库),FAIRsFAIR对评估指标进行了多个阶段的改进,最新版本的指标及其内涵如表2所示。
3)F-UJI自动化FAIR数据评估工具(F-UJI Automated FAIR Data Assessment Tool)是一个开源工具,实现了REST API,可根据上述FAIR对象评估指标对研究数据集的FAIR度进行评估。对于这些指标中的每一个,已经根据现有标准和最佳实践为基于机器的验证实施了实际测试。F-UJI遵守现有的网络标准和PID解析服务最佳实践,并利用外部注册表和资源,例如re3data和Datacite AP、SPDX许可证列表、RDA元数据标准目录和关联开放词汇表(Linked Open Vocabularies)。
F-UJI已通过Github平台作为开源软件公开提供,允许包括商业用途在内的广泛应用。FAIRsFAIR希望该工具能获得尽可能广泛的使用,这将对工具的可持续开发完善有重要意义。理想情况下,在不久的将来,活跃的用户和开发者社区会持续使用、维护和不断改进F-UJI。同时,越来越多的利益相关者开始注意到F-UJI并在实践中予以采用。如EOSC北欧团队正在利用F-UJI监控和改善其北欧数据存储库的FAIR度,研究基础设施ICOS和ENVRI-FAIR希望使用F-UJI进行内部FAIR评估。在国家层面,比利时经济共同体研究数据门户以及德国NFDI4Chemistry表达了使用意向。在机构和组织层面,巴西农业研究公司、西班牙DATEST项目、丹麦地质调查局(GEUS)和一些大学及研究机构(如根特大学、奥尔登堡大学、爱荷华大学、意大利国家研究委员会、韩国科学技术信息研究所等)均表达了合作兴趣。
3.3发布政策与实践报告,梳理FAIR实施现状与未来建议了解现状是FAIRsFAIR开展工作的前提和基础。2019年3—11月,FAIRsFAIR采用公开咨询、文献研究和访谈的方式,围绕影响研究人员工作方式的政策、不同学科FAIR实践的成熟度水平、研究人员目前可获得的支持来源3个方面来评估当前的FAIR政策和实践环境,共收到106封回复。此外,FAIRsFAIR还对当前不同层面(国家、资助者、出版商、机构)的42项数据政策进行了分析,梳理支持或阻碍FAIR数据实践的政策要素,并分享良好实践的案例。据此,FAIRsFAIR发布了一系列报告和针对政策制定者、数据管理员和存储库管理者的实用建议,如图4所示。
3.4开发数据能力框架,推动FAIR原则融入高等教育体系为更好地推动FAIR原则的实施,FAIRsFAIR项目将开发FAIR数据能力框架(FAIR Data Competence Framework),以推动FAIR原则的理念、知识和技能融入高等教育人才培养体系作为重要努力方向。为此,项目团队进行了系列深度环境扫描研究:一是调研欧洲各高等院校当前的科研数据政策、科研数据管理与服务,以及对FAIR原则的支持度、科研数据管理的教育培训现状、对FAIR原则的认识与了解程度等,形成了《欧洲高等教育FAIR现状》[21]报告;二是调研分析科研数据管理、开放科学和FAIR原则相关领域现有的技能与能力框架、教育资源和培训项目,目的是为FAIR原则技能框架的設计和应用提供支持[22]。在此基础上,推出了FAIR数据能力框架(FAIR Data Competence Framework),包括“面向高等教育的FAIR能力框架”[23]“高校FAIR能力采用手册”和“FAIR能力培训的良好实践”等系列建议指南,如图5所示。
3.5举办国家路演,广泛宣传FAIR原则
为了促进欧洲不同国家对FAIR原则的认知与采纳,FAIRsFAIR项目计划于2021—2022年在欧洲国家开展“FAIR国家路演”(National Roadshow Series),目前已经在罗马尼亚、西班牙、芬兰、爱尔兰、荷兰5个国家开展线上路演,如表3所示。
4FAIRsFAIR项目对推动我国FAIR实践的启示
4.1将FAIR原则融入科研数据管理相关政策中
政策是推动科研数据管理与共享、提升科研人员FAIR意识、促进FAIR原则落实的最有效措施之一。推动支持FAIR原则的相关政策地制定与实施也是FAIRsFAIR项目的重要目标和举措。作为我国首个国家层面的、专门面向规范科学数据管理共享的政策,我国《科学数据管理办法》充分借鉴国内外先进经验和成熟做法,已体现了FAIR原则的部分要求,如:①要求主管部门组织编制并公布科学数据资源目录,同时鼓励主管部门和法人单位积极推动科学数据的出版传播工作,有助于促进科研数据的“可发现”;②推动建立科学数据共享中心,有助于保障科研数据的“访问与获取”;③要求法人单位及科学数据生产者要按照相关标准规范进行科研数据的采集生产、加工整理和长期保存,形成便于使用的数据库或数据集,有助于保障科研数据的“可互操作”和“可重用”。然而,这些规定较为抽象和笼统,不够具体,要落实到实践中还需要相关实施细则或具体措施的支撑。如编制和公布数据资源目录是确保数据资源的可发现,进而实现获取利用的前提,但如果没有为数据资源建立唯一和持久稳定的标识系统(如持久唯一标识符),则很可能会因资源被移动或其他原因导致链接失效,无法获取和使用[24]。又如,若共享的数据资源没有包含足够的元数据或说明文档,则用户即便获得数据,也可能因不清楚数据的含义而无法利用。可见,亟待对《科学数据管理办法》进行修订完善或通过实施细则将FAIR原则的相关要求融入政策中,以更好地推动FAIR原则在我国的落实,促进科研数据的充分高效共享。
4.2建设支持FAIR原则的科研数据基础设施
FAIR原则的实施离不开相关基础设施特别是科研数据存储库/平台的支持,如为数据提供长期稳定安全的存储,为数据提供唯一标识符,支持数据的易于发现、访问获取、互操作等。此外,科研数据基础设施不仅仅包括数据存储库/平台,为了更好地支持FAIR原则的落实,还需要在以下方面努力:①制定适用于广泛对象类型的持久标识符,如针对出版物的数字对象标识符(DOI)、针对研究人员的(ORCID)等,并根据实际需要,尽快为其他类型的对象(如数据集、组织机构、仪器装置等)制定持久标识符;②制定开发特定领域的领域知识本体,以便数据获得者对不同来源的数据集进行集成融合;③采用人类和机器共同可读的标准,以支持数据集的可发现、可重用和可互操作(如CC协议);④能自动生成或获取符合相应领域标准的元数据[25]。我国在这方面也进行了较多努力,2019年6月,科技部、财政部对原有国家科技资源共享服务平台进行优化调整,形成20个国家科学数据中心[26],同时,科技部和财政部还共同印发了《国家科技资源共享服务平台管理办法》,以推进我国科技资源的开放共享。在此基础上,形成了科学数据银行(ScienceDB)、中国科技云、全球变化科学研究数据出版系统等一批基于FAIR原则的科研数据存储、管理与服务的基础设施。但与实际要求相比,还存在不少差距,有待进一步推进以国家科学数据中心为代表的科研数据储存库向基于FAIR原则的科研数据基础设施发展,以支持我国科研数据的高水平共享。AD5675B3-4B2B-4EAC-A183-C74F532CBF0B
4.3把FAIR原则的理念内涵融入研究生教育体系
正如《将FAIR变成现实》(Turning FAIR Into Reality)报告所指出的,FAIR原则的实施是一项重大的事业,需要从系统和整体的角度同步推进研究文化和基础设施的变革,一方面,应将FAIR原则的要求嵌入研究实践的流程中;另一方面,应将数据技能纳入大学课程[27]。为了提升研究人员对FAIR原则的认识与理解,塑造全新的FAIR文化与生态,FAIRsFAIR项目一方面通过多种措施宣传FAIR原则的内涵与要求;另一方面积极探索将FAIR原则融入高等教育课程体系。该项目开展的一项针对欧洲高等教育领域的FAIR教育现状的调研表明:高等教育机构对提高学生、研究人员和专业人员的研究数据相关技能和能力表现出明显的兴趣,部分高校已经制定了数字素养和技能提升规划,越来越多的机构表达了在未来制定此类规划的意图,表明高等教育机构认为有必要培养学生的数字技能和能力[28]。此外,FAIR教育与培训不应仅限于数据管理技能,除了与数据相关的能力和知识外,还需要了解科研管理、科研服务等相关知识,以便更好地开展FAIR实践与服务。鉴于此,FAIRsFAIR项目基于EDISON数据科学框架(EDISON Data Science Framework,EDSF)提出了数据管理专业能力框架(Data Stewardship Professional Competence Framework,CF-DSP)[29]。国外在科研数据素养人才培养方面已经有了一些实践探索[30],而我国高校在科研数据管理、数据监护相关教育方面,专门的项目和课程还较少[31]。因而,我国应充分借鉴其有关思路和成果,将FAIR原则相关的知识和技能有序融入研究生和博士生教育体系,培养未来的FAIR数据专家,建立和塑造适应FAIR原则的科研生态系统。
4.4建立FAIR设施与服务的认证评估机制
对FAIR相关设施与服务进行认证和评估是推动FAIR服务的重要途径。通过认证,可以明确哪些基础设施和服务符合FAIR原则的要求,并向用户推荐,从而有助于FAIR原则的逐步落地。基于此,FAIRsFAIR项目从两方面入手:一是推动欧洲的数据存储库获得CoreTrustSeal认证,以证明并促进数据储存库的管理与服务能力[32];二是基于文献分析、服务提供者的访谈以及邀请存储库和其他数据服务者试用并收集反馈信息等方法,提出了包含7个方面和50项不同优先级建议的服务评估框架(Service Assessment Framework),以帮助FAIR服务提供者(即为研究数据开发和提供服务的个人或组织)不断改进和提升其服务的FAIR度。该框架适用于多领域并适用于所有类型的服务,并可以被FAIR生态系统中的众多利益相关者使用[33]。目前,我国已有一些数据库申请并获得了CoreTrustSeal认证,如中国天文数据中心[34]、WDC可再生资源与环境数据中心[35]、中国地球物理学科中心[36]、国家空间科学数据中心[37]、国家人口健康科学数据中心数据仓储[38],为提升我国科研数据储存库的专业水平和服务能力奠定了基础。未来,我国可借鉴FAIRsFAIR的思路,在参考国际经验的基础上,探索建立适合我国的FAIR设施与服务评估认证的标准机制,不仅有助于促进我国FAIR设施与服务的建设发展,推动FAIR原则在我国的实施,同时也可促进我国更多地参与国际交流合作,提升我国科研数据管理与服务的国际化水平,以及在相关领域的国际影响力,此外,还有助于推动形成FAIR数据管理与服务交流社区,共同推进FAIR原则在我国的实施与发展。
参考文獻
[1]宋佳,温亮明,李洋.科学数据共享FAIR原则:背景、内容及实践[J].情报资料工作,2021,42(1):57-68.
[2]Wilkinson M D,Dumontier M,Aalbersberg I J,et al.The FAIR Guiding Principles for Scientific Data Management and Stewardship[J].Scientific Data,2016,3(1):167-172.
[3]2016年G20峰会官网.二十国集团领导人杭州峰会公报[EB/OL].http://www.g20chn.org/hywj/dncgwj/201609/t20160906_3392.html,2021-09-07.
[4]European Commission Expert Group on FAIR Data.Turning FAIR Into Reality:Final Report and Action Plan from the European Commission Expert Group on FAIR Data[R/OL].https://ec.europa.eu/info/sites/default/files/turning_fair_into_reality_1.pdf,2021-07-16.
[5]Australian National Data Service.FAIR Webinar Series[EB/OL].https://www.ands.org.au/working-with-data/the-fair-data-principles/fair-webinar-series,2021-09-07.
[6]CODATA.The Beijing Declaration on Research Data[EB/OL].https://srd.nmdc.ac.cn/codata/web/pdf/Beijing%20Declaration-19-11-07-FINAL.pdf,2021-09-07.AD5675B3-4B2B-4EAC-A183-C74F532CBF0B
[7]Boeckhout M,Zielhuis G A,Bredenoord A L.The FAIR Guiding Principles for Data Stewardship:Fair Enough?[J].European Journal of Human Genetics,2018,26(7):931-936.
[8]Wise J,Barron A G,Splendiani A,et al.Implementation and Relevance of FAIR Data Principles in Biopharmaceutical R&D[J].Drug Discovery Today,2019,24(4):933-938.
[9]段青玉,王晓光.人文社科数据出版平台FAIR原则应用调查研究[J].科技与出版,2019,(4):6-11.
[10]Jacobsen A,Azevedo R,Juty N,et al.FAIR Principles:Interpretations and Implementation Considerations[J].Data Intelligence,2020,2(1):10-29.
[11]杨啸林,杨晟,潘虹洁,等.FAIR准则与生物医学数据标准应用服务[J].中国医学伦理学,2020,33(2):153-159.
[12]刘凤红,彭琳.FAIR原則背景下国际出版集团的数据政策和实践[J].中国科技期刊研究,2021,32(2):173-179.
[13]叶未央,周生辉.基于FAIR原则的中医药古籍数字化出版[J].出版发行研究.2021,(2):49-54.
[14]European Commission.EOSC Declaration[EB/OL].https://eosc-portal.eu/sites/default/files/eosc_declaration.pdf,2021-09-07.
[15]FAIRsFAIR.The Project[EB/OL].https://www.fairsfair.eu/the-project,2021-09-06.
[16]FAIRsFAIR.The Partners[EB/OL].https://www.fairsfair.eu/partners,2021-09-06.
[17]FAIRsFAIR.A Series of 3 Workshops in Europe-Services to Support FAIR Data[EB/OL].https://www.fairsfair.eu/news/series-3-workshops-europe-services-support-fair-data,2021-09-06.
[18]FAIRsFAIR.Outcomes from FAIRsFAIR Workshops at OSFAIR 2019[EB/OL].https://www.fairsfair.eu/articles-publications/outcomes-fairsfair-workshops-osfair-2019,2021-09-06.
[19]FAIR-Aware[EB/OL].https://fairaware.dans.knaw.nl/,2021-09-08.
[20]FAIRsFAIR.FAIR-Aware:Assess Your Knowledge of FAIR[EB/OL].https://www.fairsfair.eu/fair-aware,2021-09-08.
[21]Zenodo.D7.1 FAIR in European Higher Education[R].https://zenodo.org/record/5361815#.YTdxZRMhUgM,2020-02-28.
[22]Zenodo.D7.2 Briefing on FAIR Competences and Synergies[R].https://zenodo.org/record/5361913#.YTdyHhMhUgM,2020-02-28.
[23]Zenodo.D7.3 FAIR Competence Framework for Higher Education[R].https://zenodo.org/record/5361917#.YTdz9BMhUgM,2020-02-28.
[24]Juty N,Wimalaratne S M,Soiland-Reyes S,et al.Unique,Persistent,Resolvable:Identifiers as the Foundation of FAIR[J].Data Intelligence,2020,2(1-2):30-39,302.
[25]Koers H,Bangert D,Hermans E,et al.Recommendations for Services in a FAIR Data Ecosystem[J].Patterns,2020,1(5):1-10.https://doi.org/10.1016/j.patter.2020.100058.
[26]中华人民共和国科学科技部.科技部 财政部关于发布国家科技资源共享服务平台优化调整名单的通知[R/OL].http://www.gov.cn/xinwen/2019-06/11/content_5399105.htm,2021-09-03.AD5675B3-4B2B-4EAC-A183-C74F532CBF0B
[27]European Commission. Turning FAIR into Reality[R/OL].https://ec.europa.eu/info/sites/default/files/turning_fair_into_reality_1.pdf,2021-09-03.
[28]Zenodo.FAIR in European Higher Education[R/OL].https://zenodo.org/record/3629683#.YTIv_cg_E88,2021-09-03.
[29]Demchenko Y,Stoy L.Research Data Management and Data Stewardship Competences in University Curriculum[R/OL].http://www.uazone.org/demch/papers/educon2021-data-stewardship-competence-fw-v02.pdf.
[30]郝媛玲,沈婷婷,高珊.高校數据素养教育实践的思考和建议——基于哈佛大学案例和我国图书情报人员访谈的分析[J].图书情报工作,2015,59(12):44-51.
[31]周志峰.数据密集型科研范式下我国高校数据监护教育模式探析[J].江苏科技信息,2021,38(2):78-80.
[32]韩雪华,王卷乐,石蕾,等.荷兰数据认可印章科学数据仓储认证及启示[J].中国科技资源导刊,2018,50(1):14-19.
[33]Zenodo.D2.7 Framework for Assessing FAIR Services[R].https://zenodo.org/record/5336234#.YTMyO_ZuI2w,2021-09-04.
[34]国家天文科学数据中心.中国天文数据中心成为亚洲首个通过CoreTrustSeal认证的数据中心[EB/OL].https://nadc.china-vo.org/article/20181029094952,2021-12-24.
[35]王卷乐,王祎,卜坤,等.世界数据系统CoreTrustSeal数据中心认证实践——以WDC可再生资源与环境数据中心为例[J].农业大数据学报.2019,1(3):71-81.
[36]北京空间环境国家野外科学观测研究站.中国地球物理学科中心获得CoreTrustSeal国际认证[EB/OL].http://bnose.geophys.ac.cn/news/202007/2020071401.html,2021-12-24.
[37]国家空间科学数据中心.国家空间科学数据中心通过CoreTrustSeal国际认证[EB/OL].http://www.cssar.cas.cn/xwdt2015/zhxw2015/202011/t20201104_5736680.html,2021-12-24.
[38]国家人口健康科学数据中心仓储PHDA获得CoreTrustSeal全球核心可信存储库国际认证[J].医学信息学杂志,2021,42(7):94.
(责任编辑:陈媛)AD5675B3-4B2B-4EAC-A183-C74F532CBF0B