科研信息基础设施的运行治理模式研究
2022-12-22张丽丽黎建辉
张丽丽,黎建辉
中国科学院计算机网络信息中心,北京 100083
引 言
科研信息基础设施(又称“数字科研基础设施”,Digital Research Infrastructure)是将分布式的多类ICT资源聚合以支持协作科研活动的各类技术平台与服务的统称[1]。依据资源类型,可将科研信息基础设施细分为网络基础设施、存储基础设施、算力基础设施、数据与信息基础设施,以及聚合多类资源的综合信息基础设施等;也可依据服务形态[2],将其分为科学文献平台、科学数据与信息平台、算法与软件代码平台、领域主题服务平台、虚拟科研环境以及联邦服务平台。科研信息基础设施,是支持科研发现的载体,是全科研过程强有力的技术与服务支撑力量。
在众多科研信息基础设施中,如何建立和推进有效的治理模式显得尤为重要。以笔者所在的“中国科技云”为例,作为国家级综合性科研基础设施,在十三五国家信息化规划期间,“中国科技云”致力于打造成为“基于云计算的国家科研信息化基础设施”[3],十四五期间[4]则进一步构建基于云网融合的新型算力基础设施,持续提升科研创新服务能力。科研信息基础设施的建设,并非一蹴而就,如何保障技术研发、平台建设、资源汇聚、服务推送等的可信、可靠、可持续,需要一套强有力的宏观治理框架来提供理论支撑和现实指导。为此,本文将依托国内外相关平台实践的比较分析,探讨科研信息基础设施的有效治理,以期对相关领域发展有所 裨益。
1 研究进展
科研信息基础设施建设是推动科研创新、社会治理、全球与区域合作的基石,它将公私各领域以及政府、研究机构、企业和公民等相关利益者[5]联合起来,推动资源共享、激发科研创新。
当前科研信息基础设施治理研究,主要集中在理论、技术和实践等方面。其中,治理理论探索,如引入制度理论[6]、二元性理论[7]、福柯话语理论[8]等,以强化治理机制设计、治理决策过程的完善性,确保建立统一的全局治理框架[9],有效调度资源、交付服务。技术治理内容更为丰富,如联邦化的技术架构[10-11],面向多科研资源融合的场景化[12]解决方案,面向科研过程的智能化[13]设计、安全策略与算法[14-15],系统可信[16]与可靠性[17]建设,也包括针对性解决方案,如网络通信优化方法[18]、算力资源有效调度[19]与自动化管理[20]、异构资源的容器化封装[21]、数据资源的语义关联[22]、质量控制等。而在治理实践方面,全球科研信息基础设施建设如火如荼,包括:综合性基础设施建设,如欧洲开放科学云(European Open Science Cloud, EOSC)、澳大利亚科研数据共同体(Australian Research Data Commons, ARDC)、加拿大创新科研基础设施组织(New Digital Research Infrastructure Organization, NDRIO)、马来西亚开放科学平台(Malaysia Open Science Platform, MOSP)、中国科技云CSTCloud等;网络基础设施,如美国的INTERNET 2、欧洲GÉANT、韩国KREONET、中国教育和科研计算机网CERNET、中国科技网CSTNET等;算力基础设施,如欧洲EGI.eu、美国的开放科学网格(Open Science Grid, OSG)、澳大利亚国家算力基础设施(National Computational Infrastructure of Australia, NCI)、瑞典算 力基础设施(Swedish National Infrastructure for Computing, SNIC)、中国国家超算网格等。此外,数据基础设施更多地分散于不同区域、学科领域和研究主题,如我国的二十个国家科学数据中心,又如南非空间科学SASDI[23]、印尼核能领域BATAN[24]、瑞典生物多样性Lifewatch[25]、英国数字健康基础设施[26]、欧洲海洋科学基础设施JERICO-RI[27]、天文科学斯隆巡天数据基础设施[28]、人文科学DatabencArt[29]等。与此同时,科研基础设施建设还面临着诸多挑战,如运营模式与管理机制的可持续性[30]、科研资源的分散性[31]、服务与科研创新模式的匹配性[32]、技术革新的不确定性[33]等。为此,初步的应对建议包括建立更为稳定的公共资金和新的创收模式保障[34],适当的激励措施、计量指标和执行机制等。
从治理研究现状来看,挑战颇多。当前的应对方案讨论多从领域实践入手,覆盖全科研过程和多科研资源的宏观治理框架尚需扩展。为此,本文将构建统一的治理框架体系,遴选案例实践对比分析,形成面向科研信息基础设施治理的系统性思考建议。
2 研究设计
科研信息基础设施同时是资源密集型的科研生态系统。如何保障其长期健康发展,需厘清该生态系统中的各类组成要素及其相互作用关系。科研信息基础设施的组成要素主要包括相关利益者、各类科研资源与技术,以及综合化的服务平台。相关利益群体责权利的有效平衡,需要较为成熟的治理模式提供支撑;网络、存储、算力、数据、模型、软件算法等资源与技术交互共享,则需配套高效的服务策略支持;此外,良好的运营模式将为基础设施长期可持续发展提供坚实保障。为此,笔者建立科研信息基础设施的基本治理模型框架(见图1),即以组织模式、服务模式、运营模式为核心的综合治理架构。
图1 科研信息基础设施治理框架Fig.1 Governance framework of the research e-infrastructure
依托上述治理框架,本文的主要关注点包括:
(1)组织模式:科研信息基础设施的典型组织模式内容与特征。
(2)服务模式:科研资源的汇聚和服务方式。
(3)运营模式:可持续的商业模式,如成本分摊机制、激励措施等。
根据前述科研信息基础设施的内容分类,同时结合先期工作经验和文献调研,重点选取综合性基础设施、网络基础设施、算力基础设施和以领域主题为聚焦的数据基础设施等代表性案例。其中,国外案例见表1,同时为加强国内外实践对比,遴选国内案例,就特定维度展开对比分析和补充,详见表2。
表1 国外案例概况Table 1 Overview of the alien cases
表2 国内案例概况Table 2 Overview of the domestic cases
3 科研基础设施的核心治理框架
3.1 组织模式
组织保障是科研基础设施运行管理的基础。良好的组织模式建设需要完整的相关利益群体角色识别、充分的责权利分配以及自洽的决策机制设计。表3所示为遴选案例的组织模式建设情况。
表3 组织模式分析Table 3 Comparative analysis of the organizational model
其中,“欧洲开放科学云”致力于在各成员机构现有组织架构基础上,打破科研基础设施孤岛,建立使相关利益者群体(如科研用户、资金供给方、服务提供方等)主动参与的、可持续的、强化资源管理能力的“目的导向型泛欧治理框架”。同时治理架构建设还应坚持轻量化、适应国际范围建设需要,确保监管工作适时适度、服务供给有章可循,同时促进跨域合作、激发最佳实践等[44]。作为非营利性机构,GÉANT参考公司治理结构的组织方式来管理国家、机构、战略伙伴间的合作。INTERNET 2围绕美国高等教育会员网络服务,提供了以会员为中心的架构。ESnet、CERNET、CSTCloud则采取垂直放射型组织架构,兼顾核心资源的稳定建设和外部资源的开放延展性。EGI面向跨国、跨区域合作形式,采用泛欧联邦制模式,来吸纳并管理松散分布的资源与服务。XSEDE则采取环状组织架构,强调逐级权力的集中和外部开放合作的可能。
从上述案例可知,治理结构是组织模式的最重要内容,是决定基础设施建设发展方向和未来的关键力量。与此同时,组织边界方面,仍需不断识别潜在利益相关主体,来推动基础设施生态系统的建设的完整性和良性发展,例如,对于更广泛用户(如创新企业、公民科学)的服务定位,决策机制中对于外部力量的有效引入(如开放性工作组、外部咨询团队的灵活接入等)等。组织模式由机构性质决定,同时还受制于经费来源,并伴随着差异化的资源服务模式选择。
3.2 服务模式
服务模式是科研基础设施中服务提供者与用户交互的主要形式和内容,遴选案例服务模式方面的主要内容,详见表4。
表4 服务模式分析Table 4 Comparative analysis of the service model
续表
其中,EOSC的联邦模式采取横纵联合方式,将项目内外、合规和兼容资源都纳入EOSC框架之中,以提升资源建设的丰裕度和服务的健壮性。在系统定位方面,强调资源FAIR化(Findable, Accessible, Interoperable, Reusable)、功能服务化(Function as A Service),致力于建设高度分布式的异构混合云,依托跨域分布的开放EOSC节点形成开放创新的系统之系统(System of System, SoS),面向科研人员、企业、公民提供全球化、联邦化的多学科服务。GÉANT围绕网络基础设施核心资源,提供从安全认证到网络联通、云解决方案在内的一体化服务,强调通过国际网络互联,推进全球跨域资源互访。INTERNET2和ESnet则更多聚焦科研网络基础设施为核心的纵深科研生态系统建设。EGI作为EOSC的核心参与机构之一,采取了类似EOSC的策略——通过云联邦建立资源分散、服务集中的汇聚体系。XSEDE和CSTCloud则强调建设统一科研生态系统的重要性,并研发定制软件、中间件、平台,为分散资源的有效汇聚、调度和可信认证等提供技术保障。其中,XSEDE生态系统由17家项目参建单位共同提供核心算力资源汇聚。XSEDE同时与其他机构就硬件基础设施和软件开发访问(应用程序代码、社区代码、中间件、收费和其他领域开发)等开展合作。中国科技云则依托中国科学院及全国相关科研机构,汇聚多领域科研资源,支持一站式科研云服务。阿里云和华为云等企业级云平台,为资源汇聚提供了其他思路,如价格杠杆(保证金)和公司契约机制(合作计划)。
集中化的资源建设已无法完全满足科研场景的多元化需求。为此,基础设施的资源与服务建设日趋开放性、包容性和关联性。核心技术研发也相应地从支持资源聚合和深度增值服务两方面展开。
3.3 运营模式
运营模式是科研基础设施长序发展的基础。清晰的成本核算与费用计量、有吸引力的激励机制缺一不可(表5)。
表5 运营模式分析Table 5 Comparative analysis of the business model
EOSC平台采取“使用时免费”策略和消费权留给用户的有偿服务规定,同时提出记账补偿、项目委托等补偿机制,以及“云币”等信用流通机制,为盘活资源提供了配套措施。考虑到资源、资源提供者、用户之间交互的复杂性,EOSC成本计量与激励措施的有效性还有待时间检验。GÉANT的成本风险模型、INTERNET2的按比例收费模型、ESNET的合作管理模式,从各自资源与服务业务情况出发,进行了公平与效率权衡的有益探索。EGI的会员制,XSEDE的项目制,北大、中科大和中国科技云的机构模式,则依托各自组织架构特质,提出了因地制宜的解决方案。值得关注的是,在计费模型上,XSEDE放弃价格杠杆,对符合条件的科研用户采取免费模式。同时建立了一套专委会评审规则,来评估用户需求、提升资源配置效率,为免费科研服务的效率保障提供了探索。
计费机制为供求双方提供了交互法则,激励机制则是促成供求交互的诱因。当前的激励机制设计,更强调以用户为中心,如计费规则的透明性和实施的便利性。然而在实施上,包括成果致谢和为用户提供折扣等具体措施尚显单薄。值得关注的是,EGI等案例中,也强调加强核心竞争力、营造信任和公平的参与机制,实现参与各方共赢与潜在机会的增长,为服务供求双方提供了另一种有吸引力的激励思路。
4 思考与展望
基础设施是支持开放科学的重要支柱,面向开放科学的科研信息基础设施一体化治理,仍需关注:
组织模式方面,中心化与去中心化趋势并存。中心化的组织模式能够保障基础设施建设的决策效率和执行力。去中心化是顺应多源异构资源汇聚发展趋势所需。中心化与去中心化之间的权衡,将根据基础设施组建的性质、背景、资金来源而有所侧重,但二者兼顾的组织架构日趋流行。同时,应保持组织活力,强化生态治理环境中的民主自治,激发个体参与积极性。在组织边界的开放性、延展性方面,需依托社会网络,面向不同研究与建设目标,组织多样化的专题组(如专家咨询团队、工作组、专题任务组、用户委员会等),攻坚核心问题,盘活潜在相关利益者网络,形成合力。
服务模式方面,应重点关注分散资源的集中化服务与纵深生态系统建设。科研信息基础设施建设依附于科研生态系统,不论规模,皆需顺应开放科学大趋势。即平台之上,既有自主研发的核心产品服务,也要有云化解决方案,探索各类资源与产品服务横纵联合、机构间交叉合作、国际国内互通有无,以期更好地覆盖全科研周期。为此,还需建设良好的资源聚合、发现和调度机制。而技术去中心化,为服务模式落地提供了有效抓手。
运营模式需探索建立动态的、完整的、开放的以及效率公平兼顾的成本收益计量与激励机制。运营模式研究需厘清成本和收益模式(如谁来收费、向谁收费、如何收费、为何收费)等问题。在用户方,成本计量的透明、公平、可靠、效率、可持续等原则皆不可少;在平台方,收入流需坚持健康、合理原则;在第三方服务提供者,资源与服务提供的有效计量、有吸引力的评价激励是其积极参与云平台共建共享的基础。鼓励各方力量共同参与规则制定,才能保障整个科研生态体系合作的长期可持续。
此外,在开放服务的一体化治理方面,还需聚焦场景、资源与科研生命周期。不同领域的科研工作流、科研行为与科研资源特征各异,对于基础设施环境资源与服务的需求存在异同,比如长序高通量数据的高性能网络传输需求、海量异构数据融合的算力密集型或数据密集型处理需求等。处于科研生命周期的不同阶段,需求也不尽相同,如建设早期的数据捕获,需要更多的存储与管理服务,研究阶段偏重需要算力和分析平台工具服务,研究末期则更需要长期归档保存等。一体化的治理体系,既要从宏观维度出发,又需要因地制宜,因服务对象的场景、特征与所处科研周期阶段而调整适配。
立足中国科技云这一类综合性科研基础设施的未来发展,我们需要从组织、服务、运营三个维度寻找动态短板,持续改进。组织模式方面,垂直的、放射性的组织架构有助于快速决策和核心基础设施的统一管理。与此同时,仍需关注组织架构外边界的开放性、流动性,如加强国际与区域交流,提升对潜在利益相关者(同行业、潜在用户)的关注,提升服务广度和服务深度。在服务模式的组织方面,云化解决方案的健壮性仍需持续增强,以支持更大规模、更深入场景的互操作解决方案实施,推动网络互联和算力资源按需共享、数据资源跨域流动。另外,运营机制上,仍需提出场景适配的激励相容措施和动态管理机制,以推进组织模式和服务模式的落地,保障科研基础设施生态系统的健康良性发展。
5 结语
综上,科研基础设施的三维治理框架中,组织模式是设施运行的根本,服务模式是连接设施与用户的媒介,运营模式是组织模式的延伸和体现,是检验服务模式有效性的标尺。三个维度互利共生,形成治理框架合力。从内容上看,资源的开放融合,技术架构的联邦与交互操作,服务的场景化、智能化,运营管理的安全可信性,无疑是当前科研基础设施建设和发展的重要趋势。而良好的治理模式并非一成不变,需综合考量上述各要素,并伴随信息技术与科研范式变化而革新。
利益冲突声明
所有作者声明不存在利益冲突关系。
致谢
感谢项目组同事刘宇德在本研究案例遴选方面提供的建议与意见。