专刊序言
2022-01-01张云泉
张云泉
中国科学院计算技术研究所,北京 100190
当前,随着“东数西算”等国家政策的出台,算力服务发展到了一个爆发的阶段,其商业模式已经逐渐形成。事实上早在2018 年,我就提出了算力经济这一概念,并在后续形成了一系列观点和预测。
算力服务产业发展应该类似于电力服务的发展。首先我们会有类似国家电网的“国家算网”。随之而来,有了国家算力网络,就像电力服务有发电厂,我们就要有“算力厂”,“东数西算”将来会在西部地区布局很大的算力工厂——主要用新能源驱动,更加绿色环保,为东部地区提供经济实惠的算力供应。
其次,为了让算力能够普及成为为广大用户可用的服务,未来可能还会有“算力插座”。当下算力的应用是很复杂的,需要很复杂的技术、各类标准等。因此我们需要“算力插座”,它不会只是物理的硬件组合,肯定还要有一些智能软件标准等。
本期专刊将围绕“东数西算”这一算力经济的世纪工程,对底层系统关键技术、中间编程计算环境以及上层应用未来发展进行交流和探讨。
寇大治等人撰写的《应用感知的算力优化调度方法》一文针对分布在不同地域超级计算机资源忙闲不均等问题开展调度管理研究,提出通过研究典型应用作业的运行特征,开发多中心任务的调度系统,解决国家高性能计算环境统一调度的关键技术问题。提出的基于应用感知的算力优化调度方法可望有效提高“东数西算”的可靠性、可用性和可维护性,为国家高性能计算环境服务化运营和稳定运行提供有力的技术支撑。[1]
程莹等人撰写的《基于互联云及多云的云化基础设施算力调度》一文面向全国一体化大数据中心体系,跨算力服务商的大规模算力服务调度,成为重要的研究议题,提出了适用于多个大型云服务商协同的基于多云及互联云的云化基础设施算力调度参考架构,并给出了相关关键技术,基于该参考架构展示了多服务商环境下通过Terraform 实现自动负载均衡部署,可以作为“东数西算”全国一体化算力调度的重要技术选择之一。[2]
易昕昕等人撰写的《算力网络可编程服务路由策略的分析与探讨》一文针对灵活高效、按需实时调用的网络计算资源,分析和设计了面向算力网络的可编程服务路由策略机制,结合算力网络的可编程服务理念,设计了路由策略的三种实现机制并进行了详细介绍。面向算力网络的可编程服务路由策略可基于业务场景及网络状况等特点,按需选择不同实现机制进行部署,实现算力随需随选随时随地接入。[3]
王小宁等人撰写的《基于高性能计算环境的HPC算力编程模式》一文面向充分发挥HPC 算力优势、提供新型HPC 算力编程模式这一新一代计算基础设施可编程能力的重要变革,分析了高性能计算环境服务模式发展和现有计算环境下不同的编程模式,提出了基于高性能计算环境的HPC 算力编程模式HPC as a function,定义了HPC 算力和任务模式的基本抽象,以及HPC 算力编程模式的参考体系结构,可支持科研业务中融合计算对HPC 算力的基本需求,可望有效提高“东数西算”计算基础设施的可编程性。[4]
周勇等人撰写的《论“东数西算”对气象行业的影响》一文着眼“东数西算”等国家重大工程对气象行业的巨大影响研究具体影响和应对措施,深入剖析“东数西算”工程对气象事业高质量发展,特别是气象数据中心、超算中心、全国气象业务布局、气象信息系统建设等方面的具体影响,并提出调整气象信息网络系统建设思路和方式、优化气象数据中心和超算中心布局、谋划对全国气象业务做适应性调整和开展气候生态效益评估等四个方面的若干项建议措施,使得气象行业更好适应“东数西算”的政策要求,更快实现高质量发展。[5]
杨昕等人撰写的《“东数西算”趋势下的气象算力网络和算力服务体系架构 》一文也面向具有高度信息化特性的气象业务开展分析,概述了现代“算力体系结构”及其应具备的核心内容及关键特性,并进一步分析气象行业个性化的特殊性需求,通过分析并结合“Cloud Native”等现代云计算技术,设计了一个先进的有持续发展能力的“气象算力体系结构”,描述了气象业务框架的核心功能领域,讨论了“气象算力架构”的可持续发展能力和业务功能效率。[6]
上述系列文章各自从底层系统、中间编程和上层应用三个层次中选取重要的示范和关键技术开展研究,提出了具有独创性的思路和方法,将进一步推进算力经济的快速发展。