论“东数西算”对气象行业的影响
2022-10-27周勇郭转转曾沁郝伊一
周勇 ,郭转转* ,曾沁 ,郝伊一
1.中国气象局气象发展与规划院,北京 100000
2.中国气象局预报司,北京 100000
引言
2022 年2 月17 日,国家发展改革委、中央网信办、工业和信息化部、国家能源局等4 部门联合印发通知,同意在京津冀、长三角、粤港澳大湾区、成渝,以及内蒙古、贵州、甘肃、宁夏等地启动建设国家算力枢纽节点,并规划了10 个国家数据中心集群,“东数西算”工程全面启动。“东数西算”工程是我国从国家战略、技术发展、能源政策等多方面出发,启动的一项国家重大工程,对于优化我国算力资源空间布局、提高数据资源利用效率、推动东西部协调发展等均具有重要战略意义。气象本身有着与生俱来的信息特征,气象行业时刻都在与数据打交道,是高度依赖数据和算力的行业,因而,也必将受到国家“东数西算”工程的影响。深入研究“东数西算”对气象行业的影响细节、影响程度及应对措施,已成为气象部门面临的重要课题。
1 “东数西算”事关国家经济社会发展大局
1.1 “东数西算”工程概况
“东数西算”工程是一项与“南水北调”、“西电东送”和“西气东输”等工程相似的国家重大战略工程,其目的在于将东部算力需求有序引导到西部,国家发力、市场接力,打造全国算力“一张网”,构筑我国数字经济发展新优势。据中国电子信息产业发展研究院援引相关机构测算,到2025 年“东数西算”工程10 个国家数据中心集群总投资可达4000~5000 亿元。
“东数西算”工程将在八大国家算力枢纽节点建设10 个数据中心集群,具体指标对比见表1。根据地理位置和发展定位不同,可分为两大类。一类枢纽节点是位于东部地区的京津冀、长三角、粤港澳大湾区和成渝枢纽,所在地区用户规模大、算力需求旺盛,主要承载实时性要求较高的灾害预警、电子商务、金融证券等业务。另一类枢纽节点是位于西部地区的内蒙古、贵州、甘肃和宁夏枢纽,土地、电力和劳动力等成本低廉,且气候适宜,是算力设备的天然冷却场所,主要承载实时性要求较低、价格敏感度高的备份存储、后台加工、网站维护、离线分析等业务,分担东部地区算力压力。[1]
表1 “东数西算”国家算力枢纽节点及数据中心集群对比分析Table 1 Comparative analysis of national computing hub nodes and data center clusters of “Counting from East to West”
1.2 “东数西算”的战略意义
新发展格局下,数据已成为新的生产要素,数字经济成为我国经济持续增长的重要引擎,其中算力又是数字经济的核心生产力。“东数西算”工程旨在优化我国算力资源空间布局、提高数据资源利用效率,对于国家、部门和社会发展都具有很强的战略引领作用。
“东数西算”工程夯实我国数字经济发展基础。“东数西算”工程通过数据中心全国一体化布局,整体上扩大算力设施规模、提升算力使用效率,有助于全国算力的规模化、集约化发展,将带来集约效应,支撑我国数字社会转型发展,加速提升数字经济在我国国民经济中的占比。[2]
“东数西算”工程有助于促进区域协调发展。算力设施由东向西布局,将带动相关产业有效转移,促进东西部数据流通、价值传递,在延展东部发展空间的同时,为西部地区转型发展注入新动力。
“东数西算”工程发挥绿色低碳示范效应。算力枢纽西迁,可充分发挥西部区域气候、能源、环境等方面优势,促进可再生能源的就近消纳,通过数据、算力和能源的高效联动,为新型基础设施绿色、低碳和可持续发展提供示范。[3]
2 气象行业高性能计算系统建设情况
2.1 气象行业高性能计算技术发展历程
气象行业是高性能计算的重要应用领域,高性能计算技术有效突破了气象数值预报模式发展的局限,在气象预报预测业务中发挥着至关重要的支撑作用。与此同时,气象业务对高性能计算能力的需求反过来促进了高性能计算技术的快速发展。自20世纪70 年代高性能计算机问世以来,气象行业始终是高性能计算机的应用大户,各国气象部门纷纷建立了适应自身气象业务实际的高性能计算机系统。中国气象局也是自1978 年建设第一台高性能计算机系统以来逐步发展数值预报业务。从20 世纪90 年代自建的银河II、神威I 到神威4000、IBM P460,再到曙光系列,计算能力呈指数级增加。与此同时,气象部门还租用了大量的社会上高性能计算资源,如天河I、天河II 等。在高性能计算的助力下,中国数值预报蓬勃发展,让中国跻身世界为数不多发布中期数值预报的国家行列。[4]
2.2 气象行业高性能计算系统建设现状
为支撑数值预报模式的快速发展,国外气象部门的高性能计算机系统更新速度较快,高性能计算能力已达每秒千万亿次(PFLOPS)。目前,全球主要发达国家的气象部门高性能算力情况如下:韩国气象厅53.8PFlops,欧洲中期天气预报中心45.3PFlops,美国天气局32.9PFlops,美国大气研究中心30.5PFlops,法国气象局25.9PFlops,日本气象厅18.3PFlops,英国气象局14.2Pflops。而中国气象局高性能计算机峰值运算能力为9.8PFlops,在国际同行业的排名下降到第8 名(2018 年,中国气象局新一代高性能计算机系统“派-曙光”计算能力达到8.2PFlops,中国气象局高性能计算机系统总体规模跃居气象领域世界第二位,仅次于英国气象局)。气象专业数据存量约35PB,随着全天候、高频次、高精度地球监测卫星的上天,以及高时空分辨率数值天气预报模式的发展,气象专业数据量快速增长,目前增量约7PB/年。我国气象高性能计算能力不仅远远落后于国外发达国家,且面临海量气象数据存储需求,存在巨大压力。[5]
由于数值天气模式研究和业务运行对计算资源的强烈需求,国内外气象领域高性能计算机及应用技术迅速发展起来。气象行业对高性能计算能力及系统的可靠性需求日益提升。
图1 气象行业高性能技术发展历程Fig.1 Development history of high performance technology in meteorological industry
2.3 气象行业高性能计算发展趋势
近年来,气象业务与科研对计算能力的需求与日俱增,高性能计算机系统已经成为提升气象部门数值天气预报能力的关键因素。《“十四五”气象信息网络业务发展规划》明确“到2025 年建成总峰值运算能力不低于200PFlops 高性能算力”,《“十四五”数值预报业务发展规划》提出“应用异构众核高性能计算技术,开展天气气候一体化模式”。由此可见,随着数值天气预报模式的发展、地球气候系统模式的研发,不仅对高性能计算能力提出新需求,还对高性能技术架构提出新目标。在“十四五”时期,强化高性能计算系统对气象业务发展的支撑能力将是中国气象局的重点建设任务。[6]
3 “东数西算”对气象高质量发展有重要影响
“东数西算”工程将影响气象信息系统建设方式、系统布局和指标设定,并进而影响到全国气象业务布局。
3.1 对气象信息系统建设提出新要求
一方面,“东数西算”工程等一系列政策、方案的出台,进一步完善了国家对信息化“新基建”的顶层设计,指向性和指导性非常明确,各部门在设计建设信息系统时的“自由空间”收窄,建设规模、布局和指标等都将受到更多约束,相关工程审批要求增多、难度加大。另一方面,在“东数西算”工程建设中,政府主要发挥指挥和引领作用,企业将是工程建设的主力军,这对气象信息系统建设方式也有示范作用,要更多依靠社会力量,租建结合、提高性价比。[7]
3.2 影响气象数据中心和超算中心布局
从国家层面上看,数据中心的适度聚集,有利于降低建设和运行维护成本、提高效益。所以,国家信息中心、应急管理部、公安部等单位的主备数据中心选址,大都与“东数西算”工程八大国家算力枢纽节点一致,具体模式和选址见表2。《“十四五”气象信息网络业务发展规划》中提出“北京主中心-西安备份中心-京外高性能计算中心”的“三地三中心”系统布局,西安备份中心建于“东数西算”工程之前,不属于国家算力枢纽节点,但“京外高性能计算中心”的选址难免要受“东数西算”工程的影响。[8]
表2 主要单位数据中心选址表Table 2 Data center location table for major units
3.3 全国气象业务及业务系统布局将受到间接影响
首先,在数据业务布局上,除了融入生产运营和应急减灾实时过程的气象数据(如:对时效追求永无止境的灾害预警数据,以及无人港装卸货、城市轨道运行等实时气象服务数据),一般延时需求都在秒级以上,都可归为“非实时性”数据业务,可以逐步“西移”(即:向绿色低碳地区迁移)。其次,国家“东数西算”战略布局,也为气象部门提供了一个畅通全国、辐射全球的“网络、算力、数据”一体化的国家大云,为改变当前气象专有云与各级政府“层层对接”的方式提供了实现基础,有望通过一点接入,实现全省、全国,乃至全球气象服务。[9]
3.4 气象信息系统关键绿色指标将会进一步提高
国家启动“东数西算”工程建设后,气象信息系统的电能利用效率(PUE)指标也将“水涨船高”。目前,国家级气象高性能计算机系统的电能利用效率是1.4,国家要求到2023 年降低到1.3 以下,而“东数西算”工程提出建设的10 个国家数据中心集群中,张家口、韶关、长三角、芜湖、天府、重庆集群的电能利用效率在1.25 以下,和林格尔、贵安、中卫、庆阳集群的电能利用效率在1.2 以下。这表明国家对绿色低碳发展的要求不断提高。国家发展和改革委员会审批气象信息系统相关建设工程时,节能指标也将从严。
4 针对气象行业适应“东数西算”的建议措施
基于上述分析,针对“东数西算”对气象行业的影响,提出建议措施如下。
4.1 调整气象信息网络系统建设思路和方式
气象业务高度依赖数据与算力资源。近年,气象数据与算力资源总量快速提升、集约化程度显著提高。但有两个问题必须加以重视:一是过多强调气象业务的特殊性,而对国家信息化总体部署不够重视;二是资源不足,算力资源落后于国外,而且缺乏迭代升级所必须的稳定投入。气象部门要抓住“东数西算”工程建设机遇,主动加强与国家算力枢纽节点所在地方政府及相关企业的交流,掌握各地算力资源建设计划,改变目前过度依赖部门“圈地自建”信息系统的方式,通过选/租地自建、“租设备,建系统”或直接购买算力资源服务等多种方式的组合,合理搭配使用部门自建资源与社会公共资源,尽可能多地使用公共资源承载非核心业务。
4.2 优化气象数据中心和超算中心布局
根据《“十四五”数值预报业务发展规划》,测算出国家级业务模式所需高性能计算峰值运算能力到2025 年约需255PFlops,2030 年约需900 PFlops。以13 个主要数值预报业务模式为基础,兼顾模式运行依赖关系,采用错峰运行方式,经精确计算得出峰值运算能力需求约为176.18 PFlops,具体峰值运算能力见表3。而且,在计算中将产生大量数据,需要及时存储。为满足业务需求,建议:一是近期仍将坚持以自建算力资源支撑核心业务,以弥补国家超算中心与气象业务需求间的供需缺口;二是要优先选择国家算力枢纽节点所在地建设气象高性能计算中心;三是要从满足“数算一体”应用需求出发,调整已建和待建数据存储管理系统位置;四是要在系统设计中,提高电能利用效率指标,使之不低于国家目标要求。[10]同时,构建要素充分流通的高速网络,使得数据中心间骨干网的速率达到20Gbps 以上,来实现数据快速交换和高速联通。
表3 国家级主要数值预报业务模式所需理论峰值运算能力Table 3 Theoretical peak capacity required for the main nwp business models at the national level
4.3 谋划对全国气象业务做适应性调整
随着数字化与气象业务的融合日趋深入,气象信息网络系统布局的变化必将带动全国气象业务布局的调整。气象观测、预报和绝大部分的服务业务都可以归类为秒级以上的非高实时性业务,其业务支持平台符合国家“向西”(即:向绿色低碳地区)布局的条件;而突发灾害预警、气象数据驱动的生产实时调度,实时性要求高,其业务支持平台符合国家“向东”(即:就近于用户所在地)布局的条件,可以布局在地方政府“城市大脑”所在地区。因此,为了更加快捷高效地融入国家和地方数字经济发展、数字社会治理和数字防灾减灾,建议要未雨绸缪,及早谋划全国气象业务布局调整方案并组织试点,渐次推进。[11]针对新的业务布局,进一步完善气象信息安全防控体系,强化数据安全分级分类,提升气象大数据有效治理能力。
4.4 开展“东数西算”工程气候生态效益评估
作为类似“南水北调”的国家重大战略性工程,“东数西算”工程效益如何,必将受到国内外关注。“东数西算”工程气候生态效益评估目前尚处于起步探索时期,从气候资源开发利用角度进行效益评估,或将成为气象部门大有可为的新领域。[12]
利益冲突声明
所有作者声明不存在利益冲突关系。