APP下载

压力之下,中国超算如何实现突围

2023-02-07Cloud

电脑报 2023年4期
关键词:海光指令集神威

Cloud

如果听说过超级计算机概念的读者朋友,相信都曾有过这样的想法“用它來玩游戏是不是很爽啊?”事实上,超级计算机是用来做大型计算的,比如对新型武器实验的计算机模拟、对重大工程项目进行计算机仿真等,这些计算往往涉及到非常巨量的数据,如果用你的个人电脑来计算,可能要花费数年、数十年甚至是上百年的时间,而超级计算机可能只需要一天甚至几小时,所以,一个国家可以组建多高算力的超级计算机,就是体现国家科技实力的重要手段。

不过,超算也是基于芯片来构建的,这恰好又是我们中国相对薄弱的环节,早在2013年,天河二号拿下全球超算TOP500的第一名之后,2015年美国就开始禁售英特尔至强芯片,2016年又用“实体清单”打击了海光基于第一代AMDZen架构的服务器芯片,2019年再次把曙光、海光微、江南计算技术研究所等超算相关中国企业列入实体清单,更在2021年把申威、飞腾以及数个国家超级计算中心列入“实体清单”……显然,多次出手打击的原因就是中国在超算领域的爬坡速度太快,而国产CPU主要在指令集授权、CPU核心技术和设计工具及CPU生产技术和设备上很容易受到钳制。不过凡事也有例外,在这三个方面,国产CPU申威反倒做足了准备,并没有要认怂的意思。

芯片架构自主化是破局的关键

在自主可控这条道路上,申威的底气来自未雨绸缪,早在美国还没有开始针对中国超算开启“封杀令”的时候,无锡江南计算技术研究所就已经预料到了可能会存在的风险,在自研超算CPU时刻意回避了x86、ARM、MIPS、RISC-V这几个热门主流架构,选择了当时已经日薄西山的DEC公司Alpha架构和Alpha21264指令集,当时这个架构早已不再更新且过了专利期限,免去了被停止授权的后顾之忧。所以在2010年,无锡江南计算技术研究所就成功推出了申威SW1600CPU,并成功搭载到神威蓝光上,使得中国成为继美国日本之后,第三个采用自主CPU构建每秒千万亿次级超级计算机的国家。

申威26010异构众核处理器架构图

后来,因为Alpha架构实在过于老旧,无锡江南计算技术研究所重新研究了全新的SW26指令集,并推出了申威26010CPU,与其他国产处理器相比,性能完全走在了前列,甚至在世界范围内都是靠前的,在实际使用效率上不见得就会比英特尔至强Phi低多少,某些应用场合甚至可能领先。基于这些优势的情况下,2016年搭载申威26010的神威·太湖之光拿下了全球第一的位置。而且在操作系统上也采用了基于Linux开源代码的国产神威睿思,而且在工艺上只需要28nm,比当时最新的14nm要成熟不少,包括EDA工具在内也能实现完全自主。事实上对于国产芯片来说,为保障生产环节的相对安全,放弃对最先进工艺的追求也实属无奈之举,像龙芯的多款CPU甚至都会采用境内外多工艺互相备份的方式来防止受限。

硬软件仍被包围,急需时间走出困境

虽然申威在超算架构上打响了国产第一枪,但总体来说,当年国家超算中心的三驾马车:申威的Alpha、鲲鹏/飞腾的ARM以及海光的x86,至少目前来看后两者都以外购IP和设计外包等因素而陷入了“实体清单”的困境当中,比如天河三号所使用的飞腾FT-2000Plus就采用了台积电的16nm制程,一旦被暂停供货也无可奈何。

更重要的是,大部分情况下超算都是用于运行复杂情况的仿真软件,尤其是面对一些需要精确模拟的项目时,软件的重要性不亚于硬件,但问题在于目前大多数仿真软件都来自国外,就很容易陷入超算硬件虽然可以实现可控可信,但配套软件又跟不上的窘境,这些问题都是不容忽视,甚至可以说是迫切需要解决的。

在面对如模拟地球气候这样的需求时,超算的作用才能真正显现

比如完全国产的神威·太湖之光,因为底层逻辑与传统的x86并不相通,造成大量的科研软件无法在系统上运行,所以中国超算还需要面临软件代码理解、转换甚至重新编译的这个过程,如果想要运行全球气候模式的高性能模拟,就需要重新编译地球系统模式,这些应用的代码有近百万行,是过去几十年各国气候学家对全世界大气、海洋和陆地圈层变化机制的理解,这个编译的工程量之大可想而知,若不是真正满腔热血,恐怕难以坚持下来……借毛主席的一句诗来说就是“鹰击长空,鱼翔浅底,万类霜天竞自由”。

猜你喜欢

海光指令集神威
压缩空气动力汽车的基本原理及可行性分析
北京海光仪器有限公司
北京海光仪器有限公司
3DNow指令集被Linux淘汰
流翔高钙显神威 科学种植促增收
聚焦国产芯片 ZStack与海光公司完成兼容互认证
实时微测量系统指令集及解析算法
《神威启示录》系列报道三 神威现代中药研发的新思考
什么是AMD64
基于覆盖率驱动的高性能DSP指令集验证方法