APP下载

进入新时代的超级计算机

2017-09-06陈左宁

民主与科学 2017年4期
关键词:神威能效超级计算机

陈左宁

超级计算机的价值,除了对计算机科学本身的贡献以外,更重要的是在超级计算机的支撑下解决了重大科学与工程应用领域的关键问题,促进了相关应用领域的快速发展,超级计算为解决国家经济建设、科学进步、国家安全等一系列重大挑战性问题提供了不可替代的重要手段。

20世纪以来,科学计算、科学实验和理论研究一起成为研究世界的三大支柱。随着计算技术的发展,科学计算对超级计算机的能力提出了越来越高的需求,超级计算机为解决国家经济建设、科学进步、国家安全等一系列重大挑战性问题提供了不可替代的重要手段。

中国的超级计算机

“十一五”“十二五”期间,我国通过部署多种国家级科技项目和资助计划来推动中国高性能计算能力的提升,成功研制出多台超级计算机,逐步形成了具有一定规模的国家级高性能计算服务环境,支撑了一批重大领域应用。国家“863计划”支持的“神威”“天河”“曙光”等超级计算机进入了世界领先行列。

“神威·太湖之光”超级计算机系统由科技部“863计划”的“高效能计算机研制”重大项目支持,国家并行计算机工程技术研究中心承研,于2015年12月完成系统研制,落户国家超级计算无锡中心。該系统是世界上首台峰值运行速度超过十亿亿次(125PFlops)的超级计算机,也是我国第一台全部采用国产处理器构建的世界第一的超级计算机,引领全球超级计算机迈入十亿亿次时代。

基于“神威·太湖之光”整机系统的大气、海洋和材料领域的三个应用入围2016年国际高性能计算应用领域最高奖——戈登·贝尔奖提名,其中大气领域的“千万核可扩展大气动力学全隐式模拟器”应用最终摘取2016年度戈登·贝尔奖,系中国团队30年来首次入围并获奖,打破西方发达国家垄断。

中国的获奖引起了世界关注,美国《华尔街日报》网站报道:“神威·太湖之光”的研制成功,以及中国系统保有量首次超越美国,标志着中国已经在高性能计算领域的竞争中超越了美国。同时,明确提出美国需要加大力度投资高性能计算,重新夺回在这一领域的领导地位。

超级计算机的价值,除了对计算机科学本身的贡献以外,更重要的是在超级计算机的支撑下解决了重大科学与工程应用领域的关键问题,促进了相关应用领域的快速发展,超级计算为解决国家经济建设、科学进步、国家安全等一系列重大挑战性问题提供了不可替代的重要手段。

超级计算机应用需求

传统的超级计算机的应用领域是“高、精、尖”的前沿科学和工程研究领域,主要包括石油勘探、天气气候、海洋科学、航空航天、核爆模拟、武器研制、信息安全等领域。这些应用领域对系统计算密度有很高的要求,这里的计算密度指的是系统在一定体积和面积内的计算能力,这也是网格计算和云计算等大量分布式计算不能完全代替超级计算的原因。超级计算机在新兴领域也有大量应用,如人工智能、深度学习、生物医药、基因工程、动漫渲染、过程控制、数据挖掘、金融分析、公共服务等。人工智能中的深度学习也属计算密集型应用,与传统数值模拟应用不同,该类问题对单处理器的计算能力和网络性能需求更高。

当前的实际复杂应用系统向着多时空尺度、强非线性耦合和三维真实构型的方向发展,包含着大量多尺度多模型的计算问题,存在多粒度、多维度、多层次的并行性,面临着全系统、全物理过程、真三维、自然尺度的计算模拟,对计算机的能力提出更高要求。在城市高分辨率空气污染数值模拟中,基于“神威·太湖之光”计算机系统,采用基于非结构有限元方法和全隐全耦合非线性系统求解算法,完成了深圳市地王大厦周边(网格分辨率达1米)大气环境及空气污染大规模并行瞬态模拟,常规模拟时间从1周缩短为5小时。在新药研发领域,上海药物所开展的药物虚拟筛选和疾病机理研究,实现了虚拟筛选大规模运行,使用“神威·太湖之光”系统的32768个处理器在7分24秒内完成451万个化合物分子和寨卡病毒蛋白的对接任务,是世界上速度最快的高通量药物虚拟筛选系统。

国内外E级计算规划

发展E级计算机,是实际应用计算精度的需求和计算能力的体现。超级计算机的发展,已经成为国家战略层面的部署。E级计算,是指每秒完成10的18次方的浮点计算。

中国的“神威·太湖之光”建成之后,特别是中国连续8届居于TOP500领先位置,加剧了各国超级计算机的竞争。美国将E级计算上升为国家战略,奥巴马总统于2015年8月签署行政命令,要求加快E级计算机的研发进度,以保持世界领导地位。美国能源部先后启动了多个研究计划,投资10~14亿美元,期待在2022年能够提供能效比达50GF/W的E级系统。日本在2013年由文部科学省启动了E级超级计算机计划“post K”,这是京速计算机的后继,预计2020年完成研发,拟投资13.8亿美元,由Fujitsu、Hitachi和NEC负责系统构建,安装在日本理化研究所,系统能效达30-50GF/W。

我国科技部于2016年年初也启动了下一代E级计算机的研制计划,支持国家并行计算机工程技术研究中心、国防科大、曙光公司3家单位在2018年6月完成E级系统方案和关键技术突破,并采用国产核心器件构建小规模的原型系统。科技部对原型系统进行测评后根据情况支持一到两家进行E级系统建设,预计在2018年启动,2020年前后完成。

回看美国的研究计划,他们首先研制一台具有新型先进体系结构的原型系统,目前该体系结构的具体内容仍在保密状态,很可能不是经典的体系结构;2022年交付一套达到50GFlops/W能效比的E级系统;达到E级计算能力之后,很有可能在此基础上研发出计算能力更高的超级计算机。反观我国的情况,虽然我们现在的指标看起来很高,但很可能的情况是我们的超级计算机技术发展已经面临天花板问题,现有技术只能勉强支撑做到E级系统,继续升级可能会遇到极大困难。因此我们没有理由盲目乐观,美国的发展战略更值得我们观察和思考。

建造E级计算机,我国在主要技术方面依然面临重大的挑战。首先是功耗墙问题。“神威·太湖之光”的系统能效比约为6GFlops/W,未来构建E级系统能效比需达到30GFlops/W,差距非常大,目前从工艺角度改变能效收益的程度越来越有限,功耗问题越来越突出。其次是可靠性问题。可靠性主要依赖单芯片的可靠性,随着集成电路的变化,单芯片的失效率越来越高,对整机稳定性的影响非常大,美国能源部认为E量级系统平均无故障时间小于两个小时,而两个小时并不足以完成一个大规模的计算任务。最后是应用效率和可编程性问题。在应用问题计算中,应用问题本身的算法已经非常复杂,程序调试和调优难度更大,而E级计算规模下算法本身很可能因为计算量的增加而失稳。此外在实际工程应用领域,工程问题需要考虑能够获取的工程条件和时间进度要求,这也对软件提出更高的要求。

E级超级计算时代即将到来,国内同行要开展全方位合作,在国产处理器、体系结构、软件和应用方面做出更多更精彩的创新成果,为我国的崛起和腾飞作出更大的贡献!

猜你喜欢

神威能效超级计算机
浅论执法中队如何在洪灾中发挥能效
破解定值有妙法,极点极线显神威
新版空调能效标准正式实施,空调市场能效测试将更加科学、规范
英国
“能效之星”产品目录(2018)
美国重登全球超算500强榜首
每秒100亿亿次 中国超级计算机
平板电视能效国标实施 14.5%液晶将退市