“当惊世界殊”:百亿亿次超级计算机向我们走来
2017-02-21高荣伟
高荣伟
10月27日,从国家并行计算机工程技术研究中心获悉,由该中心牵头的“E级高性能计算机原型系统”研制项目正式启动,速度将十倍于目前世界最快。
国家并行计算机工程技术研究中心,是经国家科委批准,于1992年8月开始组建,1996年6月通过国家验收,中心总部设在北京市海淀区。中心组建的目的是开发商品化的并行计算机系统,逐步形成我国的高性能并行计算机产业,并将产品推向国内、国际两个市场。公开资料显示,1999年10月,中心研制的第一台神威-I型机进入国家气象局业务运行,并以此为基础成立了北京高性能计算机应用中心。2001年1月,以中心研制的第二台神威-I型并行计算机为主计算机系统的上海超级计算中心成立。2012中心因为成功研发全部装备“中国芯”及具有全自主知识产权的“神威蓝光”高性能计算机系统,在中央电视台2012年度“创新改变中国”科技盛典中,荣获创新团队奖。
据悉,目前世界上运算速度最快的就是由国家并行计算机工程技术研究中心研制的“神威·太湖之光”超级计算机,峰值性能为125.436PFlops,也就是每秒执行超过12.5亿亿次浮点计算。目前启动的新超算将提高到全新的E级,即ExascaIe(1000PFIops),每秒以百亿亿次浮点计算,将为航天、材料、气候气象等多领域关键应用提供强有力支撑。何为E级超算?所谓E级超算,是指每秒可进行百亿亿次数学运算的超级计算机,被全世界公认为“超级计算机界的下一顶皇冠”,它将在解决人类共同面临的能源危机、污染和气候变化等重大问题上发挥巨大作用。何为“百亿亿次”?中国国家超算天津中心主任助理孟祥飞表示,已启动样机研制的中国百亿亿次超级计算机的浮点计算处理能力将达到10的18次方,是“天河一号”的200倍,其工作一小时相当于全体国人上万年的工作量。
“原型系统可以良好地支撑高性能计算、深度学习、大数据、云计算等领域应用,加快技术成果产业化应用,对我国高性能计算产业发展有重大支撑作用。”中科曙光副总裁沙超群如是说。业内人士介绍,超级计算机是世界高新技术领域的战略制高点,是国家综合国力和竞争力的重要标志,美、日、欧、俄等发达国家纷纷加大投入,而美国则将E级计算机上升为国家战略。
我国也将E级超算的研究写入了国家“十三五”规划。据悉,科技部国家重点专项共支持了三种不同技术路线的E级原型系统,国家并行计算机工程技术研究中心负责的只是其中之一,国防科技大学、中科曙光也在做。从我国高性能计算机角度分析,多年来,位于天津的中科曙光在国家“863”“核高基”等重大专项支持下,一直致力于在高性能计算机领域的探索与研发。2004年6月,每秒运算11万亿次的超级计算机曙光4000A研制成功,落户上海超级计算中心,进入全球超级计算机前十名,从而使中国成為继美国和日本之后,第三个能研制10万亿次高性能计算机的国家。从曙光一号、曙光1000到曙光6000,先后研制成功了百万亿次和千万亿次高性能计算机系统,一直代表国产高性能计算系统的最高水平,见证了我国高性能计算机从跟跑、并跑到领跑的全过程。新华社报道,6年前,中国首台千万亿次超级计算机“天河一号”落户天津,且以每秒4700万亿次的峰值性能获得世界超级计算机排名第一的殊荣。
虽然中国超级计算机一直走在世界前列,但科研人员的脚步并没有因此放缓。据了解,中国新一代百亿亿次超级计算机主要特点是突出“全自主”,自主芯片、自主操作系统、自主运行计算环境,样机预计在2017年底至2018年初完成。此前,“神威·太湖之光”用上了纯国产核心处理器,已经震惊世界,而此次新的E级原型系统将进行全面提档升级,全面配备国产的处理器、高性能网络,以及自主设计的系统软件和应用,具有全套知识产权。所有这一切,“当惊世界殊”,必将再次吸引全球的目光。
目前“天河一号”系统使用率超过90%,已进入“饱和”运行状态,并发运行的作业数量达到1200余个,先后服务国家重大重点科研项目超过1000个,为企业带动经济效益超过20亿元。据悉,今年国家超级计算天津中心同国防科技大学联合开展我国新一代百亿亿次超级计算机研制。“新一代中国百亿亿次超算与现有超算相比,不仅是计算能力上的扩展,在计算密度、单块计算芯片计算能力、内部数据通信速率都将得到极大提升。”孟祥飞说,科技创新真正为产业发展服务,才是其最根本目标。他强调,如何将更多航空航天、石油、气候气象等成熟应用软件移植到中国百亿亿次超级计算机平台上且保证其高效运行,是研发团队面对的重要课题。针对E级计算可能带来的众多难题,中科曙光从计算、存储、网络、系统软件、系统冷却和可靠性等方面,针对性地布局E级计算。
中心副主任梁军介绍,E级计算机在效率、能耗、可靠性和应用适应性等方面仍面临前所未有的挑战,具有很多不确定性。本次研发具有一定规模的E级计算机原型系统,将充分验证国产核心技术和创新技术的有效性,为实现E级以上规模计算机提供坚实基础。
“针对传统数据中心建设规划周期长、建设成本高、运维复杂、系统利用效率低、数据聚合性差等问题,中科曙光推出了‘立体化数据中心。”沙超群介绍说,立体数据中心同时兼有模块化、绿色化、智能化、分离融合、高密度等特点,可满足E级计算对数据中心的需求。“绿色节能与智能化将是成熟数据中心的‘标配,未来数据中心都将围绕这两个方向来优化。”
据中科曙光介绍,E级超算原型系统搭建完毕后,将在上海超算中心、深圳超算中心、中科院网络中心等地进行应用示范,直接提供高性能计算、云计算、大数据处理等商业化服务。