“天河一号”:中国计算机研制的里程碑
2010-11-08苏光陆
文│苏光陆
“天河一号”:中国计算机研制的里程碑
文│苏光陆
2009年10月29日,中国国防科技大学成功研制出峰值性能为每秒1206万亿次的“天河一号”超级计算机,使中国成为继美国之后,全世界第二个研制成功千万亿次超级计算机的国家。消息传出,世界为之瞩目,尤其是计算机领域的专家,他们无不坦言,“天河一号”的问世,必将加速中国科技水平的整体提升,为中国早一天成为科技大国创造了条件。
超级计算机又称高性能计算机、巨型计算机,是世界公认的高新技术制高点和21世纪最重要的科学领域之一。
随着我国经济的发展,环境控制、生物医药等领域已经对千万亿次甚至更高性能的计算机提出了现实需求。因为在现代科学发展中,计算已经成为与理论和实验并行的第三大引擎。作为我国高技术研发计划的一个重大项目——“天河一号”,是在中国国防科技大学“银河”系列超级计算机的基础上,仅用一年多时间便研制完成的。
可喜成果
每秒钟1206万亿次的峰值速度和每秒563.1万亿次的Lihpack实测性能是什么概念?这个速度意味着,用“天河一号”计算一天,相当于一台当前主流微机运算160年。它的存储量则相当于4个藏书量为2700万册的国家国书馆,能够为全中国每人储存一张大小接近1mb的照片。
在技术创新方面,“天河一号”的显著特点是:
——低能耗。能效是每瓦电创造的计算效能,“天河一号”目前的能效为每瓦电运算4.3亿次,与2009年6月世界排名第一的美国“走鹃”的能效相当。在全球绿色超级计算机前500强的排名中,“天河一号”位居第五。
——高安全。“天河一号”实现了不同用户间数据和工作信息的相互隔离。对用户来说,相当于到银行租个保险柜,钥匙掌控在自己手里。
——易使用。“傻瓜化”的操作界面和菜单、鼠标等常规操作,让机器的使用变得更简单。同时,作为一台国际通用的标准化超级计算机,“天河一号”能运行来自各行业的各种程序,不存在兼容性问题。
作为国家超级计算天津中心的业务主机,这台计算机将部署在天津滨海新区,面向国内外用户提供高性能计算服务,向全社会开放。最可喜的是直接参与“天河一号”研发的科技人员有200多人,平均年龄仅为36岁,中国计算机研发队伍的年轻化,可见一斑。
重要意义
与百姓生活最密切相关,须臾不可离开超级计算机计算的是天气预报和生物制药。目前世界最高水平的天气预报是8天,我国为5~6天。但对于中长期预报特别是气候预报来说,目前世界上的超级计算机仍然是无法满足需求的,因为天气预报的计算需要10的18次方也就是每秒百万万亿次的速度。世界上一个公认的说法是,天气预报时效每增加一天,气象和计算机界需要努力10年。
过去每研制一种新药,从化合物筛选到临床试验,一般需要10~15年的时间。使用超级计算机,以计算机模拟的手段,科学家可以在较短的时间内从几十万甚至几百万种化合物中筛选出有效的药物化合物,不仅节省了真实购买化合物的大量资金,而且大大缩短了药物的研发周期。
此外,石油勘探、汽车安全性的碰撞实验和集成电路设计,无不需要借助超级计算机帮助。波音飞机的外形设计过去一个型号要在风洞做3年的实验,现在运用超级计算机后,设计周期缩短到了6个月。金融产品投资运用超级计算机计算是否盈利,能精确到几分几秒出手……
难点聚焦
首先,在体系结构方面。一台计算机从百万亿次到千万亿次的跃升并不只是一个简单的数字上的变化,而需要在其体系结构上进行大量的创新和调整。“如果原来是10个人来完成某项工作,现在就相当于要有100个甚至1000个人来完成一项工作。每个人的工作怎么分配、人与人之间如何分工合作、如何互联协调就变得极其重要。否则,就很难保证1000个人的工作效率就比100个人高。要解决这些问题,就需要设计出一套让这数千个部件可以和谐互联的体系。
其次,是如何应对错误。“天河一号”有一万余个部件,从科学角度来讲,故障是不可避免的,这就需要设计出一套机制来保证某个部件的错误不至于影响到整个系统的运作。此外,还必须尽快找到并排除错误。
最后,就是解决能耗问题。巨型计算机的能耗极大,即使是效能已经很高的“天河一号”,每小时的耗电量也达到1280千瓦。美国科学家曾经说过:“如果不解决能耗问题,那么巨型计算机就只能和核电站建在一起了。”而美国就打算把未来的巨型计算机建在海边,因为核电站需要用海水来为核反应堆降温。
未来展望
超级计算机性能的发展遵循千倍定律,即每隔10年性能就会提高1000倍,而实际上发展的速度可能会更快。
如果只使用当前的技术是无法研制出百万万亿次计算机的。科学家预测,10的18次方级别计算机芯片之间应采用光互连。而研制10的21次方级别计算机将是20年后的事情,目前的半导体技术尚不能支撑,或许会采用纳电子技术,再往后或许将产生量子计算技术。
据中国计算机专家预测,在未来超级计算机发展中,混合的架构将成为主流。但这种混合架构的计算机编程十分复杂,需开发更多的软件。在未来超级计算研制中,峰值速度其实只是性能的一个方面,可靠性、易用性、互联通信、能耗等问题将更加突出。百万万亿次计算机的功耗将为几十兆瓦甚至几百兆瓦,如果不采取有效的降低能耗措施,一座城市的供电都不够一台超级计算机使用。
参加“2009年全国高性能计算机学术年会”的科学家对超级计算机的发展持积极乐观态度,认为用不了十年时间,世界上将研制出运算速度超过每秒百万万亿次(即10的18次方)的超级计算机。这个速度是目前世界上最快计算机的1000倍。
科学家的理由是,一些重大的科学研究,例如气候预报和灾害性天气预报以及飞行器的空气动力学计算等,都需要这个量级的计算。而迫切的现实需要,正是促进超级计算机研发的最好动力。
实践证明,人类对于高性能计算机的需求是没有止境的。这其中每一个台阶都需要从基础理论到实践技术以及应用技术的重大创新和跨越。
很多看似遥远或根本不可能的事情,就是因为社会现实的急切需求,再坚固的科学堡垒也都被科学家相继攻克了。超级计算机自然也不会例外。