国家高性能计算发展现况
2014-03-13钱德沛
国家高性能计算发展现况
钱德沛北京航空航天大学教授,中德联合软件研究所所长
科研信息化有三个基本要素,第一,计算,第二,海量数据的存储与处理,第三,交流与协同能力。这三个能力形成了科研信息化的支撑手段。当然网络支撑所有的,包括计算、协同和数据传输的最基础手段。
科研信息化关乎一国竞争力和科研水平的发展,是一种长久的计划,不是可抓可不抓的问题。我国在高性能计算方面有很多的部署,从自然科学基金开始。自然科学基金刚刚设立了一个重大研究计划,“高性能科学计算的基础算法与可计算建模”,该计划将持续八年,投资1.8亿人民币,专门研究高性能计算的算法与建模方法。即将结束的一个重要计划是以网络为基础的科学活动环境的研究,这个项目也是聚焦于网格技术来支撑我国的科学研究。
第一,计算方面。
“863计划”最近十年连续支持了三期重大项目。第一期是从2002年到2005年,高性能计算机及核心软件;第二期是“十一五”期间,2006年到2010年,高效能计算机及网格服务环境;第三期,是目前正在执行的高效能计算机及应用服务环境。这三期项目集中力量来解决高性能计算的资源、环境和应用问题。“973计划”设立了众多的项目,相关的有2个。第一个执行了3期,包括高性能科学计算算法研究和大规模科学计算研究。另一个是虚拟计算环境,也连续执行了2期,一是聚合与协同机理研究,二是虚拟计算环境的基础研究。
“863计划”的指导思想有几个转变。第一个转变是从1999年开始,从研究单台高性能计算机,向研究国家高性能计算环境的转变。第二个转变是2006年,从强调单一性能指标的高性能计算机,到强调综合指标的高效能计算机转变。国家重大项目强调高性能计算机、高性能计算环境、高性能计算性应用这三个方面的均衡协调发展,强调产学研用结合,同时特别强调多学科的交叉合作。这几年,国家863计划推出了一系列高效能计算机系统,2008年的深腾7000是150万亿次,曙光5000A是230万亿次;2010年推出了曙光6000,3000万亿次,天河一号是4700万亿次。2011年,我们用国产的处理器推出了千万亿次系统神威蓝光,这是一个里程碑式的的成果,解决了国内用自主研发的处理器实现千万亿次系统的突破。2013年6月,世界超级计算机500强中,天河二号名列第一,其峰值速度达到了5亿亿次。“863计划”将启动第二台10亿亿次的计算机研究,由神威蓝光的团队研制我国第二台10亿亿次系统。可以看到,在系统研制方面,我们已经走到了世界领先的地位。
第二,环境方面。
2002年到2005年期间,在国家“863计划”重大专项的支持下,依托国产高性能计算机建立了中国国家网格。将全国8个结点连接起来,形成了18万亿次的计算能力,当时在全世界国家级的网格环境中名列第二。这一期的项目重点是解决资源共享、协同工作的技术问题,来支持多领域的应用。 “十一五”期间,在“863计划”的支持下,进一步发展了中国网格CNGRID,建立了中国国家网格服务环境,着重解决环境的服务形态,更好地支持应用,网格规模发展到14个结点,聚合的计算能力达到3000万亿次以上。
正在执行的“十二五”期间的“863”重大项目,进一步把国家网格服务环境升级为我国的高性能计算应用服务环境,资源将进一步拓展。更重要的是要解决环境基础设施的运行和新型运营模式,探索环境的可持续发展途径。CNGRID部署了450多个应用和服务,支持了2800多个团队用户,用户来自科研、教学和工业等;支持了1000多家国家级的科技项目的研发工作,同时对地方经济发展的重要工程项目也提供了计算支持。
第三,应用方面。
在应用方面我们支持了两类应用。一类应用是强调资源共享、协同工作的网格应用。包括新药发现、气象结合预报、科学数据网格、水利信息化、铁路信息化等等,这类属于网格应用。另外一类应用是强调计算能力,解决重大计算问题。比如计算化学、计算天文学、面向千万亿次的并行算法库、大型流体机械的优化设计、激光核聚变领域的并行计算软件、天气预报在国产千万亿次机上运行、大飞机的流场设计等等。目前正在发展的六个应用,包括聚变与裂变能源数值模拟软件系统研制、真实飞机外形全流场和优化设计数值模拟、新药研发与蛋白质折叠数值模拟软件、真实感动漫渲染系统、大型工程设备结构力学、复杂电磁场环境数值模拟,以及支撑各类应用的高性能计算应用支撑软件框架体系。
我们同时把云计算和网格技术有机地结合。中国国家网格服务环境CNGRID成为IaaS和PaaS,在应用社区和网格服务环境之间建立起商业模式,目的是要促进高性能计算服务业。未来高性能计算应该以服务业的形式来体现。即将建设的三个社区,一是工业产品的创新设计,二是新药创制,三是数字媒体和文化创意。
(本文整理自钱德沛教授在“第三届中国科研信息化发展研讨会”上的演讲)