APP下载

千万亿次HPC:软硬件挑战如何应对

2009-12-09刘洪宇

中国计算机报 2009年45期
关键词:英特尔高性能处理器

刘洪宇

新的里程碑到来,总是回顾与展望的最好时机。当中国国产高性能计算机——天河一号冲破千万亿次计算大关,跻身全球Top500前五名,荣登中国Top500榜首之时,我们更因读到的关键信息加深了对未来的冷静思考。HPC能力需求永无止境,计算量级再向前发展会怎样呢?HPC发展遭遇的软硬件挑战还会有哪些?我们又该如何应对?

混合计算发挥潜能

国防科技大学建造的天河一号实现了每秒1206万亿次双精度浮点运算的峰值性能,计算与服务阵列都采用了英特尔至强处理器,加速阵列则采用了AMD的GPU,这是一种通用处理器与加速处理器并行的混合架构,与去年的Top500冠军“走鹃”路线相同。

然而,从总体趋势来看,更有效往往伴生着牺牲灵活性。英特尔高性能计算架构师David Scott长期关注HPC的发展状况,他认为,混合计算将为HPC带来巨大潜能,但当前GPU的应用状况却并不理想。GPU往往被用于定制计算,灵活性不强,难于编程、纠错也影响了性能,同时,使用的向量矩阵的数据结构也相对简单。更严重的是,GPU与CPU内存空间分离,交互通信瓶颈限制了性能发挥,“光考虑计算不行,必须把数据传送考虑进去,GPU还有很长的路要走。”David Scott说。

从竞争到融合往往不会太久,“加速卡在小众市场上获得了巨大成功,走向批量市场,为什么不把它放在CPU里面去呢?历史已经证明了。”英特尔高性能计算业务总经理Richard Dracott曾在接受记者采访时表示。但在当前的竞争阶段,CPU与GPU的竞争将是软件之争,根本不是硬件之争。David Scott认为,开发软件的复杂度涉及到客户最后的投资回报。如果加速比与迁移工作不匹配,投资回报低于预期,客户会考量是否要做大量的代码转移工作或重新编译工作。

那么是否有一条更和谐的道路,让高效与灵活兼顾呢?

x86架构的一统图谋

CPU的路径很明显,从多线程、多核、再到众核,GPU从部分编程到完全可编程,“二者的优势将结合并交汇于x86架构。”David Scott告诉记者,英特尔已经从软件和硬件方面都为此做好了充分准备,他所在的高性能计算部门更是有250多名员工在软件、硬件、平台等方面工作,集中优势资源服务HPC行业。

英特尔的做法是,从硬件上要按照既定路线图保证用户处理器及平台的能效和可扩展性,从软件上则要保证保护客户的软件代码投资,“任何一个新架构想要获得成功,最大的瓶颈就在于软件的接受度。” David Scott表示,最优的解决方案是要让终端用户容易地使用其调优特性、可编程性、灵活可扩展以及兼容性。

在硬件方面,英特尔服务器产品经理顾凡介绍说,在最新的TOP500中,超过五分之四的系统都采用了至强英特尔处理器,超过7成系统采用至强四核处理器。至强5500系列已经成为HPC市场上最为主流的高性能及高能效处理器。其突出的智能概念表现在HPC领域就是智能性能,不同的应用特征匹配不同的性能,同时匹配相应的能耗。

就在明年,英特尔还有一系列重要产品发布,32nm制程的Westmere双路处理器是至强5500的升级版,与至强5500完全兼容;Nehalem EX多路处理器则开启了下x86胖节点的新时代,其中一款针对高性能计算优化的6核处理器能比 8核Nehalem-EX 处理器以更高频率运行,并提供更高带宽,以此构建的胖节点可用于构建更大规模的HPC集群。同时,英特尔还将继续在平台层面、数据中心层面投入,推动HPC系统向前发展。按照英特尔预期,每年将帮助客户在数据中心层面的能耗比方面提升50%。

而在新一代处理器问世前,永远要软件先行,目的是让工具软件支持ISV在新平台上将应用软件的性能发挥出来。从Nehalem发布就可以看出,很多HPC系统实施只要3个月,而在过去这样的系统实施差不多需要一年。英特尔不仅更新了并行工具套件Parallel Studio,还计划于今年年底推出英特尔 Ct 技术 Beta 版,这项技术能自动对多核和众核处理器进行并行编码,帮助客户轻松使用 C 和 C++ 并行编程。

对于众所期待的Larrabee,David Scott表示,早期问世的Larrabee还只是显卡,但众核探索将必然会用于CPU,目前英特尔正在解决编程模型问题等一系列挑战。从某种意义上讲,英特尔自身也在走混合计算的道路,但毫无疑问的是,兼顾混合计算与同一架构下的软件投资保护,将是HPC继续发展的巨大推动力。

猜你喜欢

英特尔高性能处理器
英特尔携手一汽集团,引领汽车行业全新变革
英特尔扩充FPGA可编程加速卡产品组合
一款高性能BGO探测器的研发
高性能砼在桥梁中的应用
SATA推出全新高性能喷枪SATAjet 5000 B
Imagination的ClearCallTM VoIP应用现可支持Cavium的OCTEON® Ⅲ多核处理器
英特尔开源帮霍金“说话”软件
高性能可变进气岐管降低二氧化碳排放
ADI推出新一代SigmaDSP处理器
好平板有强芯 英特尔Bay Trail芯片解析