解读最新TOP500排行榜MPP结构略胜Cluster,四核主流地位不变
2010-01-16杜晓梅王广益李利
文/杜晓梅 王广益 李利
解读最新TOP500排行榜MPP结构略胜Cluster,四核主流地位不变
文/杜晓梅 王广益 李利
第35届全球超级计算机TOP500排行榜于2010年5月31日在德国汉堡举行的SC10大会上发布。排名第一的仍是美国Cray公司研制的“美洲豹”系统;中国曙光公司制造的“星云”超级计算机以1.27Pflops的Linpack性能和2.98Pflops的峰值性能排名第二。
TOP10重点分析
在TOP10系统中,IBM公司占有4台(一台“走鹃”和三台“蓝色基因”),Cray公司拥有2台(“美洲豹”和“海怪”),SGI、Sun以及中国的曙光公司和国防科技大学各占有一台。但必须指出,我国所制造两台系统(“星云”和“天河”)的核心部件CPU和GPU仍是源自美国的Intel、AMD以及NVIDIA公司。由此可见,美国在高性能计算领域的综合技术实力是无可比拟的。
三种技术路线并存
从技术路线来看,TOP10系统可分为三种技术路线:一是基于高性能通用CPU;二是基于低功耗嵌入式CPU;三是基于通用CPU+加速器(或称协处理器)。
采用第一种技术路线的系统有4台。其中,Cray公司的“美洲豹”和“海怪”系统基于AMD六核2.6GHz Opteron处理器;SGI公司的“昴宿星”和Sun公司的“红色天空”系统则是基于Intel四核EM64T Xeon处理器(型号和频率不同)。
采用第二种技术路线的系统有3台。它们都属于IBM“蓝色基因”系列,都是基于低功耗嵌入式PowerPC处理器,其中2台“蓝色基因/P”系统基于850MHz PowerPC 450处理器,1台“蓝色基因/L”系统基于700MHz PowerPC 440处理器。
采用第三种技术路线的系统也有3台。它们分别为IBM公司的“走鹃”以及我国曙光公司的“星云”和国防科技大学的“天河”系统。所不同的是,作为2008年世界首台Linpack实测性能突破千万亿次大关的IBM“走鹃”系统采用Cell处理器(最初用于索尼公司的PS游戏机)作为加速器,而我国的“星云”和“天河”系统则是利用GPU来实现加速。具体地说,“走鹃”是AMD Opteron CPU+ PowerXCell 8i;“星云”是Intel X5650 CPU+NVIDIA Tesla C2050 GPU;“天河”是Intel E5540 CPU+AMD/ATI Radeon 4870 GPU。
表1 TOP10系统对比(性能单位:Tflops;能效单位:Mflops/W)
MPP结构略胜Cluster
从大的体系结构来看,TOP10系统分为两种:MPP(大规模并行处理)和Cluster(机群)。其中,采用MPP结构的系统有6台——Cray“美洲豹”和“海怪”、三台IBM蓝色基因机器、SGI“昴宿星”;采用Cluster结构的机器有4台——曙光“星云”、IBM“走鹃”、国防科大“天河”、Sun“红色天空”。
MPP结构的系统又分为基于高性能通用多核CPU(Cray、SGI系统)和基于低功耗嵌入式CPU(IBM蓝色基因系统)。
Cluster结构则分为同构(只用一种CPU,Sun“红色天空”)和异构(CPU+GPU或Cell,“星云”、“天河”和“走鹃”)。
商用互连和专用互连平分秋色
从互连技术来看,TOP10系统采用商用互连和专用互连的机器各占一半。其中,“星云”、“走鹃”、“昴宿星”、“天河”、“红色天空”都是采用商用Infiniband互连。“美洲豹”和“海怪”系统采用了基于Cray专有Seastar2+芯片的高带宽低时延互连网络;3台“蓝色基因”系统采用基于IBM公司专有ASIC路由器芯片的三维环网。由此可见,Cluster结构的机器基本都是采用商用标准互连,而MPP结构则一般采用专用互连技术,SGI“昴宿星”MPP系统是一个例外。
在操作系统方面,TOP10系统全部采用了Linux操作系统。
“传统教学中学生习惯了听,习惯了被灌输,我们必须改变传统课堂中‘老师滔滔讲,学生昏昏睡’的现象,高效课堂就是一个非常有效的途径。”盛庆余说,“高效6+1”课堂模式在内地已经普遍应用,但在新疆还处在探索阶段。
TOP500综合分析
系统性能继续攀升,系统规模不断扩大
此次500台系统的总Linpack性能从6个月前的27.6Pflops增加到32.4Pflops,一年前为22.6Pflops。TOP500进入门槛的Linpack性能为24.7Tflops,6个月前为20Tflops,一年前为17.1Tflops。TOP100的进入门槛从6个月前的47.72Tflops提高到52.84Tflops。此次排名最后一位的系统在6个月前的TOP500中位列357。其更新率远低于平均水平,反映了目前的经济形势和HPC市场将出现新的产品周期。
自从2008年6月份第31届TOP500首次出现千万亿次超级计算机(Roadrunner)以来,两年的时间里峰值性能突破千万亿次的系统增加到7台,其中有3台系统的Linpack性能超过千万亿次。
最新TOP500的系统规模同上一期相比继续扩大,系统所用内核数也发生变化,内核数在4097~8192个的系统数量最多,从六个月前的252台增加到291台,达到58.2%,而六个月前为252台。系统规模在8193~16384个处理器的系统从上一次的48台增加到57台。而系统规模在2049~4096个处理器的系统规模继续减少,从一年前的228台,到六个月前的160台,此次则减少到111台。规模低于2048个处理器的系统已经寥寥无几。其他规模的系统数量变化不大。
此次TOP500中平均每系统内核数从6个月前的9174个增加到10267个,一年前为8210个。此次TOP50中平均每系统内核数从6个月前的44338个增加到49080个,一年前为40871个。具体情况如表2所示。
继续关注能效指标
此次TOP500按惯例跟踪了500台超级计算机的实际功耗。此次TOP500的平均功耗为397kWatt,平均能效为195Mflops/Watt(一年前为108Mflops/Watt,六个月前为125Mflops/Watt)。
表2 TOP500系统规模(性能单位:Tflops)
排名第1的Jaguar系统最高总功耗为6.95Mwatt。TOP10的平均功耗为2.89Mwatt(一年前为2.45MWatt),平均能效为300Mflops/Watt(一年前为280Mflops/Watt)。
能效最高的系统主要基于:采用IBM PowerXCell 8i处理器的Qpace机群系统,能效最高达774Mflop/Watt;IBM QS22 Cell处理器刀片系统,能效高达458Mflop/Watt;采用Intel Westmere处理器的iDataPlex系统,能效高达418Mflop/Watt。
四核主流地位不变,Intel引领发展
此次TOP500的系统中,处理器结构仍以多核处理器为主。有85%(425台)都使用了4核处理器,有5%的系统使用了6核或以上的处理器。仍有48台系统采用双核处理器。
Intel无疑仍是最大赢家。在所有500台系统中,使用Intel处理器的占了81.2%,而且在使用4核处理器的系统中,Intel的份额超过了90%。使用Intel Core i7(Nehalem-EP)处理器的系统数量增长迅速,从上次的95台增长到此次的186台,几乎翻了一倍。
表3处理器制造商情况(性能单位:Tflops)
表4 TOP500系统保有量前10国家(性能单位:Tflops)
AMD Opteron系列处理器的采用率此次超过IBM,排名第二,从42台增加到47台,占9.4%。IBM Power处理器份额略有下降,从52台减少到42台,占8.4%。具体情况如表3所示。
美国仍旧一家独大,中国系统性能再创新高
美国的领先地位依旧无人能撼,500台系统中占了282台(6个月前277台)。欧洲所占份额(从152台减少到144台)仍远远超过亚洲(从51台增加到57台)。
亚洲系统拥有量占优势的分别是中国(从21台增加到24台)、日本(从16台增加到18台)和印度(从3台增加到5台)。
在欧洲,英国的系统保有量仍位居第一,有38台(6个月前为45台)。法国有29台(6个月前为26台),超过德国(24台,6个月前为27台)排名第2。
中国保有的系统数持续增长,此次达到24台,与德国持平,系统保有数排名第四,排名前三的国家依次是美国、英国和法国。而就系统总体性能值而言,中国仅次于美国之后,排名第二,超过了排名第三的德国。表4所示为系统保有量前十位的国家。
机群地位牢固,Infiniband奋起直追
机群结构仍是TOP500系统主要使用的结构,此次机群结构的系统数量继续稳步增加,达到424台(占85%。),六个月前为417台,一年前为410台。采用MPP结构的系统数量继续减少,从六个月前的81台减少到74台(一年前为88台),虽然数量不多,但仍主打高端系统。在TOP50中,MPP结构占据大半江山,数量达到28台,在TOP100中,也有47台系统使用了MPP结构。采用星群结构(Constellations)的系统仍为两台。
在操作系统方面,Linux继续扩大优势,以455台的绝对优势独霸一方,比上一次的446台有所增加。而且Linux系统占据高端,排名前十的系统全部采用该操作系统。Unix和Mixed的份额都有所下降。具体情况如表5所示。
表5 TOP500操作系统情况(性能单位:Tflops)
表6 TOP500互连类型(性能单位:Tflops)
采用千兆以太网(Gigabit Ethernet)的系统数量虽略有下降,但仍是使用最多的互连技术,有244台系统使用,并广泛应用于工业用户。排在第2的是InfiniBand技术,有205台系统使用。
但是,使用Infiniband技术的系统的总体性能(15.9Pflops)是使用千兆以太网技术总体性能(7.8Pflops)的2倍。
在前十台系统中,Infiniband和专有互连平分秋色,使用台数都为5台。TOP50中仅有一台系统采用千兆以太网(Gigabit Ethernet)互连技术。TOP100中有63台系统采用Infiniband互连结构。表6所示为TOP500互连的具体情况。
为江南计算技术研究所)
本文转载于上海超算中心内部刊物《高性能计算发展与应用》最新一期,经授权引用。