APP下载

新卡皇之争

2014-04-29

CHIP新电脑 2014年1期
关键词:显示卡功耗处理器

在10月底AMD正式发布了其新一代的R7/R9系列显示卡,向英伟达发起了全面的反击,其中,采用新的Hawaii架构的旗舰级显示卡Radeon R9 290X,凭借激增的流处理器数量和显存位宽,在性能方面较上一代的旗舰级显示卡Radeon HD 7970GHz有了大幅提升,一举将对手同价位的GeForce GTX 780斩于马下,并且在某些项目中具有挑战比自己身价高出数千元的GeForce GTX TITAN的实力,一时之间似乎让英伟达有些猝不及防。不过老道的英伟达似乎对此早有准备。紧接着,在11月初,英伟达便高调发布了其新一代旗舰级显示卡GeForce GTX 780Ti来应对这个局面。

硬件规格:再创新高

AMD的Radeon R9 290X采用的Hawaii核心使用了成熟的28nm工艺,晶体管数量达到了62亿个,核心面积提高到了438mm?,其一大亮点就是搭载了512bit位宽的显存控制器,但Hawaii核心面积并没有大幅提高,较之前的Tahiti核心仅增加了20%,与竞争对手采用的GK110核心(核心面积561mm?)相比还要小不少,大概只有GK110核心面积的78%。

Hawaii核心分为两个版本,R9 290X采用的是最高档的Hawaii XT核心(低一档的Hawaii Pro核心被用于稍晚些上市的次旗舰产品R9 290),其光栅单元比Tahiti XT核心多了一倍,纹理单元也增至176个,流处理器达到了2 816个,比Tahiti XT多出了37.5%。R9 290X采用的Hawaii XT核心基本频率定为800MHz,Boost频率最高可达1 000MHz。

Radeon R9 290X的显存频率定为1 250MHz,GDDR5等效数据频率为5 000MHz,似乎稍低了些,但由于其内置的显存控制器位宽达到了512bit,于是其最终的显存带宽达到320GB/s。如果未来的非公版R9 290X采用等效6 000MHz的显存,显存带宽甚至可高达384GB/s。提高显存位宽固然会提升GPU与显存之间的数据交换速度,然而代价也往往是非常高昂的。提高显存位宽需要提高GPU核心显存控制器的位宽,而提高显存控制器位宽一般而言需要增加大量的晶体管,这也直接导致以往的R600和GT200的核心面积巨大,这一次AMD再度将512bit显存控制器装入新的GPU中,不过得益于Hawaii的高密度外加优化设计,512bit显存控制器占用的芯片面积比上一代Radeon HD7970的384bit还要小,瘦身幅度达20%。

英伟达GeForce GTX 780Ti采用的GK110核心架构与之前的GeForce GTX 780和GeForce GTX TITAN所采用的GK110核心相同,晶体管数量为71亿个。但是相比前两者,本次英伟达可谓下上了血本,首先GeForce GTX 780Ti开放了G110核心中所有的15组SMX单元,包含6组ROP管线以及6组GDDR5显存控制器,于是它总计有恐怖的2 880个CUDA核心、960个DP CUDA核心、240个纹理单元、384bit显存位宽以及48组ROPs单元。而曾经的旗舰GeForce GTX 780和GeForce GTX Titan只分别使用了GK110核心的13组和14组SMX单元。由于保留了完整的6组GDDR5显存控制器和ROPs管线,它的核心频率显然难以像GeForce GTX 780GHz那样突破1GHz,其基础频率只有875MHz,Turbo频率为928MHz。在显存频率方面,GeForce GTX 780Ti做到了史无前例的7 000MHz,虽然仅为384bit的核心位宽,如此高的显存频率也将显存带宽提升到了366GB/s,超越了AMD R9 290X的320GB/s。不过GeForce GTX 780Ti公版标配的显存容量只有3GB,仅为GeForce GTX TITAN显存容量的一半,或许英伟达是想给之前高价(7 999元)购买GeForce GTX TITAN的用户一点心理安慰。

架构设计:各有特色

GeForce GTX 780Ti采用的GK110核心基于Kepler架构,它并不是一款“革新”的产品。从GK110核心SMX逻辑结构图中我们可以得知,虽然它与上一代的GK104的SMX具有相同的结构、相同的192个CUDA Core和相同的16个纹理单元,但是它在CUDA Core的附近新加入了许多DP Unit单元,既Double Precision Float Unit,意为双精度浮点单元。一组SMX中就包含64个DP Unit,15组共包含960个。英伟达在GK110核心中加入如此之多的双精度浮点单元,目的就是为大幅增强GK110的双精度浮点运算能力以满足和对手竞争的需求。

此外,GK110核心在缓存方面也有所增强,GK110核心的每组SMX里除了配备64KB 的L1 缓存外,还增添了48KB 的只读数据缓存(Read-Only Data Cache),用来提升核心的通用计算性能。

AMD的R9 290X采用了新的Hawaii核心,作为GCN架构的改良版本,Hawaii在诸多方面进行了修改,首先是Hawaii XT的流处理器引擎(Shader Engine)由Tahiti XT的2组变为4组,RB(Render Back-ends,后端渲染器)也倍增至16个。几何处理器(Geometry Processor)、光栅单元(Rasterizer)也都划分到了这4组流处理器引擎里,其中光栅单元每组16个,总计64个。 ACE(异步计算引擎)达到了8个,是上一代Tahiti XT的4倍。相比上一代的Tahiti核心,Hawaii核心在增加了768个流处理器、1倍的光栅单元、3倍的几何处理器、两组显存控制器等总共19亿个晶体管之后,核心面积仅增加了86mm?。也就是说,Hawaii相比Tahiti增加了约45.6%的晶体管数量,但芯片面积仅增大了24%。这样一来,Hawaii的核心密度便有了明显提升。与之带来的运算能力提升也非常高效,Radeon R9 290X的几何处理能力和像素填充率相比上一代的Radeon HD7970 GHz几乎翻番,浮点运算、纹理填充也都达到了1.3倍。不过由于和上一代的Tahiti相同的新架构,Radeon R9 290X在单位面积的浮点运算性能提升有限,仅为5%。

技术比拼

英伟达在GPU行业里一直致力于游戏玩家的体验和软硬结合的开发。每次发布重要的产品时,都会同时带来几个让人耳目一新的全新技术,这之中不乏一些英伟达开发的基于游戏的应用,这次GeForce GTX 780 Ti也不例外。

英伟达ShadowPlay是一款专为游戏玩家准备的实时录像工具。它可以随时记录游戏玩家的游戏表现(包括声音与画面),并且保证1080p的高清显示效果。在工作时,英伟达的GPU会在后台记录你游戏中的一举一动,当你做出了精彩的操作或者打破了某项纪录,只需要敲击快捷键,那么之前20分钟内的影像与声音就会全部保存下来。而当你开启ShadowPlay时,录像功能仅仅会让你损失非常少的性能,相比其他录像软件ShadowPlay有着足够的低资源占用优势。与此同时,尽管ShadowPlay会持续录制,但是只要不按下快捷键,它持续录制的东西将不会占用任何磁盘空间。

G-SYNC则是另一项完全颠覆传统概念的技术,英伟达打造了一个开发板并将它用于显示器之中,搭载这种开发板的显示器可以与英伟达的显示卡无缝连接,并且实时改变屏幕刷新率。当显示卡的游戏性能足够强大,然后让屏幕刷新率与显示卡显示的帧数一致时,游戏将不会产生任何卡顿与屏幕撕裂,传统的垂直同步和帧生成问题就可以不再担心,让用户可以直接获得更好的游戏体验。

AMD方面,新的Radeon R9 290X支持DirectX 11.2、OpenGL 4.3、Mantle技术,还有增强的Eyefinity宽域技术,并且DisplayPort接口不再是必需品,DVI/HDMI即可直接组建三屏系统。这是个非常大的进步,可以大大降低组建多屏系统的成本和复杂度。

的DirectX 11.2是个微量升级版,主要是增加了对所谓“Tiled Resources”的支持,实现硬件管理虚拟内存,使得开发人员只需少量的物理内存就能创建更大的逻辑资源。微软称,该技术非常适合用户界面设计。

Mantle也是一个API,但是仅仅针对GCN架构显示卡,可以让开发人员绕过DirectX、OpenGL直接从底层访问GCN硬件资源,大大提升执行效率和性能,而且鉴于PS4、Xbox One也都用上了GCN架构的GPU,可以说AMD在跨平台一统天下方面的野心勃勃。

性能、功耗、温度对比

无论两款产品的设计和采用的技术如何,对于游戏玩家来说显示卡的性能表现才是最重要的。在分别测试显示卡理论DirectX 11图形性能的New 3DMark和3DMark 11中,两者互有胜负,可以说不分伯仲。不过在随后在多款不同分辨率设置的热门游戏测试中,GeForce GTX 780Ti高规格带来的不俗游戏性能渐显露出来,在《蝙蝠侠》、《战地3》、《Crysis3》、《热血无赖》、《古墓丽影》等对款游戏中的成绩相比对手Radeon R9 290X有10%~30%不等的领先幅度,不过Radeon R9 290X也有自己的优势项目,在《马克思佩恩3》、《地铁:最后的曙光》、《尘埃》等游戏中小幅领先对手。综合所有性能测试项目,平均下来GeForce GTX 780Ti相比Radeon R9 290约有6%的领先幅度。在显示卡高负载功耗测试中,由于如今的高端显示卡均具备了功耗保护功能,在使用Furmark等严酷的烤机软件进行测试时,显示卡会自动降低频率来保护自己不会损坏。这导致我们无法通过常用烤机软件来得到其准确的最大功耗,所以我们选择了用3DMark 11测试程序来测试整个平台的整体功耗(不含显示器)。在待机功耗方面,GeForce GTX 780Ti所在的平台整体待机功耗仅为52W,Radeon R9 290X平台整机功耗略高,为57W。高负载状态下GeForce GTX 780Ti平台的最高功耗为330W,相比之下Radeon R9 290X的平台最高功耗为380W。因此在功耗表现方面,GeForce GTX 780Ti略胜一筹。

在噪音方面,二者的待机和高负载风扇转速都较为相似,噪音表现也较为相近。不过在核心温度方面,GeForce GT 780Ti 的无论是待机温度28℃还是高负载温度82℃,均相比待机温度为65℃和高负载95℃的Radeon R9 290X要强上不少。

总结:

通过此次旗舰级产品针锋相对的碰撞,英伟达再一次通过土豪级的规格在性能方面取得了胜利,并且在功耗、温度和噪音等方面力压对手,当之无愧地夺回了单芯卡皇的宝座。

对于那些追求极致性能的玩家来说,GeForce GTX 780Ti自然是不二之选,况且其功耗和温度方面的表现也更佳。不过Radeon R9 290X也并不是败的一无是处,因为在价格方面,由于Radeon R9 290X的价格为4 699元,而GeForce GTX 780Ti的的价格为4 999元,相差了约6%,而这恰好是两者之间性能方面的差距,而且AMD向来在后续驱动优化方面表现非常不错,因此Radeon R9 290X在性能方面还有不少优化的余地。此外,AMD显示卡的“挖矿”性能也成为游戏玩家在空闲时间赚取外快的一个功能,对手英伟达在这方面的表现则入不敷出。

猜你喜欢

显示卡功耗处理器
揭开GPU功耗的面纱
数字电路功耗的分析及优化
“功耗”说了算 MCU Cortex-M系列占优
IGBT模型优化及其在Buck变换器中的功耗分析
Imagination的ClearCallTM VoIP应用现可支持Cavium的OCTEON® Ⅲ多核处理器
低温高性能
ADI推出新一代SigmaDSP处理器
读编往来
呼噜处理器
焊接电阻升级显示卡