Maxwell全新出击
2014-04-29小欢
小欢
英伟达GTX 980、GTX 970全面解读
显显卡的发展总是吸引着玩家的眼球,尤其是游戏玩家,对画质和游戏的无限追求使得显卡性能一直处于“饥渴”状态,这也一直引领着显卡的高速发展。在今年早些时候,英伟达发布了Maxwell架构以及这个架构的小核心GM107之后,人们就对Maxwell在大核心上的优势非常期待。终于,英伟达在上个月发布了全新的GM204核心的Maxwell旗舰产品——GeForce GTX 980和GTX 970。这两款产品以强大的性能优势和史无前例的超高性能功耗比出现在人们面前。那么,GTX 970和GTX 980又有哪些值得我们了解的内容呢?它们又带来了哪些全新技术呢?
作为目前最重要的GPU厂商之一,英伟达早在去年就公布了自己的架构路线图。在广受好评的Kepler架构后,英伟达将推出的是Maxwell架构,继续加强GPU的能耗比同时提高性能。不过,Maxwell的首款产品是面向中低端市场的GTX 750系列,展示出了超强的性能功耗比,这也使得人们对Maxwell架构在中高端显卡上的表现有了更多的期待。终于,在2014年9月18日,英伟达正式发布了Maxwell架构的高端显卡——GTX 980和GTX 970,采用了Maxwell架构的较大核心GM204,掀起了GPU市场的又一次热潮。
GTX 980和GTX 970的规格介绍
在介绍产品性能之前,让我们一起来看看GTX 980和GTX 970的相关产品规格。
GTX 980采用的是GM204-400核心,这也是目前GM204规格最高的核心,它拥有2048个CUDA Core,单精度计算能力为5TFLOPS,纹理填充能力为144GT/s。在频率方面,GTX 970的核心基准频率为1126MHz,Boost频率为1216MHz,几乎是目前频率最高的GPU。显存方面,GTX 980没有配备更大的显存位宽,而是很恰当地使用了256bit位宽,不过搭配的显存频率高达7012MHz,显存带宽也达到了顶级显卡才有的224GB/s,显存容量为4GB,满足4K超清时代的显存需求。接口方面也为4K超清做出了改变,GTX 980首次在桌面显卡上支持了HDMI 2.0,支持HDMI接口输出60Hz的4K超清视频。此外,公版的GTX 980还首次提供了三个DisplayPort 1.2接口,只提供了一个带模拟信号输出的DVI双链接口。在如此强悍的功能和规格背后,GTX 980的功耗表现令人惊讶, GTX 980 TDP为165W,使用双6pin接口,是目前同档次显卡中最为节能的产品。在实际测试中,这款显卡的性能超越目前最强悍的GTX 780Ti15%左右,令人咋舌。
说完了GTX 980,再来看看GTX 970。GTX 970采用了GM204-200核心,流处理器数量缩减至1664个,核心基准频率为1050MHz, Boost频率为1178MHz,都比GTX 980略低。显存规格方面和GTX 980完全相同,也是256bit、4GB、7012MHz的配置。由于规格略低,因此GTX 970的功耗进一步降低至145W,也同样配备了双6pin供电接口。接口方面GTX 970和GTX 980能够支持的规格完全一样,但目前市场上的GTX 970都是非公产品,因此具体配置和厂商选择相关。性能方面GTX 970公版频率下比GTX 780略快,但是功耗奇低,非公版性能还会更好,值得期待。
在说完了GTX 980和GTX 970的规格后,很多玩家很好奇,为什么Maxwell架构的GM204有如此出色的功耗表现呢?
更高的性能功耗比——Maxwell全新的架构设计
Maxwell在之前的GM107上展示出了超强的性能功耗比,在这次的GM204上也是如此。下面我们根据英伟达的官方资料来详细看一下有关GM204内部架构设计的内容。
根据目前的数据来看,GM204核心拥有4个GPC,每个GPC内部有4个SMM(麦克斯韦流式多引擎单元),一个SMM拥有128个CUDA Core。这样算下来,一整个GM204就拥有总计16个SMM和2048个CUDA Core。
具体到每个SMM来看的话,每个SMM除了密密麻麻的CUDA Core外,还有1个多形体引擎和8个纹理单元。多形体引擎主要和几何计算相关,用于曲面细分以及相关计算,后者则和贴图、纹理能力相关。根据NVIDIA的官方数据,Maxwell的SMM相比之前Kepler的SMX,每瓦特效能是后者的2倍,每核心的效能提升到了后者的135%。
对于SMM和SMX在内部设计上的差异,英伟达表示,相比SMX,SMM最大的特点在于为每一个SMM继续进行了层级分配,SMM将之前只有独一份、较大的逻辑控制、指令分派单元并行设计为四个较小的单元,每个单元仅仅控制32个CUDA Core以及相关配套计算单元,逻辑控制能力更强,因此效率更高了。此外,之前SMX上的Register File容量为65536×32bit。在SMM中,每个Register File的容量被缩减到16384×32bit,相当于只有之前的1/4,但一共设计了4个,因此总量不变。
在显存控制器方面,一个完整的GM204拥有4个64bit的显存控制器,每个显存控制器拥有16个ROP单元并控制着512KB的L2缓存。整个GM204总计拥有256bit显存位宽、64个ROP单元和2MB缓存。整个GM204核心拥有52亿个晶体管,采用TSMC 28nm工艺制造,核心面积大约398平方毫米。
全新技术——随GM204而来的新特性
除了显卡本身,英伟达也公布了一些全新技术,有些技术可以在之前的产品上使用,比如DSR,有些技术则不能。下面为大家简单介绍一下部分新技术内容。
1.MFAA多帧采样抗锯齿
传统的抗锯齿是在单帧中获取锯齿信息并加以增加采样计算,从而降低锯齿的。但是MFAA则不是这样,它通过判断多帧中同一部位的不同信息,从而达到抗锯齿效果。英伟达MFAA的优点在于比传统的MSAA性能要求更低,比如在4XMFAA的效果就相当于传统的8XMSAA,但是性能要求也只和4XMSAA相当。目前MFAA还在研发中,尚未正式推出。
2.DSR动态分辨率
DSR全称是Dynamic Super Resolution,它的特点是在显卡端通过对分辨率倍数的提升,在高分辨率或者超高分辨率下渲染,再缩减采样至显示器上,这样可以实现极为出色的画面效果,同时彻底杜绝诸如锯齿等现象。比如1080p的显示器以3840x2160的分辨率渲染,再缩放至1080P显示器,使得画面精美度大幅度提升。
3.基于体素的全局光照技术
这项技术的全称是VOXEL GLOBAL ILLUMINATION。之前的对3D图形的光照计算多只有一次光照或者二次光照,对光的散射和折射处理都不够到位。而英伟达全新的VGXI技术基于体素的改建,重构了光照模型,使得渲染效果更为逼真,接近真实照片,这也是光线追踪技术的最新发展之一。
Maxwell,英伟达的又一次极致
从上文的介绍来看,Maxwell的GM204在工艺没有更新的情况下,依靠架构改进和内部设计优化,实现了相比之前Kepler架构的效能大跃进。这也是英伟达在转向追求产品性能功耗比之后的一次重大胜利。其代表产品GTX 980和GTX 970无论性能、功耗、技术还是散热、实际产品都几乎无可挑剔,堪称目前顶级显卡的最佳选择。目前GTX 980的官方指导价格为4999元,GTX 970则是2999元,也比较合适。如果你是顶级玩家的话,相信这两款显卡都不会让你失望的。