性能追平上代万元旗舰 NVIDIA GeForceRTX 3070规格解析

2020-12-02

电脑报 2020年42期

“逢7必香”，NVIDIA显卡的性能升级步伐又回来了

在RTX 3090和RTX 3080后，9月2日NVIDIA发布会上老黄（NVIDIA CEO黄仁勋）发布的第三款显卡如今终于揭开了其神秘的面纱。由于前两款的市场反应非常激烈，开卖即断货，所以NVIDIA也还特别推迟了RTX 3070的正式上市时间，从而准备更充分的备货量。如果说NVIDIA的显卡有着“逢7必香”的定律，那么RTX 3070的表现和定位又如何呢？

熟悉显卡发展历史的玩家一定知道，在这几代的显卡中，NVIDIA显卡有着“逢6必火”“逢7必香”的升级路线。“逢6必火”暂且不说，“逢7必香”指的是NVIDIA当代的7字头的型号性能会持平或超过上一代的旗舰产品。具体来说GTX770的综合性能超过了GTX680，GTX970超过了GTX780Ti，GTX1070超过了GTX 980Ti。但在RTX 20系列这一代，这个升级步伐却停了下来，RTX 2070没能实现对GTX 1080 Ti的超越，这个活留给了RTX 2080。

当然，这并不是说Turing架构不够优秀，或者老黄“挤牙膏”。这是因为从Kepler架构（GTX680）演变到Maxwell架构（GTX980）再升级到Pascal（GTX1080Ti）架构，每一代的CUDA核心都由FP32单元组成。在Turing架构中，CUDA核心中加入了一个INT32单元，在运算效率上得到了不小的提升。但问题在于，大部分玩家购买显卡的升级动力大多来自游戏，而游戏对于浮点运算的需求是远高于整数运算的，所以在游戏过程中，Turing架构中新加入的INT32单元经常处于闲置状态，没有实际的性能反馈。这也就是为什么RTX 2070没法很好地替代GTX 1080 Ti的原因。

到了RTX 30系列，我们熟悉的升级路线又回来了，而新一代Ampere架构的最大改进就是将上一代的INT32单元变成了FP32/INT32的可变单元，即同一个单元可以在整数和浮点运算间进行切换。再加上8nm工艺带来了单位面积下更多的晶体管数量，所以我们可以看到RTX 30系列的CUDA单元数量暴增，性能提升也非常巨大。

据NVIDIA官方介绍，RTX 3070的综合性能就可以持平RTX 2080 Ti，远超RTX 2070，熟悉的“逢7必香”定律又重回各位玩家的视野。

RTX 3070规格解析，5888个CUDA单元搭配GDDR6显存

NVIDIA RTX 3070基于GA104-300核心，同样采用三星定制的8nm制程工艺。作为一款中高端产品，RTX 3070的核心面积仅为392.5mm2，相比RTX 3080/RTX 3090的核心面积小了三分之一。即便如此，由于制程的迭代，RTX 3070在这个尺寸下塞入了174亿个晶体管，而上一代的旗舰RTX 2080 Ti，核心面积几乎是RTX 3070的两倍，晶体管数量却只比RTX 3070多了12亿。与此同时，RTX 3070的功耗仅为220W，比RTX 2080的225W还低，更不用说RTX 2080 Ti的260W了，这足以见得制程带来红利优势。

由于定位的关系，RTX 3070的规格相比RTX 3090和RTX 3080还是缩减了不少（但也为中间进一步细分市场留下了空间），SM单元从RTX 3080的68组再次缩减到46组，每组128个CUDA核心，4个纹理单元，共5888个CUDA核心，184个纹理单元。Tensor Cores缩减到184个，RT Cores缩减到46个。

显存颗粒方面，RTX 3070没有采用RTX 3080/RTX 3090上使用的美光GDDR6X显存，依旧还是使用的GDDR6显存，这显然和其定位/成本有关系。在FE公版的RTX 3070上，使用的是来自三星的GDDR6显存，不再是之前美光的GDDR6显存，三星的GDDR6颗粒在超频性能上表现更好，也受到众多超频玩家喜爱。显存容量方面，RTX 3070和上一代RTX 2070一样是8GB，显存位宽/频率/带宽也同样是256bit/14GHz/448GB/s。

从规格上来看，RTX 3070或许有些不像想象中那么强大，但Ampere架构的一个改进值得大家注意，那就是在之前的GPU构架中，ROP单元（光栅化处理单元）集成在内存控制器中，如果缩减GPU位宽就会降低ROP单元数量。但Ampere架构将ROP单元整合进了GPC，每个GPC含有16个ROP单元。只要GPC数量不变，即使显存位宽缩减，也不会影响ROP单元的数量。

RTX 3070拥有和RTX 3080一样的6个GPC设计，所以ROP单元数量同样也是96个，超过了RTX 2080 Ti的88个。而这一改进，也是RTX 3070能够“以下犯上”挑战RTX 2080 Ti的规格优势之一。

除了ROP单元和CUDA核心外，RTX 3070可以说在硬件规格参数上全面低于RTX 2080 Ti（甚至连CUDA核心数都不能保证真的超过RTX 2080 Ti，因为RTX 30系列的CUDA核心数是按照极限情况下，所有的CUDA核心都在进行FP32计算时统计，但这种情况在实际中几乎不会遇到），它比后者少了近百个纹理单元，RT核心只有后者的70%，Tensor核心只有后者30%，显存位宽也只有其三分之二。比较有意思的是，如果RTX 20系列是作为光线追踪的探路者出现，那么RTX 30系列无论是从玩家期望出发还是NVIDIA本身出发，都是作为光线追踪游戏普及的一代出现，在这一代上如此大规模地削减RT核心和Tensor核心的数量，也说明了NVIDIA对第二代RT核心和第三代Tensor核心在性能上的信心。

如果说RTX 3080/RTX 3090以强大的硬件规格实现了在性能上对RTX 2080 Ti的超越不足为奇，那么RTX 3070以看似弱很多的规格如果真能战平RTX 2080 Ti，这才真的能够说明Ampere架构的强大。

定价有惊喜，性价比竟高过RTX 2070

如果是和上一代同为7字辈的RTX 2070相比的话，RTX 3070的规格就有大幅的提升。相比RTX 2070的2304个CUDA核心来说，RTX 3070的5888个CUDA核心已经在数量上翻倍（即使没有全部进行FP32运算，也能保证在游戏中的调用超过RTX 2070），纹理单元、ROP单元、RT核心等规格也同样高出不少。加上这一代架构的效能提升，稳赢RTX 2070 50%以上的性能应该问题不大。

RTX 3080的售价几乎只有RTX 2080 Ti的一半，性价比已经让玩家感到十足的惊喜。而RTX 3070的定位更低，售价自然也就再次下探到3899元（FE公版）的价位上。如果它真能战平RTX 2080 Ti，那么以不到4000元的售价买到上代万元旗舰的性能（甚至诸多非公版已经超过了一万元），对于玩家来说可以说是真香了，要知道3899元这个售价，不但远低于RTX 2080 Ti，甚至比RTX 2070的首發售价都低了900元（事实上后期众多RTX 2060S都卖到这个价位），可以说是相当惊喜了。

另外，除了硬件规格方面本身的提升之外，NVIDIA Reflex低延迟技术、BROADCAST直播串流辅助、新一代AV1编解码、新一代HDMI2.1接口等RTX 30系列带来的全新特性，RTX 3070均有搭载和支持。下面就让我们一起来看看RTX 3070显卡的实际测试，是否能真的如NVIDIA所说那样，综合性能战平RTX 2080 Ti。

猜你喜欢

两种内存规格Intel 100系列支持DDR3L/DDR4

性能追平上代万元旗舰 NVIDIA GeForceRTX 3070规格解析

猜你喜欢

杂志排行

电脑报的其它文章