APP下载

性能追平上代万元旗舰 NVIDIA GeForceRTX 3070规格解析

2020-12-02

电脑报 2020年42期
关键词:制程规格售价

“逢7必香”,NVIDIA显卡的性能升级步伐又回来了

在RTX 3090和RTX 3080后,9月2日NVIDIA发布会上老黄(NVIDIA CEO黄仁勋)发布的第三款显卡如今终于揭开了其神秘的面纱。由于前两款的市场反应非常激烈,开卖即断货,所以NVIDIA也还特别推迟了RTX 3070的正式上市时间,从而准备更充分的备货量。如果说NVIDIA的显卡有着“逢7必香”的定律,那么RTX 3070的表现和定位又如何呢?

熟悉显卡发展历史的玩家一定知道,在这几代的显卡中,NVIDIA显卡有着“逢6必火”“逢7必香”的升级路线。“逢6必火”暂且不说,“逢7必香”指的是NVIDIA当代的7字头的型号性能会持平或超过上一代的旗舰产品。具体来说GTX770的综合性能超过了GTX680,GTX970超过了GTX780Ti,GTX1070超过了GTX 980Ti。但在RTX 20系列这一代,这个升级步伐却停了下来,RTX 2070没能实现对GTX 1080 Ti的超越,这个活留给了RTX 2080。

当然,这并不是说Turing架构不够优秀,或者老黄“挤牙膏”。这是因为从Kepler架构(GTX680)演变到Maxwell架构(GTX980)再升级到Pascal(GTX1080Ti)架构,每一代的CUDA核心都由FP32单元组成。在Turing架构中,CUDA核心中加入了一个INT32单元,在运算效率上得到了不小的提升。但问题在于,大部分玩家购买显卡的升级动力大多来自游戏,而游戏对于浮点运算的需求是远高于整数运算的,所以在游戏过程中,Turing架构中新加入的INT32单元经常处于闲置状态,没有实际的性能反馈。这也就是为什么RTX 2070没法很好地替代GTX 1080 Ti的原因。

到了RTX 30系列,我们熟悉的升级路线又回来了,而新一代Ampere架构的最大改进就是将上一代的INT32单元变成了FP32/INT32的可变单元,即同一个单元可以在整数和浮点运算间进行切换。再加上8nm工艺带来了单位面积下更多的晶体管数量,所以我们可以看到RTX 30系列的CUDA单元数量暴增,性能提升也非常巨大。

据NVIDIA官方介绍,RTX 3070的综合性能就可以持平RTX 2080 Ti,远超RTX 2070,熟悉的“逢7必香”定律又重回各位玩家的视野。

RTX 3070规格解析,5888个CUDA单元搭配GDDR6显存

NVIDIA RTX 3070基于GA104-300核心,同样采用三星定制的8nm制程工艺。作为一款中高端产品,RTX 3070的核心面积仅为392.5mm2,相比RTX 3080/RTX 3090的核心面积小了三分之一。即便如此,由于制程的迭代,RTX 3070在这个尺寸下塞入了174亿个晶体管,而上一代的旗舰RTX 2080 Ti,核心面积几乎是RTX 3070的两倍,晶体管数量却只比RTX 3070多了12亿。与此同时,RTX 3070的功耗仅为220W,比RTX 2080的225W还低,更不用说RTX 2080 Ti的260W了,这足以见得制程带来红利优势。

由于定位的关系,RTX 3070的规格相比RTX 3090和RTX 3080还是缩减了不少(但也为中间进一步细分市场留下了空间),SM单元从RTX 3080的68组再次缩减到46组,每组128个CUDA核心,4个纹理单元,共5888个CUDA核心,184个纹理单元。Tensor Cores缩减到184个,RT Cores缩减到46个。

显存颗粒方面,RTX 3070没有采用RTX 3080/RTX 3090上使用的美光GDDR6X显存,依旧还是使用的GDDR6显存,这显然和其定位/成本有关系。在FE公版的RTX 3070上,使用的是来自三星的GDDR6显存,不再是之前美光的GDDR6显存,三星的GDDR6颗粒在超频性能上表现更好,也受到众多超频玩家喜爱。显存容量方面,RTX 3070和上一代RTX 2070一样是8GB,显存位宽/频率/带宽也同样是256bit/14GHz/448GB/s。

从规格上来看,RTX 3070或许有些不像想象中那么强大,但Ampere架构的一个改进值得大家注意,那就是在之前的GPU构架中,ROP单元(光栅化处理单元)集成在内存控制器中,如果缩减GPU位宽就会降低ROP单元数量。但Ampere架构将ROP单元整合进了GPC,每个GPC含有16个ROP单元。只要GPC数量不变,即使显存位宽缩减,也不会影响ROP单元的数量。

RTX 3070拥有和RTX 3080一样的6个GPC设计,所以ROP单元数量同样也是96个,超过了RTX 2080 Ti的88个。而这一改进,也是RTX 3070能够“以下犯上”挑战RTX 2080 Ti的规格优势之一。

除了ROP单元和CUDA核心外,RTX 3070可以说在硬件规格参数上全面低于RTX 2080 Ti(甚至连CUDA核心数都不能保证真的超过RTX 2080 Ti,因为RTX 30系列的CUDA核心数是按照极限情况下,所有的CUDA核心都在进行FP32计算时统计,但这种情况在实际中几乎不会遇到),它比后者少了近百个纹理单元,RT核心只有后者的70%,Tensor核心只有后者30%,显存位宽也只有其三分之二。比较有意思的是,如果RTX 20系列是作为光线追踪的探路者出现,那么RTX 30系列无论是从玩家期望出发还是NVIDIA本身出发,都是作为光线追踪游戏普及的一代出现,在这一代上如此大规模地削减RT核心和Tensor核心的数量,也说明了NVIDIA对第二代RT核心和第三代Tensor核心在性能上的信心。

如果说RTX 3080/RTX 3090以强大的硬件规格实现了在性能上对RTX 2080 Ti的超越不足为奇,那么RTX 3070以看似弱很多的规格如果真能战平RTX 2080 Ti,这才真的能够说明Ampere架构的强大。

定价有惊喜,性价比竟高过RTX 2070

如果是和上一代同为7字辈的RTX 2070相比的话,RTX 3070的规格就有大幅的提升。相比RTX 2070的2304个CUDA核心来说,RTX 3070的5888个CUDA核心已经在数量上翻倍(即使没有全部进行FP32运算,也能保证在游戏中的调用超过RTX 2070),纹理单元、ROP单元、RT核心等规格也同样高出不少。加上这一代架构的效能提升,稳赢RTX 2070 50%以上的性能应该问题不大。

RTX 3080的售价几乎只有RTX 2080 Ti的一半,性价比已经让玩家感到十足的惊喜。而RTX 3070的定位更低,售价自然也就再次下探到3899元(FE公版)的价位上。如果它真能战平RTX 2080 Ti,那么以不到4000元的售价买到上代万元旗舰的性能(甚至诸多非公版已经超过了一万元),对于玩家来说可以说是真香了,要知道3899元这个售价,不但远低于RTX 2080 Ti,甚至比RTX 2070的首發售价都低了900元(事实上后期众多RTX 2060S都卖到这个价位),可以说是相当惊喜了。

另外,除了硬件规格方面本身的提升之外,NVIDIA Reflex低延迟技术、BROADCAST直播串流辅助、新一代AV1编解码、新一代HDMI2.1接口等RTX 30系列带来的全新特性,RTX 3070均有搭载和支持。下面就让我们一起来看看RTX 3070显卡的实际测试,是否能真的如NVIDIA所说那样,综合性能战平RTX 2080 Ti。

猜你喜欢

制程规格售价
团结起来力量大
台积电又推先进制程增强版本N7P和N5P
Nokia7:重新开始
特斯拉公布Model X国内售价
两种内存规格Intel 100系列支持DDR3L/DDR4
彻底撑握8大关键词 看懂规格买液晶
刺柏