APP下载

2K性能超3090 TiNVIDIA RTX 4070 Ti首发测评

2023-01-17戴寅

电脑报 2023年2期
关键词:豪华版战斧大作

戴寅

AdaLovelace架构AD104核心登场再现能耗比优势

在之前的测试中我们已经对NVIDIAAdaLovelace架构进行过全面的解析,这里简单概括一下重要的技术亮点。

●NVIDIAAdaLovelace架构中全新设计的流式多处理器具有最高83TFLOPS的着色能力,吞吐量超过上代产品2倍。

●第三代RTCores有效光线追踪计算能力达到191TFLOPS,是上代產品的2.8倍。

●第四代TensorCores新增FP8引擎,具有高达1.32PFlops的张量处理性能,超过上代5倍。

●支持着色器执行重排序(SER),通过即时重新安排着色器负载来提高执行效率。SER可为光线追踪带来最高3倍的性能提升,整体游戏性能可最高提升25%。

●新增Ada光流加速器带来2倍的性能提升,使DLSS3能够预测场景中帧和帧之间的运动变化,让神经网络能够在保持图像质量的同时提高帧率。

●架构进行大幅改进,采用TSMC4NNVIDIA定制工艺,此工艺专为GPU优化,实现高达2倍的能效飞跃。

●12GB显存及以上型号提供双NVIDIA编码器(NVENC),可最多缩短一半的视频导出时间,并提供了对AV1的硬件编码支持。

RTX4070Ti规格解析:功耗与性能的平衡点

作为RTX40系列第三位登场的成员,从核心图上可以看到,RTX4070Ti换上了规模更小一点的AD104核心。晶体管数量从AD103的459亿个减少到了358亿个,相较于完整的AD103,AD104精简了一组完整的GPC和一组“不完整”的GPC,因此总共具备5组GPC。

RTX4070Ti拥有30组TPC,比RTX4080少了8组,CUDA核心从4080的9728个缩减到了7680个,综合来看它拥有了RTX4080近8成的核心规模,理论性能定位其实也比较清晰了。此外,RTX4070Ti拥有80个光栅单元,虽说比RTX3070Ti少16个,但它还具备60个第三代光追单元和240个第四代张量单元,比RTX3070Ti多出不少。

RTX4070Ti同样也采用TSMC4NNVIDIA定制工艺,GPU加速频率可以达到2610MHz(公版),游戏加速频率则更高。显存部分用上了12GBGDDR6X,比RTX3070Ti要多4GB。显存位宽为192bit,虽说低于RTX3070Ti的256bit,但它的二级缓存有48MB,是RTX3070Ti的12倍,同时显存频率也要高一些,所以综合计算下来的显存实际工作效率反而更高。

功率部分,RTX4070Ti的整卡功率为285W,比RTX3070Ti低了5W。官方表示,RTX4070Ti的平均游戏功率其实只有225W左右。官方测试成绩表明,得益于NVIDIAAdaLovelace架构创新和NVIDIADLSS3,RTX4070Ti在1440P分辨率的Cyberpunk2077withOverdrivemode等游戏中,比RTX3090Ti最高可以快3倍,而功耗只有RTX3090Ti的一半,可见RTX40这一代的能效比非常高。

绝地战斧出击,七彩虹RTX4070Ti战斧豪华版解析

RTX4070Ti没有FE公版,所以本次首发测评使用的是七彩虹战斧GeForceRTX4070Ti豪华版。该显卡整体非常方正硬朗,全新的造型结构搭配撞色设计,诠释出十足的硬派风。散热装甲上红色的钻石三角元素进一步增强了整体设计中的力量感,显得低调而又精致。

七彩虹RTX4070Ti战斧豪华版搭载了全新设计的利斧散热器,内置了6条6mm回流焊工艺热管,使得热管与鳍片间紧密贴合,从而能够优化散热效能,实现更好的散热效果。它还配备了3个98mm的大直径散热风扇,有效提升进风量和风压,能够在高负载场景更好地驱散热量。此外,散热器也沿用了镂空背板的设计,更利于通风,更好地排出废热。

七彩虹RTX4070Ti战斧豪华版配备了12pin+4pin辅助电源接口,包装盒也附送了一条转接线。接口部分,七彩虹RTX4070Ti战斧豪华版提供了3个DP1.4接口和1个HDMI2.1接口,可以支持8K/60HzHDR10输出。

规格方面,七彩虹RTX4070Ti战斧豪华版的基础频率为2310MHz,Boost频率为2715MHz,游戏实际频率会更高。显存规格和公版规格保持一致。

光追大作高帧率畅玩DLSS3游戏帧率亮眼

测试平台

显卡:七彩虹战斧GeForceRTX4070Ti豪华版

处理器:酷睿i913900K

内存:金士顿DDR5600016GB×2

主板:华硕ROGMAXIMUSZ790HERO

硬盘:WD_BLACKSN8502TB

电源:华硕ROG雷神Ⅱ1200W

操作系统:Windows11专业版22H2

基准性能测试

首先看看3DMark的GPU得分。在DX11的FireStrikeExtreme项目中,RTX4070Ti得分相比RTX3070Ti高出了9000多分,约55%,提升幅度相当可观。相对RTX4080则有20%左右的差距。DX12的TimeSpy项目中,RTX4070Ti轻松实现23000+的得分,大约是RTX3070Ti的1.54倍,表现比较抢眼。相比RTX4080,则也是有大约18%的差距。在4K分辨率的TimeSpyExtreme中,RTX4070Ti同样比RTX3070Ti提升50%左右,和RTX4080的差距也依旧是20%,老黄的刀法依旧是比较精准的。

DX12UltimateAPI的专项测试SpeedWay中,RTX4070Ti相对RTX3070Ti的提升为45%,相比RTX4080则差了24%。

光追性能方面,PortRoyal测试中,RTX4070Ti比RTX3070Ti提升了59%。纯光追场景的DXR测试就要明显一些,帧数直接翻倍了。可以看到,光追特效越多,RTX4070Ti领先RTX3070Ti的幅度越大,甚至相对RTX3070Ti做到了翻倍,当然RTX3070Ti显存仅有8GB在这里确实也造成了一定的瓶颈效应。

DLSS3的测试demo中,默认为4K/性能模式,RTX4070Ti在开启DLSS3后帧率达到原生4K的4.5倍,相比RTX3070Ti开DLSS2的帧速则是2.5倍左右,可见RTX40特有的“光学多帧生成”功能对帧率的提升效果多么大。在这里也可以看到,RTX3070Ti不开DLSS时只有5帧,应该是8GB显存不够用了,所以RTX4070Ti升级到12GB确实是很有必要的。

综合基准测试得分来看,RTX4070Ti的性能差不多是RTX4080的80%,相比上代同档次的RTX3070Ti的提升则达到了50%左右。光看跑分成绩的话,RTX4070Ti和RTX3090Ti是在差不多的水平上,和RTX3070Ti的代际提升还是比较明显,由此可见,如果玩家买了RTX4070Ti,那么一定要在游戏中开启DLSS3从而获得成倍的性能提升。

光栅游戏性能测试

首先看看2K下的表现。RTX4070Ti在該分辨率下相对于RTX3070Ti的提升在27%~59%之间,综合12款游戏大作的测试成绩,RTX4070Ti平均领先RTX3070Ti大约44%,相当于RTX4080约83%的水平。当我们把分辨率提升到4K之后,RTX4070Ti相对于RTX3070Ti的提升在29%~68%之间,平均则为大约42%,相当于RTX4080约79%的水平,这个表现也是达到了预期的目标。

在部分优化比较好、显存利用率相对较高的游戏中,RTX4070Ti的提升幅度尤其大,例如2K下的《COD19》相对RTX3070Ti提升幅度高达59%,4K下的《毁灭战士:永恒》相对RTX3070Ti的提升幅度更是高达68%。

综合来看,RTX4070Ti在不开启光追的极限画质设置情况下,可以轻松驾驭现有主流游戏大作,2K下保持120fps以上帧率轻而易举,4K下大部分游戏可以达到70fps以上、半数游戏可以过百帧、所有游戏都能达到60fps以上。整体的提升还是显而易见的。

光追游戏性能测试

接下来看看光追游戏和DLSS2测试的情况。先来看看《古墓丽影:暗影》。之前在4K下不开光追,RTX4070Ti比RTX3070Ti的提升有49%,开启光追后,提升进一步加大到了62%,开启DLSS2后,更是有高达78%的提升。即使是在2K下,这个差距也拉大到了59%。考虑到RTX4070Ti的光追单元和张量单元数量都要多于RTX3070Ti,这应该也是一个合理的表现。

《杀手3》中,RTX4070Ti相对于RTX3070Ti的优势也比较大,各分辨率下保持了56%~68%的提升。《地铁:离去》增强版4K分辨率下,RTX3070Ti不开DLSS只有26fps,即使开启DLSS2质量模式也只有40fps,RTX4070Ti在4K下领先了62%,但也没到60fps,不过开启DLSS后就可以跑到65fps。

《看门狗:军团》的硬件要求比较高,因此也是同样的情况,RTX3070Ti在开启DLSS的情况下也只有42fps,如果不开则只有25fps,8GB显存已经捉襟见肘了。RTX4070Ti同样也需要开启DLSS才能满足4K下达到60fps的需求,不过相对RTX3070Ti来说,优势达到了50%。

《控制》中,4K开启DLSS下,RTX4070Ti相比RTX3070Ti的提升为40%左右,不开启DLSS,RTX4070Ti相对于RTX3070Ti的优势就要稍微小一些,4K原生下领先35%。《孤岛惊魂6》中的表现和《控制》比较接近,4K下RTX4070Ti相对于RTX3070Ti的提升大约为41%。赛车游戏《F12022》中,4K开启DLSS时RTX4070Ti相对于RTX3070Ti的提升在45%以上。

《我的世界》开启RTX后就成了硬件杀手,光追地图默认会开DLSS。如果关闭DLSS,RTX3070Ti就只有25fps了,RTX4070Ti也不过40fps。开启DLSS情况下,RTX4070Ti可以跑到104fps,相对于RTX3070Ti提升为44%。

最后再来看看一向优化良好的《毁灭战士:永恒》,在这里RTX4070Ti相对于RTX4080有着20%的差距,这个没有什么意外。但和RTX3070Ti的对比又有新的情况了。2K下,RTX4070Ti相对于RTX3070Ti有着75%的帧数提升,幅度比较巨大。而RTX3070Ti因为只有8GB显存,已经无法满足在最高画质下开启光追时的显存需求,甚至开启DLSS也不行。看来8GB显存对于4K下的次世代3A大作来说,确实有些捉襟见肘了。

总体来看,平均这些游戏的表现,在开启光追后,RTX4070Ti在2K下相对于RTX3070Ti提升为51%,相对于RTX4080落后20%。4K下相对于RTX3070Ti的提升为52%,落后RTX4080为21%。开启DLSS后,RTX4070Ti相对于RTX3070Ti的提升为52%,和RTX4080的差距则为22%。

如果我们再综合之前的测试成绩和RTX3090Ti做一个对比,那么RTX4070Ti的游戏性能和RTX3090Ti是差不太多的。在2K分辨率下RTX4070Ti完全可以媲美RTX3090Ti,4K下稍稍弱一点,但也在可接受的范围内。整体来看,在光栅游戏和光追游戏以及开启DLSS2时,差距都非常小。而RTX40系列的一大卖点就是DLSS3,那凭借DLSS3,RTX4070Ti是不是就能完勝RTX3090Ti呢,这次我们也选取了其中几款进行了测试。

DLSS3测试

DLSS3可以说是RTX40系列的核心功能了,开启之后能让游戏帧率得到极大的提升。从测试来看,《赛博朋克2077》在2K超级光追预设下,RTX4070Ti开启DLSS3性能模式后,帧率从48fps暴增至129fps,达到了RTX3090Ti开DLSS2性能模式的1.6倍。

《生死轮回》中RTX4070Ti开启DLSS3后可以提升近100fps,RTX3090Ti开DLSS2的话只有124fps,RTX4070Ti在这里的帧速是后者的1.4倍。

《瘟疫传说:安魂曲》原生2K最高画质下RTX4070Ti能跑到接近100fps,开DLSS3后暴增至195fps,超过原生的2倍。对比RTX3090Ti开DLSS2的性能则是1.37倍。

《光明记忆:无限》开启DLSS3后,RTX4070Ti能跑到相当于原生2K大约2倍的帧率,大概是RTX3090Ti开DLSS2的1.34倍。

《F12022》中,RTX4070Ti原生画质可以跑到接近120fps,开启DLSS3后帧数接近翻倍,和RTX3090Ti开启DLSS2相比则是1.23倍。

在RTX40首发时,老黄就已经宣布将用新推出的RTXRemixMOD平台翻新经典老游戏《传送门》,给其加入光线追踪。《传送门》RTX版是一款全景光追渲染光线的游戏,所以对硬件的要求也是很高的。

如果使用原生渲染,即使只有2K分辨率,RTX4070Ti和RTX3090Ti都只有不到30帧,如果RTX4070Ti开启DLSS3,那么帧数可以达到90帧,而RTX3090Ti开DLSS2则只有48帧左右。

从几款DLSS3游戏测试可以看到,RTX4070Ti开启支持“光学多帧生成”技术的DLSS3之后,游戏帧率的提升非常夸张,虽然没有实现翻倍,也能让2K光追游戏大作实现100fps以上的流畅帧率,像《赛博朋克2077》《微软飞行模拟》这样要求较高的大作更是从几十帧的普通流畅度直接提升到上百帧的高流畅度,可玩性上了几个台阶。

延迟方面,虽然补帧可能会带来一定的延迟,但在DLSS3提供的高帧率+Reflex技术的支持下,延迟方面可以得到很好的解决。从实测来看,在开启DLSS3后,游戏实际延迟都是低于原生画质下的延迟,操作方面玩家们也完全不用担心延迟问题。

生产力性能测试

接下来看看生产力方面的表现。BlenderBenchmark3.3中,RTX4070Ti相对RTX3070Ti提升比较明显,其中monster和classroom的性能接近RTX3070Ti的1.9倍和1.8倍,junkshop也有40%的提升。

RTX4070Ti在V-Ray中的表现也比较不错,无论是使用RTX还是CUDA相对于RTX3070Ti都能实现50%以上的渲染效率提升。而OC渲染器中的性能提升则是57%以上。由于RTX4070Ti有12GB内存,所以其在3D渲染中的生产力性能自然比8GB的RTX3070Ti更好。

达芬奇中做MagicMask魔法遮罩时RTX4070Ti的效率提升也非常明显,RTX3070Ti需要近43秒完成的工作RTX4070Ti只要27秒就可以搞定。

AV1编码方面,我们依旧选用达芬奇转码输出一段Prores422HQ的视频,RTX4070Ti和大哥RTX4080区别不大,而具备双编码器的它相对RTX3070Ti来说在H265的转码测试中却真的有成倍的效率提升。

总的来说,如果不考虑显存容量,其实RTX4070Ti的单卡生产力性能是超越RTX3080Ti且可以比肩RTX3090Ti的。再考虑到CUDA与NVIDIASTUDIO生态圈在业界无可匹敌的地位,RTX4070Ti也非常值得设计师用户选择。

功率与温度测试

功耗方面,由于采用了新的TSMC4NNVIDIA定制工艺,使得RTX40系列GPU有着更好的能耗比,在实现相同甚至更高的性能时,功耗更低。这使得RTX40系列出现了一个有趣的现象,那就是游戏功耗基本上都跑不到标称的TGP功耗。其实这是因为TGP功耗是GPU运行在Boost状态下的上限限制,简单来说就是功耗墙上限,并不是指GPU满载时必须达到的功耗。

RTX40系列GPU跑到TGP功耗上限前,频率或电压可能就已经达到了上限,所以它无需更高的功耗才能满足性能释放需求。而在上一代Ampere架构的GPU上,通常就需要跑到极限功耗才能完成最高性能释放。从而造成了RTX40系列GPU总是跑不满功耗的错觉,实际上这是因为能耗比提升,无需更高功耗。

我们使用NVIDIAFramView工具监测了一下RTX4070Ti在一些游戏2K分辨率下的功耗表现,可以看到在这些游戏中的平均功耗都没有达到285W的TGP功耗。如果我们简单计算一下,以《荒野大镖客:救赎2》为例,在该游戏中RTX4070Ti的帧速和RTX3090Ti表现差不多,但功耗只有后者的50%左右。这样可以计算出在该游戏中RTX4070Ti的能耗比达到了RTX3090Ti的2倍以上,可以说是表现非常出色了。如果在支持DLSS3的游戏中,那能耗比表现将会更加夸张。

温度方面其实完全没有什么可担心的,毕竟RTX4070Ti的TGP功耗也只有285W,而游戏实际功耗就更低了。在七彩虹RTX4070Ti战斧豪华版这套散热器的加持下,我们可以看到考机温度最高仅为62℃,热点温度也才72℃左右,玩家完全不用担心温度问题。新的TSMC4NNVIDIA定制工艺带来的能效比提升确实是相当可观的。

总结|次世代中端悍将直指上代旗舰,高能耗比表现亮眼

使用NVIDIAAdaLovelace架构的RTX40系列GPU有着近乎革命性的进步,TSMC4NNVIDIA定制工艺的加入,为其带来了极高的能耗比。DLSS3技术带来了开创性的光学多帧生成技术,在大幅增加游戏帧率的同时还降低了延迟,为未来AI计算与GPU发展探索了新的道路。

RTX4070Ti作为RTX40系列第三位登场的成员,从实测来看可以让大部分3A大作在2K分辨率最高画质下以超过120fps的高帧率运行,即使在4K分辨率也能获得60fps以上的流畅体验,如果开启DLSS,那么帧率将再次拔高,带来更好的游戏体验。特别是在支持DLSS3的游戏中帧率更是能获得成倍的提升,甚至可以轻松超越上代旗舰RTX3090Ti。

由于DLSS3技术有着非常不错的兼容性,同时也能方便地集成到游戏中,所以在短短几个月中,已经有数十款游戏支持或即将支持DLSS3,随着RTX40系列新GPU的不断发布,玩家们也将看到DLSS3应用在更多的游戏中。此外,從测试中可以看到,8GB显存在应对4K分辨率高画质3A大作时,已经捉襟见肘,RTX4070Ti所配备的12GB显存则能带来更好的高分辨率游戏体验。

生产力方面,RTX4070Ti在3D渲染输出与视频剪辑方面即使面对RTX3090Ti也毫不示弱。由于12GB及以上显存的RTX40系列GPU都配备了双编码器,所以其在视频编码性能方面甚至做到了翻倍,新加入的AV1编解码功能,对于次世代视频制作、直播和流媒体观看等也有着非常重要的意义。

在性能大幅提升的同时,RTX4070Ti同样为我们带来了能耗比上惊喜的表现,虽然TGP功耗为285W,和上代RTX3070Ti差不多,但其实际游戏中的功耗多在225W左右,表现让人惊喜。由于在游戏实测中,RTX4070Ti的整体表现和RTX3090Ti非常接近,但RTX3090Ti几乎都是顶着TGP功耗上限在跑,所以即使不算上DLSS3的帧数提升,RTX4070Ti真的可以算得上相对RTX3090Ti翻倍的能耗比提升了。

我们再看看玩家们非常关心的价格。从测试中可以看到,RTX4070Ti的性能大约是RTX4080的80%,而其上市建议零售价则为6499元起,相比RTX4080便宜了3000元,大约是RTX4080建议零售价的68%,这样来看的话,对于中端玩家来说,它的价格更好接受,性价比表现也更高。如果再简单一点来说,现在只需要6000多块钱,就能获得和上代旗舰RTX3090Ti接近的游戏性能,在DLSS3加持下还有更多增幅。

另外,对于想要体验次世代3A光追大作的玩家来说,GeForceRTX4070Ti也是一个非常不错的升级好选择,特别适合之前拥有GTX1080Ti或RTX2080的玩家。根据官方提供的测试数据,在DLSS3技术的加持下,RTX4070Ti相比一代经典GTX1080Ti,最高可以带来12倍性能提升,堪称夸张了。

因此,对于追求高帧率游戏体验的玩家和追求高效率的设计师用户来讲,RTX4070Ti可以算得上是中端价位上一个非常不错的选择。

猜你喜欢

豪华版战斧大作
风雨大作
战斧牛排
ASCENDO 9.5.6高级定制私人影院 黑天鹅,战斧系列
超市大作战
战斧乐队全新单曲《最初的自己》真挚上线
凯美瑞双擎 2018款2.5HG豪华版
A6 CVT豪华版
美海军新型潜艇发射管发射首枚“战斧”巡航导弹
逍客2016款 2.0L豪华版
传祺GS4200T手自一体豪华版