4K新旗舰有多香?
2021-11-01金角
金角
虽然时隔一年多,相信游戏发烧友对上一代GeForce RTX 2080 Ti还不陌生,作为一款一经推出就“默秒全”(默认秒杀全部游戏)的发烧级GPU,在RTX 30系列推出前,它一直是当仁不让的游戏王者。甚至再早些的GTX 1080 Ti和GTX 980 T,i 同样“出道即巅峰”。80 Ti也一直是让玩家津津乐道的终极升级梦想。然而币圈的云波诡谲,让GeForce RTX 3080 Ti在2021年出现的稍晚了一些,毕竟在RTX 3090完成秀肌肉后,RTX 3080 Ti承载了顶级游戏GPU“价格落地”的重要任务,因此我们也能够理解这次放大招的蓄力时间。而RTX 3080 Ti凭借Ampere架构的诸多技术革新,在游戏体验之外,还提供了更高的创意应用性能。特别是RTX 3080 Ti 为创作应用带来12GB GDDR6X显存,在NVIDIAStudio平台的支持下,为创作者带来更快的渲染速度和更强的AI性能,帮助他们在更短的时间内完成创作工作。
NVIDIA Ampere架构的性能提升
经过近一年的检验,NVIDIA Ampere架构可以说已经完成了NVIDIA目前最大的一次性能飞跃。作为NVIDIA GPU的计算核心,SM模块的设计的变化也是此次GA102核心Ampere架构最大的亮点。与上一代Turing架构GPU相比,全新的NVIDIA Ampere SM架构的FP32性能提升了一倍。NVIDIA Ampere架构GPU每个SM有四个处理分区,以及一个用于FP32和INT32操作的新数据路径设计,所有四个SM分区组合在一起,每个时钟可执行128 FP32操作(等效128个CUDA核心,可以粗略看作上一代Turing核心CUDA的两倍)。这为FP32算数指令提供了强大支持,并且FP32加速非常有助于光线追踪降噪着色器运算,简单来说新架构在光线追踪渲染工作中承担的负载越重,RTX 30系列GPU对比上一代产品的性能提升也就越大。
在上一代Turing架构中,NVIDIA首次引入实时光线追踪,为游戏带来了逼真的光照和图像质量,玩家首次感受到了光线和阴影等特效对游戏画质沉浸感的巨大改变。Ampere架构的第二代RT Core的性能提升一倍,带来2倍于Turing第一代RT Core的吞吐量,同时支持光线追踪和着色,使光线追踪性能达到全新高度。并且第二代RT Core还引入了动态模糊等重要特性。而面向图形的Ampere架构也加入了第三代张量计算核心,专门为稀疏矩阵优化。RTX 3080 Ti所配置的Tensor Core可加速用于深度神經网络处理功能的线性代数,这是现代AI的基础。全新第三代Tensor Core加速AI功能,例如用于AI超分辨率的NVIDIA DLSS和用于AI增强的声画处理技术NVIDIA Broadcast应用。在DLSS的支持下,不仅游戏帧率可以得到大幅度提升,而且画面细节并没有损耗,在某些场景下画面清晰度甚至更高,这也让我们看到了未来GPU在AI能力上继续探索的可能。而如今NVIDIA DLSS升级到了2.1版本,甚至在RTX 3090上8K游戏支持9倍画面缩放。
另外在Ampere架构中,NVIDIA将光线追踪专用内核和着色器并行运行,三个独立处理器同时运行,整体处理速度也得到了加快。值得一提的是,随着Windows 10今年5月大版本更新,我们还迎来了NVIDIA的硬件加速GPU计划,NVIDIA允许GPU自行管理显存,来提升性能和减少延迟。我们只需在Windows 10中开启游戏模式,并且在GPU设置中打开硬件加速功能,就能体验这一新功能。
另外GTX 30系列支持HDMI 2.1总带宽从18Gigabits/s提高到48Gigabits/s,并增加对高动态范围的支持,支持更高对比度的明亮图像和更鲜艳的色彩,以及更好的阴影和高光。而AV1解码与现有的H.264、HEVC和VP9等编解码器相比,它能提供更好的压缩和质量,比H. 264节省50%~55%的容量;在DirectStorage加持下,下一代游戏将能够在降低CPU负载的同时,而充分利用RTX IO硬件,缩短加载时间,打造更宽阔的开放世界。而NVIDIA Reflex低延迟电竞技术的加入,能够让CPU把外设采样数据尽快交给GPU渲染,通过提升GPU的运行频率和动态的降低渲染队列,从而最大化提高系统的响应速度,进一步提升玩家操作的准确度。为了帮助玩家直观地查看系统延迟的具体情况,NVIDIA还将系统延迟根据鼠标输入信息到显示器过程拆分为鼠标输入延迟以及PC+显示器延迟两个部分。同时,玩家们可以通过最新版的GeForceExperience开启实验性功能,进而在性能覆盖显示的功能界面中获取游戏延迟和帧率等性能指标,查看当前PC的状态。
GTX 30系列还支持非常有时代意义的NVIDIABroadcast技术,玩家可以通过AI驱动的声画处理技术在自己家中借助RTX 30系显卡和Broadcast完成直播。通过AI驱动的噪音消除、虚拟背景和自动取景等,将直播和视频聊天提升到一个新水平。通过在GeForce RTX显卡上加速AI驱动的Tensor Core,AI网络能够保证高质量直播的实时运行。
次旗舰级的硬件设计
从参数对比来看,RTX 3080 Ti仅比RTX 3090少了2组SM,这也是让玩家能够喊出让RTX 3080Ti真香的原因所在。RTX 3080 Ti拥有仅次于RTX3090的核心配置,也就是80组SM模块。但在显存容量上,RTX 3080 Ti则仅为RTX 3090显存容量的一半。尽管如此,12GB GDDR6X显存的配置依然是目前游戏市场的次顶级存在,在非8K游戏的应用场景下,12GB的配置应对当下的顶级3A游戏绰绰有余。除显存容量存在明显差异,可以说RTX 3080 Ti各项配置都是向老大哥RTX3090看齐的,整卡功耗也控制在了350W,因此理论上来说RTX 3080 Ti和RTX 3090的游戏性能并不会拉开太大差距。
从外观来看,NVIDIA GeForce RTX 3080 TiFounders Edition(以下简称RTX 3080 Ti FE),与之前我们见过的RTX 3080 FE没有任何差异,显卡背面有大大的RTX 3080 Ti的型号标识,并且同样采用双槽双轴流推挽式散热设计—将上一代原本右侧的散热风扇移到了背面,这样一来正面的散热风扇将冷空气吸入GPU内部,热空气则通过GPU背面吹出,形成下进上出的风道结构,可以利用机箱现有双风道设计,将热量通过机箱顶部的风道扇或水冷风扇顺利排出。RTX 30系列另一独特设计则来自它的开放式散热鳍片,散热鳍片直接裸露在外可以将热量直接排出,不仅大大提升散热效率,而且规则的黑色鳍片在视觉上也有着非常硬核的工业设计风。电源接口部分RTX 3080 Ti FE同样采用和RTX相同的双8Pin转12Pin接口设计,并且随卡附送了标准的电源转接头。输出接口还是RTX 30系列一贯的3×DP1.4a+1×HDMI 2.1视频输出接口。
在供电设计上,由于RTX 30系列独特的风扇散热,RTX 3080 Ti FE同样采用了与该系列同出一门的异形PCB设计,空间利用率可圈可点。在PCB布局上,RTX 3080 Ti FE和之前的RTX 3090供电方案几乎一致,只不过减少了两相供电电路设计。显存部分同样是12颗GDDR6X闪存颗粒排列,只不过单颗容量减少为1GB。
理论性能测试:无限逼近RTX 3090
理論测试我们选择了3DMark测试软件。分别测试了FireStrike、FireStrikeExtreme、FireStrikeUltra、TimeSpy、TimeSpyExtreme以及PortRoyal以及NVIDIA DLSS七项成绩。成绩则与之前的RTX 3090 FE进行直观对比。既然两款GPU的规格非常接近,理论上二者的性能测试成绩也应该非常接近。从3DMark的几项测试来看,RTX 3080 Ti FE与RTX 3090FE的总体性能差距在4%~5%,而且凭借优秀的功耗,RTX 3080 Ti FE实现超频性能反超也未可知。而与之前评测的另一款RTX 30系列的新GPU RTX 3070 Ti FE相比,RTX 3080 TiFE的测试分数更是全面领先了1/3。
游戏性能测试:DLSS催生4K光追旗舰
针对RTX 30系列的特性升级,RTX 3080 Ti FE这样准旗舰级GPU的光追+DLSS的战力如何是我们最关心的话题。但是为了取得更全面的对比成绩,我们还是将非光追游戏和光追游戏一起进行了测试,毕竟脱离了光追和DLSS的加持,RTX 3080 Ti FE依然是不可多得的高玩利器。在非光线追踪游戏中,我们测试了《荒野大镖客2》《刺客信条:奥德赛》以及《杀手3》在2K和4K最高画质下的表现,。而在光线追踪游戏中,我们分别测试了《古墓丽影:暗影》《赛博朋克2077》《地铁:离去》三款游戏,2K和4K测试均在最高画质下进行,光线追踪为超级光线追踪模式,DLSS开启自动。从几款游戏的成绩来看,RTX3080 Ti FE在2K和4K环境下开启光追+DLSS均可以实现流畅运行,相较之前的RTX 3070 TiFE,这款GPU的性能优势同样十分明显。虽然由于测试游戏库更新,缺少RTX 3090部分游戏的测试数据,但从《刺客信条:奥德赛》和《古墓丽影:暗影》等几款经典游戏成绩来看,二者差距也微乎其微。当然主要原因要归结为即便在4K超级光追环境下,现有游戏依然很难超出12GB显存容量的需求。但作为一款当下高性价比的4K光追旗舰GPU,谁又能说这款RTX 3080 Ti FE它用着不香呢?
创作性能测试:优秀的渲染性能
RTX 30系列针对内容创意设计效率提供了最新的NVIDIA STUDIO解决方案,这也意味着在更多支持光追的3D专业渲染应用中,RTX 30系列相较上一代有着巨大的效率提升。尤其在不需要占用过多显存的常规3D渲染应用中,RTX3080 Ti FE凭借巨大的光追性能提升,有着无可比拟的性能优势。因此我们也对常规的3D渲染应用进行了简单测试。从V-Ray和Indigo Bench渲染测试中,可以看到RTX 3080 Ti FE在专业内容创意设计中拥有的巨大潜力。特别是和之前发售的RX 6900XT相比,RTX 3080 Ti FE的3D渲染性能优势非常明显。
结语:
通过以上一系列的测试,我们额能够清晰地看到RTX 3080 Ti的市场定位。尤其是对于受到ETH挖矿影响严重的高端GPU市场,NVIDIA GeForce RTX 3080 Ti这样锁哈希算力的顶级GPU其实是非常稀缺的,因此它的出现可以一举让现有高端市场出现的巨大空缺,得到很好的填补。RTX 3080 Ti与RTX 3090性能微乎其微的差距,也让它成为玩家和专业创作用户们选择高端GPU时,一个不容错过的好选择。尽管从目前4K游戏性能的表现来看,RTX 3080 Ti似乎有着和RTX 3090一同登顶的趋势,但其实从Studio专业创作的角度,又或者追求8K游戏性能的角度,RTX 3090依然是未来一段时间无可代替的顶级GPU。总而言之,作为新一代“80 Ti接班人”,RTX 3080 Ti有着极致的游戏体验和专业级的Studio性能。8999的FE版售价也让RTX 3080 Ti可以成为理论上承前启后的新一代旗舰GPU销量王者。不过想要等到GPU价格落地,也同样非常考验玩家们的耐心。借这次评测的机会,我们也衷心期望在年底前GPU全面缺货的情况,多少能有所缓解吧。