APP下载

《我的世界》Windows 10正式版光追体验及性能测试

2021-03-12张祖强

微型计算机 2021年3期
关键词:张量光线分辨率

张祖强

更多地图,画面仍然惊艳

《我的世界》提供全局照明、反射、阴影、大气特效、透明體反射、折射和散射等多种光线追踪效果。例如,光线追踪全局照明可以准确地为场景中不同表面的一次或多次间接反射所造成的动态间接散射光线建模,并使其与其他光线追踪效果相互作用;路径追踪在每个世界中都添加了光线追踪反射效果,能反射每个细节、每个群体和N P C以及其他每种视觉效果,从而在像素级别实现反射效果。目前,《我的世界》中一共拥有多达15款地图供玩家体验光线追踪,下面我们不妨在这些地图中看看光线追踪的加持下,《我的世界》究竟能给我们带来怎样的视觉享受。

划重点:你得有一张支持光线追踪的显卡

想要在《我的世界》中体验光线追踪的魅力,玩家需要一张支持该技术的显卡才行。目前N V I D I AGeForce RTX显卡和AMD Radeon RX6000系列显卡均支持光线追踪,下面我们不妨首先回顾一下上述显卡在光线追踪方面的技术亮点。

NVIDIA GeForce RTX显卡相关技术解析

在NVIDIA GeForce RTX 20系列显卡的图灵架构上,N V I DI A引入光线追踪核心(下简称为“R T核心”)。R T核心的主要作用是针对光线追踪计算中最耗费时间的加速边界体积层次(B V H)遍历和光线/三角形(基元)交叉测试(光线投射)过程进行加速,将整个光线追踪计算的时间降低至可接受的范围内。而在NVIDIA GeForce RTX 30系列显卡的Ampere架构上,NVIDIA将其RT核心升级至第二代。相比第一代RT核心,NVIDIA GeForce RTX 30系列显卡的第二代RT核心在光线和三角形相交测试速率和整体G P U光线追踪速率上均实现性能翻倍。

除了上述性能提升外,NVIDIA在Ampere架构的第二代RT核心中还带来比较重要的技术创新,那就是光线追踪动态模糊加速。动态模糊是一种非常流行且重要的计算机图形效果,可用于电影、游戏和许多不同类型的专业渲染应用程序中。动态模糊的本质和胶片摄影相关,因为胶片摄影时,图像不是立即创建的,而是通过将胶片在有限的时间段内曝光来创建的。这意味着目标物体在胶片快门时间内的高速移动将带来模糊的曝光效果。对GPU来说,要创建类似效果,必须模拟相机和胶片工作流程。动态模糊对于电影是非常重要的,它能够避免画面出现断续卡顿的效果,对游戏来说亦是如此。

为了完成动态模糊下的光线追踪计算,N V I DI A加入有关位置和时间函数的计算,同时硬件部分还需要新加入有关时间位置计算的单元,最终在Ampere架构的第二代RT核心中,NVIDIA实现了BVH、边界框计算、位置(时间)计算、三角形相交、命中返回五个单元的协同工作,相比之前图灵架构的第一代R T核心,新增内插三角形位置单元,进一步提升了执行效率。

除了率先将支持硬件实时光线追踪渲染的RT核心加入到GPU中,NVIDIA在GPU上的另一个创举就是引入张量核心(TensorCore)。在之前的Volta架构中,张量核心的引入为AI计算带来了极高的效率,这是NVIDIA的第一代张量核心。图灵架构中,NVIDIA又对张量核心进行微调,可以看作是第二代张量核心。目前在Ampere架构中启用的是第三代张量核心。简单来说,第三代张量核心主要特点是支持了更多的数据格式,大幅度加强了在稀疏矩阵计算时的效能,比如在原始矩阵具有稀疏性时,第三代张量核心的速度可达到第一代伏特架构的20倍等。另外,新的第三代张量核心还加入了对BF16等数据格式的支持。

在实际游戏中,张量核心提供的就是玩家熟悉的NVIDIADLSS功能,而第三代张量核心所提供的就是NVIDIADLSS2.1版本。这项实时渲染技术通过基于AI的超高分辨率来提升性能,这一过程包括渲染更少的像素,然后使用AI构建清晰、更高分辨率的图像,从而以快得多的帧率运行。具体到《我的世界》这款游戏里,NVIDIADLSS2.1提供了质量、平衡、性能和超性能这4种模式—在1080p下默认为质量模式,2.5K分辨率下默认为平衡模式,4K分辨率下默认为性能模式,8K分辨率下默认为超性能模式。

AMDRadeonRX6000系列显卡相关技术解析

支持DirectX12Ultimate让AMDRadeonRX6000系列显卡实现对硬件光线追踪渲染的支持。在AMDRadeonRX6000系列显卡使用的RDNA2架构上,AMD引入硬件光线追踪单元(下文简称:RA单元)。AMD目前的消息只是提到为每个CU单元配备1个RA单元,性能方面只是宣称RA单元的光线追踪交叉性能是传统软件执行的10倍,更具体的数据显示AMDRadeonRX6000系列显卡的RDNA2架构GPU在微软DXRSDK的ProceduralGeometry的测试中带来了471fps的成绩,在软件模拟下只有34fps,因此前者的性能达到软件的13.8倍。

实际上ProceduralGeometry只是整个DXRSDK中的一部分,用于测试地面以上所有对象在光线追踪上的性能,其图元信息包括解析几何、体积几何和带符号的距离几何等多重内容。因此,AMD在此处给出的性能只是光线追踪计算的一部分内容,更多的信息还有赖于更多的测试和实际游戏内容。那么在开启光线追踪之后,AMDRadeonRX6000系列显卡运行《我的世界》的表现如何,其性能表现是否能够比肩NVIDIAGeForceRTX30系列显卡呢,我们不妨通过实测结果来寻找答案。

《我的世界》光线追踪性能测试

我们本次测试的主要目的,是想看看NVIDIAGeForceRTX30系列显卡和AMDRadeonRX6000系列显卡运行《我的世界》的性能表现。为此我们特别请到NVIDIAGeForceRTX3090FE和其竞品AMDRadeonRX6900XT,以及NVIDIAGeForceRTX3070FE和其竞品AMDRadeonRX6800这4款显卡参与本次测试。考虑到NVIDIAGeForceRTX30系列显卡还支持DLSS2.1技术,所以对于NVIDIAGeForceRTX30系列显卡的这两款参测显卡,我们将分别进行“光追:开+DLSS:关”,以及“光追:开+DLSS:开”这两个项目的测试。需要说明的是,《我的世界》中拥有名为“光线追踪渲染能见度”的选项,其设定值越高,玩家在游戏中开启光线追踪后的游戏画面渲染距离就越远,玩家能看到的游戏画面也更加丰富。为了考察《我的世界》对显卡性能需求的最大值,我们决定将“光线追踪渲染能见度”设为最高,即24个区块。

从测试成绩我们可以看到,NVIDIAGeForceRTX3090FE和NVIDIAGeForceRTX3070FE運行《我的世界》的性能表现非常亮眼。例如在1080p分辨率和打开光线追踪设定下,不开启DLSS时NVIDIAGeForceRTX3090FE运行这款游戏的平均帧率约为134fps。作为NVIDIAGeForceRTX3090FE的竞品,AMDRadeonRX6900XT的表现就有些不如人意—这款显卡在1080p分辨率下运行《我的世界》的平均帧率仅有58fps。不仅如此,即使将分辨率提升至2.5K,NVIDIAGeForceRTX3090FE和NVIDIAGeForceRTX3070FE运行《我的世界》的平均帧率也分别达到83fps和51fps,它们的测试成绩也都大幅领先各自的竞品。

下面我们特别关注一下DLSS技术带来的帧率提升。首先在1080p分辨率下,DLSS给NVIDIAGeForceRTX3090FE带来约34%的性能提升。当分辨率提升至2.5K并开启DLSS之后,NVIDIAGeForceRTX3090FE运行《我的世界》的平均帧率逼近关闭DLSS时的两倍。将分辨率进一步提升至4K之后,这款显卡运行《我的世界》的平均帧率更是达到109fps,是关闭DLSS时的2.7倍。反观AMDRadeonRX6900XT,这款显卡在4K分辨率下运行《我的世界》的平均帧率仅为16fps,距离30fps的基本流畅水平也相去甚远。值得一提的是,NVIDIADLSS2.1在提升游戏帧率的同时还保证了出色的游戏画质。例如在平衡和性能模式下,《我的世界》的游戏画面相比关闭DLSS时的游戏画面在细节上几乎没有明显差距。

玩光追,有NVIDIAGeForceRTX30系显卡才畅快

正如我们预料的那样,《我的世界》Windows10正式版仍然提供了令人惊艳的光追效果,各种反射、阴影和全局光照等效果给让《我的世界》的游戏画面得到蜕变,同时也让玩家的游戏体验得到质的飞跃。不仅如此,光线追踪的加持还让《我的世界》中众多物体表面的细节纹理更为逼真,对于这款像素游戏来说,这是非常难能可贵的。

从我们的测试成绩也可以看出,参与本次测试的这两款NVIDIAGeForceRTX30系显卡在运行这款游戏时的平均帧率非常亮眼,并且将AMD的两款参测显卡远远甩在身后。更加喜人的是,DLSS的加持还让这两款NVIDIAGeForceRTX30系显卡运行《我的世界》的平均帧率大幅提升,并且游戏画面也更加流畅,而没有DLSS加持的RX6900XT和RX6800就完全不是前者的对手。因此我们认为,对于那些想要在《我的世界》中享受畅快光追体验的玩家来说,NVIDIAGeForceRTX30系显卡更值得入手。

猜你喜欢

张量光线分辨率
偶数阶张量core逆的性质和应用
四元数张量方程A*NX=B 的通解
EM算法的参数分辨率
“你看不见我”
原生VS最大那些混淆视听的“分辨率”概念
基于深度特征学习的图像超分辨率重建
一种改进的基于边缘加强超分辨率算法
扩散张量成像MRI 在CO中毒后迟发脑病中的应用
淘气的光线
流动的光线