新显卡时代你准备好了吗？

2022-05-30OverLord

电脑爱好者 2022年16期

OverLord

新显卡时代，因为英特尔的加入变得越来越有趣，经历了几年的显卡涨价风波后，近期显卡价格已经趋于平稳，这对未来一段时间上市的新一代显卡起到了很好的铺垫作用——更为合理的价格、更出众的显卡性能指日可待，在临近（部分已经）上市的时机，笔者在这里和读者朋友们一起分享新一代显卡/GPU（图1），各家产品的技术特色，为日后的采购打好知识储备。

新显卡排排看

AMD Radeon RX7000系列显卡

AMD下一代Navi 3x系列GPU将基于RDNA 3架构（图2），预计初期会有三款产品，分别是Navi 31、Navi 32和Navi 33。其中Navi 31和Navi 32将采用MCM多芯片封装，而GCD（图形芯片）和MCD（缓存I/O芯片）会采用两种不同的芯片工艺。而且，图形芯片部分会使用TSMC 5nm工艺，而在缓存I/O芯片上则会采用TSMC 6nm工艺制造。而作为定位低阶一些的Navi 33，将会采用TSMC 6nm工艺制造。

在规格上，当前有很多不同的信息（图3），但大都存在一些不合理的地方，笔者综合了多个渠道的信息，认为Navi 31将拥有60个WGP（15360个流处理器），Infinity Cache为256MB，显存位宽仍维持在256bit，配备16GB的GDDR6显存，核心频率为2.5GHz。Navi 32则拥有40个WGP（10240个流处理器），Infinity Cache为192MB，显存位宽为192位，配备12GB的GDDR6显存;Navi 33目前存疑的地方在于WGP数量，范围在16至20个WGP（4096至5120个流处理器），Infinity Cache为64MB，显存位宽为128位，配备8GB的GDDR6显存。

预计在2022年末，我们就可以看到R X7000系列显卡显卡上市，笔者非常看好Navi 32为核心的显卡拥有较高性价比，预计会有意想不到的惊喜。

NVIDIA GeForce RTX 40系列显卡

NVIDIA GeForce RT X 40系列显卡基于全新的AdaLovelace架构，其中RTX 4090将采用AD102核心，RTX 4080基于AD103核心，RTX 4070基于AD104核心，而RTX 4060则基于AD106核心。以AD102的核心（图4）为例，根据目前的信息，它将包括12组GPC、72组TPC、144组SM，每组SM有128个FP32浮点核心、64个INT32整数核心。同时，RTX 40系列显卡的旗舰型号AD102核心可能具有96MB二级缓存，是上一代的16倍，显存规格为24GB GDDR6X（位宽为384bit，带宽达到21Gbps）。

需要注意的是，RTX 40系列显卡显卡并没有采用超大位宽的显存设计方案，而是大幅度提升了二级缓存的容量，应该可以部分弥补GDDR显存（图5）的高延迟问题，在这方面的性能可能更加出色。此外，其功耗可能会大幅度提升，好在它支持PCIe 5.0规范接口与ATX 3.0电源规范，可以得到足够的供电。可以预见的是，新一代显卡的性能必然有一个大幅度的提高，但相应的消耗也更大——为此你可能需要更新整套电脑系统。当然，笔者也相信在非旗舰产品上，如RTX 4060显卡等等，都还会考虑到兼容问题而兼容更低规范（如PCIe 4.0接口、ATX 2.3电源规范）的产品，所以也不用太过担忧。

英特尔ARC系列显卡

英特尔其实不算独显市场的“新人”——24年前英特尔就曾经推出过独立显卡。而今，英特尔再次进入独立显卡市场，而且是率先发布上市新世代产品的厂商。英特尔ARC系列显卡延续了处理器的命名方式，分为3、5、7三个系列，ARC 3针对主流游戏，ARC 5针对性能需求更高的大型游戏，ARC 7针对性能需求极高的高品质游戏。

在臺式机独显市场上，率先上市的是ARC 3系列的ARC 380显卡（图6），透过它也可以管中窥豹，一探究竟。从规格上看，Xe-HPG架构的灵活性十分优异，它最多可以扩展到8个Render Slice（渲染切片），每个Slice包含有4个Xe-core，加上4个专为光线追踪加速的单元，支持DXR和Vulkan光追，以及一些针对网格着色、采样器反馈等DirectX 12 Ultimate图形技术的硬件单元。

此外，Xe-HPG架构（图7）中还带有负责视频处理的Xe MediaEngine（Xe媒体引擎）（图8），可支持VP9、AVC、HEVC和AV1格式的硬件编解码，最高能支持到8K@60FPS 12bit HDR硬解码，以及8K 10bit HDR硬编码。

最后是负责画面输出的Xe显示引擎部分，Xe-HPG架构带有4个显示通道，支持HDMI 2.0b、DisplaysPort 1.4a和2.0 10GReady，最高支持输出2条8K60 HDR，或者4条4K120 HDR，而2K和1080P均能达到360Hz，并支持Adaptive Sync、SpeedSync和Smooth Sync三种显示同步技术。

从实际的使用上看，英特尔独立显卡尚存在着驱动优化空间，假以时日，这个独立显卡的“老将新兵”定能凭借着强大的技术优势迎头赶上，有兴趣的朋友不妨多多关注。

不能忽略的显卡秘钥

除了基础规格，显卡还有一些“看不见”或者说被忽略的重要技术规格，它们也很大程度上决定着显卡的性能、功能，所以，不要单纯看外在的硬件规格堆积，内涵是否丰富也十分重要。

1 图形API至关重要

按理说，图形API并不是普通电脑用户需要了解的事情，毕竟它主要针对游戏开发者，但是，作为电脑图形程序接口的开放标准，它某种程度上决定着游戏是否能够完全释放显卡的性能。现在总是听说DirectX12、Vulkan这样的名词，这二者就是目前竞争最为激烈的图形API接口。

OpenGL

OpenGL（图9）全称为Open Graphics Library，原本是行业领域中最为广泛接纳的2D/3D图形 API，自诞生至今已催生了各种计算机平台及设备上的数千种优秀应用程序。它是个与硬件无关的软件接口，可以在不同的平台如Windows、Unix、Linux、macOS、OS/2之间进行移植。不过现在它已经停止继续开发。

Vulkan

Vulkan（图10）是Khronos组织制定的开放图形A P I 接口，重点就是和DirectX12进行竞争。其实它是基于AMD的Mantle API产生的，提供了能直接控制和访问底层显示核心的显示驱动抽象层，这样能够显著提升操作显示核心硬件的效率和性能。

简言之，Vulkan秉承着“少即是多”的原则，尽可能减少接口对于硬件的干预，这样可以充分调用硬件资源，全数用来处理软件的图形生成工作，无疑，它的效率极高，而且可以實现跨平台使用。

DirectX

DirectX的全称为Direct eXtension，是由微软公司创建的图形API接口，最新版本为DirectX 12（图11）。由C++编程语言实现，它被广泛使用于微软的Windows操作系统、Xbox游戏机上的图形软件开发，但是它也仅限于上述两个平台，不支持Linux等操作系统。不过在Windows以及Xbox平台上，其表现十分优异，早年在和3DFX的Glide API竞争胜出后就再无对手，Vulkan虽然非常优秀，也无法真正撼动DirectX的霸主地位。

目前，无论是英特尔还是AMD、NVIDIA，都能够完整支持上述图形API，当然，应用最多的还是DirectX，这和庞大的Windows生态不无关系。

2新一代显卡完整支持AV1

2022年三大显卡核心厂商都将全面支持完整的AV1编、解码，这是一次重要的功能升级，也为未来十年做好了准备。可不要小看视频编解码功能，这是非常重要的一个硬件功能，可是大家往往都会忽略掉。要知道视频的编码都是有损压缩，通过更好的压缩比在同体积下提供更好的视频质量，或者在同样的视频质量下将体积压缩得更小，就是视频编码不断变化更新的重要推动力。

现在无论是集显还是独显，其实都有专门的单元负责编解码工作（见图7、图8）。根据它们的技术特点、档次高低，对编码格式的支持也不尽相同。由于这些编码单元都是固化在显卡核心之中的，因此你使用的显卡支持哪一些视频编码格式，从一开始就确定了，无法以软件升级的形式获得对新格式的硬件编解码功能。之所以需要特定的单元做视频编码设计，是因为它依据特定的编码算法进行设计，而不是软件编程来支持。这也是为什么显卡编码、解码被称作“硬件编解码”（图12），如果以处理器进行编码、解码工作，则被称之为“软件编解码”。

那么，为什么笔者这么强调AV1（图13）编解码功能呢？它是时下已经普及的HEVC（即H.265）编码的下一代产物，主要解决了超高分辨率视频的需求——在8K分辨率下（7680×4320）HEVC已经不足以应对，必须有一个压缩比更高的视频编码格式。同时，无论是H.264还是HEVC，都受到专利授权的影响，任何平台（如视频在线网站）想使用这些编码格式提供视频媒体服务，都必须缴纳一笔专利授权费用。因此，2015年以谷歌为首的诸多厂商组建了一个新的联盟：开放媒体联盟（AOMedia），目标只有一个：设计一个免费、高效的视频编码格式。

AV1的全称是AOMedia Video 1，它是由谷歌开发的流媒体编码VP9衍生而来，它在技术上最大、最主要的特征就是AV1拥有高于HEVC 20%的压缩比（图14），这让其具备了承载8K视频编解码工作的能力。为了进一步提高压缩比、降低（消除）专利费，AV1的诞生可谓是“重任在肩”。与HEVC编码格式相比，它不仅能保持原视频的分辨率、帧率、比特率，视频体积还能再缩小20%，这就意味着在同等带宽下可以流畅传输更高画质的视频，例如未来的8K视频。

在硬件端，當前英特尔的内置显卡Iris Xe、核芯显卡UHD700系列，以及AMD的RX6000系列、NVIDIA的RTX30系列独显，都开始提供AV1的解码能力，英特尔ARC系列则提供了完整的编解码能力。在软件端，也就是视频来源方面，爱奇艺、哔哩哔哩等在线视频网站，也从2021年开始小规模的尝试使用AV1编码处理视频。要在电脑本地播放AV1编码视频，还需要额外安装解码器才可以——在Windows系统的Microsoft Store商店中搜索“AV1 Video Extension”，匹配到扩展插件后，点击AV1 Video Extension的“获取”按钮（图15），系统将自动安装。安装完毕，默认自带的播放器就可以正常播放AV1格式的视频了（是否能够硬件解码需要视显卡而定）。

注意，如果你想要自行生成更好的AV1视频，光有解码能力是不够的的，当前除了英特尔能够在核显上提供完整的AV1编码能力（图16）外，AMD和NVIDIA都尚未支持。而未来，除了新一代的英特尔ARC独显外，已经确定的AMD RX7000系列、NVIDIA RTX40系列也终于提供了对AV1视频编码的完整编码能力，这可以让拥有上述显卡的电脑平台在视频播放和处理方面，至少能支持1 0 年左右的有效使用时间，意义非凡。

3显存容量、位宽不能忽略

除了显示核心之外，还有另一个因素决定着显卡性能、尤其是高分辨率下游戏性能，这就是显存配置，包括容量（图17）、速度和位宽等参数。显示器有不同的分辨率，如我们常说的1080P、2K、4K分辨率，以1080P为例，代表着显示器上排列着1920×1080个像素，即2073600个像素点，这个数字也是该显示器所能描绘的像素点的最大数量。软件（游戏）生成的计算数据会通过处理器发送到显卡上计算出画面，最后输出到显示器上，这个过程中必须使用显存来暂存这些待显示的“像素数据”。这些暂存的数据也并不是简单的2D图形图像，以一个建筑场景（图18）为例，在生成画面时显卡会完整计算这个建筑的立体结构全部细节，它由无数个顶点组成的多边形“拼凑”而成，外部贴上模拟墙体、瓦片、柱子、浮雕、布幔材质的图片，这些顶点的位置、颜色与材质贴图的数据量非常庞大。要注意一些不能显示在2D界面（显示屏幕）的3D构造“暗面”一样要暂存在显存之中，所以不能只看到当前视野中的景物简单就认为显存占用不大。

值得一提的是，如果在游戏中用户打开抗锯齿技术，由于抗锯齿技术需要更多的采样点，这样实际游戏存储在显存中的数据容量还会成倍增长，所以现在显存不仅仅要求速度更快，容量也越来越大。

不仅如此，显存同内存类似，还有一个非常重要的技术指标叫做“位宽”，显存位宽是显存在一个时钟周期内所能传送数据的位数，位数越大则瞬间所能传输的数据量越大。目前最低端的显卡位宽为64位，之后是128位，高端显卡一般显存都是256位、384位乃至512位的位宽（GDDR6），HBM2显存甚至可以达到惊人的2048位！位宽与频率的乘积就是带宽（图19）。当然，这也并不是说显存位宽必须越宽越好，例如NVIDIA GeForce RTX40系列如果真的采用大容量高速二级缓存作为“数据缓冲”，不失为另一个解决方案——当然代价就是功耗、发热增加，成本也相对高出不少。