原来不只是高带宽,PCIe4.0应用场景测试与分析
2020-11-16
平台对比凸显PCIe4.0高带宽优势
我们目前使用最广泛的PCIe3.0标准其实已经是10年前(2010年)制定的标准,而部分设备还在用到的PCIe2.0标准,则是在更早的2006年制定的。PCIe 2.0采用8b/10b的编码方式,拥有2.5GT/s的信号速率,PCIe3.0的编码方式修改为128b/130b,信号速率增长到8GT/s,而PCIe4.0则再次翻倍,达到了16GT/s。所以在带宽方面,×16带宽时,PCIe3.0为32GB/s,而PCIe4.0则翻倍为64GB/s。
消费级桌面处理器的CPU直连PCIe通道非常有限,以目前主流的处理器来看,Intel第十代酷睿旗舰i9 10900K只有16条直出PCIe通道,AMD第三代锐龙旗舰如锐龙9 3900X则有20条直出PCIe通道。直出通道的数量决定了与处理器高速互联的设备数。
在Intel平台,当这个直连处理器的PCIe×16插槽只插一块显卡时,可以达到PCIe3.0×16全速,但如果使用双显卡SLI或CFX时,就只能使用8+8通道,而三个PCIe设备连接时则只能分配为8+4+4,在有限的PCIe通道数下,多设备连接速度会有所降低,多个高性能PCIe设备连接时无法发挥全部的性能。
在Intel目前的消费级平台上(如Z390、Z490),绝大多数情况下,直连处理器的就是主板上的第一根PCIe3.0×16插槽,而NVMe等存储设备,使用的都是主板芯片组提供的PCIe通道,不是直连处理器的PCIe通道,在Intel平台中,主板芯片组和CPU通信采用的是DMI总线(基于PCIe总线打造),带宽和PCIe3.0×4一样为8GB/s。也就是说虽然主板最高能提供24条PCIe通道,但由于和处理器的通信带宽只有PCIe3.0×4,所以各种高速传输的设备同时运行时,受带宽限制并不能真正达到全速。
AMD第三代锐龙平台不但提供了PCIe4.0,同时还多提供4条用于NVMe的通道
在AMD第三代锐龙平台中,首先处理器就提供了20条PCIe4.0通道,对应在B550和X570主板上,则可以直接划分为用于显卡的PCIe4.0×16直连和用于NVMe的PCIe4.0×4直连,在单条NVMe的情况下,存储不必为了跑满速而去抢占显卡的通道。同时,AMD第三代锐龙处理器和主板(B550/X570)芯片组的通信带宽同样也升级到了PCIe4.0×4,可以提供16GB/s的带宽,能更好地满足多个高速设备同时工作的带宽需求。
实测分析PCIe4.0高带宽具体表现
使用Intel酷睿i9 10900K平台,RTX 3080在3DMark的PCIe带宽测试中成绩为12.93 GB/s
使用AMD锐龙9 3900X平台,RTX 3080在3DMark的PCIe带宽测试中成绩为26.17 GB/s
技嘉B550 AORUS MASTER,我们使用NVIDIA RTX 3080进行了PCIe 4.0的测试,并使用第三代锐龙处理器+X570主板和第十代酷睿+Z490主板进行了对比测试。从3DMark的PCIe带宽测试来看,RTX 3080在支持PCIe 4.0的第三代锐龙处理器+X570主板上的带宽测试达到26.17GB/s,而在仅支持PCIe3.0的第十代酷睿+Z490主板上则只有12.93GB/s的带宽,可以很明显地看到PCIe4.0两倍于PCIe 3.0的帶宽。
在这一代旗舰显卡上,PCIe4.0的高带宽虽然在测试中很明显,但在日常应用中,因为多方面的原因,还无法吃满PCIe4.0的全部带宽性能,所以就目前来看,其对显卡的性能影响还很小,但这并不意味着PCIe4.0的高带宽无用,因为未来显卡的性能和带宽需求肯定是越来越高,带宽对旗舰显卡的性能影响也会逐渐显现出来。
而对玩家们影响最大,也是目前有着最直观的感受的,那就是存储方面带来的性能上的直接提升。所以我们也进行了存储方面的PCIe4.0测试。
测试平台:
处理器:AMD锐龙9 3900X
内存:技嘉AORUS DDR4 3200 8GB×2
主板:技嘉B550 AORUS MASTER
硬盘:技嘉PCIe Gen4 1TB NVMe SSD
技嘉B550 AORUS MASTER主板对PCIe4.0 M.2插槽进行了重新规划设计
技嘉B550 AORUS MASTER按照旗舰级的X570主板规格来打造,配备了16相直出式数字供电,每一相供电电流高达70A,这个规格已经超过了市面上大多数X570主板。存储部分的设计是技嘉B550 AORUS MASTER一大卖点。B550原本可以提供由第三代锐龙直出的一个PCIe 4.0 ×4 M.2插槽,而技嘉B550 AORUS MASTER提供了3个PCIe 4.0 ×4 M.2插槽,都来自第三代锐龙处理器,其中两个则是分自显卡的PCIe 4.0 ×16通道。如此一来,技嘉B550 AORUS MASTER就可以支持3個PCIe 4.0固态硬盘组建RAID0系统。此外,技嘉B550 AORUS MASTER还配备了6层PCIe 4.0专用2盎司铜PCB,能够充分保证信号传输的稳定性。
从测试来看,单块PCIe 4.0固态硬盘在技嘉B550 AORUS MASTER上的连续读取速度已经达到了5GB/s左右,连续写入速度也超过了4GB/s,这个成绩已经远超PCIe 3.0顶级固态硬盘了。
由于这块主板可以将处理器的PCIe4.0通道划分至NVMe,从而在B550主板上实现3个PCIe4.0的M.2接口,所以我们也利用这个特性进行了PCIe4.0的RAID0测试。从测试结果来看,主板上3个PCIe 4.0 ×4 M.2插槽组建RAID0系统,连续读写均可突破12000MB/s,这个性能表现可以说是非常恐怖了。
那么这样的性能表现具体能在哪些方面为我们带来直观的感受呢?第三代锐龙处理器在多线程性能方面的表现非常强劲,已经成为目前专业创意工作者的首选平台,高性能的处理器搭配读写更快的PCIe4.0 NVMe SSD,可以极大地加快工程素材的拷贝和载入速度,明显改善使用体验和工作效率。
为什么这么说呢?以视频拍摄剪辑为例,随着佳能EOS R5的发布,8K RAW格式视频已经正式宣布进入消费级市场,8K RAW格式下,几秒钟的视频素材就已经达到按GB计算的容量,这给素材的拷贝和载入都提出了更高的要求。虽然8K视频并不是目前的主流,但是以松下S1H和索尼A7S3为代表的视频机所拍摄的6K和4K视频工程需求已经越来越突出,大型工程中,这样的素材量级依旧给拷贝和剪辑载入提出了更高的要求,在这种时候,使用PCIe4.0 NVMe能够极大地减少素材的相互拷贝和载入时间,更方便、更好地完成以前要用多块机械硬盘阵列才能完成的事情,极大地简化工作流程,提高工作效率。
随着目前主流显卡已经全面切换到PCIe4.0,PCIe4.0只需要PCIe3.0一半的通道数即可实现相同的带宽,所以在未来,主流设备都切换到PCIe4.0之后,通道的分配就更加方便,例如入门和中端显卡,可以不需要再用×16的通道,因为它们对带宽的需求相对较低,而使用×8的通道即可实现以往PCIe3.0×16的带宽,也不会对性能有所影响,从而留出更多的通道数给其他设备使用。对于存储系统来说,PCIe4.0×2即可实现以往PCIe3.0×4的带宽,对于不追求性能的入门级NVMe来说,只需要用到更少的通道数即可满足产品定位的需求,从而实现更大容量的配备,也不失为一种灵活的解决方案。
高带宽更灵活,AMD锐龙平台搭配PCIe4.0更高效
AMD第三代锐龙处理器将PCIe4.0带入了消费级市场,随着一年时间的市场培养,PCIe4.0的NVMe SSD刚上市时处于性能高/价格高的状态,如今价格方面也已经达到了和旗舰PCIe3.0 NVMe SSD接近的程度,众多存储品牌也发布了更多的PCIe4.0 NVMe SSD产品。借助PCIe4.0的高带宽,采用PCIe4.0的SSD也在速度上进一步实现了突破,三星刚发布的旗舰NVMe SSD 980Pro甚至能够达到7000MB/s,非常恐怖,也让我们看到了更多高速存储的应用环境。随着NVIDIA RTX 30系列显卡的推出,目前市面上的主流显卡已经全部实现了对PCIe4.0的支持,这将进一步推动PCIe4.0的发展,更好地发挥其高带宽的优势。可以说支持PCIe4.0已经是目前的主流趋势,在这种情况下,能够支持PCIe4.0的AMD B550/570平台就成为了更能战未来且合理的选择。