APP下载

Zen:AMD最快的CPU

2017-04-07

CHIP新电脑 2017年2期
关键词:浮点英特尔指令

通过新的Zen处理器,AMD希望能够打破英特尔的主导地位。由于采用了众多新的设计,Zen处理器至少在计算速度上可以与其对手最好的处理器一较高下。

个人电脑是每一个家庭最主要的电脑设备,因而英特尔和AMD之间的竞争影响着所有的人。大约5年前,AMD推出的Bulldozer芯片架构以失败告终,不得不退出与英特尔的竞争。从那时起,英特尔成为了个人电脑用户爱好者唯一的选择:如果我们想组建一台强大的个人电脑,英特尔的Core i处理器将是唯一的选择,因为它们是最强大的处理器,同时也代表着最佳的性价比。不过,现在AMD又回来了,其新的芯片架构Zen预期将有能力与Core i处理器一较高下。

两个因素确保了这一点,此前AMD芯片的效率明显要低于英特尔的芯片。与AMD合作的晶圆代工厂Global foundries(格罗方德)公司直到最近仍然在使用32nm的晶体管工艺。而英特尔2012年就已经生产了22nm的晶体管,现在的晶体管尺寸更是缩小到了14nm。每次缩小尺寸,芯片的效率可以提高约40%,这导致AMD一直处于劣势。而随着Global foundries 2017年开始生产14nm的芯片,AMD公司的芯片效率将大幅度提升。

AMD的“回到未来”

第二个因素与洞察力有关:AMD当时的副总裁安德鲁·费尔德曼(Andrew Feldman)在2013年表示,Bulldozer已经“彻底失败”。AMD在Bulldozer芯片架构上不再采用一个处理器中多个完整核心的概念,而是将处理器划分为核心模块,模块由执行整数运算和浮点运算的两个计算核心构成。这导致出现两个核心竞争浮点资源,在多媒体应用程序等多种应用上出现处理器性能下降的问题。

而在Zen架构上,AMD不再采用这个模块的概念。相反,Zen处理器的每个核心都有一个整数和一个浮点单元。此外,AMD引入了名为“对称多线程”的超线程。像Core i处理器一样,Zen的每个核心都可以同时处理两个线程。在新的架构下,AMD还调整了为内核传送或记录数据的缓存。两个L1高速缓存已经被加大,同时L1数据高速缓存根据“回写”原理保存,其内容不再镜像(直写)到较慢的L2缓存。这解决了Bulldozer数据缓存不足以及两个核心共享L1缓存的问题。

L1指令高速缓存和L2缓存的大小现在是过去的两倍,L2缓存现在是每个核心512KB,这是Skylake处理器的两倍。因此,Zen核心一般不怎么需要依靠最慢的L3高速缓存。虽然AMD牺牲了可以用于投入于更多计算单元的芯片面积,但是根据AMD的介绍,与上一代Bulldozer相比,Zen的L1和L2缓存的访问时间明显降低。L3缓存方面Zen架构下每个内核2MB,这与Skylake处理器相同。Zen处理器可以将4个核心组合为一个基本单元,可以与图形单元或4个以上的内核对接形成一个相当于8内核Skylake 6700或Broadwell E的处理器单元。

复制英特尔并超越它

AMD在新的处理器中开始加入了微指令缓存:来自缓存的指令对于计算单元来说太长了,不可能直接进行处理,解码器必须将它们转换成更小的微指令。为此,AMD在Zen架构中加入了一个微指令缓存,它将负责保存解码了的微指令,形成一个微指令的队列。微指令队列能够分别对两个计算单元进行馈送,提高整数和浮点计算单元的利用率。这将可以避免核心浪费额外时间从缓存中获取指令,并改进指令队列的分支预测,对提升核心的执行效率效果非常明显。在微指令缓存的辅助下,芯片每个时钟最高可以处理6个指令。而对于英特尔来说,从SandyBridge开始一直都是这样做的。

Zen的最大劣勢在于其浮点单元,合并4个128位浮点单元不等于一个完整的512位单元。在处理英特尔推出AVX2指令集的256位指令时,由于每个单元只有128位,所以这使得Zen必须将两个单元合并起来,这将不可避免地产生一定的时间延迟,而Skylake处理器则无需如此。为此,Zen的回退队列将包含每个时钟两个计算单元的8个结果,这是Skylake处理器的两倍。

AMD在一项测试中证明,一个Zen8核处理器与相同时钟的BroadwellE一样快。很快AMD将推出其新一代的Zen架构的处理器,预计我们将能够在2017年的春季可以买到。新的处理器使用AM4插座,主板支持新的接口(M.2、USB 3.1)和DDR4内存,在众多的改进下,我们很可能可以在2017年组装一个基于Zen的高性能个人电脑。

责任编辑:金雅文jin_yawen@chip.cn

猜你喜欢

浮点英特尔指令
听我指令:大催眠术
LEO星座增强GNSS PPP模糊度浮点解与固定解性能评估
英特尔携手一汽集团,引领汽车行业全新变革
基于浮点DSP的铁路FSK信号检测
ARINC661显控指令快速验证方法
LED照明产品欧盟ErP指令要求解读
英特尔扩充FPGA可编程加速卡产品组合
基于FPGA的浮点FIR滤波器设计
改进的Goldschmidt双精度浮点除法器
英特尔开源帮霍金“说话”软件