PC核心技术概况

2016-05-14

个人电脑 2016年6期

不论是AMD、Intel的CPU还是AMD、NVIDIA的GPU，FinFET工艺都会带来20%以上的性能提升，30-40%的功耗降低，最终的CPU/GPU不仅性能更强，功耗也会大幅降低。

在过去的几年里，尽管PC产业一直面临下滑的困境，但技术进步是止不住的，越是在困难的情况下，技术发展就越重要，新技术不仅能为企业打开新的大门，也能给消费者带来全新的应用体验，创造全新的需求，从而推动产品升级换代。作为PC核心技术的CPU、GPU等领域，会有哪些值得关注的技术进步呢？

半导体技术是整个PC产业的根基，半导体工艺没进步，核心PC产品就无法继续发展。在过去的50年中“摩尔定律”成了主导半导体工艺进展的金科玉律，Intel不仅是摩尔定律的提出者，也是摩尔定律最坚定的捍卫者，Intel也靠着摩尔定律成就了一方霸业。

但是业界对摩尔定律的质疑也从来没断过，特别是最近几年，很多人都认为硅基半导体技术很快就要面临极限了，Intel自己的“Tick-Tock”钟摆战略在Haswell架构之后也失效了，14nm工艺延期了一年多，以致于到了2016年14nm依然会是主流。

按照目前的形势来看，14/16nm FinFET工艺已经成熟，除了Intel之外，TSMC、三星已经在去年分别量产了14nm、16nm FinFET工艺，今年开始量产第二代高性能工艺了，GlobalFoundries今年也会量产14nm工艺。下一步是10nm节点，虽然进度比预期的晚，不过10nm工艺现在也渡过研发阶段了，目前正在准备量产，Intel预计是在2017年下半年推出10nm CannonLake处理器，TSMC与三星在10nm工艺上更积极，对宣称今年下半年就会量产10nm工艺。

10nm之后就是7nm节点了，但它离量产还有段距离，因为工艺越先进，晶体管间距越小，漏电流也愈加严重，导致晶体管功耗过高。除此之外，先进的生产工艺还要依赖半导体制造装备的进步，原本在10nm工艺就准备启用的EUV光刻机一直不够成熟，ASML公司为了研发EUV设备投入了相当多的资源，但EUV光刻机的产量及光照强度还是上不去，离规模化工业生产还有很长的距离，以致于Intel等公司并不看好7nm节点启用EUV的前景，有可能要拖到5nm节点。硅基半导体受挫，科研人员很早就开始寻找新的半导体材料，包括砷化镓、碳纳米管甚至量子阱晶体管。2015年IBM及合作伙伴三星、GlobalFoundries率先展示了7nm工艺芯片，使用的就是硅锗材料，使用这种材料的晶体管开关速度更快，功耗更低，而且密度更高，可以轻松实现200亿晶体管，晶体管密度比目前的硅基半导体高出一个量级。

英特尔公司虽然没有展示过7nm工艺，但他们对此一直很自信，此前表态称即便没有EUV工艺，他们也懂得如何制造7nm芯片，但愿这没有在吹牛，因为Intel能否即时推出7nm工艺，关系着摩尔定律还能否再战二十年。

半导体工艺发展虽然很重大，但并不急迫，AMD、Intel新一代处理器至少还有14nm、10nm两代工艺可用。2016年这两家都会推出新一代处理器，其中AMD推的是呕心沥血研发多年的改头换面之作——Zen处理器，Intel今年则会有Broadwell-E及Kabylake处理器。

先说领跑者Intel，今年的2代新品中，Broadwell-E是针对LGA2011平台的HEPT发烧级处理器，Kabylake是针对主流市场的LGA1151处理器，前者最动人的地方在于桌面处理器首次出现10核心设计，旗舰型号Core i7-6950X将是10核20线程，频率3.0GHz，L3缓存高达25MB。

至于跟跑者AMD，他们今年上半年会把第四代模块化架构Excavator核心带到桌面市场上，推出AM4插槽的Bristol Ridge处理器，下半年的重点则是Zen架构处理器，也是AM4插槽，但架构、工艺全新升级，放弃之前由推土机架构引入的模块多核理念，回归传统的SMT多线程。

Zen架构曝光率非常高，隔三差五就要在媒体上亮相，虽然我们对Zen架构的细节所知甚少，但从AMD及各方流传出来的信息来看，Zen架构性能值得期待，官方表示IPC性能提升40%还多，14nm FinFET工艺也会大幅降低处理器的功耗。

还有一点值得注意，不光Intel在推8核甚至10核处理器，AMD的Zen架构多核并行能力也有提高，桌面版首发时至少是4核8线程起步，中高端会是8核16线程，而服务器/工作站出现16核32线程甚至32核64线程也不要惊讶。

不论是Intel的10核处理器还是AMD的16核处理器，桌面处理器在突破6核、8核之后会继续进入10核+时代，Intel Broadwell-E在前两代突破8核之后已经确定有10核20线程产品，AMD的Zen架构更加激进，8核16线程不是问题，是否会在桌面市场推出12核甚至16核的旗舰也令人期待。

伴随着CPU、GPU计算性能的飞速增长，PCI-E总线也要有相应的准备，不过最新一代PCI-E 4.0总线技术已经推迟了，原定于2015年上半年发布最终规范，但现在来看PCI-E 4.0总线可能要拖到2016年甚至2017年了。

新一代总线具备更高的性能，具体来说，目前在用的PCI-E 3.0总线速率是8GT/s，Link带宽8Tb/s，每一通道带宽约为1GB/s，x16通道双向带宽32GB/s，而PCI-E 4.0在PCI-E 3.0基础上保持架构不变，速率翻倍到16GT/s，通道带宽提升到2GB/s，x16双向带宽高达64GB/s。

不过PCI-E 4.0面临的问题也不少，除了铜介质速率继续提升的技术难题之外，PCI-E 4.0最大的尴尬之处在于——桌面显卡用不到这么高的带宽，高性能计算领域PCI-E 4.0带宽又不给力。前者很好说，因为从PCI-E 2.0到PCI-E 3.0时代，显卡性能也没有因此受益，PCI-E 3.0 x16带宽已经达到了32GB/s，目前的高端显卡并不需要这么高的带宽，而升级到PCI-E 4.0，64GB/s的带宽对桌面显卡来说也是浪费。

如果用到HPC领域，PCI-E 4.0带宽的64GB/s又有点捉襟见肘了，等不及的厂商早已经在暗地里开发新的总线技术，其中NVIDIA跟IBM联合开发了NVLink总线，号称带宽是PCI-E总线的5-12倍，AMD也在开发自家的架构互联技术，带宽超过100GB/s。

无论AMD还是NVIDIA，他们开发的新总线技术带宽可以轻松超过100GB/s，这对服务器产品很有用，但对桌面市场有什么意义呢？值得发烧友关注的就是多卡互联技术，目前AMD、NVIDIA最多能做到的也就是4卡SLI/CF交火，有了NVLink这样的技术，8卡SLI或者CF都是有可能的。

说完了CPU处理器，我们也不能忽视GPU处理器。作为当前PC中功耗最高的一部分，显卡对游戏性能影响至关重要，但在性能越高=功耗越高这条路上，显卡也面临一个选择——NVIDIA的Maxwell架构证明了显卡性能增长的同时，能耗也可以很低。2016年的GPU不仅要性能，更重要的是效能，我们要看到还是每瓦性能比。

在Maxwell架构之后，NVIDIA将推出新一代的Pascal架构。根据官方公布的资料，Pascal显卡将支持3D Memory显存，容量、带宽可达普通显存的2-4倍，而显卡只有标准PCI-E显卡的1/3大小，如今基于Pascal架构的新一代显示芯片已经有两款高端产品——GeForce GTX 1080、GTX 1070相继问世了。

至于AMD，由于目前的R200、R300系列显卡大都还在使用GCN架构改款，制程工艺还是28nm工艺，能效方面已经落后NVIDIA的Maxwell架构了，所以2016年AMD也会在GPU领域有大动作——推出了GCN 4.0架构Polaris，制程工艺升级到14/16nm FinFET，同时会搭配HBM 2显存，号称每瓦性能比提升一倍。

AMD还实际演示了Polaris显卡的能效优势，之前使用用Polaris架构的一款中端显卡跟NVIDIA的GTX 950做了对比，同样是在1920x1080 60fps的性能上，Polaris显卡的整机功耗是86W，而GTX 950整机功耗是140W，可见功耗优势非常非常大。2016年GPU要想提高性能、降低功耗，除了架构改进之外，新一代内存技术也功不可没，其中AMD在去年的Fury显卡上首次使用的HBM内存就是代表，NVIDIA所说的3D显存其实也是HBM技术，不过是HBM 2代技术。与HBM竞争的则是美光主导的HMC内存技术。对于HBM技术，简单来说，HBM就是在GDDR5显存无法继续大幅提升频率的情况下换了一种思路，通过提高总线位宽来提高带宽，第一代HBM显存的频率只有500MHz，等效1GHz，远低于目前的GDDR5显存，但带宽高达128GB/s，4颗芯片总计可以带来512GB/s的带宽，远高于主流GDDR5显存。（图8）

2016年HBM 2代也来了，JEDEC已经正式批准了HBM 2显存规范，相比第一代HBM，HBM 2可堆栈的层数更多，单颗容量最高可达8GB，频率也翻倍到2Gbps，带宽从128GB/s提高到256GB/s，这样一来布置4组HBM 2显存就可以实现32GB容量、1TB/s的带宽了，次之也有16GB容量，1TB/s带宽，这正好与NVIDIA之前宣称的数据相符。

HBM内存技术已经得到了SK Hynix、三星等厂商的支持，另一个内存技术大腕美光的选择不同——显存市场他们继续推改良版的GDDR5X，3D堆栈内存上则选择了HMC（Hybrid Memory Cube），它跟HBM一样都需要使用TSV工艺连接多层DRAM芯片。

性能方面，HMC闪存相比DDR内存依然有足够多的优势，普通DDR3-1600内存双通道带宽不过12.8GB/s，美光之前宣称HMC的性能是DDR3内存的20倍，单通道带宽就有128GB/s（跟HBM 1代相同），同时功耗比DDR3减少70%，占用面积比DDR3减少95%。

HMC阵营实际上也有Intel、三星等其他公司参与，但目前力推HMC的基本上只有美光公司，他们现在推出了2/4GB容量的HMC内存，有两种封装，896-Ball BGA封装的带宽为160GB/s，666-Ball BGA封装的带宽是120GB/s。

具体应用方面，HMC在Intel的新一代Xeon Phi加速卡上露过面了，代号Knights Landing的Xeon Phi加速卡配备了16GB板载缓存，号称5倍带宽、5倍能效于DDR4内存，它就是美光提供的HMC内存。

不过总体来看，HMC相对HBM来说还有点滞后，HBM在新一代显卡上站稳脚跟没问题，未来也会进入服务器等市场，HMC受到的支持力度不如HBM，不过3D内存技术现在还是新兴事物，现在给HBM、HMC作出最终判决还有点为时过早。2016年半导体/处理器技术的进步首先要依赖工艺升级，虽然10nm及7nm工艺还有点远，但2016年我们可以预期新一代处理器全面升级14/16nm FinFET工艺，这比去年的28nm、20nm工艺已经有很大进步了。不论是AMD、Intel的CPU还是AMD、NVIDIA的GPU，FinFET工艺都会带来20%以上的性能提升，30-40%的功耗降低，最终的CPU/GPU不仅性能更强，功耗也会大幅降低。