PC核心技术概况
2016-05-14
不论是AMD、Intel的CPU还是AMD、NVIDIA的GPU,FinFET工艺都会带来20%以上的性能提升,30-40%的功耗降低,最终的CPU/GPU不仅性能更强,功耗也会大幅降低。
在过去的几年里,尽管PC产业一直面临下滑的困境,但技术进步是止不住的,越是在困难的情况下,技术发展就越重要,新技术不仅能为企业打开新的大门,也能给消费者带来全新的应用体验,创造全新的需求,从而推动产品升级换代。作为PC核心技术的CPU、GPU等领域,会有哪些值得关注的技术进步呢?
半导体技术是整个PC产业的根基,半导体工艺没进步,核心PC产品就无法继续发展。在过去的50年中“摩尔定律”成了主导半导体工艺进展的金科玉律,Intel不仅是摩尔定律的提出者,也是摩尔定律最坚定的捍卫者,Intel也靠着摩尔定律成就了一方霸业。
但是业界对摩尔定律的质疑也从来没断过,特别是最近几年,很多人都认为硅基半导体技术很快就要面临极限了,Intel自己的“Tick-Tock”钟摆战略在Haswell架构之后也失效了,14nm工艺延期了一年多,以致于到了2016年14nm依然会是主流。
按照目前的形势来看,14/16nm FinFET工艺已经成熟,除了Intel之外,TSMC、三星已经在去年分别量产了14nm、16nm FinFET工艺,今年开始量产第二代高性能工艺了,GlobalFoundries今年也会量产14nm工艺。下一步是10nm节点,虽然进度比预期的晚,不过10nm工艺现在也渡过研发阶段了,目前正在准备量产,Intel预计是在2017年下半年推出10nm CannonLake处理器,TSMC与三星在10nm工艺上更积极,对宣称今年下半年就会量产10nm工艺。
10nm之后就是7nm节点了,但它离量产还有段距离,因为工艺越先进,晶体管间距越小,漏电流也愈加严重,导致晶体管功耗过高。除此之外,先进的生产工艺还要依赖半导体制造装备的进步,原本在10nm工艺就准备启用的EUV光刻机一直不够成熟,ASML公司为了研发EUV设备投入了相当多的资源,但EUV光刻机的产量及光照强度还是上不去,离规模化工业生产还有很长的距离,以致于Intel等公司并不看好7nm节点启用EUV的前景,有可能要拖到5nm节点。硅基半导体受挫,科研人员很早就开始寻找新的半导体材料,包括砷化镓、碳纳米管甚至量子阱晶体管。2015年IBM及合作伙伴三星、GlobalFoundries率先展示了7nm工艺芯片,使用的就是硅锗材料,使用这种材料的晶体管开关速度更快,功耗更低,而且密度更高,可以轻松实现200亿晶体管,晶体管密度比目前的硅基半导体高出一个量级。
英特尔公司虽然没有展示过7nm工艺,但他们对此一直很自信,此前表态称即便没有EUV工艺,他们也懂得如何制造7nm芯片,但愿这没有在吹牛,因为Intel能否即时推出7nm工艺,关系着摩尔定律还能否再战二十年。
半导体工艺发展虽然很重大,但并不急迫,AMD、Intel新一代处理器至少还有14nm、10nm两代工艺可用。2016年这两家都会推出新一代处理器,其中AMD推的是呕心沥血研发多年的改头换面之作——Zen处理器,Intel今年则会有Broadwell-E及Kabylake处理器。
先说领跑者Intel,今年的2代新品中,Broadwell-E是针对LGA2011平台的HEPT发烧级处理器,Kabylake是针对主流市场的LGA1151处理器,前者最动人的地方在于桌面处理器首次出现10核心设计,旗舰型号Core i7-6950X将是10核20线程,频率3.0GHz,L3缓存高达25MB。
至于跟跑者AMD,他们今年上半年会把第四代模块化架构Excavator核心带到桌面市场上,推出AM4插槽的Bristol Ridge处理器,下半年的重点则是Zen架构处理器,也是AM4插槽,但架构、工艺全新升级,放弃之前由推土机架构引入的模块多核理念,回归传统的SMT多线程。
Zen架构曝光率非常高,隔三差五就要在媒体上亮相,虽然我们对Zen架构的细节所知甚少,但从AMD及各方流传出来的信息来看,Zen架构性能值得期待,官方表示IPC性能提升40%还多,14nm FinFET工艺也会大幅降低处理器的功耗。
还有一点值得注意,不光Intel在推8核甚至10核处理器,AMD的Zen架构多核并行能力也有提高,桌面版首发时至少是4核8线程起步,中高端会是8核16线程,而服务器/工作站出现16核32线程甚至32核64线程也不要惊讶。
不论是Intel的10核处理器还是AMD的16核处理器,桌面处理器在突破6核、8核之后会继续进入10核+时代,Intel Broadwell-E在前两代突破8核之后已经确定有10核20线程产品,AMD的Zen架构更加激进,8核16线程不是问题,是否会在桌面市场推出12核甚至16核的旗舰也令人期待。
伴随着CPU、GPU计算性能的飞速增长,PCI-E总线也要有相应的准备,不过最新一代PCI-E 4.0总线技术已经推迟了,原定于2015年上半年发布最终规范,但现在来看PCI-E 4.0总线可能要拖到2016年甚至2017年了。
新一代总线具备更高的性能,具体来说, 目前在用的PCI-E 3.0总线速率是8GT/s,Link带宽8Tb/s,每一通道带宽约为1GB/s,x16通道双向带宽32GB/s,而PCI-E 4.0在PCI-E 3.0基础上保持架构不变,速率翻倍到16GT/s,通道带宽提升到2GB/s,x16双向带宽高达64GB/s。
不过PCI-E 4.0面临的问题也不少,除了铜介质速率继续提升的技术难题之外,PCI-E 4.0最大的尴尬之处在于——桌面显卡用不到这么高的带宽,高性能计算领域PCI-E 4.0带宽又不给力。前者很好说,因为从PCI-E 2.0到PCI-E 3.0时代,显卡性能也没有因此受益,PCI-E 3.0 x16带宽已经达到了32GB/s,目前的高端显卡并不需要这么高的带宽,而升级到PCI-E 4.0,64GB/s的带宽对桌面显卡来说也是浪费。
如果用到HPC领域,PCI-E 4.0带宽的64GB/s又有点捉襟见肘了,等不及的厂商早已经在暗地里开发新的总线技术,其中NVIDIA跟IBM联合开发了NVLink总线,号称带宽是PCI-E总线的5-12倍,AMD也在开发自家的架构互联技术,带宽超过100GB/s。
无论AMD还是NVIDIA,他们开发的新总线技术带宽可以轻松超过100GB/s,这对服务器产品很有用,但对桌面市场有什么意义呢?值得发烧友关注的就是多卡互联技术,目前AMD、NVIDIA最多能做到的也就是4卡SLI/CF交火,有了NVLink这样的技术,8卡SLI或者CF都是有可能的。
说完了CPU处理器,我们也不能忽视GPU处理器。作为当前PC中功耗最高的一部分,显卡对游戏性能影响至关重要,但在性能越高=功耗越高这条路上,显卡也面临一个选择——NVIDIA的Maxwell架构证明了显卡性能增长的同时,能耗也可以很低。2016年的GPU不仅要性能,更重要的是效能,我们要看到还是每瓦性能比。
在Maxwell架构之后,NVIDIA将推出新一代的Pascal架构。根据官方公布的资料,Pascal显卡将支持3D Memory显存,容量、带宽可达普通显存的2-4倍,而显卡只有标准PCI-E显卡的1/3大小,如今基于Pascal架构的新一代显示芯片已经有两款高端产品——GeForce GTX 1080、GTX 1070相继问世了。
至于AMD,由于目前的R200、R300系列显卡大都还在使用GCN架构改款,制程工艺还是28nm工艺,能效方面已经落后NVIDIA的Maxwell架构了,所以2016年AMD也会在GPU领域有大动作——推出了GCN 4.0架构Polaris,制程工艺升级到14/16nm FinFET,同时会搭配HBM 2显存,号称每瓦性能比提升一倍。
AMD还实际演示了Polaris显卡的能效优势,之前使用用Polaris架构的一款中端显卡跟NVIDIA的GTX 950做了对比,同样是在1920x1080 60fps的性能上,Polaris显卡的整机功耗是86W,而GTX 950整机功耗是140W,可见功耗优势非常非常大。2016年GPU要想提高性能、降低功耗,除了架构改进之外,新一代内存技术也功不可没,其中AMD在去年的Fury显卡上首次使用的HBM内存就是代表,NVIDIA所说的3D显存其实也是HBM技术,不过是HBM 2代技术。与HBM竞争的则是美光主导的HMC内存技术。对于HBM技术,简单来说,HBM就是在GDDR5显存无法继续大幅提升频率的情况下换了一种思路,通过提高总线位宽来提高带宽,第一代HBM显存的频率只有500MHz,等效1GHz,远低于目前的GDDR5显存,但带宽高达128GB/s,4颗芯片总计可以带来512GB/s的带宽,远高于主流GDDR5显存。(图8)
2016年HBM 2代也来了,JEDEC已经正式批准了HBM 2显存规范,相比第一代HBM,HBM 2可堆栈的层数更多,单颗容量最高可达8GB,频率也翻倍到2Gbps,带宽从128GB/s提高到256GB/s,这样一来布置4组HBM 2显存就可以实现32GB容量、1TB/s的带宽了,次之也有16GB容量,1TB/s带宽,这正好与NVIDIA之前宣称的数据相符。
HBM内存技术已经得到了SK Hynix、三星等厂商的支持,另一个内存技术大腕美光的选择不同——显存市场他们继续推改良版的GDDR5X,3D堆栈内存上则选择了HMC(Hybrid Memory Cube),它跟HBM一样都需要使用TSV工艺连接多层DRAM芯片。
性能方面,HMC闪存相比DDR内存依然有足够多的优势,普通DDR3-1600内存双通道带宽不过12.8GB/s,美光之前宣称HMC的性能是DDR3内存的20倍,单通道带宽就有128GB/s(跟HBM 1代相同),同时功耗比DDR3减少70%,占用面积比DDR3减少95%。
HMC阵营实际上也有Intel、三星等其他公司参与,但目前力推HMC的基本上只有美光公司,他们现在推出了2/4GB容量的HMC内存,有两种封装,896-Ball BGA封装的带宽为160GB/s,666-Ball BGA封装的带宽是120GB/s。
具体应用方面,HMC在Intel的新一代Xeon Phi加速卡上露过面了,代号Knights Landing的Xeon Phi加速卡配备了16GB板载缓存,号称5倍带宽、5倍能效于DDR4内存,它就是美光提供的HMC内存。
不过总体来看,HMC相对HBM来说还有点滞后,HBM在新一代显卡上站稳脚跟没问题,未来也会进入服务器等市场,HMC受到的支持力度不如HBM,不过3D内存技术现在还是新兴事物,现在给HBM、HMC作出最终判决还有点为时过早。2016年半导体/处理器技术的进步首先要依赖工艺升级,虽然10nm及7nm工艺还有点远,但2016年我们可以预期新一代处理器全面升级14/16nm FinFET工艺,这比去年的28nm、20nm工艺已经有很大进步了。不论是AMD、Intel的CPU还是AMD、NVIDIA的GPU,FinFET工艺都会带来20%以上的性能提升,30-40%的功耗降低,最终的CPU/GPU不仅性能更强,功耗也会大幅降低。