新“芯”向荣 英特尔第四代酷睿智能处理器
2013-04-29王丁王旭
王丁 王旭
制作本期专题的内容时,我们和英特尔公司签署的保密协议还没有到期;当然,杂志印刷出来捧在读者手中时,英特尔公司已经正式发布了Haswell——第四代酷睿智能处理器。全新的架构能带来多大的性能提升,新平台又有哪些技术进步,是否值得马上升级你的PC?那就跟随我们一起来领略第四代酷睿平台的魅力吧。
Tick-Tock这个名称源于钟表上秒针行走时所发出的嘀嗒声,英特尔公司在2007年正式提出了以此命名的发展战略模式,为其芯片设计制造业务规划出一个可持续的发展框架——将处理器微架构的更新和芯片制造工艺升级的时机错开,Tick代表着制造工艺的进步,例如从32纳米的Sandy Bridge到22纳米的Ivy Bridge,架构没有发生变化,性能提升不大,只是缩小了芯片面积、降低功耗和发热量;而Tock则意味着微架构的变化,例如同样32纳米的Sandy Bridge就采用了与Westmere不同的架构,还有这次专题的主角——Haswell,它和同样基于22纳米制造工艺的Ivy Bridge也是两种不同的架构。也就是说,英特尔公司以两年为一个周期,在Tick年提升制造工艺,在Tock年改变处理器的微架构,从而让自己的芯片设计制造业务有规划、有效率地发展下去。
一般来说,普通家庭中一台PC的使用寿命大约是四到五年,当然也有两种例外,一种是坚持使用十年前的Windows XP系统、平时只上上网看看新闻,不玩PC游戏不看高清,甚至有可能还没跨入酷睿的时代;另一种则是走另一个极端的发烧友用户,电脑的配置始终要和最新一代的技术规格保持同步,按照英特尔的Tick-Tock战略,他们几乎一年就要升级一次PC。对于游戏发烧友来说,不需要别人去说服他升级或更换PC,只要他觉得自己的电脑在运行热门游戏时已经显得力不从心,就会主动萌生这个想法。而对于那些在PC的投资上特别保守的人来说,你很难用技术规格的进步、性能提升的比例来打动他;当然,这里还包括受购买能力的限制和对PC依赖程度很低(靠笔记本或平板电脑来实现娱乐功能)这两种可能。所以,我们这篇文章的目标读者是那些关注核心技术进步、日常生活中对PC有依赖性(纵然不热衷于高负载的3D游戏,起码也是以PC为常用的多媒体娱乐工具)的人群。如果你的电脑还停留在Sandy Bridge以前的规格,确实应该考虑考虑更新一下配置了。
介绍Haswell处理器之前,我们不妨先来回顾一下Tick-Tock战略发布以来的英特尔处理器发展历程。
2006年6月
Core架构的问世堪称是英特尔X86处理器发展道路上的一个里程碑,在此之前NetBurst架构的发展已经明显遭遇了瓶颈——尽管制造工艺从90纳米进化到65纳米,但是Pentium D处理器功耗过高的问题却没得到明显的改善,4GHz基本已经成为NetBurst架构的频率极限,10GHz的Nehalem计划只能胎死腹中(老外也喜欢放卫星啊)。Core架构的诞生,彻底解决了英特尔处理器散热量过高的问题,也标志着主频至上的策略从此被“每瓦性能”的策略所取代。第一代Core架构的桌面级处理器核心代号为Conroe,这两个单词的发音对于不懂英语的人来说比较容易混淆,因此在电脑卖场里经常能听到商家称其为“扣肉”。而处理器的正式命名Core 2 Duo也让人感到莫名其妙——明明是第一代Core架构的处理器,为什么却叫Core 2 Duo?实际上,Core Duo处理器也确实存在,只不过没有应用在台式机上,而移动平台又是主打迅驰的整体概念,因此不太受人关注。
2007年11月
英特尔将Core架构的制造工艺水平提高到45纳米,以Penryn作为开发代号(实际上就取自这一代移动处理器的核心代号),桌面级双核处理器的核心代号为Wolfdale、四核处理器的核心代号为Yorkfield。相对于前一代产品来说,只是增加了二级缓存的容量,性能有小幅提升,TDP(热功耗)还维持在65W和95W不变。
2008年11月
英特尔推出了基于45纳米工艺的新架构——Nehalem,是不是觉得这个代号有点熟?没错,就是之前提到过的那个胎死腹中的10GHz处理器,英特尔难以割舍这个名字,又把它用于新架构的命名了。从这一代产品开始,英特儿放弃了Core 2 Duo的命名方式,改为Core i7/5/3的商标,也就是第一代酷睿智能处理器。Nehalem处理器在接口规格方面比较混乱,既有LGA 1366的规格——对应Bloomfield核心的Core i7 9xx(姑且把它看作是Core 2 Extreme至尊版的延续也未尝不可),也有LGA 1156的规格——对应Lynnfield核心的Core i7 8xx以及Core i5处理器。Nehalem架构的诞生也带来了翻天覆地的变化,比如用QPI(Quick Path Interconnect)取代了使用多年的前端总线(FSB),将内存控制器集成到CPU中,支持三通道DDR3规格的内存,北桥芯片的传统功能基本上已经被架空了。由于Bloomfield Core i7处理器 + X58芯片组主板 + 三通道DDR3内存的整体成本太高,不利于新平台的推广,于是英特尔公司才推出了“缩水版”的Lynnfield——集成双通道DDR3内存控制器,搭配价格相对低廉的P55芯片组平台,取代Core 2 Quad四核处理器的位置。
2010年1月
Nehalem架构迈入了32纳米的制造工艺,英特尔称其为Westmere。按照Tick-Tock战略的规划,这次Tick变化本应发生在2009这一奇数年,英特尔公司这次的动作略有些迟缓,在2010年1月才正式发布,从自然年来看好像是滞后了一年,实际上距离上一次Tock变化也就是13个月多一点。这一代产品的技术进步并不仅限于制造工艺方面,将显示单元从北桥芯片中挪到处理器封装内,也是一项创举;只不过运算单元和图形单元的工艺并不同步——前者已经跨入32纳米时代,后者还停留在45纳米阶段,它们只是被一起封装在处理器的散热外壳下,彼此相对独立。英特尔平台的集成显示方案从主板上的Graphics Media Accelerator变成了处理器内部的HD Graphics。
2011年1月
第二代酷睿智能处理器——Sandy Bridge问世,虽然这属于一次架构的变化,但是其中也包含了图形芯片的工艺改进,达到了与CPU运算单元同步的32纳米工艺,同时还获得了一个“核芯显卡”的新称谓。此外,Sandy Bridge架构中还引入了全新的AVX(Advanced Vector Extensions)指令集,英特尔公司宣称在AVX指令集的帮助下,矩阵运算的速度远远高于SSE指令集,并且其SIMD(Single Instruction, Multiple Data)演算单元的位宽也从128bit提升为256bit,这对于缩减核心面积带来了很大的帮助。在处理器的命名方式上,Sandy Bridge依然沿用Core i7/i5/i3的商标,只是将数字编号由三位数调整为2开头的四位数,以表明其第二代酷睿智能处理器的身份。架构的变化,自然就意味着芯片组平台的变迁,虽然只是从LGA 1156到LGA 1155这么“一pin之差”,但是Sandy Bridge处理器已经无法再兼容5系列芯片组平台,英特尔推出了Z68、Q67、P67、H67、H61等一系列平台与之匹配。
2012年4月
核心代号为Ivy Bridge的英特尔X86处理器迈入了22纳米制造工艺的阶段,也宣布了第三代酷睿智能处理器的问世。伴随着制造工艺水平的提升,Ivy Bridge核心还引入了创新的3D晶体管技术,从二维到三维的演变无疑会显著增加单位面积下的数据流通行效率,就好比修建了高架桥和隧道的道路,要比单一的地面道路通行效率更高。虽然第三代酷睿和第二代酷睿之间并没有发生架构的变化,也可以兼容6系列的芯片组平台;不过英特尔还是推出了涵盖原生USB 3.0、SATA 6Gbps、PCI-E 3.0等先进规格的7系列芯片组,下文介绍8系列芯片组平台时我们就以Z77和Z87作为比较对象。有一点需要单独说明,在这个阶段代表着英特尔桌面级处理器最高性能的产品并不是Ivy Bridge核心的Core i7-3770K,而是基于32纳米工艺的Sandy Bridge-E处理器(相当于至尊版或者Bloomfield的延续),它采用LGA 2011的封装方式,只能搭配Intel X79芯片组平台来使用;而22纳米的至尊版产品(Ivy Bridge-E)则是在Haswell的产品周期内才会上市。
2013年6月
英特尔发布Haswell架构的第四代酷睿智能处理器平台,前面铺垫了这么多,终于说到正题了,那就让我们一起来看看它的新特性吧。
处理器部分
既然定义为第四代酷睿智能处理器,那在命名方式上也毫无悬念,一定是符合Core i7-4770、Core i5-4670/4570的规则。至于字母后缀的含义,K、M、S、T、U都是我们熟悉的规格,移动平台中增加了H和Y两种规格,其中H后缀可以看作是M后缀的显示性能增强版(关于显示核心的类别以及锐炬显卡的细节,在下文会有详细描述),而Y后缀则是比U后缀功耗更低的版本,专为可变形超极本而打造;在桌面平台中增加了一个R后缀,实际上也只有Core i7-4770R这么一款产品,也是唯一一款集成了锐炬显卡的桌面级处理器,据称是特供苹果iMac一体机的,不会在零售市场上销售。
关于处理器的运算性能部分,并没有太多可以诉之于笔墨的文字。简单一句话,22纳米工艺下更成熟的架构以及新指令(AVX2)的扩展,让Haswell具备明显优于Ivy Bridge的性能。所谓更成熟的架构,就是指环形总线的设计,它可以更容易地实现各个单元之间的连接;而升级到256位的AVX2指令集则是让CPU的浮点运算性能提升了一倍。除了基本性能提升之外,第四代酷睿处理器在超频方面也有得天独厚的优势,在以往的主板电路中,必须设计不同的VR(电压调节器)来分别控制CPU、GPU、I/O等不同部件的电压,用户通过微调这些参数来获得更好的稳定性或超频性能。但是在Haswell架构中,这些调节器全部整合到了CPU之中,主板只需要设计一个VR,其他的微调交给CPU完成,大大降低了主板的供电设计难度,同时也大大简化了超频的操作。
与其细抠那些枯燥晦涩的专业词汇,去探询Haswell性能提升的理论依据,倒不如用事实说话,从下面三组数据的对比中就可以看出,无论是高端的Core i7-4770K、还是主流的Core i5-4670,运算性能都要比与之对应的Ivy Bridge处理器提高了10% 左右。
尽管Haswell的架构变化,给处理器的运算性能带来了明显的提升,不过这还不是最令人激动的环节,核芯显卡的变化才是第四代酷睿智能处理器中的最大亮点。英特尔第一款集成图形单元的处理器是32纳米的Clarkdale Core i3,其中运算单元基于32纳米的制造工艺,而图形单元还停留在45纳米工艺的阶段,在一些第三方的硬件检测工具中,它就被识别成HD Graphics 1000;从Sandy Bridge开始,英特尔正式提出了核芯显卡的概念,包括代号为GT1和GT2的两种规格,对应的正式名称分别为HD Graphics 2000和HD Graphics 3000,前者包含6个执行单元,后者为12个执行单元;到了Ivy Bridge这一代,仍然是分为GT1和GT2两种规格,只不过命名变成了HD Graphics 2500和HD Graphics 4000,前者的执行单元数量没有变化还是6个,后者的执行单元数量提升到16个。具体到处理器型号与图形核心的搭配上,规律性不是很强,尤其是桌面级处理器的规格更是略显混乱——在第二代酷睿处理器家族中,只有以K结尾的不锁频型号以及以5结尾的型号会采用GT2核芯显卡(即HD Graphics 3000),而其他产品则提供GT1核芯显卡(HD Graphics 2000)。但是在第三代台式机酷睿处理器家族中,这一政策并未完全延续下来。因为从目前英特尔已经公布的规格来看,所有酷睿i7产品,无论其是以K结尾的不锁频版本,还是以T或S结尾的低功耗版本,搭载的都是GT2核芯显卡(即HD Graphics 4000);只有酷睿i5处理器保持了与二代酷睿相同的组合——不锁频版本搭载HD Graphics 4000,其它搭载HD Graphics 2500。在笔记本平台上,与第二代一样,所有第三代酷睿处理器搭配的都是GT2核芯显卡(即HD Graphics 4000)。
上面这段话看起来够绕的吧?到了Haswell这一代产品,图形单元的分类就更加复杂且无规律可循了。Haswell的图形单元包含GT1、GT2和GT3三种核心代号,其中GT3又分为15瓦、28瓦和GT3e这三个版本,GT3(15瓦)对应的正规命名为Intel HD Graphics 5000,而GT3(28瓦)和GT3e对应的正规命名为Intel Iris 5100和Intel Iris Pro 5200。Iris是英特尔公司为其图形芯片注册的一个新商标,其中文名叫锐炬(Iris Pro翻译为锐炬Pro——居然还是中英文混搭)。从英特尔官方给出的对比数据来看,以3DMark11的Performance模式为测试脚本,锐炬5100显卡(Core i7-4558U)相对于核芯显卡4000(Core i7-3687U)的性能提升基本是翻了一番,已经超过了目前入门级独立显卡的水平,也就是说下一代超极本中部分产品的3D性能应该能达到GeForce GT 640的水平。对于台式机用户来说,目前已知的桌面级处理器绝大多数都采用GT2的核心,只有一款特供苹果iMac的型号—Core i7-4770R集成了锐炬Pro的显示核心,恐怕大部分消费者是无从体验的(不过话又说回来了,有多少肯花两千元买颗CPU的人,不搭配个中高端的独立显卡,只用它的核芯显卡呢,所以说英特尔为Core i7/i5级别的桌面级处理器搭配GT2显示核心也算是明智的;至于未来的Haswell架构Core i3处理器搭配哪种核显,现在还不得而知)。至于GT1核心,我们只知道它的正规名称叫Intel HD Graphics(没有任何数字序号),其它细节目前还不得而知,据推测应该是应用于下一代的奔腾和赛扬处理器中。在移动平台中,据说会增加一种H后缀的四核处理器,热设计功耗为47瓦,就是采用了GT3e显示核心、也就是核芯显卡里的最高规格—锐炬Pro,至于这类处理器会被应用到什么样的笔记本中,现在还难以判断。从技术规格来说, Haswell核芯显卡也有很多进步,例如支持DirectX 11.1、OpenGL 4.0、OpenCL 1.2的接口规范,支持4K×2K的分辨率,另外在三屏输出的操作上也更加简单——选择任意三个视频输出接口即可实现,比起Ivy Bridge核芯显卡必须要依靠两个DisplayPort接口才能实现三屏输出的解决方案,显然是靠谱多了。
在第四代酷睿智能处理器问世之前,一体式电脑和超极本就已经成为桌面市场和移动计算领域中的生力军。新的Haswell架构不仅在计算性能上相对新一代产品继续攀升,而且还提供了前一代的图形引擎,3D性能呈指数型提升,堪称是核心计算领域内近十年来最伟大的创新。在它的推动下,超极本、一体机、以及NUC这类的迷你型产品都将迎来更大的发展空间,在运算性能大幅提升的同时,也会呈现出更丰富多样的应用模式。
芯片组部分
既然第四代酷睿智能处理器已经发生了架构的变化,显然也就意味着不再兼容上一代的芯片组平台,因此与LGA 1150封装的Haswell处理器相匹配的英特尔8系列芯片组也就一同诞生了。我们最早看到的产品是面向高端消费市场的Z87芯片组,它也是完全开放超频功能的唯一平台,如果要体验不锁倍频(K后缀的处理器)的Core i7-4770K,必然要搭配Intel Z87芯片组平台。我们在第一时间拿到了一款技嘉的Z87主板——GA-Z87X-UD3H,根据它的命名规则,我们可以看出这是一款采用二倍铜PCB和全固态电容的主流平台,下面我们就结合着这款产品来介绍8系列芯片组的技术规格。
8系列芯片组最大的变化就是增加了原生高速接口的数量,此前Z77主板能够提供4个原生USB 3.0接口、2个原生SATA 6Gbps接口以及1条PCI-E 3.0插槽的支持;而到了8系列芯片组,原生USB 3.0接口的数量会从4个变为6个、原生SATA 6Gbps接口数量会从2个变为6个,从而能够更好地适应高速外置存储设备的连接。
另外7系列主板中的Rapid Storage技术在8系列芯片组中也得到升级,除了大幅优化SSD硬盘的支持外,新的快速储存技术还能提供三项重大的新技术:利用内存作缓存加速的“快速同步”,通过动态调整供电状态为磁盘加速的动态磁盘加速器;基于UEFI技术的极速启动支持。