有序进化历代Core i7处理器性能大比拼

2017-02-28雷雨王旭

个人电脑 2017年1期

雷雨王旭

十年前，当Intel处理器从奔腾D升级到Core 2 Duo，業界是用“雷霆一击”来形容，那是一种飞跃式的质的变化，功耗温度大降而性能大涨，随后的Core 2 Quad虽然是个胶水四核，不过多了两个核还是带来了相当大的性能提升，接下来的Nehalem架构实现了原生四核，内存控制器整合到CPU内部使得内存带宽大幅攀升，超线程技术的回归让CPU的多线程性能有了很大提升，后面的Sandy Bridge架构是对Nehalem的一次大改，CPU与GPU真正的融合在一起，性能有了全面的提升。

但是后面几代CPU的性能提升就相当小了，每一代都是几个百分点的性能升幅，这也让Intel这几年被玩家笑称为牙膏厂的原因，下面这个图也许不真是，但却非常欢快的说明了这个问题。

在2006年Intel提出了Tick-Tock战略，其中的Tick一环是指CPU工艺升级，Tock则是CPU架构升级，二者轮流交替，两年为一个周期，在Haswell架构之前Intel一直都是按照这个步伐一步步走过来的，2007年45nm工艺的Penryn处理器，2008年是同为45nm工艺的Nehalem架构，之后分别是32nm Westmere、32nm Sandy Bridge、22nm Ivy Bridge、22nm Haswell，22nm工艺是一个相当重要的节点，这是Intel首次投入实用的3D晶体管工艺，然而随后的14nm工艺Intel栽了个大跟斗，14nm工艺的延期迫使Intel放慢了前进的步伐。

实际上Intel现在的工艺技术路线已经变成了制程-架构-优化（Process-Architecture-Optimization），算是从之前的两步走改成三步走了，步调放缓了。

都在说Intel这几年来CPU的性能提升幅度不大，旧U还能继续战N年，那么最近几代Intel处理器到底有多大性能差距呢？今天我们要测试一下从第一代的Core i7-870开始到现在最新的Core i7-7700K共六款六代的酷睿处理器，看看各代之间到底有多大的差距。

不过在测试之前我们先来回顾下这几年来Intel的各代CPU架构。

一切的开端：Nehalem

08年推出的Nehalem微架构是一切的基础，Intel这几年的酷睿处理器微架构都是以它为基础，严格来说，Nehalem微架构仍是基于上一代Core微架构改进而来的，但它的改进是全方位的，计算内核的设计来源于之前的Core微架构，并对其进行了优化和加强，主要为重拾超线程技术、支持内核加速模式Turbo Boost和支持SSE4.2等方面，非计算内核的设计改动主要的有三级包含式Cache设计、使用QPI总线和整合内存控制器等重要改进。

Nehalem微架构采用可扩展的架构，主要是每个处理器单元均采用了Building Block模组化设计，组件包括有：核心数量、SMT功能、L3缓存容量、QPI连接数量、IMC数量、内存类型、内存通道数量、整合GPU、能耗和时钟频率等，这些组件均可自由组合，以满足多种性能需求，比如可以组合成双核心、四核心甚至八核心的处理器，而且组合多个QPI连接更可以满足多路服务器的需求。

正因为这样的模组化设计，英特尔可以灵活的制造出各种差异化的核心，比如支持三通道DDR3的Bloomfield核心、支持双通道DDR3的Lynnfield和Clarkdale核心，而且这些核心间还存在是否支持超线程、Turbo Boost技术等区别，Clarkdale还整合了GPU图形单元。

在2009年9月，Intel推出基于Nehalem微架构的Lynnfield处理器，采用LGA 1156接口，它与Bloomfield的区别不单只在于内存通道数的差别，Lynnfield把PCI-E控制器整合到了CPU内部，而北桥其他功能与南桥一起整合到PCH里面，主板从三芯片变成了双芯片，形成了现在主板的基本布局。

2010年的Clarkdale只有双核设计，它把GPU也整合到CPU内部了，但是只是简单的将GPU和CPU封装在一起，并没有真正达到“融合”，一颗CPU里其实有两颗“芯”，CPU的制造工艺升级到了32nm而GPU部分则依然是旧的45nm工艺，它们采用QPI总线相连，对外则采用DMI总线连接PCH。

真正的双芯融合：Sandy Bridge

在2011年伊始，Intel就把微架构升级到新一代的Sandy Bridge，它真正将GPU与CPU融合，从以前的双U各立山头到合二为一，是非常大的突破，内核架构也较Nehalem有了较大变化，这些变化包括：新的分支预测单元、新的Uop缓存、新的物理寄存器文件、有效执行256位指令、放弃QPI总线改用环形总线、最末级缓存LLC机制、新鲜的系统助理等。

AVX指令集的加入是Sandy Bridge最为重要的改进，浮点性能得以激增，新一代的Turbo Boost 2.0技术增强了Sandy Bridge自动提速的弹性，除CPU外还可对GFX进行加速，并随着系统负载的不同协调二者的频率升降，表现得更加智能化。

新一代图形核心具备出色的图形与多媒体性能，由于改用了环形总线设计，三级缓存可由CPU各核心、GPU核心与系统助理System Agent共享，可直接在L3内进行通信。GPU主要包含了指令流处理器、媒体处理器、多格式媒体解码器、执行单元、统一执行单元阵列、媒体取样器、纹理采样器以及指令缓冲等等，架构与上一代相比有了较大修改。

3D晶体管起航：Ivy Bridge

Ivy Bridge虽然说只是Sandy Bridge的工艺改良版，架构上没太大改变，不过对Intel来说却是一款相当重要的产品，因为它是首次采用22nm 3D晶体管工艺，是今后Intel半导体工艺的重要基础；另外CPU内部的PCI-E控制器也升级到了PCI-E 3.0标准，带宽提升了一倍，分配方式也更灵活；内核方面的改进说是提升了IPC每周期指令性能，SSE以及AVX指令也有所增强；整合GPU性能也有所提升，EU数从12个提升到16个，API支持也从DX10.1升级到了DX11。

更强图形性能与更为精确的功耗控制：Haswell

Haswell是Intel在2013年推出的全新微架構，该架构给人最深刻的印象就是把原来主板上的VRM模块整合到了CPU内部，FIVR调压模块的加入让主板的供电变得简单，并且可以对CPU内部的电压进行更为精确的控制，提高供电效率，实际上Haswell与Broadwell架构的产品是我见过电压最为稳定的Intel处理器。

指令集方面，Haswell增加了两个指令集，一个是针对多线程应用的TSX扩展指令，另一个是就是AVX指令的进阶版AVX2。还有一点就是从Haswell架构开始Intel的核显开始了模块化、可扩展的设计，就此走上了暴力堆砌核显规格的道路，最高级的核显拥有40个EU，还有大容量eDRAM作为L4缓存，可同时提升CPU与GPU性能。

其实在Haswell与Skylake之间还有个Broadwell，就是采用14nm工艺的Haswell处理器，不过Broadwell主要用在移动平台上，桌面级的Broadwell就两颗，而且国内没有正式上市所以没啥存在感，这里就不再做介绍了。

DDR4的时代到来：Skylake

Skylake可以说是自Sandy Bridge以来Intel最给力的一次升级了，CPU同时升级架构、工艺及核显，内存同时支持DDR3与DDR4，采用了更为先进的14nm工艺使得Skylake在频率提升、性能增强的同时功耗有了明显降低，而FIVR电压控制模块则被取消了，电压的控制也重新回到主板上。

Skylake处理器在超频上的改进可能让人眼前一亮，因为此前Intel对超频的限制颇多，全民超频的盛况早就不存在了，但Skylake处理器上，Intel虽然会继续限制倍频，但这次的BCLK外频限制没这么严了，外频能轻易超到125MHz以上，外频的解放更有助于极限超频玩家挑战更高记录。

核显方面，Skylake与Broadwell其实挺相似的，每组Subslice单元依旧是24个EU，但是整体规模变得越来越大了，Skylake最多可以扩展到3组Slice单元，也就是说最多会配备72个EU单元，因此Skylake也多出GT4这个级别的核显。

小修小补提升能耗比：Kaby Lake

Kaby Lake只是Skylake的优化版本，主要改善能耗比，然而这些在桌面版的处理器上表现并不明显，桌面版第七代处理器比较明显的区别只是频率高了。

Kaby Lake虽然都是使用14nm制程，不过Intel说他们对工艺进行了改良，Kaby Lake处理器上使用的新工艺使用了更高的鳍片与更宽的栅极间距，更高的鳍片意味着需要更小的驱动电流，这可减少漏电概率，而更宽的栅极间距这货会降低晶体管密度，这需要更高的电压但是可以降低生产难度，另外更宽的间距允许每个晶体管的产生的热有更多地方扩散，这有助降低内核温度并提升频率，这也是为什么Kaby Lake频率都比Skylake高但功耗则没什么变化的原因。

GPU方面Kaby Lake的核心与Skylake一样都是Gen 9，不过针对4K视频回放进行了改良，增加了H.265 Main.10、VP9 8/10-bit格式的硬件解码与编码，可大幅降低4K视频播放时的功耗，这对台式机来说可能不算什么，不过对移动设备来说降低功耗等同增加续航时间，这个是相当重要的。

说真的主板芯片组的变化可能是给消费者更新换代的更大原因，如果说这些年来LGA 115X平台CPU给人的感觉总体差别不大的话，主板更新换代的差别就是相当大了，PCI-E总线从2.0变3.0，存储接口从SATA 3Gbps慢慢进化到SATA 6Gbps到现在最新的M.2/U.2接口，USB接口从2.0到3.0再到现在最新的3.1，这些都是能看得到且相当实在的变化，再加上主板厂商每次都会在主板上加新花样，可以说主板带来的变化更有让人更新换代的冲动。

测试平台与说明

这次测试的处理器包括从Core i7-870到Core i7-7700K的六代Intel LGA 115X平台的处理器，Core i7-5775C是稀有品那个就算了，他们会搭配对应的主板，Core i7-7700K/6700K会使用DDR4内存，而其他处理器则使用DDR3内存，显卡采用GTX 1070 FE版，系统使用Windows 10 build 1607，显卡驱动是NVIDIA GeForce 372.70。

测试项目包括CPU基础性能测试与游戏性能测试，CPU性能测试用的都是基础性能测试软件，而游戏测试包括3DMark Fire Strike基准测试与《文明：超越地球》、《GTA 5》两个游戏，会分别对比CPU默认性能与4G同频下的性能差别，此外还有功耗与温度的测试，由于CPU超频后的电压会随不同CPU的体质而不同，所以只测试CPU默认频率下的功耗与温度。

默频测试

默认频率测试会让Intel的Turbo Boost自动调节处理器的频率，单核频率就是Turbo Boost的CPU的最高频率，而四核的Boost频率则分别是：Core i7-870 3.2GHz，Core i7-2600K 3.5GHz，Core i7-3770K 3.7GHz，Core i7-4770K 3.7GHz，Core i7-6700K 4.0GHz，Core i7-7700K 4.4GHz。由于默认频率设置的不同所以它们间的性能差距会比较明显。

可见从Core i7-870到Core i7-2600K与Core i7-4770K到Core i7-6700k再到Core i7-7700K的性能差异是相当大的，而Core i7-2600K到Core i7-3770K再到Core i7-4770K的差异则不算大，不过默频测试由于有频率的差别，有较大的一部分性能提升其实有由频率提升引起的。

游戏性能测试

游戏性能测试这里3DMark Fire Strike的成绩里面我们只取了物理得分来计算整体性能提升幅度，游戏测试的结果显示每代处理器之间都有10%以上的性能提升，总幅度没有基准性能测试那么明显。

4GHz同频测试

同频测试我们会把全部处理器频率都超到4GHz（对Core i7-6700K/7700K来说其实是降频），由于Core i7-870是通过超外频来达到4GHz的，所以内存频率也会小幅提升到1660MHz，不过这影响不会很大。

频率一样的话就能看得出各代架构间的真正差异了，Core i7-2600K与Core i7-870、Core i7-6700K与Core i7-4770K都是有10%的提升的，然而Core i7-2600K、Core i7-3770K、Core i7-4770K相互间只有个位数的差距，Core i7-6700K与Core i7-7700K基本上都一样的，其实从2009年的Core i7-870到2016年的Core i7-7700K在同频下性能差距也只有36%，用了7年才把性能提升这么多，怪不得Intel被人说他挤牙膏。

温度与功耗测试

温度与功耗测试我们会让CPU回到默认频率和电压下进行，负载工具是AIDA64稳定性测试里面的FPU测试，散热器用的是采融的黑豹。

功耗方面采用45nm工艺的Core i7-870自然是当仁不让最高的，Core i7-2600K这代工艺升级到了32nm，功耗大幅下降的同时频率还升了，这两代之间的升级是最明显的，Core i7-3770K工艺升级到了22nm 3D晶体管，频率升了200MHz的同时功耗与上代维持一致，Core i7-4770K虽然整合了FIVR调压模块，负载电压也是最低的，然而由于核显规格的暴涨，导致负载功耗不降反升，整合到CPU内部的FIVR可能也有一定的关系，Core i7-6700K的工艺升级到了14nm，移除了FIVR模块，再加上一系列优化，在频率提升的同時功耗也有较明显的下降，到了Core i7-7700K，工艺与架构都没有大改，然而频率升了10%，结果功耗又升上去了。

温度方面，Core i7-2600K表现其实是最好的，因为那时候Sandy Bridge用的还是导热性非常好的无钎剂焊料，再加上功耗较上代有很大的降低，所以满载温度才58℃，从Ivy Bridge开始Intel就把无钎剂焊料换成了普通的TIM硅脂，这导致Core i7-3770K后面的CPU温度都爆增，Core i7-4770K温度与Core i7-3770K差不多，到Core i7-6700K这一代功耗降下来后温度才有所下降，到了Core i7-7700K温度又升上去了。

从这个角度来看，Sandy Bridge确实是Intel近几年来最给力的一次升级。

总结：牙膏就是这么挤的，同频性能平均每代提升5%

从2009年的Core i7-870到2016年的Core i7-7700K，用了7年换了七代架构在同频下性能差距也只有35%，平均每代性能提升只有5%，如果默频下平均每代也差不多是10%的提升，所以说英特尔挤牙膏其实也无可厚非，当然这个只是CPU性能上的，这几年来Intel主要还是不断的在提升处理器的能耗比，提升核显性能，这些都是移动平台上所需要的，桌面处理器可以说只是一种附带品。

从Lynnfield升级到Sandy Bridge确实是质的改变，功耗大降性能明显提升，主板带来了SATA 6Gbps与USB 3.0接口，提升是相当明显的，CPU整合了核显让用户有了更多的选择。

Ivy Bridge则带来了PCI-E 3.0，主板上的USB 3.0也从第三方变成了原生，性能上的提升不算太明显，然而CPU温度暴增带来的负面影响就很明显。

Haswell整合了FIVE调压模块使得功耗控制相当精确，轻载时功耗会有明显下降，核显性能也有很大提升，然而这对桌面平台来说意义不大，Z87带来更多的SATA 6Gbps接口也没太大实际意义，带M.2接口的Z97主板作用到是大一点，然而那时的M.2 SSD并不亲民，而且Z97主板上那个PCI-E 2.0 x2接口的M.2口也限制了M.2 SSD的性能。

Skylake较Haswell来说性能提升了功耗也降了，虽然没有当年Lynnfield升到Sandy Bridge那么明显，不过也算近年来较给力的一次升级，而且Z170与Z97主板在规格上也有很大的差别，Z170一共有20条PCI-E 3.0通道，这使主板可以支持全速32Gbps的M.2与U.2接口，比Z97上那个M.2 10Gbps强多了。

Kaby Lake的体质较Skylake好得多，频率更高，而且中低端产品变化会比较明显，届时会有不锁倍频的Core i3处理器和双核四线程的奔腾处理器，此外还会带来全新的Intel Optane技术。

当然这里讨论的只是Intel主流平台LGA 115X，旗舰平台每代升级还是很明显的从当年的Core i7-965到现在最新的Core i7-6950X，从4核变成了10核，性能有多大差距就不用多说了。

然而Intel的表现比起对手AMD已经好得多了，Intel这几年的挤牙膏与AMD在CPU市场上低迷的表现肯定脱不了关系，AMD的挖掘机、推土机完全不是Intel的对手，没了竞争对手Intel自然也会放慢脚步，希望AMD明年的Zen给力一点把，不然Intel会继续挤牙膏的。□