有序进化历代Core i7处理器性能大比拼
2017-02-28雷雨王旭
雷雨 王旭
十年前,当Intel处理器从奔腾D升级到Core 2 Duo,業界是用“雷霆一击”来形容,那是一种飞跃式的质的变化,功耗温度大降而性能大涨,随后的Core 2 Quad虽然是个胶水四核,不过多了两个核还是带来了相当大的性能提升,接下来的Nehalem架构实现了原生四核,内存控制器整合到CPU内部使得内存带宽大幅攀升,超线程技术的回归让CPU的多线程性能有了很大提升,后面的Sandy Bridge架构是对Nehalem的一次大改,CPU与GPU真正的融合在一起,性能有了全面的提升。
但是后面几代CPU的性能提升就相当小了,每一代都是几个百分点的性能升幅,这也让Intel这几年被玩家笑称为牙膏厂的原因,下面这个图也许不真是,但却非常欢快的说明了这个问题。
在2006年Intel提出了Tick-Tock战略,其中的Tick一环是指CPU工艺升级,Tock则是CPU架构升级,二者轮流交替,两年为一个周期,在Haswell架构之前Intel一直都是按照这个步伐一步步走过来的,2007年45nm工艺的Penryn处理器,2008年是同为45nm工艺的Nehalem架构,之后分别是32nm Westmere、32nm Sandy Bridge、22nm Ivy Bridge、22nm Haswell,22nm工艺是一个相当重要的节点,这是Intel首次投入实用的3D晶体管工艺,然而随后的14nm工艺Intel栽了个大跟斗,14nm工艺的延期迫使Intel放慢了前进的步伐。
实际上Intel现在的工艺技术路线已经变成了制程-架构-优化(Process-Architecture-Optimization),算是从之前的两步走改成三步走了,步调放缓了。
都在说Intel这几年来CPU的性能提升幅度不大,旧U还能继续战N年,那么最近几代Intel处理器到底有多大性能差距呢?今天我们要测试一下从第一代的Core i7-870开始到现在最新的Core i7-7700K共六款六代的酷睿处理器,看看各代之间到底有多大的差距。
不过在测试之前我们先来回顾下这几年来Intel的各代CPU架构。
一切的开端:Nehalem
08年推出的Nehalem微架构是一切的基础,Intel这几年的酷睿处理器微架构都是以它为基础,严格来说,Nehalem微架构仍是基于上一代Core微架构改进而来的,但它的改进是全方位的,计算内核的设计来源于之前的Core微架构,并对其进行了优化和加强,主要为重拾超线程技术、支持内核加速模式Turbo Boost和支持SSE4.2等方面,非计算内核的设计改动主要的有三级包含式Cache设计、使用QPI总线和整合内存控制器等重要改进。
Nehalem微架构采用可扩展的架构,主要是每个处理器单元均采用了Building Block模组化设计,组件包括有:核心数量、SMT功能、L3缓存容量、QPI连接数量、IMC数量、内存类型、内存通道数量、整合GPU、 能耗和时钟频率等,这些组件均可自由组合,以满足多种性能需求,比如可以组合成双核心、四核心甚至八核心的处理器,而且组合多个QPI连接更可以满足多路服务器的需求。
正因为这样的模组化设计,英特尔可以灵活的制造出各种差异化的核心,比如支持三通道DDR3的Bloomfield核心、支持双通道DDR3的Lynnfield和Clarkdale核心,而且这些核心间还存在是否支持超线程、Turbo Boost技术等区别,Clarkdale还整合了GPU图形单元。
在2009年9月,Intel推出基于Nehalem微架构的Lynnfield处理器,采用LGA 1156接口,它与Bloomfield的区别不单只在于内存通道数的差别,Lynnfield把PCI-E控制器整合到了CPU内部,而北桥其他功能与南桥一起整合到PCH里面,主板从三芯片变成了双芯片,形成了现在主板的基本布局。
2010年的Clarkdale只有双核设计,它把GPU也整合到CPU内部了,但是只是简单的将GPU和CPU封装在一起,并没有真正达到“融合”,一颗CPU里其实有两颗“芯”,CPU的制造工艺升级到了32nm而GPU部分则依然是旧的45nm工艺,它们采用QPI总线相连,对外则采用DMI总线连接PCH。
真正的双芯融合:Sandy Bridge
在2011年伊始,Intel就把微架构升级到新一代的Sandy Bridge,它真正将GPU与CPU融合,从以前的双U各立山头到合二为一,是非常大的突破, 内核架构也较Nehalem有了较大变化,这些变化包括:新的分支预测单元、新的Uop缓存、新的物理寄存器文件、有效执行256位指令、放弃QPI总线改用环形总线、最末级缓存LLC机制、新鲜的系统助理等。
AVX指令集的加入是Sandy Bridge最为重要的改进,浮点性能得以激增,新一代的Turbo Boost 2.0技术增强了Sandy Bridge自动提速的弹性,除CPU外还可对GFX进行加速,并随着系统负载的不同协调二者的频率升降,表现得更加智能化。
新一代图形核心具备出色的图形与多媒体性能,由于改用了环形总线设计,三级缓存可由CPU各核心、GPU核心与系统助理System Agent共享,可直接在L3内进行通信。GPU主要包含了指令流处理器、媒体处理器、多格式媒体解码器、执行单元、统一执行单元阵列、媒体取样器、纹理采样器以及指令缓冲等等,架构与上一代相比有了较大修改。
3D晶体管起航:Ivy Bridge
Ivy Bridge虽然说只是Sandy Bridge的工艺改良版,架构上没太大改变,不过对Intel来说却是一款相当重要的产品,因为它是首次采用22nm 3D晶体管工艺,是今后Intel半导体工艺的重要基础;另外CPU内部的PCI-E控制器也升级到了PCI-E 3.0标准,带宽提升了一倍,分配方式也更灵活;内核方面的改进说是提升了IPC每周期指令性能,SSE以及AVX指令也有所增强;整合GPU性能也有所提升,EU数从12个提升到16个,API支持也从DX10.1升级到了DX11。
更强图形性能与更为精确的功耗控制:Haswell
Haswell是Intel在2013年推出的全新微架構,该架构给人最深刻的印象就是把原来主板上的VRM模块整合到了CPU内部,FIVR调压模块的加入让主板的供电变得简单,并且可以对CPU内部的电压进行更为精确的控制,提高供电效率,实际上Haswell与Broadwell架构的产品是我见过电压最为稳定的Intel处理器。
指令集方面,Haswell增加了两个指令集,一个是针对多线程应用的TSX扩展指令,另一个是就是AVX指令的进阶版AVX2。还有一点就是从Haswell架构开始Intel的核显开始了模块化、可扩展的设计,就此走上了暴力堆砌核显规格的道路,最高级的核显拥有40个EU,还有大容量eDRAM作为L4缓存,可同时提升CPU与GPU性能。
其实在Haswell与Skylake之间还有个Broadwell,就是采用14nm工艺的Haswell处理器,不过Broadwell主要用在移动平台上,桌面级的Broadwell就两颗,而且国内没有正式上市所以没啥存在感,这里就不再做介绍了。
DDR4的时代到来:Skylake
Skylake可以说是自Sandy Bridge以来Intel最给力的一次升级了,CPU同时升级架构、工艺及核显,内存同时支持DDR3与DDR4,采用了更为先进的14nm工艺使得Skylake在频率提升、性能增强的同时功耗有了明显降低,而FIVR电压控制模块则被取消了,电压的控制也重新回到主板上。
Skylake处理器在超频上的改进可能让人眼前一亮,因为此前Intel对超频的限制颇多,全民超频的盛况早就不存在了,但Skylake处理器上,Intel虽然会继续限制倍频,但这次的BCLK外频限制没这么严了,外频能轻易超到125MHz以上,外频的解放更有助于极限超频玩家挑战更高记录。
核显方面,Skylake与Broadwell其实挺相似的,每组Subslice单元依旧是24个EU,但是整体规模变得越来越大了,Skylake最多可以扩展到3组Slice单元,也就是说最多会配备72个EU单元,因此Skylake也多出GT4这个级别的核显。
小修小补提升能耗比:Kaby Lake
Kaby Lake只是Skylake的优化版本,主要改善能耗比,然而这些在桌面版的处理器上表现并不明显,桌面版第七代处理器比较明显的区别只是频率高了。
Kaby Lake虽然都是使用14nm制程,不过Intel说他们对工艺进行了改良,Kaby Lake处理器上使用的新工艺使用了更高的鳍片与更宽的栅极间距,更高的鳍片意味着需要更小的驱动电流,这可减少漏电概率,而更宽的栅极间距这货会降低晶体管密度,这需要更高的电压但是可以降低生产难度,另外更宽的间距允许每个晶体管的产生的热有更多地方扩散,这有助降低内核温度并提升频率,这也是为什么Kaby Lake频率都比Skylake高但功耗则没什么变化的原因。
GPU方面Kaby Lake的核心与Skylake一样都是Gen 9,不过针对4K视频回放进行了改良,增加了H.265 Main.10、VP9 8/10-bit格式的硬件解码与编码,可大幅降低4K视频播放时的功耗,这对台式机来说可能不算什么,不过对移动设备来说降低功耗等同增加续航时间,这个是相当重要的。
说真的主板芯片组的变化可能是给消费者更新换代的更大原因,如果说这些年来LGA 115X平台CPU给人的感觉总体差别不大的话,主板更新换代的差别就是相当大了,PCI-E总线从2.0变3.0,存储接口从SATA 3Gbps慢慢进化到SATA 6Gbps到现在最新的M.2/U.2接口,USB接口从2.0到3.0再到现在最新的3.1,这些都是能看得到且相当实在的变化,再加上主板厂商每次都会在主板上加新花样,可以说主板带来的变化更有让人更新换代的冲动。
测试平台与说明
这次测试的处理器包括从Core i7-870到Core i7-7700K的六代Intel LGA 115X平台的处理器,Core i7-5775C是稀有品那个就算了,他们会搭配对应的主板,Core i7-7700K/6700K会使用DDR4内存,而其他处理器则使用DDR3内存,显卡采用GTX 1070 FE版,系统使用Windows 10 build 1607,显卡驱动是NVIDIA GeForce 372.70。
测试项目包括CPU基础性能测试与游戏性能测试,CPU性能测试用的都是基础性能测试软件,而游戏测试包括3DMark Fire Strike基准测试与《文明:超越地球》、《GTA 5》两个游戏,会分别对比CPU默认性能与4G同频下的性能差别,此外还有功耗与温度的测试,由于CPU超频后的电压会随不同CPU的体质而不同,所以只测试CPU默认频率下的功耗与温度。
默频测试
默认频率测试会让Intel的Turbo Boost自动调节处理器的频率,单核频率就是Turbo Boost的CPU的最高频率,而四核的Boost频率则分别是:Core i7-870 3.2GHz,Core i7-2600K 3.5GHz,Core i7-3770K 3.7GHz,Core i7-4770K 3.7GHz,Core i7-6700K 4.0GHz,Core i7-7700K 4.4GHz。由于默认频率设置的不同所以它们间的性能差距会比较明显。
可见从Core i7-870到Core i7-2600K与Core i7-4770K到Core i7-6700k再到Core i7-7700K的性能差异是相当大的,而Core i7-2600K到Core i7-3770K再到Core i7-4770K的差异则不算大,不过默频测试由于有频率的差别,有较大的一部分性能提升其实有由频率提升引起的。
游戏性能测试
游戏性能测试这里3DMark Fire Strike的成绩里面我们只取了物理得分来计算整体性能提升幅度,游戏测试的结果显示每代处理器之间都有10%以上的性能提升,总幅度没有基准性能测试那么明显。
4GHz同频测试
同频测试我们会把全部处理器频率都超到4GHz(对Core i7-6700K/7700K来说其实是降频),由于Core i7-870是通过超外频来达到4GHz的,所以内存频率也会小幅提升到1660MHz,不过这影响不会很大。
频率一样的话就能看得出各代架构间的真正差异了,Core i7-2600K与Core i7-870、Core i7-6700K与Core i7-4770K都是有10%的提升的,然而Core i7-2600K、Core i7-3770K、Core i7-4770K相互间只有个位数的差距,Core i7-6700K与Core i7-7700K基本上都一样的,其实从2009年的Core i7-870到2016年的Core i7-7700K在同频下性能差距也只有36%,用了7年才把性能提升这么多,怪不得Intel被人说他挤牙膏。
温度与功耗测试
温度与功耗测试我们会让CPU回到默认频率和电压下进行,负载工具是AIDA64稳定性测试里面的FPU测试,散热器用的是采融的黑豹。
功耗方面采用45nm工艺的Core i7-870自然是当仁不让最高的,Core i7-2600K这代工艺升级到了32nm,功耗大幅下降的同时频率还升了,这两代之间的升级是最明显的,Core i7-3770K工艺升级到了22nm 3D晶体管,频率升了200MHz的同时功耗与上代维持一致,Core i7-4770K虽然整合了FIVR调压模块,负载电压也是最低的,然而由于核显规格的暴涨,导致负载功耗不降反升,整合到CPU内部的FIVR可能也有一定的关系,Core i7-6700K的工艺升级到了14nm,移除了FIVR模块,再加上一系列优化,在频率提升的同時功耗也有较明显的下降,到了Core i7-7700K,工艺与架构都没有大改,然而频率升了10%,结果功耗又升上去了。
温度方面,Core i7-2600K表现其实是最好的,因为那时候Sandy Bridge用的还是导热性非常好的无钎剂焊料,再加上功耗较上代有很大的降低,所以满载温度才58℃,从Ivy Bridge开始Intel就把无钎剂焊料换成了普通的TIM硅脂,这导致Core i7-3770K后面的CPU温度都爆增,Core i7-4770K温度与Core i7-3770K差不多,到Core i7-6700K这一代功耗降下来后温度才有所下降,到了Core i7-7700K温度又升上去了。
从这个角度来看,Sandy Bridge确实是Intel近几年来最给力的一次升级。
总结:牙膏就是这么挤的,同频性能平均每代提升5%
从2009年的Core i7-870到2016年的Core i7-7700K,用了7年换了七代架构在同频下性能差距也只有35%,平均每代性能提升只有5%,如果默频下平均每代也差不多是10%的提升,所以说英特尔挤牙膏其实也无可厚非,当然这个只是CPU性能上的,这几年来Intel主要还是不断的在提升处理器的能耗比,提升核显性能,这些都是移动平台上所需要的,桌面处理器可以说只是一种附带品。
从Lynnfield升级到Sandy Bridge确实是质的改变,功耗大降性能明显提升,主板带来了SATA 6Gbps与USB 3.0接口,提升是相当明显的,CPU整合了核显让用户有了更多的选择。
Ivy Bridge则带来了PCI-E 3.0,主板上的USB 3.0也从第三方变成了原生,性能上的提升不算太明显,然而CPU温度暴增带来的负面影响就很明显。
Haswell整合了FIVE调压模块使得功耗控制相当精确,轻载时功耗会有明显下降,核显性能也有很大提升,然而这对桌面平台来说意义不大,Z87带来更多的SATA 6Gbps接口也没太大实际意义,带M.2接口的Z97主板作用到是大一点,然而那时的M.2 SSD并不亲民,而且Z97主板上那个PCI-E 2.0 x2接口的M.2口也限制了M.2 SSD的性能。
Skylake较Haswell来说性能提升了功耗也降了,虽然没有当年Lynnfield升到Sandy Bridge那么明显,不过也算近年来较给力的一次升级,而且Z170与Z97主板在规格上也有很大的差别,Z170一共有20条PCI-E 3.0通道,这使主板可以支持全速32Gbps的M.2与U.2接口,比Z97上那个M.2 10Gbps强多了。
Kaby Lake的体质较Skylake好得多,频率更高,而且中低端产品变化会比较明显,届时会有不锁倍频的Core i3处理器和双核四线程的奔腾处理器,此外还会带来全新的Intel Optane技术。
当然这里讨论的只是Intel主流平台LGA 115X,旗舰平台每代升级还是很明显的从当年的Core i7-965到现在最新的Core i7-6950X,从4核变成了10核,性能有多大差距就不用多说了。
然而Intel的表现比起对手AMD已经好得多了,Intel这几年的挤牙膏与AMD在CPU市场上低迷的表现肯定脱不了关系,AMD的挖掘机、推土机完全不是Intel的对手,没了竞争对手Intel自然也会放慢脚步,希望AMD明年的Zen给力一点把,不然Intel会继续挤牙膏的。□