无电不欢
2021-11-13张平
张平
对电源供电的需求,在功耗1W的智能手机处理器和200W级别的高性能服务器处理器上同样存在,甚至对功耗高达15kW的处理器也是如此。为了保证处理器能够运行在设计频率下并发挥正常性能,现代处理器中的每个晶体管和相关电路都需要运行在合适的电压下。如果电压太低,那么處理器的速度就会降低,数据计算可能会出错,这会影响处理器的稳定性,甚至出现故障。
由于硅的特性,在现有工艺下处理器大多工作在1V左右的电压下。如果采用FinFET或者其他先进技术的处理器,额定电压范围一般在650mV~1.2V之间。创新的电路设计可以使用接近晶体管阈值电压的电源电压,英特尔近期产品采用的阈值电压证明了这一点。一个非常重要的技术特性是:开关电路(比如处理器)的功耗与电压的平方成正比,因此降低电压对提升能耗比效率非常关键。这会导致一个两难的情况:电压需要足够高以避免出错,但是又不能太高,这样会导致功耗无法控制。
另外在1V左右的电压下,如何处理如此巨大的电流也是一个难题。目前高端服务器处理器的功耗在200W左右,这意味着处理器和相关配套电路需接受200A的电流才能正常工作。当然对现代处理器而言,由于不同的电压域和电源域的存在,实际情况还要复杂很多。但有一个数据是非常明确的,就是在功耗基本不变的情况下,降低电压意味着增大电流。如果将200W处理器的工作电压降低至0.75V,那么相应的工作电流则会提升至267A。不仅如此,对一些规模更大的芯片比如GPU而言,其TD P功耗更高,可达450W~600W,因此其电流数值更为夸张。
在传输电能时,一般会使用较高的电压和较低的电流,这是因为较低的电流可以降低线路电阻的损耗,这也在很大程度上降低了成本以及电阻带来的热量。电阻热损失和电流的平方成正比,因此增加电压减少电流会降低电阻热损失,这也是目前高压输电和特高压输电的原理之一。一些大型数据中心在服务器内部的电压是12V,只有一些新的数据中心使用48V传输电能以提高效率,尤其是那些功耗非常高的产品。
上述所有因素形成了现代处理器供电所需要面临的综合问题:在整个系统中既要以较高电压运输电能以维持较高的传输效率,还需要转换至一个较低且又不那么低的电压并保持稳定,以维持处理器计算的稳定和可靠。由于各种物理条件限制,人们不得不在狭窄的区域内辗转腾挪,以获取最好的供电效果。
处理器所需要的供电网络
对于处理器来说,供电所需要的网络是一个完整的系统,从主电源开始一直延伸至处理器的供电模块,最终抵达每个需要执行计算的晶体管。对台式机而言,这个转换过程是从110V或者220V的交流电转换为12V的直流电,电流将从主板的电源接口分配至所有部件。对手机或者笔记本电脑而言,情况比较复杂,比如这些设备往往会使用3.7V的直流输出,因此不存在交流到直流的转换,只是电压的提升(或者降低)。但考虑到电流在12V时最高可达20A~30A,因此这里的直流降压效率相比从高压的交流电转换至直流电要低一些。
对于标准处理器而言,电压调节模块(VRM)的转换电压约为1V。V R M一般被放置在靠近处理器的地方,这样电源传输大多使用的是主板上的12V信号,较高的电压会降低损耗。1V电源在主板上只传输很短的距离,从主板上处理器电源转换模块出发,通过处理器接口的一组凸点(或者处理器上的针脚)进入处理器本身。处理器包含一个从凸点伸出的电源网,并使用各种金属互联层向处理器上的晶体管输送电源。主板电压调节器的速度相当慢,工作频率在1M H z左右,这意味着V R M只能每微秒调整一次输出电压。
基于英特尔的系统遵循同样的原则,但在电力输送方面多了一个特殊的处理阶段。这就是英特尔在很多处理器中集成的FI VR或全集成电压调节器。FIVR或者类似功能的部件被集成在处理器内部,并向不同块的几十个电源轨提供电能。从Haswell开始,大多数服务器处理器都使用了FIVR,同期的Haswell和Broadwell客户端处理器也同样开始使用FIVR,直到前不久的Ice Lake和Tiger Lake。在这些系统中,主板VRM将12V(或48V)信号转换为约1.8V,从V R M传输,穿过主板、插座和处理器引脚,进入FIVR。FIVR负责电源转换的最后阶段,最终将电压从1.8V左右降至1V左右,这取决于特定模块的电源轨的参数。值得注意的是,Skylake和其衍生处理器产品不使用FIVR。
FIVR有一个显著的优点,从主板V R M输送到处理器的电压大约是传统系统的两倍。使用更高的电压可以在相同功耗下使电流降低至之前的一半,这不但可以减少电源引脚的数量,还能够在一定程度上提高效率。缺点是电压转换从来都不是100%有效的,即使FIVR效率再高,它的电压降低也会带来一些功耗损失和额外的热能。在这里,降低电能传输损失和降低电能转换损失之间存在一个平衡点,这在很大程度上取决于具体的情况。对于功率较高的处理器来说,由于电流需求巨大,因此降低电能传输损失带来的能源节省更为明显,反之则降低电能转换损失更为重要。此外,由于集成在C P U中并采用较高级的工艺,FIVR的速度非常快—它的工作频率为140M H z,比主板的VRM快两个数量级。
还不够快的供电电路
FI VR采用如此高的频率运作,其背后的原因是现代处理器电源传输所面临的最大挑战,那就是传统专注于稳态功率和热特性(如TDP)的功耗、电源工作思路,很大程度上低估了电源传输问题的严重性。举例来说,现代处理器是动态的,它们的行为会根据工作负载而改变。当单个晶体管开关时,它需要相对较小的电流。然而,如果许多晶体管同时开关,总的电流消耗会变得很大,并在片上电源上产生噪音。在CPU或GPU这样大规模、高频率芯片中,晶体管的开关数量在不同周期中会有很大变化。当CPU内核开始执行AVX512乘积运算时,其耗电量要比简单执行整数运算大得多。同样,动态电压和频率调整系统(DVFS)将根据工作负载或操作条件的变化,即时改变处理器频率和电压。这些突然出现的电流峰值会导致电压暂时下降。