APP下载

VR普及的奠基石

2016-08-26

电脑爱好者 2016年13期
关键词:联发科刷新率功耗

4K显示和VR技术必然是智能手机未来的发展趋势,然而现有的移动处理器技术却难以驾驭这些新特性。为此,ARM祭出了Cortex A73处理器和Mali G71 GPU两大杀器,它们的结合将为4K和VR铺平道路。

未来是4K和VR的时代

2015年,索尼Xperia Z5 Premium第一次开始了4K分辨率的尝鲜(图1),可惜4K屏幕实在太过耗电,成本也是相当昂贵,所以并没有厂商敢于跟进。2016年则是VR大爆发的时节(图2),只是目前的移动VR眼镜(将手机作为屏幕和计算单元的设备)都存在两个问题:画面存在颗粒感,眩晕感严重。颗粒感是因为屏幕分辨率太低,眩晕感则是画面刷新率不够(涉及到LCD自身的刷新率低,和手机性能无法渲染出更高刷新率的画面)。

那么,如何让手机可以完美驾驭未来的4K和VR趋势?更快的CPU运算能力,更强的3D渲染水平,这二者缺一不可。为此,ARM带来了可提供“极致的VR体验”的全新CPU和GPU技术,并已获得了包括华为海思、三星电子、联发科、Marvell等在内的九家芯片厂商的捧场(和ARM签署了技术授权协议)。那么,ARM的新技术究竟有何过人之处?

重温ARM的三大血脉

在PC领域,英特尔将处理器划分为了Core(酷睿)和Atom(凌动)两个大的架构,分别用于高性能和低功耗计算。在移动处理器领域,ARM则提供了Cambridge(剑桥)、Austin(奥斯汀)和Sophia(索菲亚)三大血脉平台(表1)。

我们熟悉的Cortex A7、Cortex A53隶属于ARM旗下的Cambridge家族,它们的共性就是功耗小、发热低;Cortex A15、Cortex A57和Cortex A72则隶属于Austin家族,它们的特色就是性能强得一塌糊涂,但却因功耗高、发热量大而无法长时间运行。为了弥补Cambridge性能不足、Austin过于热情的缺陷,ARM推出了名为“big.LITTLE”(大小核)的技术,可将A15(大)与A7(小)、A57(大)与A53(小)、A72(大)与A53(小)混合搭配(图3),从而兼顾了多核处理器的性能与功耗。

所谓“知子莫若父”,ARM在很早以前就意识到Cambridge和Austin的缺陷和不足,所以才有了Sophia家族的诞生。可惜,Sophia的历史就是一部活生生的悲剧。

搭载联发科MT6595处理器的魅族MX4

作为Sophia家族的首批成员,Cortex-A12的性能介于当时Cortex-A9和Cortex-A15之间,但功耗却比Cortex-A15低了很多,曾一度被视为最均衡的移动之芯。然而,A12在设计上却出现了失策:缺乏必要的一致性总线,因此不支持big.LITTLE,无法搭配“小核心”的Cortex-A7,最终“出师未捷身先死”,直接被后辈Cortex-A17所取代(图4)。而Cortex-A17的表现也不负众望,性能几乎和Cortex-A15一样,但核心面积更小、功耗更低。

令人遗憾的是,Cortex-A17也“生不逢时”,好不容易才有了瑞芯微RK3288和联发科MT6595(都是四核Cortex-A17+四核Cortex-A7)两颗八核处理器加盟(图5),但却赶上了移动处理器从32位时代向64位时代(ARMv8 64位指令集)的转型期。于是,Cortex-A17和Cortex-A7同时被64位的Cortex-A57和Cortex-A53所取代。

ARM此次推出的全新CPU技术,就是Sophia家族的最新血脉:Cortex-A73,它的最高主频可达2.8GHz,功耗最多可降低30%。那么,它又是如何做到的呢?

架构层面有优化

由于隶属于Sophia家族,所以虽然Cortex-A73从型号上与Cortex-A72接近,但二者在架构层面的差异却是非常明显,Cortex-A73反而与Cortex-A17有着更多的“血缘关系”。比如,它们都非常重视流水线(A72流水线为15级,A73则仅有11级)、注重资源和接口的优化(图6),以求在最低功耗下获得最大性能。

具体来说,Cortex-A73基于64位ARMv8-A构架设计(图7),是早期Cortex-A57架构计算速度的2倍,Cortex-A15的3.5倍。它所支持的CPU簇依旧为4个,理论上一颗处理器内可以塞进2组共计八核Cortex-A72和2组八核Cortex-A53从而构成16核心处理器。

由于Cortex-A73只是针对消费级市场,所以它较Cortex-A72精简了AMBA5 CHI接口,一级缓存也不再支持ECC。此外,Cortex-A73还将数据缓存寻址机制从PIPT(物理索引物理标签)升级到了VIPT(虚拟索引物理标签),优化后的一级和二级缓存预取器也令外部内存带宽大幅提升。

总之,Cortex-A73和其他前辈相比,在性能、功耗及核心面积这三个方面都做了全面的改善,这也是半导体设计的三个重要指标。按照ARM官方的数据显示,和Cortex-A72相比,Cortex-A73典型移动应用性能提升10%,SIMD媒体和计算性能提升5%,内存吞吐能力提升15%(图8);整数应用功耗节省最多30%,浮点和二级缓存应用节省最多25%,同等工艺频率下至少节省20%(图9)。

一切都要以10nm为前提

Cortex-A73看起来很厉害?那是因为它的技术门槛非常之高,需要使用10nm FinFET工艺设计制造。要知道,这个工艺要到2017年才能大规模量产。实际上,用10nm的Cortex-A73和14nm/16nm的Cortex-A72等前辈们对比多少有些不公平,当后者应用10nm工艺时也能运行在更高频率且能明显降低能耗。然而,世界上没有绝对的公平,Cortex-A73的起点就是高……

对处理器厂商而言,10nm工艺可以减少处理器核心的硅圆使用面积,在提高性能的同时降低SoC和设备的成本。比如,Cortex-A73在同等性能的基础上,芯片封装面积可以比Cortex-A72减少25%(图10),双核Cortex-A73的尺寸和四核Cortex-A53持平。这意味着今后会出现很多双核Cortex-A73+四核Cortex-A53的六核处理器,取代现有的四核Cortex-A53+四核Cortex-A53的八核处理器。根据ARM的数据显示,前者可以在核心面积相同的情况下,比后者的性能提升30%,最佳响应时间提升90%。

全新GPU助力VR

实际上,对4K和VR而言CPU性能并非最关键的因素,GPU图形渲染能力才是提高刷新率、降低VR体验延迟的大杀器。此外,当我们遇到手机玩游戏卡顿的现象时,99%的情况下并非CPU性能不够,同样是受了GPU性能不足的拖累。联发科Helio X20、麒麟955等处理器虽然CPU多核性能远胜骁龙820,但游戏流畅度却被后者完虐,就是因为它们集成的Mail-T880MP4 GPU不够给力造成的。随着Cortex-A73的出现,给了其他芯片厂商(在游戏性能方面)逆袭高通骁龙、体验更佳VR效果的机会。

为了与Cortex-A73搭配,ARM同步推出了与其相配套的新款GPU——Mali-G71。这款GPU的目标非常明确:满足大型3D游戏和未来移动VR体验的需求。

简单来说,Mali-G71的核心数量可在1个~32个之间调节(上代Mail-T880最多可配备16个核心,即Mail-T880MP16)(图11),性能比Mali-T880可提升最多40%,而且在能耗方面的表现更优。同时,Mali-G71还全面支持OpenGL ES 3.2、OpenCL 2.0、DirectX 11.2等API接口,其综合性能甚至可以媲美笔记本领域的中端独立显卡(图12)。

当然,想获得媲美笔记本独显的性能,就需要Mali-G71搭配32个核心,而实际应用中却受限于工艺、发热和耗电量等因素的制约,手机处理器不可能搭配满血的Mali-G71,而我们则希望联发科Helio和麒麟的下代芯片可以更给力一些,至少也要搭配Mali-G71 MP8或Mali-G71 MP12的GPU规格吧?

小 结

ARM此次发布Cortex A73处理器和Mali G71 GPU算是给我们画了一张大饼,表面看起来光鲜无比,但它们却存在着很多不确定性。比如,10nm工艺能否在预计的时间内投入量产?如果不能,让Cortex A73与主流的16nm/14nm工艺搭配还能释放几分动力?此外,Mali-G71是否强悍取决于计算核心的数量。Mali-T880原本也够强悍,但架不住手机处理器厂商只为其搭配4个核心啊?要知道,三星Exynos 8890处理器同样集成Mali-T880 GPU,但凭借12个核心的优势,在3D性能上足以媲美骁龙820。

总之,Cortex A73的出现会进一步刺激智能手机领域的军备竞赛,未来一个时期内你会看到2K屏幕满天飞,4K屏幕不稀奇,高刷新率屏幕到处跑,六核、八核、十核处理器共存的格局,届时手机端的VR体验也会因它而提高到新的层面,让我们共同期待吧。

猜你喜欢

联发科刷新率功耗
基于任务映射的暗硅芯片功耗预算方法
高刷新率 手机必备新功能?
联发科第二款7纳米5G SoC终端将于明年上半年亮相
电竞显示器不能只认刷新率
数字电路功耗的分析及优化
IGBT模型优化及其在Buck变换器中的功耗分析