“初识”算力
2022-11-06
算力,一个原本并不为外界所熟悉的芯片界术语,一般用于描述芯片处理数据或完成算法训练的能力,近些年却时常出现在汽车领域的相关文案里。究其原因,实在是车载芯片之性能直到这会儿才值得被探讨而已。
其实,此前用于控制ADAS高级辅助驾驶系统以及多媒体座舱的MCU单片机式微控制器,也具备算力。只是,随着市场日益看重智能座舱的应用以及自動驾驶技术的性能,乃至将它们作为购车时的重要参考,厂商这才单独把算力摘出来,以便消费者进行量化比较。
既然是用来衡量比对,那自然得有基准单位,而目前汽车行业普遍使用的算力单位则是TOPS,也就是Tera Operations PerSecond,意指处理器每秒可进行一万亿次运算。1TOPS即每秒运算一万亿次,2TOPS便是每秒二万亿次,以此类推……这其实是相当强大的算力,要知道,在TOPS之下至少还有每秒十亿次的GOPS,跟每秒一百万次的MOPS两档算力单位托着。
值得一提的是,今日所谓智能汽车的算力,说的是那个包含多颗SoC系统级芯片的车载计算平台算力,并不包括其他域控制器所用MCU的算力。换句话说,目前智能汽车已凭借高算力平台迈入大算力时代。
话虽如此,但眼下全车真正消耗大量算力的,却“只有”智能座舱跟自动驾驶两大系统。以智能座舱为例。当前主流智能座舱操作系统除完成传统的多媒体交互功能外,还需具备可支持高清大屏、多屏联动等显示功能的图形计算能力,以及支持车内人工智能助手完成交互、监测等功能的AI运算及学习能力。实际上,车载操作系统维持自身流畅运行所需的算力并不亚于旗舰级智能手机。
不仅如此,今后随着整车电子电气架构的进一步集成化,或者直接通过OTA软件进行在线升级,智能驾驶系统必将融合更多的功能域控制器。而想要保证新系统继续正常工作,并持续维护信息的安全,势必要处理更为庞大的数据量。显然,对于使用寿命远久于其他消费级智能终端的汽车来说,对算力的需求永远不嫌少,毕竟还得为将来预留相当大的余地。
至于自动驾驶方面,对算力的需求更是惊人。别看眼下L2级高级辅助驾驶系统只需10TOPS左右的算力,一旦进入L3级有限自动驾驶模式,随着传感器数量的激增,以及决策场景的复杂化,系统所需的算力将跃升至30~60TOPS。顺便一提,之前主流旗舰手机所用的骁龙888Plus芯片的AI算力“仅有”32TOPS。
另外,根据自动驾驶系统相关厂商的预测,若要完成L4级高速自动驾驶,车载计算平台的算力至少要有300TOPS,而L5级无人驾驶则需有1000TOPS的算力打底才行。同时,海内外的多家自动驾驶AI芯片供应商也认为,随着自动驾驶技术的进化和落地,系统对于车载算力的需求将呈指数级增长,并最终获得远超消费级智能终端的算力,甚至会引起车载芯片自身的革新。
值得一提的是,由于智能座舱的最终目标是解放驾驶者,并将汽车变成“智能移动空间”,这跟自动驾驶系统的进化方向其实是一致的,而在现实里,智能座舱与自动驾驶系统之间的界线也确实存在着模糊的地方。因此,已有不少相关从业人员认为,将来这两套域控制器有望合二为一,并由一颗SoC芯片控制。
事实也的确如此。英伟达在2022 GTC秋季大会上发布的新一代集中式车载计算平台NVIDIA DRIVE Thor,即已凭借具备最高2000 TOPS AI算力以及2000 TFLOPS浮点算力的单颗Thor SoC芯片,将智能座舱和自动驾驶等智能功能整合到单个架构中。
然而,在算力方面无限制地内卷、膨胀未必有益于智能汽车的进化。首先,算力并不完全等同于汽车智能。与其他人工智能一样,车载AI系统最终所能呈现的人机交互、事件决策等自主行为的效果,更多取决于AI自身的学习能力,以及算法迭代的结果。而算力只是实现这一切的基础。
不仅如此,现有的智能手机SoC芯片已经证明,单方面提升算力,将使整个平台难以兼顾功耗、散热及安全等其他方面的需求,以至于在用户体验层面一败涂地。
总而言之,智能汽车的进化离不开大算力计算平台的支撑,但计算平台的设计却不能完全偏向算力,需要综合复杂的外部环境和用户需求等因素,并进行整体优化方可完成。
严格来讲,根据测算对象的不同,使用对应的算力单位。例如,在测算单片机或CPU处理指令的速度时,就该用MIPS,即Million Instructions PerSecond每秒执行的百万级指令数;而若用Dhrystone整数运算测试程序进行计算,则单位又会变成DMIPS,即Dhrystone测试模式下的MIPS。
又比如,在测试浮点计算能力时,则要使用FLOPS,即floating-point operations per second每秒执行的浮点运算次数。顺便一提,FLOPS跟OPS一样,也能细分为MFLOPS、GFLOPS、TFLOPS,以及代表每秒一千万亿次计算的PFLOPS。当然,对于面向普通群众的智能汽车来说,笼统地使用TOPS已足以代表整车的算力。
华为MDC智能驾驶计算平台:Mobile Data Center移动数据中心是华为专门为智能驾驶研发打造的计算平台。其中包含标准化的系列硬件产品以及智能驾驶操作系统AOS等软件产品,并提供配套工具链及车路云协同服务。
于2021上海车展发布的MDC810搭载两颗昇腾610芯片,使平台的AI算力达到400TOPS,可满足拥堵跟车、高速巡航、自动泊车等高级别自动驾驶应用场景的需求。
高通骁龙Ride平台:高通于2020年1月发布的自动驾驶计算平台,平台主要由单颗算力为30TOPS的安全系统SoC芯片、自动驾驶专用加速器和自动驾驶软件栈构成。平台具有高度可扩展性和完全可定制化的特点。
根据SoC芯片以及自动驾驶加速器数量的不同,平台最高可提供单颗700TOPS的算力,从而可使面向城市环境的乘用车实现L5级自动驾驶功能。而若采用L2+级自动驾驶方案,平台最多可支持7个摄像头、6个毫米波雷达、高精地图导航以及C-V2X车联网技术。
英伟达DRIVE Thor:发布于2022年9月20日GTC秋季大会的英伟达新一代集中式车载计算平台,可将自动驾驶和智能座舱的所有功能整合到单一架构中。官方宣称,这是首个集成推理Transformer引擎的自动驾驶汽车平台,能使Transformer深度神经网络的推理性能提升9倍。与此同时,作为平台核心的英伟达Thor SoC芯片还可凭借具备8位浮点精度的2000 TFLOPS浮点算力,让開发人员在进行数据传输时,不至于损失神经网络原本的精准度。
顺便一提,英伟达Thor并非那颗算力高达1000TOPS的Atlan SoC芯片的继任者,而是直接取代Atlan,在不远的将来接班现役Orin 芯片上位。此举甚至让那套登台不过半年,基于Atlan芯片构建的NVIDIA DRIVE Hyperion 9自动驾驶平台也变得前景未明。