大幅度扩张产业生态圈英伟达GTC 2021部分新品解读

2021-06-20张平

微型计算机 2021年10期

关键词：测试

张平

英伟达于2021年4月13日召开了GTC 2021大会。在会议上，英伟达CEO黄仁勋代表英伟达对计算市场的发展提出了一些看法并进行了展望，同时也发布了全新的DPU、CPU、下一代GPU以及自动驾驶芯片。本期我们将对GTC 2021会议中的要点进行解读，并带来部分英伟达下一代计算产品的解析。

GTC在早期是英伟达发布新品、宣布相关合作或产业信息的大会，会上往往会有新一代GPU和相关技术的发布，是游戏玩家一年一度的盛会。不过，随着英伟达产业布局越来越广产品越来越多， GTC逐渐转变成了面向所有用户包括游戏玩家、行业用户、特殊领域用户以及技术专家，有关英伟达技术、产品、产业生态等内容的综合性大会。在2021年的GTC上，英伟达CEO黄仁勋介绍了大量与计算相关的产品，包括全新的DPU、CPU、下一代GPU以及自动驾驶芯片。下面，本文带大家一起对GTC 2021上发布的新品进行深入解读。

综述：英伟达的四个新技术方向

目前英伟达的产业发展方向主要针对五大板块，分别是计算加速、AI自生成软件（AI编程）、数据中心、AI和5G应用以及在现实世界或者虚拟世界中的自动化系统等。

会上，英伟达着重提到了一个名为“Metaverse”的概念，其中文含义被称为“元宇宙”。所谓元宇宙，实际上是一个来源于科幻小说的概念，其本质是使用数据化来构造一个持久、同步、实时、闭环、跨越数字和物理、跨越私有和公有、跨越开放和封闭、拥有“临场感”、可以由个体创造内容和数据的虚拟宇宙。之所以说它是“Meta（希腊语“超越”）+verse”，是因为Metaverse并不是一个虚拟世界、虚拟空间或者虚拟现实，也不是一个所谓简单的虚拟游戏，英伟达认为的Metaverse是一个和我们现在的时空完全相同的虚拟“时空”。英伟达的所有技术，，都和Metaverse相关，一个Metaverse的存在，也会促进英伟达提到的所有技术的发展和应用。

现在，基于Metaverse的愿景和英伟达所提出的五大板块，英伟达给出了四个新技术方向和基于这些技术的应用。这四个新技术应用方向分别是RTX（Omniverse）、DGX （以及相关的Grace CPU、BlueField DPU、DOCA SDK）、EGX和5G技术、自动驾驶芯片（Hyperion、Atlan、Orin）。在此基础上，英伟达还给出了这四个技术方向的应用领域，分别是RTX针对Omniverse和Isaac， DGX十对Megatron（大规模语言模型）、药物发现以及量子计算机，EGX和5G针对AI、Merlin（AI应用框架）、Maxine （视频会议平台）、Jarvis （对话式人工智能的框架平台）以及Morpheus （利用AI的网络安全技术框架），最后的自动驾驶芯片自然对应的是自动驾驶技术。

这四大技术是英伟达在GTC上重点介绍的发展方向，包括CPU、GPU、DPU等多款产品都归类在这四大技术和五大板块中。

英伟达的数字孪生宇宙：Omniverse

熟悉英伟达发展历史的读者肯定知道，英伟达起家的根本是图形计算，其技术基础是计算机图形学。计算机图形学的核心是模拟，它使用数学和计算机科学模拟了材质和光线的交互，模拟物体、粒子和波的特性，现在已经开始模拟智能和物理。当然，这样的模拟已经被英伟达做到了极致，模拟也仅仅基于一个或者数个物理定律或者规则。下一步，英伟达计划将这些规则组合起来，结合Metaverse概念，实现自己的“元宇宙”计划，这个计划在GTC大会上被正式发布，这就是Omniverse。

更进一步来看的话， Omniverse是这样一个平台：它通过各种技术和标准化的软件，搭建了一个数字孪生宇宙。理论上来说，只要技术足够先进，算力足够充足，你可以通过Omniverse中英伟达或者其他使用者开发的接口、软件、库文件等，在Omniverse内部模拟一个村落、工厂、社区、城市或者国家，甚至整个地球。当然，受制于现在的技术和应用场景，当前Omniverse更偏重面向工业行业的元宇宙。

当然，模拟某个具体的物体或者群体并不是Omniverse的目的，通过这些模拟，来实现对现实世界的数字化孪生，并通过相关处理和操作，来获得在现实世界中难以得到的数据和内容，才是Omniverse最核心的作用。

英伟达举了一个很好理解的例子来描述Omniverse的作用。我们知道，目前智能机器人的发展如火如荼。在现实世界中，人们可以通过前期的数学计算、算法模拟或者各种各样的手段为机器人设计相关运动程序，然后制造出一个真实存在的机器人，并将其放置在真实世界中进行測试，从而获得反馈信息，再进一步去调节机器人的设计，从而获得最终可以商业化，并交付给用户的产品。

但是，这样的测试过程存在两个问题，一是耗资巨大，二是速度很慢。为了在真实世界中进行这样的测试，人们不得不先造出一大堆测试产品，测试速度受到真实世界的物理规则的约束，比如时间、空间、能源以及人类自身的精力等。那么，解决这个问题的最终办法是什么？并不是花更多的钱，也不是雇佣更多的工程师，而是直接将整个过程虚拟化、数字化后，在数字世界中进行测试、反馈和修改，这就是Omniverse的作用。

在Omniverse中，用户可以建立一个到数个、数千个和现实世界中运行参数、状态几乎一样的机器人。在合理的约束条件下，搭建相关测试场景，让模拟的机器人在虚拟的测试场景中进行测试，并利用AI的“测试—反馈—改进”机制，实现机器人的自学习、自测试和自提升。其中，搭建的虚拟测试场景可以和真实世界的某处测试场完全-样，并且遵循完全一样的物理定律。场景设置不仅仅局限在地球上，也可以在月球、火星甚至太空中，毕竟人类已经基本掌握了这些场景下的物理参数，这种虚拟的测试场景就成为真实测试场景的“数字孪生”。最终测试的结果可以反馈到工程师手中，然后进一步用于真实场景中机器人的改进，完成了“真实场景—数字孪生场景—真实场景”的闭环，这充分体现出了Omniverse的价值。

在GTC上，英伟达介绍了Omniverse的三大重要部分。首先是Omniverse Nucleus，顾名思义，这个部分是Omniverse的核心，用于连接用户并实现3D资产交换和场景描述的引擎。其次是有关合成、渲染和动画的引擎，英伟达为这部分内容加入了包括PhysX物理模拟、NVIDIA MDL材质模拟和NVIDIA AI等功能，使其可以更好地模拟真实世界。此外英伟达还通过这个部分将Omniverse扩展至多GPU、云计算平台，使得Omniverse可以在各种RTX平台上进行操作，并提供远程流式传输功能等。第三个部分被称为CloudXR，它被英伟达称之为“星际之门”，通过这个部分，人们可以利用VR将内容传输至Omniverse， AI可以使用AR将内容从Omniverse内传输出去，这相当于Omniverse和现实世界的接口。

除了上述三大部分外， Omniverse的重要内容还包括Omniverse Connect库和Omniverse Kit。其中OmniverseConnect库可以使得Omniverse Nucleus连接应用程序并且发布和订阅整个Omniverse内的资产，并执行更新程序等。Omniverse Kit则是构建本地Omniverse应用程序和微服务的工具包，也可以支持独立扩展，支持Python或者C++等。

在最重要的3D文件格式方面，Omniverse采用了皮克斯动画提供的USD （Universal Scene Description）格式来实现3D内容的标准化和统一化。USD格式是皮克斯动画公司发明的一种标准化通用场景描述格式。利用USD，人们可以实现3D场景的标准化并确保移植和交互的可靠性。USD在2016年成为开源标准后，英伟达对其进行了不少改进，比如将其和整个Omniverse系统结合起来，为其增加了协同工作、实时预览、资源共享等相关功能，并结合建筑、制造、模拟等相关产业的特点进行了一些改进。

英伟达在发布会上展示了Omniverse的大量实际用途。比如借助Omniverse的同步功能，福斯特建筑师事务所实现了全球17个办公地点的设计协同。ILM借助Omniverse实现了工作管线的汇聚和统一。爱立信利用Omniverse进行了5G传输和干扰模拟测试等工作。

一家名为TwinEarth的公司计划使用Omniverse和2万个GPU打造一个地球的数字李生体。著名的游戏公司动视暴雪计划将10万多3D资产全部使用Omniverse整理并建立一个可搜索的数据库。全球著名的基础设施建设公司Bently （这家公司相关的产业总产值接近每年3.5万亿美元）结合Omniverse，建造了一个名为iTwin的基础设施数字孪生，用于在整个建筑的生命周期内监控和优化性能。另外，在一些特色产品方面，比如广告制作，相关制作人员不用再走遍全球进行广告拍摄和制作，借助于Omniverse的特性，人们可以搭建虚拟场景并进行虚拟拍摄，并且全球的艺术家都可以通过Omniverse同步创意和制作过程。

除了上述用途外，英伟达还和宝马联手，实现了利用Omniverse对宝马的汽车制造工厂进行数字孪生。在Omniverse的数字工厂中，宝马实现了对工厂的全流程模拟，通过全球不同地区的专家的协同工作，对工厂流水线相关的机台、物流、动线等进行优化，还改善了整个工厂的人体工学设计和效率。此外，借助于Omniverse中整合的NVIDIA Isaac机器人协作平台，宝马准备了物流智能机器人，且借助域随机化实现了机器人的自我学习和进化以及人类的远程控制等功能。现在，宝马已经将全球31个工厂在Omniverse中进行数字孪生，宝马宣称，通过缩短规划时间、提高精度和灵活性，最终宝马还可以将规划流程效率提升30%。

在整个Omniverse的生态圈和产业链方面，英伟达宣布目前已经提供了12个和Omniverse有关的主流设计工具连接器，此外还有40个正在开发过程中。目前全球已经有大量企业加入Omniverse平台，来自游戏、媒体、娱乐、ACE、电信、基础设施、汽车等不同的行业。Omniverse目前一方面提供经由英伟达认证的硬件設备，包括台式机、笔记本电脑和服务器，另一方面也面向企业开放相关认证，最终实现软硬协同发展的目标。

从英伟达的介绍来看，Omniverse只是结合现有的一些模拟和应用场景进行了可视化的处理，虽然还处于早期发展阶段，但是毫无疑问这种“元宇宙”的概念是非常震撼的。随着技术和算力进一步发展，未来Omniverse和类似的平台可能拥有将整个社区、工厂、城市或者某些大型研究室整体数字化的能力。就像计算机从机械计算机进步到电子计算机，使得处理速度和效率提升了上亿倍那样，Omniverse将真实世界数字化，可以带来不亚于机械计算机到电子计算机这样巨大的效率提升。借助Omniverse和类似的元宇宙平台，虚拟和真实的边界可能会逐渐被融化模糊，人类的生产力、想象力和研发能可能会借由此进一步大幅度提升。如果一切顺利的话，英伟达Omniverse在未来可能会成为PC上的一种基础资源，那个时候英伟达的市值和技术实力，可能也不是现在的我们可以想象的了。

更强的专用计算单元：DPUBluefield-3

英伟达在之前花费69亿美元收购了一家来自以色列、专注高性能网络和数据处理器的企业，名为Mellanox。在收购这家企业之后，英伟达获得了梦寐以求的在大型服务器、超算、云计算设备中布置高性能网络接口的能力，还获得了在这些设备中进行有关数据处理、安全处理、数据解析等工作的全新芯片DataProcessing Unit，也就是DPU，数据处理器。

在GTC 2021上，英伟达发布了全新DPU产品，并且进一步解释了为什么目前的服务器、云计算和超算设备更需要DPU。按英伟达的说法，目前AI计算和云计算使得数据中心处理数据的方式发生了变化。早期企业都在服务器上运行单一的软件包，此时CPU任务不重，甚至资源存在很多富裕和空闲。接下来，在虚拟化出现后，通过虚拟化设备，软件任务可以迁移，并且各项任务包括计算、网络、存储和安全等都可以通过虚拟化迁移至CPU上，整个平台环境变得更为方便，但这样做也使得CPU增加了计算负载且降低了CPU运行任务的能力，毕竟运行任务才是CPU的主要工作。随后，云计算进一步将各种任务分解为各类微任务，并且尽可能多地利用服务器的所有空闲资源。不过，随着云计算、AI计算的发展，整个系统的安全形势愈加严峻，在这种基础上出现了“零信任”安全理念。这种理念的特点是不信任任何软件，均给予其最小权限和最复杂验证，并且不再设置相关安全区域，应用和资源的边界就是安全边界。零信任的安全理念使得整个服务器或者云计算中，有关安全验证的工作计算压力大增，也就是基础设施软件处理成为了数据中心最大的计算任务，这又使得CPU陷入极重的计算负荷中。

从目前的发展情况来看，零信任安全理念很可能成为未来发展的主流。因此， CPU繁重的安全验证任务和相关数据处理、数据转移等任务就需要新的设备来接手。英伟达给出的解决方案正是DPU，这是一种高性能、软件可编程、多核心的新型，可编程处理器。它的特点是拥有高性能网络接口、并行处理大量数据的能力以及和CPU、GPU快速传输数据的能力。

在2020年，英伟达就推出过BlueField-2、BlueField-2X两款DPU产品，以及新的DUCA SDK，后者用在BlueField DPU上开发有关软件定义、硬件加速的网络、安全和存储应用，包括深度数据包检测、安全启动、TLS加密卸载、RegEX加速以及基于硬件的实时时钟等，和DPU搭配可谓相得益彰。

在2021年的GTC上，英伟达发布了全新的BlueField-3，并给出了BIueField-4规模的展望。BlueField-3拥有220亿晶体管，其中包含了16个Cortex-A78核心。网络方面支持CONNECTX-7，其最高速度高达400Gbps，支持PCIe 5.0和DDR5内存。其性能为SPECint测试数值为42，计算能力为1.5TOPS。相比之下，上代BlueField-2的SPECint测试数值为9，计算能力为0.7TOPS。英伟达还顺便预告了下一代BlueField-4，其拥有640亿晶体管， SPECint测试值高达160，计算能力超过1000TOPS，网络带宽进一步翻倍至800Gbps。在上市时间上，BlueField-3大约会在2022年第一季度上市，英伟达没有介绍其生产工艺，据推测应该是采用5nm工艺进行生产。BlueField-4则会在2023年发布，届时生产工艺应该更为出色了。

继续来看BlueField-3。英伟达介绍到，其包含的16个ARM核心可以用来运行整个虚拟化软件栈，比如VMware ESX，这相当于接替了一大部分CPU的工作。在安全特性方面，新的处理器可以支持解包或者加速IPSEC和TLS加密算法、密钥管理等。有了这些特性和功能，CPU就可以极大地释放计算压力，能腾出更大的空间来运行目标应用程序了。

在具体的应用方面，英伟达使了自家的GeForce NOW服务进行举例。英伟达宣称GeForce NOW是一个交付难度非常高的、面向消费级用户的游戏服务，其需要关注的内容非常多，包括了视觉质量、帧率、流畅度、响应时间、启动时间、成本以及安全性。在之前，它的几乎所有任务都是交由CPU来执行的，但是现在英伟达将基础设施从游戏实例中进行了分离，将加速网络、存储、安全等计算放置在BlueField DPU上执行，极大地释放了CPU的资源，使得CPU可以专注于更重要的、更关乎用户体验的游戏计算等内容。由于BlueField DPU的存在，一个GeForce NOW的服务器反而可以支持更多的用户使用，这使得BlueField DPU拥有非常出色的投资回报率。

解决AI计算的带宽之困：英伟达Grace CPU

英伟达做CPU或者相关的产品其实是早有历史渊源的，之前英伟达就推出过ARM架构的多款CPU或者SoC产品，比如Project Denver计划和DenverCPU，其产品品牌为Tegra。后来由于战略、市场等原因，英伟达在面向民用市场的SoC产品上持续收缩，目前Tegra只供应部分游戏主机市场，在消费级市场难觅踪影。

当然，作为全球排名前列的集成电路企业，不做不意味着没有能力做。在GTC 2021上，英伟达宣布推出了全新的代号为“Grace”的CPU产品，采用下一代ARM的Neoverse架构，主要面向数据中心市场。本刊在上一期《GTC 2021， Grace CPU暴露英伟达的野心？》一文中，基于当时的信息和資料，对这款CPU进行了一定的分析，有兴趣的读者也可以翻看上期文章，在本文中我们将利用一些新的消息，并对Grace CPU进行进一步分析。

根据英伟达在GTC 2021上的解释，他们面对的问题主要是带宽，尤其是在目前体积巨大的AI计算模型或者框架面前，现有的CPU-GPU的PCIe架构的带宽是不可能满足实际需求的。英伟达的数据是，PCIe在目前的情况下可以提供单向16GB/s的带宽，在配置4路系统的情况下，也能够提供64GB/s的带宽。同样的四路系统，采用新的Grace CPU后，借助于CPU内置的第四代NVLink，单个CPU连接GPU的数据带宽可达到500GB/s，那么4路总计2000GB/s，是PCIe产品的30倍以上。

进一步来看Grace CPU本身的话，在架构方面英伟达只是说采用下一代ARM的Neoverse架构，但是并没有明确给出相关的信息。另外，英伟达还提到，Grace的SPECint性能超过300分，一个DGX系统中有8个Grace CPU，总体性能超过2400分。

那么，Grace CPU究竟会采用ARM哪一款架构、其性能究竟如何呢？

根据ARM官方介绍，Neoverse架构分为高性能的V、高性能功耗比的N和低功耗的E三大系列，拋开E系列不看的话，现在ARM拥有两款Neoverse架构分别是Neoverse N1和Neoverse V1，其中前者和Cortex-A76有衍生关系，后者则和ARM目前力推的高性能核心Cortex-X1存在衍生关系。考虑到Grace CPU在2023年面世并且明确表示采用下一代Neoverse核心的话，Neoverse N1和Neoverse V1显然都不在选择之中。

好在ARM在前段时间发布了新的路线图。2021年，ARM将推出5nm的Neoverse N2，相比Neoverse N1，Neoverse N2的IPC性能提升了40%，增加了SVE指令集，支持2×128b的浮点计算，并且还加入了对BF16格式的支持，接口方面提供了PCIe 5.0、DDR5、HBM3等，最多支持128核心和128线程。2022年以后，ARM还会推出新的Neoverse架构，性能进一步提升30%，支持机器学习和矢量指令集，支持更大的核心密度等，新的核心将采用5nm或者3nm工艺制造，支持PCIe 5.0或者PCle 6.0，支持DDR5、HBM3等。

考虑到Grace CPU将在2023年才推出，因此这里的猜测就落在Neoverse N2和更远期的Neoverse架构上了。英伟达给出的示意图显示，一个Grace CPU中拥有4个区域，每个区域有24个模块，但是不知道最终有多少模块被用作CPU核心，因此， Grace ;CPU的核心数量可能最多96个，也可能远比这个数据要少。毕竟NeoverseN1的SPECint2006性能大约为37分，即使采用Neoverse N2，其性能应该在45分以上。如果这里的测试标准是统一或者接近的话，这意味着英伟达的Grace CPU中Neoverse核心的数量远比示意图中展示出来的模块数量要少。考虑到目前AMD Zen 2架构的EPYC处理器已经能达到SPECint 300分以上的成绩，在2023年新的工艺和架构的支持下，要达到这样的性能应该更为容易，因此一个比较明显的推测是，Grace CPU并不是面向性能的，而是耗费了大量的晶体管在NVLink和其他互联、数据传输等功能上，毕竟这是英伟达需要解决的最根本的问题， GraceCPU和x86 CPU也并非生死抉择的替代关系。

在性能方面，英伟达对Grace CPU加入自己的系统之后的情况做了一些预测，英伟达称Grace CPU的使用能够大幅度降低神经网络模型计算所需要的时间，并且英伟达正在努力使得Grace CPU相关的系统在1万亿个参数的神经网络模型上实现相比目前系统10倍以上的性能，比如采用了64个Grace CPU+A100组合、且采用NVLink 4的设备，将使得类似模型的训练时间从1个月缩短至3天，或者在拥有8个Grace CPU+A100组合的（也就是单个DGX设备）设备中，使得拥有5000亿个参数的模型可以实时获得推断结果。

目前Grace CPU系统的客户已经确定的包括瑞士国家计算中心的ALPS超级计算机，这款设备在AI上的计算能力超过20EFLOPS。注意，这里的性能应该指的是GPU的CUDA内核、张量核心和CPU计算能力的组合。另外，这款超算并非只有Grace CPU一种处理器，在之前的消息中，惠普企业集团宣布这款超算将采用自己的CrayEX架构，这意味着AMD的EYPC处理器也将是重要的组成部分。在这款超算建成后，将有可能成为全球AI计算得最快、效率最高的产品。另外一款超算也决定使用Grace CPU进行搭建，但是消息不多，其主要客户是美国能源部旗下的洛斯阿拉模式国家实验室，这个系统的主要目的是用于3D仿真，计划于2023年交付。

英伟达的自动驾驶计划：ATLAN现身

英伟达在2019年的GTC上推出了DRIVE AGX Orin，当时英伟达的计划是在2022年正式销售。在GTC 2021上，英伟达再次提到了Orin，并带来了有关Orin的一些新的技术动向。

现在， Orin并不只是用于L2以上级别的自动驾驶了，它现在是整个汽车的中心计算机，利用单个Orin芯片，英伟达实现了包括图像处理集群、娱乐和多媒体中心、乘客交互、信心视图等诸多功能。所谓信心视图，是，英伟达提出的一个全新概念，它是指汽车通过探测周围的环境和道路情况，将其数字化后反应在车内屏幕上，在实现自动驾驶的同时还给予车内人员以“信心”，因此被称为“信心视图"。换句话来说，所谓信心视图，就是指自动驾驶技术的可视化，车内人员可以通过信心视图和车周围的情况做出对比，从而监控现有的自动驾驶执行过程或者判断汽车状态和信息，英伟达还特别提到，未来的后视镜将被数字化摄像头所替代，人们不再需要车外的镜面后视镜就能观察到车后信息。

在更深一层的技术层面上，英伟达通过软件虚拟化，将Orin本身分为四个独立的域，虚拟化之间是互相隔离的，采用了支持功能安全和信息安全的架构设计，这种设计在整个汽车的全周期都可以进行升级，同时提供精美的视觉图像效果。软件技术方面，配合即将大规模上市发售的Orin，英伟达带来了第八代Hyperion系统，这个系统的主要目的是提供一个统一的传感器平台，帮助汽车厂商快速接入不同的传感器设备并开始采集和使用数据，再将其使用在自动驾驶中。Hyperion系统的核心是2个Orin SoC，能够实时处理12个外部摄像头、3个内部摄像头、9个雷达和2个激光雷达的数据，从而实现汽车的L4级别自动驾驶。另外，Hyperion还带来了DRIVER AV和DRIVERIX所需要的所有工具，并且可以随时记录数据并进行事件捕捉，从而使得自动驾驶数据处理更为流程化。

根据英伟达在发布会上的描述，在2022年，应该有很多配备了激光雷达和Orin自动驾驶平台的自动驾驶汽车开始销售，其合作伙伴包括国内的造车新势力蔚来、小鹏、理想智造、智己汽车等以及全球级别的梅赛德斯-奔驰、沃尔沃、现代、奥迪等诸多厂商。极有可能2022年到2023年将是高等级自动驾驶的元年，我们可以小小地期待一下这个重要时刻的到来。

在Orin之后，GTC 2021也给出了发展方向，那就是算力超过1000TOPS的DRIVER Atlan，其SPECInt的性能大约100。英伟达给出了一个有关DRIVER Atlan的简单的架构示意图，可以看出，Atlan和英伟达其他的一些设备具有很强的通用性，比如DPU、CPU和GPU。DRIVER Atlan在CPU部分采用的是Grace下一代产品，模糊的示意图显示大约有2个部分，每个部分有大概8个模块。GPU部分则采用的是安培的下一代架构产品，大概拥有12个计算模块。此外， Bluefield DPU也被使用在DRIVER Atlan之内，应该是用于接管安全和数据转移等任务，释放CPU资源。其余的部分还包括内存部分、内存IO部分、高速IO单元、加速单元、安全单元以及功能安全模块等。英伟达在DRIVER Atlan上还启用了400Gbps的网络连接，并达到了ASIL-D最高安全等级。

有关DRIVER Atlan的用途，英伟达表示2个Orin SoC实际上就可以在很大程度上实现高等级自动驾驶了，但是在特殊条件下实现自动驾驶的话，需要更高分辨率的摄像头、雷达等传感器以及更复杂的AI模型、更多的冗余和安全功能等。这些所有新增的功能都需要计算才能实现，这也就是DRIVER Atlan继续提升算力的基础。并且英伟达还考虑到未来的应用，包括汽车厂商一款汽车持续十余年的维护和使用。英伟达认为未来的汽车并不再是一个汽车，而是一个平台，一个数字化的、可以安装成千上万软件的平台，因此更强的性能是绝对必要的。

一个全栈计算巨无霸的诞生

GTC 2021上，英伟达CEO黄仁勋的演讲时长其实并不长，只有一个半小时多一点，但是其透露出来的信息是非常令人震撼的，本文只摘选了一部分改变整个产业界或者和硬件发展相关的内容给予解读，其中包括了元宇宙的概念和Omniverse的实现、DPU的用途和针对超算、云计算等场景的加速，以及Grace CPU突破AI计算带宽的桎梏，还有全新的、可以实现L5级别自动驾驶的DRIVER Atlan等，仅仅是这些内容，就足以让人感到震撼，更不要说整个GTC 2021演讲中还有大量包括软件、平台和AI方面的内容，着实精彩纷呈。我们推荐热爱技术的玩家花费一点时间去看看，除了了解新技术以外，说不定还对你的生活和人生有一点新的启发，观看地址在英伟达中文官网就有，中文字幕，也比较好理解。

总的来看，英伟达通过最近数年的发展，已经远远不是我们印象中那个只会造显卡，顺便做做A加速和自动驾驶的企业了，英伟达开始越来越关注生态、软件和底层，在拥有了GPU、DPU还是Omniverse，英伟达成为了业内少有的拥有全栈计算能力的巨无霸，并且依旧在快速发展着。我们可以看到，目前无论是工业还是娱乐、无论是汽车还是医药、无论是线上还是线下，英伟达的解决方案总会让你眼前一亮，甚至带给人们一种超越现在时代的感觉，充满未来感和科技感。

在本文的最后，我们还是要为Omniverse這样的平台叫好，它可能会改变人类一直以来获取数据和信息的方式，夸张一些说，Omniverse或者类似的平台，可能是推动下一个人类科技大爆发时代的重要工具，就像钻木取火、就像蒸汽机、就像电力一样，引领人类走向下一个时代。