黄仁勋:危机感从未远离
2024-01-09陈洋
陈洋
英伟达创始人兼CEO黄仁勋。图/视觉中国
“时间机器”狂欢的气氛早早燃起。
当地时间2023年8月22日,2024财年第二财季财报发布前夕,英伟达的股价飙升8.47%,创下自5月25日以来的最大单日涨幅。据芝加哥期权交易所的数据,2023年截至8月中旬,投资者已向英伟达相关期权注入超1000亿美元,其中约60%的资金涉及可用于押注股价持续走高的看涨期权。除特斯拉外,还没有其他股票曾收获如此热捧。
投资者的狂热没有踏空。8月23日发布的财报显示,英伟达期内实现收入135.1亿美元,同比上涨101%,高于预期的111.9亿美元;净利润61.9亿美元,同比上涨843%;非美国通用会计准则(non-GAAP)每股摊薄收益为2.70美元,同比上涨429%,高于预期的2.08美元。
分业务来看,AI芯片所在的数据中心业务贡献突出。2024财年第二财季,数据中心业务营收达到创纪录的103.2亿美元,环比增长141%,同比增长171%。相比分析师预期的79.8亿美元高出了29%。英伟达表示,这部分收入主要来自云服务商和大型消费类互联网公司。
“全球已经安装了价值约1万亿美元的数据中心,而这个上万亿美元的数据中心市场正在从通用计算向加速计算和生成式人工智能转型,” 60岁的英伟达联合创始人兼CEO黄仁勋在财报电话会议上宣称,“一个新的计算时代已经开启。”
2023年5月底,上一财季财报发布后,高涨的股价已将英伟达推上神坛,使其成为美国第七家市值破万亿美元的公司。3个月后,它再度刷新纪录且增势不减。作为这轮生成式人工智能浪潮中重要的基建公司,英伟达正在成为这个“新时代”的主要受益者和推动者。
时间回到大半个月前。8月8日晚,洛杉矶,穿着标志性的黑色皮夹克、黑色T恤、黑色牛仔裤,黄仁勋时隔5年再度登上计算机图形界顶级会议SIGGRAPH的舞台,宣布推出新一代GH200 Grace Hopper超级芯片(以下简称GH200)。
与2022年3月发布的H100相比,GH200专为人工智能大模型的训练和推理需求而打造。H100的架构以GPU(图形处理器)为主,GH200则将Nvidia Grace CPU(中央处理器)与 Hopper GPU 架构结合起来,并配备了当前全球最快的内存HBM3E,不仅极大提升了带宽,还显著降低了互连功耗,将为运行TB级数据应用提供高达10倍的性能。
2023年8月8日,在美国洛杉矶的SIGGRAPH大会上,英伟达发布新一代GH200 Grace Hopper超级芯片平台。图/NVIDIA
据悉,已投入量产的GH200将于本季度发货,采用HBM3e内存的第二代版本预计将于2024年第二季度发货。在此之前,H100仍是市场需求最大的GPU产品。虽然老牌芯片巨头AMD和英特尔接连加码AI芯片,陆续推出对标H100的产品,但当前英伟达在AI芯片领域的市场份额仍超过八成。
三十年前,因为看到游戏市场对3D图形处理能力的需求,黄仁勋和其他两位合伙人共同创建了英伟达。创立初期,公司的主要营收是向游戏玩家出售能提升画面清晰度的显卡。2003年,英伟达开始对传统GPU进行优化设计,旨在利用GPU的计算能力在非图形处理领域进行更通用的科学计算。一场更广泛的创新革命的齿轮由此开始转动。
黄仁勋将深度学习和GPU的相遇形容为“命运撞上了一点运气”,“创立英伟达是因为我们相信人类对计算速度的要求会越来越高。我们开发了一种非常擅长处理数据且有高通量计算能力的处理器,这恰恰使深度学习成为可能。”
2016年4月,英伟达发布了首款深度学习超级计算机DGX-1,其中搭載了8块专为深度神经网络打造的GPU产品P100。4个月后,黄仁勋亲自将一台DGX-1送往旧金山一家成立不足一年的非营利性人工智能研究机构。捐赠仪式上,他用记号笔在这款售价12.9万美元的机箱上写道,“为了计算和人类的未来,我捐出世界上第一台DGX-1。”这家受赠机构就是日后赫赫有名的OpenAI。正是基于 NVIDIA DGX 系统,OpenAI训练出了ChatGPT。
算力是机器学习得以不断突破极限的基础。据黄仁勋介绍,在2021年推出的A100上需要7天完成的训练,在H100上仅需20个小时。随着英伟达GPU在运算性能和能效上的逐代提升,以此为算力支撑的大模型得以在参数上实现质的飞跃。公开数据显示,OpenAI于2018年推出的GPT参数为1.17亿个,而到2023年发布的GPT-3.5,参数规模已超过1750亿个。
黄仁勋喜欢把GPU比作“时间机器”,“如果我们能让某件事加速100倍,研究人员、医生和艺术家就能看到未来”,“帮助这个时代的爱因斯坦和达芬奇们完成他们的事业就是我们公司的价值。”
“军备竞赛”
通用性、易用性和高性能是衡量AI芯片好坏的三个维度。英伟达能成为行业在AI算力上的首选,其护城河既体现在硬件性能,也在软件生态。
黄仁勋很早就意识到协同完善的软硬件生态是创造价值及压制对手的关键。2006年,为了推广GPU通用计算,英伟达开发了用于加速并行计算的软件开发平台CUDA,CUDA可以帮助开发人员更便捷地利用GPU加快计算应用程序的速度。
CUDA平台投入巨大,一度严重拖累了英伟达的利润。最初的几年里,黄仁勋背负了很大的压力,“股东希望我们专注于提高盈利能力,但我们坚信加速计算的时代即将来临。”黄仁勋将承受苦难视作追求愿景路上的必经之痛。
十几年来,CUDA逐渐渗透到包括AI在内的各个通用计算领域,实现了从硬件层到软件层的打通,且基于海量客户,不断实现性能优化。如今,英伟达的软硬件生态已经形成“比较成熟的市场、标准和护城河”。竞品要打开市场,短期内只能兼容CUDA生态,长期则很可能因此而被限制创新潜能,沦为夯实CUDA生态的砖瓦。
2022年底,ChatGPT展现出的强大内容生成能力震惊全球,成为现象级的消费类AI应用。科技巨头应势而动,争相布局大模型领域,其示范效应引发了AI领域的军备竞赛。生成式人工智能的繁荣建立在算力基础上,训练大模型无疑是昂贵的,特别是在供不应求的状况下。据硅谷风投巨头a16z测算,一家企业若要构建并运行自己的数据中心,每年需要花费在基础设施上的支出将超过5000万美元。一些大模型初创公司前脚筹集了数十亿美元的风险投资,其中的八九成转身便被投入购买算力。
错失大机会的恐惧让算力成为科技圈的“最硬通货”。市场对英伟达芯片的需求激增,远远超过了供应。“H100的供应自2023年4月初起便日益紧张,哪怕现在立刻下单,到货也要等到来年一二季度,” CoreWeave负责人8月初在接受《巴伦科技》采访时表示。CoreWeave此前的主要业务是加密货币挖矿,如今面向市场提供GPU租赁服务。
就连最初掀起这波热潮的公司OpenAI也无法获得足量的英伟达高性能GPU。2023年5月,在参加美国参议院司法委员会听证会时,OpenAI CEO萨姆·奥特曼就表示并不希望人们过多地使用ChatGPT,因为“我们没有足够的GPU”,这也影响了ChatGPT的持续优化。
芯片行业是个由一系列瓶颈构成的相互依存的网络。英伟达的主营业务是设计和销售图形处理器和系统芯片,并提供开发环境、工具和系统。以H100为例,其中使用到的高带宽内存(HBM)由韩国企业SK海力士供应,后者是目前唯一量产HBM3的供应商。H100的制造则被委托给台积电。除了HBM3供应吃紧,台积电的CoWoS封装产能同样是关键瓶颈。据悉,台积电正在积极扩大CoWoS封装产能,其2024年产能的四成已被英伟达提前预订。
2016年,黄仁勋将率先推出的DGX-1单机箱人工智能超级计算机赠予OpenAI。OpenAI 研究团队在计算机上签名。图/NVIDIA
除硅谷巨头外,中国的大型互联网企业是AI芯片的另一大去向。据英国《金融时报》8月初的报道,中国互联网巨头今明两年AI芯片的订单价值达50亿美元。针对这一数据,英伟达向第一财经回应称:“消费互联网公司和云服务提供商每年在数据中心组件方面投入金额达数十亿美元,通常都会提前几个月下订单。”
“过去两年的降本增效中,一些云计算平台减少了GPU采购,储备不足。此外,谁也不敢保证,今天能买的高性能 GPU,明天會不会就受到新的限制。”2023年6月,一位业内人士在接受《晚点 LatePost》采访时表示。
2022年8月,美国商务部对英伟达的最新两代GPU A100和H100实施出口管制,禁止向中国企业销售。同年10月,美国商务部正式出台了针对中国大陆的半导体出口管制新规,对先进芯片、软件以及用于生产先进芯片的各种半导体制造设备的对华出口提出了许可限制。
英伟达数据中心业务收入的20%至25%来自中国市场。为了降低政策影响,英伟达迅速推出了A100的替代产品A800和H800。根据公开资料,特供版的单卡算力几乎不变,但集群卡间高速互联的带宽分别下降了四分之一和一半左右,会限制AI模型的训练速度。按照彭博社的说法,同样的 AI 任务,H800要比H100多耗费10%到30%的时间。
《华尔街日报》6月底曾援引知情人士消息称,美国正在考虑对向中国出口人工智能芯片实施新的限制,将禁止在没有许可证的情况下对华销售A800芯片,并将一些低算力芯片纳入限制范围。包括英伟达在内的美国半导体行业曾多次就政府的对华限制政策发声。在最近的财报电话会议上,英伟达首席财务官科莱特·克雷斯就强调,“中国市场是全球最大的市场之一。一旦GPU禁售政策实施,美国半导体行业将永久失去在这里竞争和领先的机会。”
“数据、算法、算力是人工智能的三大核心要素。中国拥有海量数据,近年在算法上突飞猛进,美国卡不了这两块,就卡算力。算法是基于算力的,把算力卡下来,算法就难以进一步优化,数据再多也没用。”一名熟悉中美半导体政策的资深人士在接受《财新》采访时表示。
在管控可能持续加码的阴霾下,半导体芯片国产替代的需求凸显。虽然在通用GPU赛道上,过去数年国内也陆续涌现出一批初创企业,但在产品的成熟度和性价比、商业化的验证和落地、客户基础和软件生态等方面,这些企业仍与英伟达差距明显。
在《芯片战争》的作者、美国塔夫茨大学副教授克里斯·米勒看来,虽然中国企业取得了一些有意义的成功,但几乎每一项重大进步都会遭到美国新的出口管制,“这使得中国推动半导体自给自足的努力更加重要,但也更加困难和昂贵。”
神话与变数
2017年,创业第24个年头,为庆祝股价突破百元,黄仁勋在左臂文上了公司的标志“绿眼睛”。此后的5年间,英伟达的股价从每股100美元飙升至超451美元(截至2023年9月11日)。2023年以来,英伟达的股价已上涨两倍多,持股3.5%的黄仁勋也成为全球科技行业财富增长最快的人之一。
1963年,黄仁勋出生在台北。他的父亲是化学工程师,母亲在小学任教。70年代初,台湾时局动荡,一家人迁往泰国。然而,越南战事正酣,泰国亦被牵涉其中。1973年,泰国爆发骚乱,考虑到孩子们的未来,黄父设法把9岁的黄仁勋和大他一岁的哥哥送到美国投奔叔叔。
叔叔英文不好,误读了招生信息,将本应去预科学校的兄弟俩送到了肯塔基州一所专门接收问题青少年的寄宿学校。据黄仁勋回忆,学生们大多会随身携带小刀,一旦发生冲突,总会有人受伤。他的室友刚从少管所出来,是个身上带着刀疤的男孩。放学后,孩子们会被分配各种工作,黄仁勋需要打扫男厕所,他的哥哥则要赶往烟草农场干活。
年少的黄仁勋没有因此颓靡,而是找到了适合自己的生存之道。他会帮助一位年长的室友学习数学,还加入了学校的游泳队。“故事的结局是我喜欢在那里的时光,这是一段美妙的学习经历,”黄仁勋学会了如何面对不可控的外部环境,并找到在混乱中前行的方法。
在俄勒冈州立大学学习电气工程专业期间,为了改变内向的性格,黄仁勋在一家名叫“Denny's”的连锁餐厅做兼职服务员。这家餐厅不仅见证了一位金牌销售员的诞生。1993年,黄仁勋30岁生日那天,也是在这家餐厅的一张餐桌上,他和两位好友决定离职创业。从斯坦福大学硕士毕业后,黄仁勋先后在AMD、LSI Logic工作。工程师出身又有销售和管理经验的黄仁勋被推选为CEO。30年后,他成为全球任职时间最长的科技公司CEO之一。
在黄仁勋看来,创业和人生一样,是“荣耀”和“悲剧”的永恒交替,成功的关键是当事情没有按预期发展时,你是否能正视错误、及时纠错、谦卑求助并持续向前。
20世纪90年代,创立不久的英伟达因为开发方向偏离市场主流,不得不更换技术路径。然而竞争对手的产品发布在即,他们必须在数月之内拿出足够有竞争力的新产品。从合作方处力争来的资金仅够支撑9个月。为确保芯片的所有功能在投产前万无一失,黄仁勋斥资100万美元买下一台模拟机,用“公司3个月的寿命”换来了反复测试的机会。RIVA 128最终顺利面世,这是一款专门用于在windows操作系统中渲染3D图形的软件。破釜沉舟的黄仁勋赢得了一次扭转公司命运的机会。
2015年3月17日,美国加州圣何塞,黄仁勋 (左) 与特斯拉创始人马斯克( 右) 在GPU技术会议上交流 图/视觉中国
2023年8月29日,谷歌云CEO托马斯·库里安 (左) 与英伟达创始人兼CEO黄仁勋 (右) 宣布扩大合作伙伴关系以推进AI计算、软件和服务的发展。图/NVIDIA
然而变数再度袭来。微软发布的游戏编程接口DirectX可支持32種图形渲染模式,而RIVA 128只能提供其中的8种。黄仁勋和团队跑遍了全球的主要游戏开发商,轮番游说,“你喜欢RIVA128的很多优点,所以没其他的24种模式也还好吧。你要是用了它们,我们就死定了。”这是一场艰难的胜利。发布后的4个月,RIVA 128的出货量超过百万台,成为英伟达的首款热门产品,也为其后续的产品开发提供了资金。
2020年,英伟达首次在市值上实现对英特尔的超越,成为美国市值最高的芯片厂商。在接受媒体采访时,被祝贺声环绕的黄仁勋描述着自己从未远离的危机感,“每天早上我都在惊慌中醒来,我有很多工作要做,我有一家公司需要拯救。我们有很多合作伙伴和企业,我们不想让他们失望。那种感觉永远不会消失。”
对于“增长神话”的源起和消散,黄仁勋并不陌生。
2017年比特币暴涨引发“挖矿”狂潮,带动显卡销量和价格大幅上扬。彼时,在数字货币市场抢占了超七成份额的英伟达市值同样屡创新高。可仅仅一年后,加密货币的币值便经历数轮崩塌。不仅与区块链相关的GPU收入同比大幅下降,大量二手显卡也回流市场,进一步影响了游戏玩家对库存GPU的需求,一度导致英伟达的市值在4个月内遭遇“腰斩”。
2021年,“元宇宙”概念兴起,又逢加密货币币值回弹,英伟达股价在当年11月创下历史新高。这轮上涨同样未能延续太久。一年后,“元宇宙”发展陷入困境,加密货币的行情再度跳水,英伟达的股价于2022年10月跌至历史新低,同比跌幅近70%。次月,ChatGPT发布,英伟达股价开始掉头拉涨,增长神话开启新的篇章。
这轮人工智能热潮会持续到明年么?并非所有分析师都持乐观态度。部分观点认为,为了规避错失良机的风险,很多企业和机构会对GPU进行过度投资,然而越过某个时点,他们终究需要谨慎评估如此昂贵的投入是否真的能帮他们赚到钱,而后过度投资之势便会暂停甚至逆转。此外,为了减少对英伟达的依赖,提高议价能力,大型云服务商等已经开始在内部积极推进定制AI芯片的研发。大客户们的下场也让这个原本就竞争激烈的赛道更为拥挤。
科技的潮头总是一波接一波,层波叠浪间翻滚着人类的好奇、欲望与盲从,裹挟着技术和经济的周期更迭,以及地缘政治的云谲波诡。作为“在淘金潮里卖铲子的人”,如何创造、选择和驾乘海浪,是不变的课题。而对于黄仁勋来说,企业经营理念和人生态度极其相似,“当你无法分辨自己是在寻找食物还是逃避成为食物时,奔跑就好了。”