APP下载

黄仁勋的选择

2024-02-09STEPHENWITT

商界 2024年1期
关键词:超级计算机克里神经网络

STEPHEN WITT

都知道ChatGPT,这个令全世界惊叹的人工智能聊天机器人,在英伟达(Nvidia)超级计算机上训练完成后,就促成了股市史上最大的单日涨幅——2023年5月25日,纳斯达克开市时,英伟达的市值增加了约两千亿美元。

几个月前,英伟达CEO黄仁勋告知投资者,英伟达已经向美国百大公司中的50家公司销售了类似的超级计算机。交易日结束时,英伟达成为了全球市值第6高的公司,价值超过沃尔玛和埃克森美孚的总和。

“人工智能领域正在进行一场战争,而英伟达是唯一的军火商。”一位华尔街分析师说。

在过去很长一段时间,CPU的主要制造商是英特尔,这家巨头多次将英伟达逼到濒临破产的绝境,黄仁勋形容他们之间的关系如《猫和老鼠》一般。

不同于英特尔专攻CPU技术,1999年,英伟达推出了一款名为GeForce的图形处理器械(GPU)。CPU的功能类似于一辆送货卡车,一次交付一个包裹;而GPU更像是一队摩托车在城市中穿梭并处理订单。

GeForce系列取得了成功,视频游戏《雷神之锤》系列则加速了它的普及,该系列游戏还推出了多人对战的模式,PC玩家为了提升体验感,每次游戏升级都会购买新的GeForce。2000年,斯坦福大学计算机图形学研究生伊恩·巴克将32张GeForce卡连接在一起,使用8个投影仪玩《雷神之锤》。“这是第一个8K分辨率的游戏机,占满了整个墙壁。”

GeForce顯卡附带了一种叫作“着色器”的原始编程工具。在美国研究机构darpa的资助下,伊恩·巴克黑进了着色器,访问了下面的并行计算电路,将GeForce变成了一台低成本的超级计算机。不久之后,巴克就加入了黄仁勋的团队。

自2004年以来,巴克一直负责英伟达的超级计算软件包(CUDA)的开发。黄仁勋的愿望是让CUDA在每张GeForce卡上运行。

随着巴克对软件的开发,英伟达的硬件团队开始为CUDA在微芯片上分配空间。英伟达的首席芯片工程师阿尔琼·普拉布将微芯片的设计比作城市规划,芯片的不同区域专门用于不同的任务。

CUDA于2006年底发布时,引起了华尔街的不安。黄仁勋将超级计算推向了普通消费者,但大家并没有展现出相应的热情。到2008年底,英伟达的股价已经下跌了七成。

黄仁勋在演讲中提到了他访问物理学教授邱庭威的经历,表示这段经历让他在那段苦闷的日子里看到了希望。邱庭威当时正在尝试模拟大爆炸后物质的演化过程,并在他办公室旁边的实验室里搭建了一个自制的超级计算机。当他拜访教授时,发现实验室里堆满了GeForce显卡的盒子。

邱庭威是一个理想的客户,然而像他这样的人并不多。CUDA的下载量在 2009年达到峰值,但在接下来的3年里下载量接连下降。

在推广CUDA时,英伟达曾四处寻求各类客户。然而,在21世纪初,人工智能是一门被忽视的学科。在这个不受欢迎的学术领域内,“神经网络”这一领域更加不受欢迎,许多计算机科学家认为神经网络是被淘汰的技术。

深度学习研究员卡坦扎罗表示:“当时我的导师们劝我不要研究神经网络,因为它过时,而且不起作用。”

卡坦扎罗将致力于神经网络研究的研究员描述为“荒野中的先知”。其中一位先知是多伦多大学的教授杰弗里·辛顿。2009年,辛顿的研究小组利用英伟达的CUDA平台训练了一个神经网络,用于识别人类语音,他对CUDA平台的效果感到惊讶。

辛顿鼓励他的学生使用CUDA,其中包括一位名为亚历克斯·克里切夫斯基的乌克兰籍学生。2012年,克里切夫斯基和他的研究搭档伊利亚·苏茨克沃在有限的预算下,从亚马逊购买了两张GeForce卡。然后,克里切夫斯基开始在英伟达的并行计算平台上训练一个视觉识别神经网络。

苏茨克沃和克里切夫斯基对这些显卡的处理能力感到惊讶。在同年早些时候,谷歌研究人员训练了一个神经网络,耗费了大约16 000个CPU。而他俩仅使用两张英伟达显卡就取得了一流的成果。

AlexNet——克里切夫斯基在他父母家里训练的神经网络,这一伟大的发明现在可以与莱特飞行器和爱迪生灯泡并论。2012年,克里切夫斯基将AlexNet提交到年度ImageNet视觉识别比赛。当时神经网络并不受欢迎,他是唯一使用这种技术的参赛者。AlexNet在比赛中表现出色,以至于主办方最初怀疑克里切夫斯基是否以某种方式作弊。

在克里切夫斯基发表AlexNet架构的9页论文的十年里,该论文已被引用超过10万次,成为计算机科学历史上最重要的论文之一。克里切夫斯基开创了许多重要的编程技术,但他其中一项重大发现是,一块专用的GPU训练神经网络的速度比一块通用的CPU快100倍。

几年之内,ImageNet比赛的每个参赛者都在使用神经网络技术。到了2010年左右,通过GPU训练的神经网络能够以96%的准确率识别图像,准确率甚至超过了人类。黄仁勋为期十年的使命,即让超级计算机大众化,取得了成功。

黄仁勋得出结论,神经网络将彻底改变社会,而他可以利用CUDA垄断硬件市场。为此,他押注了整个公司。

“他在星期五晚上发了一封电子邮件,说公司一切都将转向深度学习领域,我们不再是一家图形处理器公司。”英伟达的副总裁格雷格·埃斯特斯表示,“到了星期一早上,我们就成了一家人工智能公司。真的,就是那么快。”

黄仁勋更喜欢一种灵活的企业结构,没有固定的部门或等级制度。员工每周需要提交5项重要任务清单。他经常走到基层员工的桌子前,对他们进行提问。“在硅谷,很多人习惯于通过编造借口来逃避责任。”行业分析师汉斯·莫瑟斯曼透露,“但你在他那里行不通,他会发火。”

每天他通过写数百封电子邮件与员工交流,有时一封邮件只有几个字。这种独特的沟通方式在公司内部形成了一种特殊的文化。一位高管将这些电子邮件比作俳句,另一位高管将其比作勒索信。

在安排时间时,他要求员工尽可能地提高效率,达到“光速”。

这意味着员工们会将效率放在第一位,然后向可实现的目标推进。他还鼓励员工探索那些没有竞争对手、甚至没有明确客户的领域,比如Cuda。

黄仁勋最激进的信念之一是“必须分享失败”。

本世纪初,英伟达发售了一款风扇噪音极大的图形处理器,故障很多。他没有解雇该卡的产品经理,而是安排了一次会议,让经理们在会上向数百人分析导致惨败的细节。

但这样的企业并不适合每个人,黄仁勋的员工有时对他多变的个性颇有微词。“我大脑里正在思考的事情与我嘴里说出来的东西并不完全一致。”他解释道,“当错位很严重时,就会表现为愤怒。”即便他在冷静时,他的性格也是强势的。有员工说,“与黄仁勋互动有点像把手指伸进插座。”

尽管如此,英伟达的员工流失率很低。杰夫·费希尔负责公司的消费者部门,是最早的员工之一。即便他现在非常富有,但仍然继续工作。

尽管有时被批评为“反复无常”和“难以相处”,但黄仁勋的这种管理风格却为公司培养了一种特殊的凝聚力。员工深深感受到了黄仁勋对公司的热爱和对使命的执着追求。这种情感也使得英伟达的员工留存率一直保持在很高的水平。

在AlexNet取得成功后,风险投资家们开始向人工智能领域投入资金。安德烈森·霍洛维茨公司的马克·安德烈森在2016年表示:“我们一直在投资许多将深度学习应用于各个领域的初创公司,而每一家的数据训练都是在英伟达的平台上进行的。”

大约在那个时候,英伟达推出了其第一台专用人工智能超级计算机DGX-1,将其交付给了OpenAI的一个研究小组。黄仁勋亲自将DGX-1送到了OpenAI的办公室。

2017年,谷歌的研究人员推出了名为Transformer的新型神经网络训练架构。第二年,OpenAI的研究人員使用谷歌的框架构建了第一个GPT。GPT模型是在英伟达超级计算机上训练的,吸收了庞大的文本语料库,并学会了如何建立类似人类的思维联系。2022年底,经过几个版本的迭代,ChatGPT向公众发布。

自那以来,英伟达订单不断。该公司的最新人工智能训练模块——DGX H100,是一个重达370磅的金属箱,售价高达20万美元。目前,该产品的交货期已经排到了几个月以后。DGX H100的运算速度是训练ChatGPT的硬件的5倍,而且可以在不到1分钟的时间内完成对AlexNet的训练。

最新的人工智能拥有令人惊讶的能力,没有人确切地知道它们能够做什么。在接下来的几年里,通过加速演化,英伟达的硬件将训练各种类似的人工智能模型。有些模型将用于管理投资组合,有些将驾驶无人机,有些将窃取用户的肖像并复制它,有些将模仿死者的声音,有些将作为自主机器人的大脑,有些将创造基因定制的药物,有些将谱写音乐,有些将创作诗歌。

英伟达设备毛利率接近70%,这一利润率引起了同行的觊觎。谷歌和特斯拉正在开发人工智能培训硬件,许多初创公司也在这一赛道深耕。

英伟达最大的竞争对手是AMD。自2014年以来,AMD便由苏姿丰掌舵。她同样是一位出色的工程师,年幼时从中国台湾移民到美国。在苏姿丰成为公司负责人之后的几年里,AMD的股价翻了30倍,使她成为仅次于黄仁勋的最成功的半导体首席执行官。

苏姿丰也是黄仁勋的表亲。

他们的个性不同:苏姿丰沉默寡言,黄仁勋性情多变且表达丰富。黄仁勋在幼年时并不认识苏姿丰;他只是在她被任命为首席执行官后才认识她。“她很棒。”他说,“我们竞争并不激烈。”

苏姿丰喜欢紧随大佬的步伐,等待其失误。与黄仁勋不同,她不害怕与英特尔竞争,在过去的十年里,AMD夺取了英特尔CPU业务的大部分份额,这一成就曾被分析师认为是不可能完成的。

“我永远不满足。”黄仁勋说到,“我永远在追求完美。”

当被问到,目前他手上是否正有值得孤注一掷的项目时,他立刻回答:“Omniverse。”受到虚拟现实建筑的启发,该项目是英伟达开发的一个虚拟现实和仿真平台,黄仁勋将其描述为“工业元宇宙”。

自2018年以来,英伟达的图形卡配备了“光线追踪”技术,该技术模拟了光线如何从物体上反射,以产生逼真的效果。

黄仁勋的愿景是将英伟达的计算机图形研究与其生成式人工智能研究统一起来。在他看来,图像生成的人工智能很快将变得非常复杂,以至于能够渲染出三维的、栩栩如生的世界,并在其中填充看似真实的人物。同时,具备语言处理能力的人工智能将能即时翻译语音指令,打破语言障碍。

当谈到人工智能是否会变得有自我意识时,黄仁勋给出了一个引人深思的答案:“为了让你成为一个生物,你必须有意识。你必须对自己有一些了解。”

猜你喜欢

超级计算机克里神经网络
我可以咬一口吗?
超级计算机
超级计算机及其在航空航天领域中的应用
神经网络抑制无线通信干扰探究
你今天真好看
美国制造出全球最快超级计算机
要借你个肩膀吗?
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定