日本AI,老无所依
2024-06-19于野
于野
2019年,有两件事一直困扰着孙正义:软银的投资失败,以及日本科技的落后。
面对媒体,孙正义痛心地说:“科技产业几乎从日本消失了,我们正在成为一个被遗忘的国家。即将到来的AI革命,是日本重回牌桌最后的机会。”
随着ChatGPT问世,孙正义的呼吁终于成为共识。然而,正当日本举国动员,准备一脚油门闯入赛道时,却发现了一个尴尬的事实:日本目前的AI研究,非常依赖以隔壁邻居为首的老外。
RIKEN(理化学研究所)是日本唯一的国家级科研机构,顶级头脑聚集地。汤川秀树等日本诺奖得主,曾在这做过研究。然而,那些被收录的RIKEN论文,近一半的作者都隶属于国外大学,其中约一半的人来自中国。
本土无人可用,使得日本在生成式AI浪潮里,始终处于失语状态。
然而,如若回溯历史,会发现日本也曾是个“AI大国”。
20世纪八九十年代,日本一度是深度学习的中心。杨立昆、余凯、林元庆、贾扬清等载入科技史册的泰斗级人物,都曾在日本的AI实验室度过一段青葱岁月。
曾经攥着一手好牌的日本,为何会迈向老无所依的结局?
站在肩膀上前行
只要在日本生活工作,你就会发现很多应用程序和软件的迭代速度非常慢,甚至没有迭代。不仅软件界面的设计有着和中美欧不一样的审美,而且速度慢、容易卡顿,随时有宕机的风险。
究其主要原因,是软件被视为硬件的补充,不算是创新的努力方向。“不就是0和1的不同排序吗?”这种思维弥漫在日本“产官学”的主流,更讽刺的是,老龄少子化进一步固化了这种思维,重硬轻软的人依旧控制着“产官学”的话语权和预算权。
20世纪80年代,正在读大学的杨立昆,被一群“疯子”吸引了。
彼时,深度学习是个已被证伪的技术路线。然而,仍有一小撮人在死磕,其中就包括一批日本科学家。杨立昆发现,当时大部分的深度学习论文,都是日本研究人员用英文写的。
其中,对他影响最大的,是一位名叫福岛邦彦的日本人。
1980年,福岛邦彦参照猫的视觉结构,设计了一个叫做“神经认知机”的多层网络模型。
在生物的初级视觉皮层中,存在多个神经元,每个神经元只“掌管”一小部分视野。随后,神经元收集到的信息会统一传输到视觉皮层,组合成完整的视觉图像。
受此启发,福岛邦彦给神经认知机设计了两个神经元,分别用来“提取图形信息”和“组成图形信息”。然而,福岛邦彦的神经认知机存在一个致命问题:太超前了。
当时,主流的神经网络只有1层,但神经认知机有足足5层。
面对多层设计带来的种种问题,福岛邦彦一时找不到解决办法,导致神经认知机只能处理一些极其简单的工作。
直到1986年,辛顿提出了“反向传播算法”,这个问题才有了标准答案。
但若向前追溯反向传播算法,会发现其源头仍是日本人。20世纪60年代,日本数学家甘利俊一提出的“随机梯度下降方法”,为其提供了技术灵感。只不过囿于特定时代,甘利俊一没有条件在计算机上进行模拟验证。
1988年,杨立昆打造出了大名鼎鼎的卷积神经网络。直到今天,卷积神经网络仍是图像识别领域最重要的算法之一。
可见,这些定义一个时代的AI研究成果,都是站在日本科学家肩膀上实现的。
同一时期,日本的产业界拉开了更为激进的历史篇章。
彼时,日本步入极度繁荣的泡沫经济时代。大型企业纷纷为爱发电,自掏腰包搭建中央实验室,发力基础科学。其中,要数NEC(日本电气股份有限公司)最为激进:它直接切入美国科技产业腹地,将实验室开到了普林斯顿和硅谷。
财大气粗的NEC实验室,很快聚集了一大批日后响当当的人物。
西安交大软件学院院长、教授龚怡宏,是第一个加入硅谷NEC实验室的中国科学家。在他担任实验室主任时期,招募了一众青年才俊。其中既有触发科技巨头竞拍辛顿的余凯,也有林元庆、徐伟等活跃在中国AI产业一线的技术人才。
彼时,中国计算机产业刚刚起步,吸纳不了那么多人才,硅谷NEC实验室无缝承接了这个需求,并招揽了大批立志从事AI研究的科学家。
余凯接棒硅谷NEC实验室主任一职后,又招募来了黄畅。当时,黄畅底下有一个名叫贾扬清的实习生。在NEC实验室期间,贾扬清展露出了高超的数学和工程代码能力,曾让实验室众人坚信其日后必有所造诣。这种薪火相传的孵化线,在林元庆接手硅谷NEC实验室后仍在继续。
可以说,历史上没有任何一家机构,能如NEC实验室这般,拥有此等高手如林的班底。
余凯曾在媒体专访中如此形容NEC实验室巅峰时期的影响力:如果你在谷歌上搜索美国NEC实验室,页面会立刻弹出一句话:你要不要来谷歌工作?
然而鼎盛时期风光无两的NEC实验室,却早已埋下了衰败的草蛇灰线。
迷航
2002年,杨立昆刚在普林斯顿进行了一年的研究工作,NEC就开始施压。
管理层毫不客气地对杨立昆讲,NEC对深度学习没有一丝兴趣,并顺手解雇了当时的实验室主任。这段经历让杨立昆对产业界彻底失望,跑回纽约大学当了老师。
NEC突然自毁长城,有两个不容忽视的现实原因:
一是对AI失去了信心。彼时,无论是芯片算力,还是数据丰富程度,都远不足以让深度学习发挥其潜力。与此同时,“第五代计算机”项目的失败,更是雪上加霜。
“第五代计算机”项目始于20世纪80年代,目标是打造AI驱动的超级计算机。
在日本的设想中,第五代计算机将具备回答问题、知识库管理、图像识别、代码生成等功能。这个“领先时代40年”的项目,一度将美国吓得不轻,立马掏出补贴与日本竞争。
如此一拍脑袋的项目,结局可想而知。
1992年,五代机项目宣告破产。日本不仅白白浪费了数亿美金,还把其他跟风的国家给忽悠了。一怒之下,人们将责任归咎于AI。日后很长时间里,AI研究在日本如同过街老鼠,人人喊打。
其次,日本的中央实验室模式,此时也出了问题。
日本企业对于NEC实验室等中央实验室的定位,是纯粹的基础科研机构。这种模式没有与市场和产业接轨,只是盲目追求多拿几个诺贝尔奖。这让科学家们非常苦闷,内部时常调侃称“反正做的东西也用不到产品上”。
因此,当经济泡沫消失,日本进入新的低谷,毫无实际用处的实验室,理所当然成了第一批“挨刀”的对象。
2009-2020年间,NEC多次进行大规模裁员,并大幅缩减研发经费。
在此阶段,中美科学家们纷纷选择自主创业或另择良木而栖。
2012年,余凯受李彦宏邀请,领导百度的AI业务。在他的号召下,此前NEC Lab的同僚,也先后加入。
日本花大力气点燃的AI火种,最终造就了今天中国AI的冲天火光。
2018年NEC第四次大裁员后,其美国实验室的技术中坚力量,几乎流失殆尽……
孤胆孙正义
日本AI高歌猛进的步调,随着NEC美国实验室的落寞戛然而止。
全球人工智能的历史仍在继续,就好像五代机项目从未存在过一样;而曾经组建了全明星阵容的NEC实验室,也渐渐被淡忘。在过去的三十年里,日本几乎没有在深度学习领域,留下任何痕迹。
不仅如此,日本还对深度学习留下了根深蒂固的偏见。
2016年AlphaGo击败了名将李世石,登上了全球科技新闻的头版。这一年,中国诞生了528家AI企业,催生371起AI投融资。从科学家到VC,都热情地谈论着深度学习的潜力。然而,日本却是另一番风景。
同年,日本产经省也举办了一场全国人工智能大会。有学者准备就深度学习提出两个企划案,却被同席的学术研究者提醒,“如果名字里加上深度学习的话,估计就没有人来听了吧”。
这种裹足不前的态度,是日本AI如今无人可用的重要诱因。
唯一意识到问题的,正是软银集团的孙正义。
2017年,孙正义在推出全球最大的私募股权科技投资基金时,笃定地表示,该基金只会根据一项策略进行投资,就是AI。
接下来的几年时间里,软银在AI领域的投资不可谓不激进。
光是在季度和年度报告中,孙正义提到“AI”的频数就超过500次,并大手笔地为超过400家AI创业公司注入1 400多亿美元资金。他甚至还在2020年胸有成竹地表示,史无前例的投资狂潮,将使软银成为主导AI革命的投资公司。
然而,孤掌难鸣。更尴尬的是,软银还押错了宝。
据相关机构于2023年公开的数据,在26家估值超过10亿美元的AI创业公司里,软银只投中了一家。
此外,孙正义虽然斥40亿美元投资英伟达,却在其股价暴涨前悉数抛掉,与近10倍的涨幅收益失之交臂。如果不是押中了ARM,孙正义的AI投资或将颗粒无收。
在ChatGPT引爆生成式AI热潮的2023年,孙正义在股东大会上痛心疾首地表示,自2022年末以来他就一直在反省,“为自己犯了很多错误感到羞愧”,“哭了好几天都停不下来”。
结语:
孙正义的眼泪,既是对软银频频押注失误的悔恨,更是对日本AI产业的恨铁不成钢。
2019年时,孙正义曾不加掩饰地公开批判:在当前最重要的科技革命上,日本已变成了一个“后进国”,而使其不断丧失竞争力的本质原因,是对进步的不贪婪。
这番言论,掺杂了不少情绪因素。实际上,这些都不是日本AI老无所依的根本原因。
深度学习从来都不是一场孤立的革命。
2012年,深度学习能够爆发,其实有两个先决条件:一是算力进化,当时英伟达所开发的GPU,已经初步能支撑起深度学习所需的算力;二是互联网的全面铺开,弥补了数据不足的问题。
集成电路、互联网、云计算,随着这些前置产业陆续成熟,深度学习才得以登上历史舞台。然而,这些产业,日本几乎一个都没有。
当年,在斯坦福教书的吴恩达想要进行大型图像识别实验,尚且有谷歌倾尽整个数据中心的算力,来成就他的The Cat Neurons项目。
然而,福岛邦彦和甘利俊一却没有这么幸运。即便是如今的日本,也没有任何一家民间公司,拥有训练AI大模型所需的庞大算力。仅在政府主导的理化学研究所中,才能找到“富岳”这样的超级计算机。
日本如果不能解决这个问题,其实发展AI的路很难走。但是这条路,和日本重硬件、轻软件的现状明显相违背。这里,其实就是一个死结。