APP下载

试图打败人类的DeepMind是个“赔钱货”

2018-10-20

看天下 2018年28期
关键词:星际争霸比斯论文

对于关注人工智能领域的人而言,DeepMind绝不是个陌生的名字。2016年DeepMind培养的AlphaGo首次击败韩国围棋冠军李世石,之后又在乌镇打败中国选手柯洁,DeepMind早已声名远 播。

但DeepMind其实是一家非常烧钱的公司。在一次次刷新人类纪录的表面风光之后,DeepMind亏损严重,换句话讲,DeepMind每一次刷的存在感,背后都是泪。

最近,这家谷歌旗下人工智能超级明星公司,刚刚提交了最新的财务报告。报告显示,DeepMind去年亏损继续扩大,一年比一年大。

2017年,DeepMind亏损3.02亿英镑,相当于人民币27亿元。这个数字同比增长221%。同期,DeepMind的员工成本大增。简单估算一下,这家公司员工的平均年薪:250万元(人民币)。

令人遗憾的是,DeepMind的商业化能力没有同步猛增。这就需要东家谷歌的大力支持了。DeepMind在报告中说,谷歌会在至少未来12个月里,继续向他们提供充足的财务支持,还写下了书面保证。

员工平均年薪:28万英镑

2014年,谷歌击败Facebook斥资6亿美元收购DeepMind,然而,并不是所有谷歌员工都认为这是明智之举。

由美国科技媒体The Information主编杰西卡·莱辛(Jessica Lessin)和记者凯文·麦克劳林(Kevin McLaughlin)撰写的深度报告称,当得知谷歌收购DeepMind的交易完成时,谷歌内部的AI研究人员感到十分吃惊,紧张情绪也有所上升。

谷歌2015年重组为控股公司Alphabet时,DeepMind独立出来,如今该公司拥有相对较高的自主权。据称,DeepMind缺少营收能力是谷歌员工感到不满的主要原因之一。另一些人则对DeepMind在Alphabet内部拥有“特殊地位”感到恼火,因为这允许它从事可能在几十年内都无法取得成果的项目。

2016年,DeepMind的亏损额仅为9395万英镑,1年后,就增加至3.02亿英镑。钱都花哪儿了?DeepMind的行政管理支出从上一年的1.64亿英镑增加到3.34亿英镑,增长了104%。其中,员工成本和相关支出占2亿英镑,这项支出在2016年是1.05亿英镑。

DeepMind CEO戴密斯·哈薩比斯(Demis Hassabis)去年年底接受电台采访时透露,DeepMind目前有700名员工,其中400名博士。

虽说2亿英镑中除了员工薪酬之外,还包含福利、差旅之类的支出,不过,也可以大致折算出DeepMind员工的平均年薪:28万英镑左右,折合人民币大约250万元。

另外,DeepMind在2017年还捐出815.3万英镑(1067万美元)的慈善和学术捐款,而2016年只有30.8万英镑。这些钱,主要花在与高校的合作上。Business Insider从该公司得到的消息是,这些学术捐款的对象包括纽约大学、伦敦大学学院、帝国理工、阿尔伯塔大学,没有附加条件,单纯地用来支持它们的AI研究。

估计谷歌AI部门的员工们,看了DeepMind最新的财务报告后,会给谷歌联合创始人、Alphabet首席执行官拉里·佩奇疯狂发邮件表达自己的不满。拉里·佩奇掌控着DeepMind的财务预算。

“钱途”不顺

赚钱方面DeepMind的进展不大。2017年,DeepMind的营业额,也就是从其他公司收取的技术服务费,共计5442万英镑,比上一年的4028万英镑增长了35%。

据Business Insider报道,这些收入依然大部分来自母公司Alphabet,比如说用AI帮谷歌的数据中心降低能耗、为谷歌Assistant提供语音合成技术等。

DeepMind在英国的医疗业务依然没有开始赚钱。2016年,DeepMind 与英国国家医疗服务体系 NHS 正式达成 5 年合作。NHS 下属规模最大的医院之中,位于伦敦的3家医院 Royal Free、Barnet 和 Chase Farm,已经同意与 DeepMind 分享 160 万名患者的医疗数据。

DeepMind 将用这些数据开发一款名为Streams的手机App,同时发布的还有一套患者健康风险警告系统,对有急性肾病和血液中毒风险的病人发出警告。该系统将被整合入Streams,医生和护士能够在手机上以“重大新闻”的方式,收到病人健康风险的警告。医护工作者们不再需要翻找纸本的检查报告,他们可以在App上查看病人的所有医疗数据,包括血液化验结果,如果任何一个化验项目不正常,App会立即推送警告。

DeepMind 联合创始人穆斯塔法·苏莱曼(Mustafa Suleyman)说:“为了扩大市场,我们必须为这类医疗软件建立起一个可持续的商业模式,这就是我们探索的方向。” 当技术被完全验证之后,他们考虑把它市场化。

不过,这个看似很有“钱途”的项目一直进展的不顺利。一方面,反对者忧虑这项合作存在泄露病人隐私的风险;另一方面,每一个英国公民从出生到死亡都享受着政府资助的免费医疗。NHS 作为向全社会提供医疗服务的公立机构,它的一举一动都牵动着大众的神经。2017年7月,英国最高隐私保护监管部门裁定,DeepMind与英国国家医疗服务体系的医学实验违反英国的数据保护法。

一心扑在论文上

花钱越来越多,挣钱的能力没有提升,但总要对东家有所交代。自2017年5月,AlphaGo击败柯洁后,CEO哈萨比斯曾表示,“这只是一个开始。”DeepMind这一年多的时间都干什么了?有没有憋出什么大招?

AlphaGo退役的头两个月,DeepMind非常勤奋,发表论文、公开新技术和讨论AI未来的次数都创下了记录,差不多每五天就会有一篇新论文面世,而且干货满满,涉及到不少AI的关键领域和空白领域。

众多论文中,有一篇论文非常出名,名称为《丰富环境下运动行为的出现》,在这篇论文中,DeepMind干了一件很有意思的事:让AI学跑酷。

根据DeepMind给出的资料,他们在实验中没有给出复杂的奖励机制:比如挺胸抬头加分、姿势优美加分等,而是制定以通过为唯一目标的简单奖励机制。在布满落崖、障碍物,甚至墙壁的关卡里,强化学习系统完全凭借自己的分析能力来制定应对策略。结果证明,简单指令下AI也可以应对复杂环境并且完成目标。这个实验的目的,在于测试强化学习如何适应陌生的复杂环境。

DeepMind的老大哈萨比斯也亲自出马,发表了一篇论文,有意思的是该文章并不是发表在人工智能领域的期刊上,而是发表在神经医学领域的最高规格刊物《神经》当中。在这篇文章中,哈萨比斯讨论的核心问题是,人工智能想要发挥最大可能性,唯一的方法是回到神经科学领域,深入钻研人类大脑。

哈萨比斯认为,现在虽然人工智能成果大量爆发,但这些算法和技术大多只能解决一个问题:机器学习只能承担一个任务、自然语言处理只能完成语音方面的交互、机器视觉只能辨认单一目标,这些能力水平绝不是类人的智能体。

这些所谓的人工智能,距离真正像人类大脑一样去感知、思考、分析、想象,还差着十万八千里,甚至根本还没上路。哈萨比斯在文章中感叹,兼具神经科学和人工智能特长的人才太难得了。这篇论文显然展示了DeepMind的一个核心思路:回到人类大脑,制造像人一样的人工智能。

除此之外,DeepMind发表的论文所涉及的领域还包括:计算机視觉、AI的推理能力、想象能力、模仿能力等。这些论文或许能给DeepMind的东家些许安慰。

会玩《星际争霸》的AI

那么DeepMind又是如何去论证这些论文,进入科研阶段?答案是玩游戏,这也是DeepMind的传统。

事实上,AlphaGo在下围棋时就是用类似的方式来进行局面判断。但相对于围棋的规则严谨性,游戏里关卡是随机生成的,规则自然也是相对开放和变化,给AI想象力带来的挑战也就更大。

像“推箱子”等游戏就展示了让深度学习系统通过简单数据进行抽象推理和长期规划的能力——基本也就是人类所说的想象力。

DeepMind还不断地升级AlphaGo系统,AlphaGo Zero只用4个小时的训练时间就从零开始学会国际象棋的规则,并在100场比赛中取得28胜72平的极佳战绩,其突出表现已然超过商用国际象棋软件Stockfish。

除了名满天下的AlphaGo,DeepMind还训练智能系统通过观看Youtube等视频自主学习超级玛丽等游戏。就在今年7月,DeepMind的智能系统学会了玩《雷神之锤》这款游戏,其强化学习技术,使得人工智能系统能在《雷神之锤3:竞技场》的夺旗游戏中达到人类的游戏水平。

在DeepMind会玩的游戏中,关注度最大的是《星际争霸Ⅱ》。2017年8月,DeepMind宣布开始训练AI玩暴雪公司旗下的《星际争霸II》游戏。当时,DeepMind计划让AI在五年后战胜《星际争霸》世界冠军。

《星际争霸》是一款极其复杂的战略游戏,需要玩家高度集中的精神力、超强的灵敏度和战略决策智慧。这款游戏充分考验AI的即时战略和人机对抗协作能力。它要求AI学习在资源有限的情况下平衡发展,学会如何发展高科技、出兵种对抗及如何调兵遣将来保证利益最大化。这些涵盖了AI亟待解决的三大问题:一是在有限视野和不完全信息的情况下做决策;二是平衡短期、中期和长期的发展策略;三是处理多智能体间的合作和博弈。

纽芬兰纪念大学的计算机科学教授大卫·丘吉尔(David Churchill)认为,《星际争霸》如此复杂,能解决《星际争霸》的AI将能解决任何其他问题。

不过,谷歌只保证在未来12个月里提供财务支持,它能等到“败家”的DeepMind击败《星际争霸Ⅱ》的人类冠军吗?

资料来源:微信公众号量子位、智东西、钛媒体、腾讯科技等

猜你喜欢

星际争霸比斯论文
本期论文英文摘要
终点,亦是起点
Neotv论坛:星际争霸2在国内的另一面镜子
星际争霸复刻:不谈情怀,就真的一无是处了么?
星际争霸复刻:不谈情怀,就真的一无是处了么?
美味的比斯开
美味的比斯开
本期论文英文摘要
本期论文英文摘要
2013年5—12月最佳论文