APP下载

AI打败人脑?

2016-04-09小菲

南都周刊 2016年7期
关键词:斯特罗姆比斯阿尔法

小菲

谷歌人工智能在比赛中击败了围棋大师,围棋这项策略和智力游戏有着2500年的悠久历史,它比国际象棋复杂得多,但尼克·博斯特罗姆对这个比赛结果却并不感到惊讶。

尼克·博斯特罗姆出生于瑞典,现在是牛津大学的哲学教授,他因新近出了一本名为《超级智能:路径、危险、策略》的畅销书而闻名。该书探讨了人工智能的好处,同时也认为真正的智能计算机可能加速人类的灭亡。他并不是低估谷歌围棋机器的能力。他只是认为这不一定是一项巨大的进步。博斯特罗姆认为谷歌系统后面的技术,多年来一直在稳定提升,包括讨论了很多的人工智能技术,例如深度学习技术和强化学习技术。谷歌打败围棋大师只是宏大计划的一部分,这个计划已经开始很久了,之后也将持续很多年。

博斯特罗姆说:“先进的人工智能从过去到现在一直在进步,谷歌的基本技术很大程度上延续了过去几年的发展。”

如果你从另一个角度来看,这也是为什么谷歌的胜利如此令人振奋,也许还有一点令人恐惧。连博斯特罗姆也表示是时候停下来审视这项技术的进展,思考一下它未来的发展方向。研究者曾经认为人工智能需要至少十年才能取得围棋的胜利,但现在它已经抵达当时认为不可企及的高度,或者至少是很多有权力和财富的人希望达到的高度。

这不只跟谷歌有关,还关系到脸书、微软等其他科技巨头。创造最聪明的人工智能已经变成了一场竞赛,参与者是这个星球上最强大和富有的人。谷歌在此所取得的成绩,脸书的创始人马克·扎克伯格对此的反应就是最有力的注脚。

造出来的大脑

谷歌的人工智能系统叫“阿尔法围棋”,由“深层思维”公司开发,谷歌在2014年早些时候以4亿美元的价格收购了该人工智能研究公司。该公司擅长深度学习技术和强化学习技术,这两项技术让机器能在很大程度上自学。

用软件和硬件打造模仿人类大脑神经元网络的人工神经网络,通过深度学习,驱动了照片应用谷歌相册内置的高效图片搜索工具。类似的还有脸书的人脸识别功能、Skype的翻译工具、推特Twitter的色情内容识别系统。如果你给深度神经网络输入数以百万计的游戏动作,你就能教会它打电玩;如果你能输入其他的海量数据集,就能教会神经网络执行其他任务—从生成谷歌搜索引擎的计算结果到识别计算机病毒,等等。

强化学习比深度学习更进一步。一旦你建立了能玩好游戏神经网络,你就能让它跟自己比赛。让两套神经网络比赛数千场之后,系统能够跟踪到哪种套路能获得最高分,从而玩法再上一个台阶。而且该技术并不局限于玩游戏,它还可以应用到任何像游戏那样需要策略和竞争的东西上。

“阿尔法围棋”运用了上述所有技术,同时还不仅限于此。哈萨比斯及其团队加入了第二个层次的深度强化学习,能够计算每一手棋后面的长远影响,他们还依靠传统的人工智能围棋的技术,包括蒙特卡洛树算法,通过大量采样的结果最终收敛到盘面最优值。综合各种技术,造出了能够打败专业棋手的系统。

围棋很复杂

在取得这次围棋比赛的胜利之前,许多人工智能专家都不认为机器可以打败人类专业棋手,至少短期内不行。

因为围棋非常复杂。国际象棋每一步平均有35种下法,而围棋每一手有250种下法,下一手又有250种可能。这样算下来,意味着即便是最大的超级电脑也不可能看到所有可能的走法会导向的结果。

深度思维公司的科研人员索尔·格雷佩尔解说过阿尔法围棋的自治属性:尽管是他们编写的计算机程序,但人们并不清楚计算机会选择什么样的下法。阿尔法围棋的下法是在接受训练后的突生现象,人们只是创建了数据集和训练算法,但是最终它的下法不在人们的掌握中,也会比棋手可能想到的下法更好。

在阿尔法围棋和李世石的比赛里,代替电脑在棋盘上落子的是深度思维公司阿尔法围棋的研发者之一黄士杰,黄士杰自己也是围棋爱好者。按照黄士杰的围棋排名,他大概只有0.7%的概率可以打败李世石。在很多方面,黄士杰体现了人工智能未来的一种可能:对于一组特定问题,我们需要人工智能的帮助,但它也需要我们的支持。坐在李世石对面的黄士杰,就像是一个人工智能接口。

而阿尔法围棋有一些令人出乎意料的下子手法,甚至被职业棋手认为是“恶手”的,但却能赢得棋局。比如在第二场第37手的时候,阿尔法围棋突然下出一步尖冲,这手棋在玩家看来非常奇怪,评论员甚至说觉得是“下错了”。李世石也被这一手惊到,用了差不多十五分钟来思索那步棋。事实上那步棋改变了局面,阿尔法围棋最终赢得了第二场。李世石在赛后的新闻发布会上表示无法用言语形容其震惊。

因为在比赛中,阿尔法围棋是试图尽可能使获胜的几率最大化。因此,如果摆在阿尔法围棋面前的一手棋有两种选择:一种是赢20目,但取胜可能性为80%;另一种是以1.5目小胜,取胜可能性是99%。阿尔法围棋会选择后者。因此,在比赛过程中,阿尔法围棋有几手棋被认为是失误,或者用术语来说太“缓”的,让它丢失了几目的优势,但格雷佩尔认为阿尔法围棋这么做只是为了增加胜算几率。

正如哈萨比斯说的,围棋可能的布局比宇宙的原子还多。想要赢得这项比赛,需要人工智能做计算以外的事情,需要它在某种程度上模仿人类的眼光、人类的直觉,甚至需要它会学习。

因此谷歌和脸书正在研究这个问题,如果他们能够解开这类极其复杂的问题,就能运用它作为跳板,让人工智能系统去处理真实世界里更实际的任务。哈萨比斯说,这些技术天生适合机器人,它能让机器人更好地了解他们周围的环境,并对环境里不可预见的变化作出反应。想象一下,一台机器除了能帮你刷盘子之外,还能执行科学研究,这能为科研人员提供一个可以指引他取得重大突破的人工智能助手。

科技巨头是玩真的

这一切说明了为什么早前,在谷歌宣布自己秘密打败围棋大师的几个小时之前,马克·扎克伯格迫不及待地更新了自己脸书的状态讨论围棋。

谷歌的声明是以科研论文的方式发表在学术期刊《自然》上的,而脸书的工作人员在官方发布之前已经看到了论文(在保密协议下提前两天分享给了记者们)。于是马克·扎克伯格和脸书的其他工作人员一起采取了提前控制损失的宣传策略。

谷歌发布声明的前一晚,脸书人工智能的研究人员发布了全新的研究报告,详细讲述了他们自己的人工智能围棋,研究进展本身已经让人印象深刻,扎克伯格也在自己的脸书账号上宣传了它。他说:“在过去的六个月里,我们已经建立了一个落子速度快到0.1秒的人工智能系统,而且下得跟之前花了数年建立起来的系统一样好。该项目的研究人员田渊栋,就坐在离我20英尺远处。我喜欢我们的人工智能团队坐在我旁边,让我从他们的工作中学习。”

尽管脸书的人工智能围棋并没有谷歌的阿尔法围棋走得那么远,但现实是脸书也很重视这类人工智能,他们跟谷歌之间竞争激烈,而谷歌也是他们最大的商业竞争对手。然而,这场人工智能竞赛,并不只是关于哪间公司的围棋人工智能更好,而是关于哪间公司更能吸引到顶尖的人工智能人才。

有多认真呢?扎克都量了他跟田渊栋办公桌的距离了。在脸书公司,你的重要性就是以你跟扎克伯格坐的距离来判断的,而扎克伯格很大程度上亲自参与了这一项目。今年的元旦,扎克伯格说他在2016年的个人挑战是建立一个能够帮他处理工作和家庭事务的人工智能系统。

人工智能的威胁

谷歌和脸书都想打造一个在很多方面超越人类智慧的人工智能系统,但他们并不孤单。微软、推特Twitter以及别的很多公司都在朝着这一方向努力。这对人工智能研究来说是好事,但对某些人,像尼克·博斯特罗姆还有特斯拉的首席执行官埃隆·马斯克等人来说,这也是一件可怕的事情。

正如深度学习创业公司Skymind的首席执行官克里斯·尼科尔森指出,人工智能围棋展示的那种人工智能,能应用到几乎所有你能想象到的比赛问题,那些重在策略的问题,包括了金融交易和战争,这两种情况都需要大量的工作和数据,但这种想法本身就已经令人不安了。博斯特罗姆的书解释说人工智能可能比核武器更危险,不仅因为人类可能滥用它,还因为人类可能造出连自己都控制不了的人工智能。

美国国家安全局和国家情报主任办公室的资深人士埃里克·哈兹尔廷说:“我们已经已经走出了人工智能的寒冬。放眼未来,我们现在看到的只是人工智能能力的很小一部分。一切才刚刚开始。”就像其他工具,比如电一样,人工智能可能要经过不断更新迭代,直到有一天最终变成人们生活中的一部分。至于它是会发挥积极还是消极作用,哈兹尔廷说:“我还没有看到任何一种工具被开发了出来,却还没有被用作武器的。”

而围棋一直以为被当做战争的缩影,让这种担忧更甚。也有评论反对将战争跟棋类游戏放在一起比较,因为真实世界有着更多不确定性也更为纷乱芜杂。而哈兹尔廷也认为,人工智能还没有到达那个程度。“了解世界上的重要人物和恐怖分子的脑袋里在想什么是情报的核心问题。也许未来这些预言会由机器给出。我们倾向于认为人工智能是解决问题的,但如果人工智能最好的用途是发现问题呢?比如气候变化问题。作为人类,作为神经元,作为自我,永远都弄不清楚,但如果我们是一个人工智能和人类的混合体,又是否能发现呢?”

但是对于像阿尔法围棋这样的人工智能系统来说,完全不可能对人构成威胁。这个系统的确会自我学习—跟自己下围棋,自己生成数据与制定策略,它也确实可以在围棋桌上击败大多数人类对手。但即便是像围棋这么复杂的游戏,它也有其局限性—没有现实世界那么复杂,深度思维的研究人员能够随意修改和关闭它。事实上,把这个特定机器视为威胁是不明智的。

但令人担忧的是,研究人员不断地改进这些系统,它们会不知不觉跨过某条界线让世界末日忧虑开始变成现实。博斯特罗姆说,他和其他人类未来研究所里的同事,正在关注那些强化学习能使机器脱离研究人员掌控的方法。“有些会在以后更复杂的系统里出现的问题,也能在现有的系统里看到痕迹。”他解释说有些蛛丝马迹提示了强化学习可能导向机器拒绝被关机。

但这些都是很细微的提示。博斯特罗姆承认这类威胁即便真的会出现,但还是很遥远。多亏了他和那些有影响力的技术专家,业界更多人理性地提前关注到了潜在的威胁,很可能远远早于需要关注的时候。这类担忧表明,深度思维正在开发的这些技术是极其强大的。

下一步是什么

哈萨比斯已经开始跟卫星运营商和金融机构合作,看看人工智能是否最终能够玩转他们的数据集,也许学会预报天气或者预测石油期货交易。但在短期内,他们团队的心目中为有一个更朴素的目标:设计一个能玩20世纪90年代电子游戏的程序。哈萨比斯于1994年开始游戏设计工作,那年他才17岁,他的第一个项目是获得金摇杆奖的主题公园,他很清楚尽管深度思维公司现在的人工智能系统已经很先进,但相比游戏还是落后了至少十五年。事实上,那些深度思维的人工智能玩起来尚未达到人类水准的游戏,包括《吃豆人》《私家侦探》《蒙特祖马的复仇》等,需要更长时间的设计或者更复杂的探索。哈萨比斯认为其中一个解决方案,可能是让人工智能在决策上更为大胆和愿意冒险,因为机械重复的强化学习,“是对它已学知识的过度开发”。

长远来看,在深度思维公司攻克了暴雪娱乐的《魔兽争霸》《星际争霸》以及其他游戏之后,研发团队的下一个目标是建立跟幼童能力相当的人工智能。但即便是这个看似不高的目标,哈萨比斯认为离实现它还很遥远。

首先,幼童会迁移学习——把之前学到的知识应用到新的情境中。换句话说,一个幼童学会了玩《乒乓》游戏,他立刻就可以把打砖块游戏玩得很好,而人工智能必须把两个游戏分别从头学起。除了这个挑战之外,更为棘手的问题是深度思维公司所选择的深度神经网络和强化学习的组合,是否能够自己发展出概念认知—不只熟练掌握计算机指令,还能够理解实际的事物,比如什么是潜水艇、水,或者氧气。对于哈萨比斯来说,这是个“未解决的问题”。

小说家和计算机专家扎卡里·梅森则没有那么乐观:“他们目前的研究路线距离攻克《星际争霸》游戏还有5到10年,距离《使命召唤》游戏也许还有20年,要在实战中驾驶无人机也许要50年。但沿着这个研究方向永远达不到幼童水平。”大多数孩童不会玩国际象棋或者《星际争霸》游戏,但是他们能够跟现实世界进行复杂的交流。梅森说:“他们能够找到路穿过房间,他们能够看见东西,且当光影发生变化时他们仍能认识到那是同一件物体。他们能够在空间里理解和控制物体。”这类孩童能轻松完成的任务,对机器来说却很难,梅森坚信一个玩打砖块游戏很厉害的机器根本无法靠自学掌握。完成这些任务所需的认知模型,比由雅达利街机或是其他任何游戏平台能提供的要丰富得多。哈萨比斯的算法代表了真正的突破,但这种突破进一步说明了人工智能跟真正的人的思维仍然差距甚远。

因此,人工智能的道路还很漫长,尽管谷歌围棋的胜利让世界很振奋,但这只是一个开始而已。

猜你喜欢

斯特罗姆比斯阿尔法
微言大义
记忆看见我
ARCFOX极狐阿尔法S
一只蝴蝶的感恩
一只蝴蝶的感恩
孤独
美味的比斯开
美味的比斯开
阿尔法狗围棋界决定组团围殴它了