人机大战300年
2016-08-10刘彭媛
刘彭媛
计算机的诞生与发展为人工智能提供了基础。在随后的几十年内,人工智能技术迅速发展,我们也得以围观到一系列人机大战的精彩场面。
人机大战并非最近才火爆起来。早在蒸汽机的时代,就出现过有趣的“尝试”。1770年,奥地利人沃尔夫冈·冯·肯佩伦宣称建造了一个会自动行棋的傀儡,并于维也纳向女大公玛丽娅·特蕾西娅及一众贵族展示。行棋傀儡当众表演与人对弈,女大公及贵族均赞叹不已,自此一炮而红。
这一行棋傀儡又被称为土耳其行棋傀儡,在随后的84年间,被屡屡带到各地展览,并与当地好手比赛。不少名人都是它的手下败将,其中包括拿破仑和本杰明·富兰克林。美国作家爱伦·坡还为它写过一篇散文。尽管许多人都曾对它有过怀疑,但直到土耳其行棋傀儡被毁后的第三年,秘密才被正式揭露原来,傀儡并非“自动行棋”,而是被人操纵的。
尽管人们如此迫不及待地向往一个“非人类”的对手,真正能与人对弈的机器到了20世纪才出现。1949年,首台延迟存储电子自动计算机于剑桥大学诞生。三年后,这个占了整间屋子的大家伙,经剑桥博士候选人亚历山大·S·道格拉斯开发,实现了在今天看来非常简单的“人机交互”。他设计了一款井字棋电脑游戏,玩家通过转轮拨号电话输入落子棋位的编号,随后电脑行棋,双方的过招会在屏幕上显示。这款后来被命名为“OXO”的游戏是世界上最早实现人机对弈的游戏之一。
计算机的诞生与发展为人工智能提供了基础。在随后的几十年内,人工智能技术迅速发展,我们也得以围观到一系列人机大战的精彩场面。
人机大战之西洋跳棋
1994年,跳棋程序切努克(Chinook)与人类卫冕冠军马里恩·廷斯利(MarionTinsley)战成平局。廷斯利是美国数学家和杰出西洋跳棋棋手。1955至1958年,以及1975至1991年,他高踞世界冠军的宝座。在45年职业生涯中,廷斯利仅仅输掉了7场比赛,被认为是历史上最强的西洋跳棋棋手之一。切努克则是美国艾尔伯特大学的计算机科学家乔纳森·谢弗(Jonathan Sehaeffer)及其同事开发的西洋跳棋计算机程序。
1990年,切努克以全美第二名的成绩获得了参加世界级跳棋比赛的资格,但是美国和英国跳棋协会迫于压力决定不批准它参赛。独孤求败的廷斯利渴望进行一场酣畅淋漓的对局。他大力推进此事,甚至不惜放弃冠军头衔。跳棋协会屈服了。1992年,一场以“人机世界大战”命名的比赛终究得以举办,切努克以2比4(33次平局)惜败它的人类对手。两年后,双方再次开棋,6局平手之后,廷斯利因病痛退赛,并将冠军称号让予切努克。7个月之后,廷斯利因癌症去世。2007年,谢弗团队在《自然》杂志上发表论文,称西洋跳棋游戏已经被破解,即使是最项尖的跳棋选手也只能和切努克打成平手。
人机大战之国际象棋
1996年,IBM公司的国际象棋电脑“深蓝”(DeepBlue)首次挑战国际象棋世界冠军卡斯帕罗夫(Kasparov)。卡斯帕罗夫15岁成为国际大师,17岁晋升国际特级大师,在22岁时成为世界上最年轻的国际象棋冠军,此后数次卫冕成功。在与象棋大师的对局中,初出茅庐的“深蓝”以2比4落败。研究小组把“深蓝”加以改良后,于次年再度发起挑战。1997年的对局中,卡斯帕罗夫采取了躲避的战术,尽量避免棋子的接触。但这种下法并没有什么显著的优势。第一局卡斯帕罗夫胜出,第二局情势则急转直下。随后,在维持了三局平局之后,卡斯帕罗夫在决胜局中出现低级失误,仅19步就宣布放弃。“深蓝”电脑最终获得胜利,成为首个在标准比赛时限内击败国际象棋世界冠军的电脑系统。赛后,卡斯帕罗夫提出质疑,认为电脑在棋局中可能有人类的帮助,他要求再战。IBM拒绝了卡斯帕罗夫的请求。随后,IBM宣布“深蓝”退役。
1992年的切努克只能够运算出每一步之后的17个动作变化。短短五年后,“深蓝”展现出更为强大的运算能力。它拥有30个并行处理器,运算速度为每秒2亿步棋,并存有70万份大师对战的棋局数据。强大的计算能力使其能够依靠穷举来选择最佳策略,“深蓝”可搜寻及估计随后的12步棋,而一名人类象棋好手大约可估计随后的10步棋。
人机大战之智力竞赛
棋盘类游戏之外,计算机在智力竞赛中也颇具优势。沃森(Watson)是IBM公司开发的能使用自然语言回答问题的人工智能程序。2011年,沃森参加美国老牌智力问答节目《危险边缘》(Jeopardy!),并挑战两位人类冠军。《危险边缘》以答案的形式给出线索,选手需要以疑问句作答,题目涉及历史、文学、政治、科学、流行文化等诸多方面。在节目中,沃森打败了最高奖金得主布拉德·鲁特尔和74场连胜纪录保持者肯·詹宁斯,并赢得了100万美元的奖金。
虽然比赛时不能接入互联网搜索,但沃森存储了2亿页的数据,包括各种百科全书、词典、新闻、甚至维基百科的全部内容,它还能辨别话语中的隐晦含义、口吻的差别。肯·詹宁斯说:“沃森将问题中的关键字提取出来,然后在集群簇(沃森有相当于15TB的人类知识)中彻底搜索这些关键字。它会针对关键字仔细搜索能找到的信息及其上下文、分类名、答案的类型、时间、地点、性别以及其他资料。当它‘认为某个答案比较肯定时,它就会按响抢答器。”在线索较少的时候,人类选手通常能比沃森更快生成思路。
不过,沃森不会像人类一样受到心理因素的影响。它甚至可以根据比赛奖金数额、比对手落后或领先的情况、擅长的题目领域等来选择是否要抢答某一个问题。沃森的设计初衷是深入理解人类语言和人类知识,它在医疗、咨询等领域具有一定的应用前景。
人机大战之围棋
AlphaGo是由Google DeepMind开发的人工智能围棋程序。相比于象棋,围棋对于人工智能来说无疑是艰巨的挑战。围棋最大有3^361种局面,大致的体量是10^170。相比之下,国际象棋的体量大致只有10^47。这是一个过于庞大的数字,超过宇宙中原子的数量,硬搜索显然并不可行。
与前辈们不同的是,AlphaGo开发出了自我学习的功能。它最初通过模仿人类玩家,在达到一定熟练程度之后,可以通过与自己对弈来提升棋力。
同时,AlphaGo使用蒙特卡洛树搜索,借助值网络(valuenetwork)与策略网络(policy network)这两种深层神经网络合作挑选棋步。通过值网络来计算局面,评估大量选点,抛弃某些线路,并通过策略网络选择落点,从而将计算量控制在计算机可完成的范围内。
随着人们对智能科技的认知逐渐深入,这场AlphaGo与李世石之间举世瞩目的比赛不仅展现出人类技术的强大,也引起普罗大众对这一未来科技的关注。这种大众认知的发展与社会对前沿科学重视程度的提升,是此次对弈在输赢之外,另一个重要的层面。(资料来源:《三联生活周刊》)