APP下载

人工智能破解谜题

2016-08-02

大自然探索 2016年6期
关键词:李世石谜题阿尔法

这道谜题是:行刑者下令100个男性囚犯按照身高从高到矮的顺序排成一列(高个子在最前面),并且把一顶红色或蓝色的帽子戴到每个囚犯头上。每个囚犯都能看见自己前面所有囚犯戴的帽子,但看不见自己的帽子或自己后面的囚犯所戴的帽子。行刑者从最后(最矮)那个囚犯开始提问:你戴的帽子是什么颜色?只有答对了,囚犯才能活下来。如果答错,囚犯就会被“安静地处死”。也就是说,其他囚犯能听见这个囚犯说的话,但不可能知道他的回答是否正确。在这场处决的前晚,囚犯们被给予机会讨论一种策略来帮助自己存活。那么,究竟有没有这样一种策略?如果有,它是怎样一种策略?

解答或理解上述谜题,有助于开发智力,启发我们从多角度去思考看似复杂的问题,并找到解决办法。探索自然世界,寻找科学途径,无疑需要独到的思维。事实上,破解诸如此类的谜题,有助于密码理论和信息工程学的进步。据报道,人工智能网络在测试中找到了破解“囚犯帽子谜题”及类似复杂谜题的策略。实施这种策略不仅要求个体具有解决复杂问题的能力,而且要求团队整体保持清醒与合作。科学家指出,包括机器人在内的人工智能有能力破解这样的谜题,这是在协作体系方面的又一个进步。

在测试中,为了解决帽子谜题,每个囚犯都被模拟成一个单独的人工智能因子。它们考虑自己可能看见的帽子颜色,决定告诉他人什么,接着,利用这种集纳信息找出答案。在学习玩视频游戏的过程中,人工智能(机器人)已经各自掌握了应对难题的方法。它们解决这些问题的思路与人类的不同。科学家仍不清楚人工智能提出的解决方案究竟属于什么性质,但这些方案确实行之有效。

据报道,这个被称为“深度分布周期性Q网”的人工神经智能网络,首次证明了自己能解决这类复杂问题。科学家向该网络输入“囚犯与帽子”等两个谜题,但Q网必须掌握交流协作,才能破解谜题。这里先卖个关子,这道谜题的答案并不直白。在“囚犯与帽子谜题”中,找出拯救囚犯的策略需要Q网厘清一系列复杂程序,并且还得依赖于单个因子之间的通信。在这道谜题的测试中,Q网不仅完成了任务,而且超越了科学家所认为的“标准策略”,这证明Q网自身内部就能给出通信协议。

随着测试的成功,科学家认为需要进行更多研究,以了解智能网络给出的解决方案,提升可扩展性,以适应更大的数字集合。在研发可通信合作的人工智能方面,这基本上还是第一步。从长期看,经过提升的延展性能让人工智能解决以前不能解决的难题。未来,这类人工智能将被测试一些涉及“现实世界数据”的疑难情景。有朝一日,成群的机器人将能通过共享信息片段,合作破解难题。

人工智能大胜九段棋手

2016年3月16~25日,由谷歌公司研发的“阿尔法狗”计算机程序与韩国九段围棋手李世石在韩国首都首尔进行了5局比赛,李世石只赢了其中的第4局,其余4局的胜者都是“阿尔法狗”。这次对抗的历史意义,被认为堪比1997年“深蓝”程序(由美国IBM公司研发)战胜国际象棋世界冠军、俄罗斯棋手卡斯帕罗夫。这次比赛后,韩国围棋协会授予“阿尔法狗”最高段位——“荣誉九段”,以表彰“阿尔法狗”以“认真的努力”掌握围棋。

“阿尔法狗”的这场胜利,被认为是人工智能研究领域的一大里程碑。在此之前,围棋的复杂程度被认为超出人工智能所能够掌握的范围。许多专家认为,像“阿尔法狗”这样的计算机程序,至少要等5年、10年甚至更长时间才可能挑战围棋高手。有评论认为,“阿尔法狗”的这场胜利提醒人类:需要为应对未来可能出现的“全能机器人”而做好准备。

李世石赛后为自己输给“阿尔法狗”而道歉。他说自己误判了“阿尔法狗”的能力,并且对此感到“无能为力”。他强调说,他这次的失败只是他自己的失败,而不是人类的失败。他还说,他最终输给机器“无可避免”,但“机器人永远都不可能像人那样明白围棋之美”。作为对这场举世瞩目的大赛的回应,韩国政府2016年3月17日宣布将在未来5年内投资8.63亿美元,用于人工智能研究。

猜你喜欢

李世石谜题阿尔法
极狐阿尔法S HI版
“萤火虫-阿尔法”小型火箭首飞概述
ARCFOX极狐阿尔法S
国庆谜题猜猜猜
怪兽谜题
关于鲸的谜题
谜题与真相
人机大战
李世石不代表人类
阿尔法磁谱仪(AMS)