人机大战二十年
2016-04-22余风
2016年3月9至15日,举世瞩目的围棋“人机大战”在韩国九段棋手李世石与谷歌“阿尔法狗”(AlphaGo)之间展开,最终,阿尔法狗以总比分4:1碾压李世石,获封“名誉九段”。
人类顶尖围棋选手竟然输给了计算机,一时之间,引发舆论热议,关于人工智能的讨论不断引爆人们的眼球。
实际上,这并非历史上第一次人机大战。自从1956年“人工智能”这一概念被提出来后,人和计算机之间就有过数次博弈,每一次博弈,都见证了人工智能的跨越发展。
“硬算高手”深蓝
1996年,卡斯帕罗夫与IBM超级国际象棋计算机RS/6000 SP(即“深蓝”)展开对决。经过一个多星期的PK,卡斯帕罗夫最终赢得比赛,但深蓝也在比赛中取胜一局,这是电脑首次在世界锦标赛中单局战胜世界冠军。
此前,卡斯帕罗夫是国际象棋英杰榜上的NO.1,自1985年成为世界冠军后,11年间,他一直打遍天下无敌手。
赛后,卡斯帕罗夫说:“我能感觉,甚至能‘闻到’桌子对面是一位高智慧的选手。”但他认为,深蓝所拥有的只是一种“畸形的智能”,效率低且缺少韧性。他甚至预言:计算机如果要打败人类棋手,至少要等到2010年!
言犹在耳,然而仅仅一年后,他便以2负1胜3平被深蓝升级版打败。
“这是人工智能发展史上的一个里程碑。”赛后,德国人工智能研究中心负责人登格尔如是评价。
创造这个“里程碑”记录的深蓝升级版,重1270公斤,有32个“大脑”(微处理器),其计算能力当时在全球超级计算机中排名第259。比赛前,IBM研发小组向深蓝输入了100年来所有国际特级大师开局和残局的200多万局下法。
深蓝取胜的法宝,是依靠强大的计算能力穷举所有路数,并选择最佳策略——深蓝每秒可运算2亿步,靠硬算可预判12步,卡斯帕罗夫只能预判10步——所谓兵贵神速,深蓝的获胜也就不那么让人意外了。
当然,深蓝取胜还有另一个秘诀——每场对局结束后,IBM研发小组都会根据卡斯帕罗夫的下棋情况相应地修改深蓝的参数,深蓝虽然不会思考,但这实际上起到了“强迫”它学习的作用。这种“被动学习”的方式,让深蓝不断强化了对对手的了解并最终获胜。
在深蓝问世之前,“人工智能之父”图灵在1950年曾提出衡量计算机智能水平的“图灵测试”——如果一个具有正常思维的人C使用正常人能理解的语言,去询问一面墙后的两个看不见的对象A和B任意问题,对象中A是机器、B是人,如果经过若干询问以后,C不能在实质上区别A与B的不同,便意味着机器A通过了图灵测试。
虽然,深蓝并没有进行图灵测试,但它在人机大战中的胜利,至少意味着计算机已经向着智能化发展迈出了重要一步。
“百晓生”沃森
2011年2月14至16日,深蓝获胜4年后,又一次人机大战在其同门师弟“沃森”与人类冠军之间展开。当时,沃森参加美国老牌智力问答节目《危险边缘》,并与该节目最高奖金得主布拉德·鲁特尔和连胜纪录保持者肯·詹宁斯展开了一场万众瞩目的人机智力大赛。
《危险边缘》采取三人竞答方式进行,通常以答案形式提供各种线索,参赛者必须以问题的形式做出简短正确的回答。因而参赛者需具备历史、文学、艺术、科技、体育、地理、政治及流行文化等知识,还得会解析隐晦含义、反讽与谜语等,而普通电脑并不擅长进行这类“深度问答”。
在比赛中,沃森表现极为突出,尽管在“回答”问题时,它的互联网功能被中断,只能“自己想”——从内存的资料中寻找并组合答案,它却总是能在3秒内迅速作答,还能分析出题目线索中的微妙含义、讽刺口吻及谜语等。此外,它还能根据比赛奖金的数额、自己的比分与对手的差距、自己擅长的题目领域来“自主决定”是否要抢答某一题。最终,沃森以77147分的总成绩轻松获胜。
那么,沃森为什么这么聪明?
首先,沃森“肚里有货”——它内存了2亿页数据,各种百科全书、词典、新闻、维基百科的全部内容以及其他可以建立知识库的参考材料都被它“收入囊中”,堪称是计算机领域的“百晓生”。
其次,它能“秒读万册”——它由90台IBM服务器(相当于90个“大脑”)、360个芯片驱动组成,每秒能处理500GB的数据,相当于1秒阅读100万本书。
最重要的是,沃森还会“深度问答”——这一法宝是IBM研发团队为它量身定制的,该技术赋予了它较高的自然语言理解能力。在拿到一个问题后,依靠内置的100多种算法,沃森会在3秒内解析问题并检索数百万条信息,包括语法语义分析、对各个知识库进行搜索、提取备选答案、对备选答案证据的搜寻、对证据强度的计算和综合等。
比如,当被问及“哥伦比亚广播公司《60分钟》节目首次播出时,当时的美国总统是谁”,“沃森”首先会对“首次播出”进行语言理解,然后检索出《60分钟》节目首次播出的日期,之后再成功搜索出当时的美国总统。
在取得这场众所瞩目的胜利后,沃森开始向医疗卫生业进军。在美国,机器人医生沃森从2011年就开始坐诊,通过询问病人的病征、病史,对患者的个性化数据、大量病例和医疗文献进行“学习”,它能迅速提出最佳诊疗方案,诊断准确率甚至高达73%。
从深蓝到沃森,从硬算能力到自然语言理解能力,从“被动学习”到“深度问答”, 计算机的“智能”向前迈进了一大步。
自学成才的“学霸”阿尔法狗
围棋一直被看作是人类最后的智力竞技高地,据估算,围棋的可能下法数量多达10的171次方。这个数字,甚至远远高于可观测宇宙中的原子总数(该总数为10的80次方)。
因此,人们普遍认为计算机无法在类似围棋这样高度复杂的项目比赛中战胜人类,但2016年阿尔法狗与李世石的人机大战,颠覆了这一认知。
阿尔法狗之所以能取胜,法宝就在于它的核心系统属于“深度学习”。
“深度学习”是时下最火的一种基于神经网络的模拟人脑的神经网络,它通过模仿人脑的机制来解释数据,例如图像、声音和文本等。
为了让计算机学会像人一样“思考”,一个重要的条件是:它必须拥有计算速度可媲美人脑的高性能计算集群,来快速完成海量数据的“学习”。而在这方面,阿尔法狗不联网时的“单机版”性能至少是当年“深蓝”的1000倍。
为了使阿尔法狗变得更“聪明”,谷歌还专门为其设计了两个神经网络,其中,“策略网络”会根据棋局选择下一步走法;“价值网络”会在下子后分析对手会怎么走,并预测进行数值性的估计。
比赛前,阿尔法狗“深度学习”用了人类围棋高手对弈的3000万局围棋走法进行“自我对弈”训练,并进行大规模的数据运算,这些运算用了两三千个CPU。对人来说,如此大规模的运算训练,即使每局只要15分钟,可能也要800多年才能下完,阿尔法狗的运算能力之强由此可见一斑。
此外,阿尔法狗还能自行研究新战略,在它的神经网络之间运行数千局围棋,利用反复试验调整连接点,这个流程也称为“巩固学习”。因此,阿尔法狗的“逆天”棋艺并不是开发者教给他的,而是“自学成才”。从这个意义上来说,阿尔法狗堪称是计算机中的“学霸”。
人工智能,还有多远?
阿尔法狗的胜利,很大程度上体现了近年来人工智能领域“深度学习”技术的快速提升。特别是随着GPU图形处理器、超级计算机、云计算和大数据的迅猛发展,“深度学习”如同火箭升空般飞速发展。早在2011年,谷歌用1000台机器、16000个CPU处理的“深度学习”模型就已经有了10亿个神经元——当然,这仍远远低于人脑100亿~10000亿个的神经元总数。
现在,“深度学习”技术在语音识别、计算机视觉、语言翻译等领域,都战胜了传统的机器学习方法,甚至在人脸验证、图像分类上还超过了人类的识别能力。专家预计,在不久的将来,我们甚至可以在手机上运行像人脑一样复杂的“深度学习”神经网络。
那么,这是否意味着计算机已经和人一样“聪明”了?
答案是否定的!
因为在更复杂的认知层面,例如对于语言和图像的深度理解、逻辑推演、情感选择等方面,计算机距离人类还有很大差距。
比如说,对普通人而言,分辨猫和狗,从阅读或娱乐中获取快乐,分辨爱或恨、激动或愤怒,都是很寻常的事情,但对计算机而言,这些问题会让它分分钟死机。
举个例子,当你和朋友一起外出就餐时,两人都抢着买单。对于这种推搡的过程,计算机很难准确判断出这是为了买单的友善行为,还是恶意的争执。更进一步来说,计算机也许可以根据人的面部表情和肢体动作,在一定程度上辨别出人的喜怒哀乐等情绪,但对于人类的那种“只可意会,不可言传”的情感,在进行辨识时,它就只能交“白卷”了。
正如经典科幻大片《人工智能》展现的那样,当女机器人席拉被问及“什么是爱”时,她回答:“爱就是微张我的眼睛,呼吸急促,体温开始上升……”对计算机来说,“爱”只能是一种可以被特征化、符号化的程序,但计算机却无法理解人类这种非理性的情感,更不可能像人一样爱得死去活来、魂萦梦牵。
可见,逻辑推演和情感选择,是人工智能尚难以逾越的障碍。所以,有人工智能专家开玩笑说:“我们努力想让机器变得稍微聪明一点,但它们还是有点笨。”因此,要想让“机器”真正变成人,科学家也许还有很长远的路要走。(编辑/余风)