人工智能“辩论员”登台亮相
2018-08-20
60年前,就已经有人提出过人工智能(AI)概念。近年来之所以得到突飞猛进的发展,主要在于三个不同趋势的会合:一是计算能力按照摩尔定律增长,每过18个月翻一倍;二是互联网、大数据产生。三是在算法上实现了很大的进步。以惊心动魄的人机对决为例,代表AI已经能在高度复杂的项目中发挥出超过人类的作用。
试与人类比高低
1997年5月11日,美国国际商业机器公司(IBM)的AI“深蓝”(Deep Blue)与国际象棋世界冠军卡斯帕罗夫的六局对抗赛降下帷幕。在前五局以2.5对2.5打平的情况下,卡斯帕罗夫在第六盘决胜局中仅走了19步就向“深蓝”拱手称臣。整场比赛进行不到一个小时,“深蓝”便赢得这场具有特殊意义的对抗,引起了巨大轰动。卡斯帕罗夫曾经说过,AI要想战胜世界冠军,得等到2010年,“深蓝”把这个日子提前了13年。
2017年5月,千年水乡乌镇迎来一场举世瞩目的围棋峰会。在为期一周的峰会中,谷歌(Google)的AI“阿法狗”(AlphaGo)与世界冠军、中国围棋职业九段棋手柯洁对弈三局。在第一局战斗中,柯洁执黑子,以相对保守的方式进行了试探,最终以四分之一子的微弱劣势落败。第二场柯洁执白,一度将局面引入复杂的拼杀,但不慎失误,导致中盘投子。第三局是最后一场比赛,柯洁执白子,颇有积极进攻的态势,但中盘无力回天,实际上双方才下了20几手。
今年6月18日,AI再次与人对决,成为头条新闻。IBM在旧金山主办了两场别出心裁的辩论赛,IBM Research最新推出的AI“辩论员”(Project Debater)闪亮登场。它的外观是一个长条形黑色箱子,高1米8,有一个人那么宽,看起来就像一块造型特异的广告屏幕。AI“辩论员”以女性的声音、自然的节奏“说话”,运作时屏幕会显示三个浮动蓝色小圆形。虽然话语有些磕磕绊绊,但充满自信,所讲的内容不无道理,仿佛是一位学识丰富但口舌结巴的教授。
AI“辩论员”的对手是以色列国际辩论协会主席丹·扎夫里先生和2016年以色列国家辩论冠军诺亚·奥瓦迪亚女士,与两位杰出的人类辩手各辩论一个回合。每一场辩论时间20分钟,正反双方各做4分钟开场白,然后用4分钟反驳对方的论点,最后2分钟做总结,两场都是它先发言。在台下,IBM的研究员们紧张地注视着自己的作品。
第一场辩论的题目是“我们是否应该资助太空探索”。AI“辩论员”持正方观点:“政府应该增加空间探索的费用。”它阐述说:“资助太空探索就像投资在非常好的轮胎上,太空探索可以丰富人类的思想,激励年轻人。这是非常合理的投资,甚至比优质道路、学校和医疗保健更重要。”奥瓦迪亚持反方观点:“政府不应该增加空间探索的费用。”她提出资金应该用于更迫切的需求而非宇宙旅行。AI“辩论员”马上应答道:“人们很容易说有更重要的东西值得你花钱,我不反对这一点,没有人声称那是支出清单上的唯一项目,但您离题了。” 它以稍微不同的言辞重复着太空探索对经济有利的论点,表示资助太空探索明显对社会有利,这是政府应该追求的。辩论结束后,记者和IBM员工等约40名现场观众投票,这一场由奥瓦迪亚胜出。
在第二场辩论中,话题为“我们是否应更广泛地使用远距医疗”。AI“辩论员”持“远程医疗会在医疗中占据更大的比例”的观点,而扎夫里反之。在辩论过程中,它能够清楚理解对方观点,并予以强有力的反驳。现场观众认为AI辩论员比扎夫里更有说服力,在评选时多获得9票,赢得了这场比赛。“围棋下不赢,人类难道连吵架都吵不赢机器了吗?”有人惊呼,“这难免让人们不寒而栗,难道AI真的来了吗?”
在比赛之前,AI“辩论员”根本不知道辩论的话题,无法提前备战。除了辩论开始的问候和笑话之外,辩论的陈述都是它自由发挥的,没有固定的陈述词。它实际上没有学会某一个具体的话题,但是能够用数据快速创建一个有说服力的论述。AI系统被训练用来讨论不熟悉的话题,只要资料库中有大量的相关内容。
AI“辩论员”在拿到辩题后,会在第一时间去搜索存录在近100个知识领域的数亿篇文章的资料库。首先通过消化大量的文本,寻找最相关的观点和证据,接着在其中选择最吸引人、最多样化、支持度最高的论点,然后把这些构建成一个完整的观点加以叙述。在“听”完对手的发言之后进行反驳,甚至预测对手可能会提出的辩点,预先攻击。这个AI“辩论员”还会根据自己论点的说服力去调整呈现出来的语气,有时甚至说出一些笑话逗观众开心。
复杂话题巧辩论
IBM希望创造一个复杂的AI系统,它可以收集大量的客观事实去做出更加理性明确的决策。比如在董事会决策时,AI系统能够将所有的论点和证据进行权重分析,不含任何情绪地给出最好的理性决策。据了解,IBM研究对话式AI已经多年,此前和美国德克萨斯大学历时四年联合打造超级电脑“沃森”(为了纪念IBM创始人Thomas J.Watson而取此名),意在创建一个能与人类回答问题能力匹敌的AI系统。这要求其具有足够的速度、精确度和置信度,并且能使用人类的自然语言回答问题。“沃森”存储了海量的数据,而且拥有一套逻辑推理程序,可以推理出它认为最正确的答案。
沃森是基于IBM “Deep QA”(深度开放域问答系统工程)技术开发的。该项技术可以读取数百万页文本数据,利用深度自然语言处理技术产生候选答案,根据诸多不同尺度评估那些问题。研发团队为“沃森”开发的100多套算法可以在3秒内解析问题,检索数百万条信息然后再筛选还原成“答案”输出成人类语言。每一种算法都有其专门的功能,其中一种被称为“嵌套分解”算法可以将线索分解成两个不同的搜索功能。
2011年,“沃森”在美国最受欢迎的智力竞猜电视节目《危险边缘》中大显身手,击败该节目历史上两位最成功的选手肯·詹宁斯和布拉德·鲁特,成为新的王者。在第三天的比赛中,“沃森”获得了41413美元的分数,詹宁斯和鲁特分别仅获得了19200美元和11200美元。将三个比赛日的成绩相加即可得出最后的总成绩,沃森也是大幅领先于人类,达到77147美元,詹宁斯排名第二,但只获得了24000美元,鲁特获得了21600美元,排名第三。
作为IBM研究对话式AI多年的最新成果,Project Debater是继“深蓝”和“沃森”后的又一突破。它是第一个可以在复杂话题上与人类辩论的AI“辩论员”,旨在通过公正的辩论来拓展人们的思维。“在进行了为期6年的训练之后,Project Debater直到两年前才具备参与辩论的能力。”IBM Research首席研究员、Project Debater创始人诺姆·索尼姆展望道,“它还可以对恐怖分子进行分析,判断该人是否具有威胁,这对反恐情报分析大有裨益。可能有一天电影中的通过AI系统捕捉犯罪分子会成为现实。”
从文化上讲,辩论的起源不是冲突和竞争,而是民主和讨论。辩论丰富了决策制定的过程,帮助人们权衡新想法和新理念的利弊。辩论是文明社会的核心,不只是为了获得他人的认同,也是为了理解和学习彼此的观点。AI技术未来可以帮助人类更好的做决定,IBM研究人员正在通过教授计算机来探索AI的界限,以创造引人入胜而且信息更加丰富的观点。
丹·扎夫里(左)、AI“辩论员”Project Debater(中)和诺亚·奥瓦迪亚(右)在辩论场上舌剑唇枪
理性决策更明智
辩论的规则是基于人而定的,而人们的论点又往往是主观的。AI“辩论员”必须适应人类的理念,并提出人们可以认可的论点。在辩论中,AI要学会如何驾驭我们这个杂乱无章的人类世界,而不是像在棋盘游戏中那样使用一套预先定义好的规则。“Project Debater的目标是建立一个AI辩论系统,帮助人们在答案不是非黑即白时,做出基于证据的决定。”IBM主管AI的副总裁达里奥·吉尔强调道,“为了让AI表现出并真正意识到它的潜力,它必须走进人类生活的混乱世界里。”
与“深蓝”和“阿法狗”的压倒优势不同,AI“辩论员”存在着明显的缺点。它有强大的数据支持,传达的讯息量较多,敏捷的思路让人印象深刻,但语言表达能力的确是个硬伤。说出来的许多话精确度和议论的清晰度不够,经常会出现一句话的前后两部分不搭调的情况,有时以不自然的方式随机提出一些轶事或引用句子。由于没有手和脸,缺乏手势和表情, AI“辩论员”始终较难令人投入,与现场观众的沟通几乎为零。上述这些,在辩论赛中都是极为重要的。
作为一个实验性项目,Project Debater的意义在于是第一个展示出具有辩论能力的AI系统,同时也可以帮助公众了解AI系统的最新进展,消除一些不必要的恐慌。或许有一天AI会战胜人类,但更应该理解成是人类更深层次的智慧战胜了人类自己。“深蓝”和“阿法狗”证明了AI可以涉足棋类竞技,而AI“辩论员”则向辩论这一项人类最至关重要的技艺发起进攻。从苏格拉底时期,辩论就是人类生活最重要的一部分。人们通过辩论各抒己见,明辨是非,达成共识,更加正确科学地制定国家战略和道德准则。虽然在辩论中理性和智慧的光辉得以闪耀,但人们很难不受到利益的裹挟。
AI在辩论上或许比人类更优越的一点是,可以帮助我们在复杂的决策环境中吸收大量的多样化的信息,分析利弊,建立有说服力的观点。Project Debater设计初衷并不是要在辩论中打赢人类,IBM想让AI以快速提供大量正反方的观点,能够进行大量的辩论模拟。由于机器不会受到主观意识和偏见的影响,AI“辩论员”可能会提出更贴近事实的“无偏颇”观点,给决策者提供更为中立,不受利益影响的信息。AI会辩论的另一个用途是辅助人们的辩论,快速提供大量正反方的观点,与人类协同创意。也许不久,它可以帮助我们理解语言是如何使用的,帮助律师构建他们的论点,甚至可以用来鉴别虚假信息。