人工智能“辩论员”登台亮相

2018-08-20

检察风云 2018年15期

60年前，就已经有人提出过人工智能（AI）概念。近年来之所以得到突飞猛进的发展，主要在于三个不同趋势的会合：一是计算能力按照摩尔定律增长，每过18个月翻一倍；二是互联网、大数据产生。三是在算法上实现了很大的进步。以惊心动魄的人机对决为例，代表AI已经能在高度复杂的项目中发挥出超过人类的作用。

试与人类比高低

1997年5月11日，美国国际商业机器公司（IBM）的AI“深蓝”（Deep Blue）与国际象棋世界冠军卡斯帕罗夫的六局对抗赛降下帷幕。在前五局以2.5对2.5打平的情况下，卡斯帕罗夫在第六盘决胜局中仅走了19步就向“深蓝”拱手称臣。整场比赛进行不到一个小时，“深蓝”便赢得这场具有特殊意义的对抗，引起了巨大轰动。卡斯帕罗夫曾经说过，AI要想战胜世界冠军，得等到2010年，“深蓝”把这个日子提前了13年。

2017年5月，千年水乡乌镇迎来一场举世瞩目的围棋峰会。在为期一周的峰会中，谷歌（Google）的AI“阿法狗”（AlphaGo）与世界冠军、中国围棋职业九段棋手柯洁对弈三局。在第一局战斗中，柯洁执黑子，以相对保守的方式进行了试探，最终以四分之一子的微弱劣势落败。第二场柯洁执白，一度将局面引入复杂的拼杀，但不慎失误，导致中盘投子。第三局是最后一场比赛，柯洁执白子，颇有积极进攻的态势，但中盘无力回天，实际上双方才下了20几手。

今年6月18日，AI再次与人对决，成为头条新闻。IBM在旧金山主办了两场别出心裁的辩论赛，IBM Research最新推出的AI“辩论员”（Project Debater）闪亮登场。它的外观是一个长条形黑色箱子，高1米8，有一个人那么宽，看起来就像一块造型特异的广告屏幕。AI“辩论员”以女性的声音、自然的节奏“说话”，运作时屏幕会显示三个浮动蓝色小圆形。虽然话语有些磕磕绊绊，但充满自信，所讲的内容不无道理，仿佛是一位学识丰富但口舌结巴的教授。

AI“辩论员”的对手是以色列国际辩论协会主席丹·扎夫里先生和2016年以色列国家辩论冠军诺亚·奥瓦迪亚女士，与两位杰出的人类辩手各辩论一个回合。每一场辩论时间20分钟，正反双方各做4分钟开场白，然后用4分钟反驳对方的论点，最后2分钟做总结，两场都是它先发言。在台下，IBM的研究员们紧张地注视着自己的作品。

第一场辩论的题目是“我们是否应该资助太空探索”。AI“辩论员”持正方观点：“政府应该增加空间探索的费用。”它阐述说：“资助太空探索就像投资在非常好的轮胎上，太空探索可以丰富人类的思想，激励年轻人。这是非常合理的投资，甚至比优质道路、学校和医疗保健更重要。”奥瓦迪亚持反方观点：“政府不应该增加空间探索的费用。”她提出资金应该用于更迫切的需求而非宇宙旅行。AI“辩论员”马上应答道：“人们很容易说有更重要的东西值得你花钱，我不反对这一点，没有人声称那是支出清单上的唯一项目，但您离题了。” 它以稍微不同的言辞重复着太空探索对经济有利的论点，表示资助太空探索明显对社会有利，这是政府应该追求的。辩论结束后，记者和IBM员工等约40名现场观众投票，这一场由奥瓦迪亚胜出。

在第二场辩论中，话题为“我们是否应更广泛地使用远距医疗”。AI“辩论员”持“远程医疗会在医疗中占据更大的比例”的观点，而扎夫里反之。在辩论过程中，它能够清楚理解对方观点，并予以强有力的反驳。现场观众认为AI辩论员比扎夫里更有说服力，在评选时多获得9票，赢得了这场比赛。“围棋下不赢，人类难道连吵架都吵不赢机器了吗？”有人惊呼，“这难免让人们不寒而栗，难道AI真的来了吗？”

在比赛之前，AI“辩论员”根本不知道辩论的话题，无法提前备战。除了辩论开始的问候和笑话之外，辩论的陈述都是它自由发挥的，没有固定的陈述词。它实际上没有学会某一个具体的话题，但是能够用数据快速创建一个有说服力的论述。AI系统被训练用来讨论不熟悉的话题，只要资料库中有大量的相关内容。

AI“辩论员”在拿到辩题后，会在第一时间去搜索存录在近100个知识领域的数亿篇文章的资料库。首先通过消化大量的文本，寻找最相关的观点和证据，接着在其中选择最吸引人、最多样化、支持度最高的论点，然后把这些构建成一个完整的观点加以叙述。在“听”完对手的发言之后进行反驳，甚至预测对手可能会提出的辩点，预先攻击。这个AI“辩论员”还会根据自己论点的说服力去调整呈现出来的语气，有时甚至说出一些笑话逗观众开心。

复杂话题巧辩论

IBM希望创造一个复杂的AI系统，它可以收集大量的客观事实去做出更加理性明确的决策。比如在董事会决策时，AI系统能够将所有的论点和证据进行权重分析，不含任何情绪地给出最好的理性决策。据了解，IBM研究对话式AI已经多年，此前和美国德克萨斯大学历时四年联合打造超级电脑“沃森”（为了纪念IBM创始人Thomas J.Watson而取此名），意在创建一个能与人类回答问题能力匹敌的AI系统。这要求其具有足够的速度、精确度和置信度，并且能使用人类的自然语言回答问题。“沃森”存储了海量的数据，而且拥有一套逻辑推理程序，可以推理出它认为最正确的答案。

沃森是基于IBM “Deep QA”（深度开放域问答系统工程）技术开发的。该项技术可以读取数百万页文本数据，利用深度自然语言处理技术产生候选答案，根据诸多不同尺度评估那些问题。研发团队为“沃森”开发的100多套算法可以在3秒内解析问题，检索数百万条信息然后再筛选还原成“答案”输出成人类语言。每一种算法都有其专门的功能，其中一种被称为“嵌套分解”算法可以将线索分解成两个不同的搜索功能。

2011年，“沃森”在美国最受欢迎的智力竞猜电视节目《危险边缘》中大显身手，击败该节目历史上两位最成功的选手肯·詹宁斯和布拉德·鲁特，成为新的王者。在第三天的比赛中，“沃森”获得了41413美元的分数，詹宁斯和鲁特分别仅获得了19200美元和11200美元。将三个比赛日的成绩相加即可得出最后的总成绩，沃森也是大幅领先于人类，达到77147美元，詹宁斯排名第二，但只获得了24000美元，鲁特获得了21600美元，排名第三。

作为IBM研究对话式AI多年的最新成果，Project Debater是继“深蓝”和“沃森”后的又一突破。它是第一个可以在复杂话题上与人类辩论的AI“辩论员”，旨在通过公正的辩论来拓展人们的思维。“在进行了为期6年的训练之后，Project Debater直到两年前才具备参与辩论的能力。”IBM Research首席研究员、Project Debater创始人诺姆·索尼姆展望道，“它还可以对恐怖分子进行分析，判断该人是否具有威胁，这对反恐情报分析大有裨益。可能有一天电影中的通过AI系统捕捉犯罪分子会成为现实。”

从文化上讲，辩论的起源不是冲突和竞争，而是民主和讨论。辩论丰富了决策制定的过程，帮助人们权衡新想法和新理念的利弊。辩论是文明社会的核心，不只是为了获得他人的认同，也是为了理解和学习彼此的观点。AI技术未来可以帮助人类更好的做决定，IBM研究人员正在通过教授计算机来探索AI的界限，以创造引人入胜而且信息更加丰富的观点。

丹·扎夫里（左）、AI“辩论员”Project Debater（中）和诺亚·奥瓦迪亚（右）在辩论场上舌剑唇枪

理性决策更明智

辩论的规则是基于人而定的，而人们的论点又往往是主观的。AI“辩论员”必须适应人类的理念，并提出人们可以认可的论点。在辩论中，AI要学会如何驾驭我们这个杂乱无章的人类世界，而不是像在棋盘游戏中那样使用一套预先定义好的规则。“Project Debater的目标是建立一个AI辩论系统，帮助人们在答案不是非黑即白时，做出基于证据的决定。”IBM主管AI的副总裁达里奥·吉尔强调道，“为了让AI表现出并真正意识到它的潜力，它必须走进人类生活的混乱世界里。”

与“深蓝”和“阿法狗”的压倒优势不同，AI“辩论员”存在着明显的缺点。它有强大的数据支持，传达的讯息量较多，敏捷的思路让人印象深刻，但语言表达能力的确是个硬伤。说出来的许多话精确度和议论的清晰度不够，经常会出现一句话的前后两部分不搭调的情况，有时以不自然的方式随机提出一些轶事或引用句子。由于没有手和脸，缺乏手势和表情， AI“辩论员”始终较难令人投入，与现场观众的沟通几乎为零。上述这些，在辩论赛中都是极为重要的。

作为一个实验性项目，Project Debater的意义在于是第一个展示出具有辩论能力的AI系统，同时也可以帮助公众了解AI系统的最新进展，消除一些不必要的恐慌。或许有一天AI会战胜人类，但更应该理解成是人类更深层次的智慧战胜了人类自己。“深蓝”和“阿法狗”证明了AI可以涉足棋类竞技，而AI“辩论员”则向辩论这一项人类最至关重要的技艺发起进攻。从苏格拉底时期，辩论就是人类生活最重要的一部分。人们通过辩论各抒己见，明辨是非，达成共识，更加正确科学地制定国家战略和道德准则。虽然在辩论中理性和智慧的光辉得以闪耀，但人们很难不受到利益的裹挟。

AI在辩论上或许比人类更优越的一点是，可以帮助我们在复杂的决策环境中吸收大量的多样化的信息，分析利弊，建立有说服力的观点。Project Debater设计初衷并不是要在辩论中打赢人类，IBM想让AI以快速提供大量正反方的观点，能够进行大量的辩论模拟。由于机器不会受到主观意识和偏见的影响，AI“辩论员”可能会提出更贴近事实的“无偏颇”观点，给决策者提供更为中立，不受利益影响的信息。AI会辩论的另一个用途是辅助人们的辩论，快速提供大量正反方的观点，与人类协同创意。也许不久，它可以帮助我们理解语言是如何使用的，帮助律师构建他们的论点，甚至可以用来鉴别虚假信息。