美国三院院士迈克尔·乔丹:人工智能革命尚未发生
2018-06-11MichaelJordan
□文/Michael Jordan
加州大学伯克利分校计算机科学与统计学教授 Michael I. Jordan 近日在Medium 上发布了一篇文章,名为《人工智能革命尚未发生》。文章回顾了机器学习领域的现状,以及今后发展面临的挑战。他认为真正 AI的实现,需要依靠逻辑、推理、决策等运算的突破才能实现,目前将它称之为AI还为时尚早。
人工智能(AI)是当前时代的颂歌。这句话是由技术人员、学者、记者和风险投资家一致提出且真诚赞扬的。就像其他许多从技术学术领域跨越到通用领域的短语一样,在使用该短语也同时存在着严重的误解。但这并不是大众不了解科学家的经典案例,在这里,科学家和大众一样感到困惑。当今时代之所以出现这样的想法,是因为在某种程度上看到了硅基智能(an intelligence in silicon)的出现,它能够与我们所有人相媲美——让我们着迷,并以同样的方式让我们感到害怕。而不幸的是,它分散了我们的注意力。
关于当前时代,还有一种不同的说法。认真思考下面这个故事,它涉及到人类、计算机、数据以及生与死的抉择问题,但重点在于硅基智能幻想之外的东西。14年前,当我的配偶怀孕时,我们进行了超声波检查。房间里有一位遗传学家,她指出胎儿心脏周围有一些白色斑点,“这些都是唐氏综合征(Down syndrome)的标志”,她指出,“你的风险现在已经升高到1/20”。她进一步告诉我们,我们可以通过羊膜穿刺术了解胎儿是否具有遗传性唐氏综合症。但是羊膜穿刺术风险很大——在手术过程中杀死胎儿的风险大约为1/300。作为统计学家,我决定找出这些数字的来源。我发现英国有一项统计分析已经进行了十年,其中,这些反映钙积聚的白色斑点确实被列为唐氏综合症的预测指标。但我也注意到,相较于英国研究中所使用的机器,我们的测试中所使用的成像机器每平方英寸中多了几百个像素。随后,我就去告诉遗传学家,我认为这些白色斑点可能是假阳性——它们实际上是“白噪声”。她说:“啊,这就解释了为什么我们几年前就开始看到唐氏综合征诊断率的上升,新机器时代到来了!”
我们没有做羊膜穿刺术,几个月后,一个健康的女孩出生了。但是这一事件让我感到很困扰,特别是进行一个粗略的计算后,我确信,全世界范围内,每天有成千上万的人得到了这种诊断,他们中的许多人选择了羊膜穿刺术,从而致使一些婴儿不必要的死亡。而这种情况日复一日地发生,直到其不知何故地得以固定下来。这一事件所揭示的问题不单单是我个人的医疗保健问题,它与医疗系统密切相关,对不同地点和时间内的变量和结果进行测量,进行统计分析,并在其他地方和时间中使用这些结果。这个问题不仅与数据分析本身有关,而且与数据库研究人员所谓的“来源”有关。广义而言,数据从何而来?从数据中得出了什么推论?以及这些推断与当前情况之间的相关程度如何?虽然一位经验丰富的工作人员能够在个案(case-by-case)基础上完成所有这些工作,但问题在于设计一个行星级(planetary-scale)的医疗系统,使其能够在无需进行这种详细的人类监督的情况下,做到这一点。
我也是一名计算机科学家,我突然意识到,建立这种行星级推理和决策系统所需的原则,将计算机科学与统计学相结合,并将人力资源纳入考虑,而这在我所接受的教育中是不存在的。不仅在医疗领域,而且在商业、交通和教育等领域,这些原则的发展至少是与那些用于建立AI系统,从而使其能够让我们惊叹于它们的玩游戏或感觉运动技能的原理是同等重要的。
无论我们是否能够在短期内理解“智能”,我们都面临着一个重大挑战,即将计算机和人类结合在一起,从而提高人类的生活质量。尽管在有些人看来,这种做法是屈从于“人工智能”的产物,但也可以将其看做是一个新的工程分支,且同样值得尊敬。就像过去几十年的土木工程和化学工程一样,这门新学科的目标是将一些关键思想的力量凝聚起来,为人们带来新的资源和能力,并且安全地做到这一点。鉴于土木工程和化学工程是建立在物理和化学基础之上,而这个新的工程学科将建立在上一个世纪所赋予的思想基础以上——诸如“信息”“算法”“数据”“不确定性”“计算”“推理”“优化”。此外,由于新学科的侧重点将放在来自有关人类的数据上,而其发展将需要社会科学和人文科学的观点。
虽然构建块已经开始出现,但将这些构建块组合在一起的原则还没有出现,因此这些构建块正在以特定方式组合在一起。
因此,正如人类在土木工程出现之前建造房屋和桥梁一样,人类正在初步构建涉及机器、人类和环境的社会规模推理和决策系统(inference-and-decision-making systems)。正如早期的建筑和桥梁有时会以不可预见的方式和悲惨的后果坍塌一样,我们早期的许多社会规模推断和决策系统已经暴露出严重的概念缺陷。
不幸的是,我们并不善于预测下一个正在出现的严重缺陷是什么,我们缺少的是一个具有分析和设计原理的工程学科。
目前,关于这些问题的公开对话过于频繁地使用“AI”作为智能通配符(intellectual wildcard),这使得人们很难对新兴技术的范围和后果进行推理。我们需要从近期和历史的角度更为仔细地思考一下,“AI”到底是用来指称什么的。
可以这样说,如今被称为“AI”的大多数东西,特别是在公共领域,在过去的几十年中往往被称之为“机器学习”(ML)。ML是一个算法领域,它将来自统计学、计算机科学和许多其他学科的思想融合在一起,设计了用以处理数据、做出预测并帮助做出决策的算法。就对现实世界的影响而言,ML是真实的,而这并不仅仅是针对近期而言的。事实上,早在20世纪90年代初期就有明确的端倪显示,ML将会发展成巨大的产业关联性。而到世纪之交,诸如亚马逊这样的具有前瞻性的公司已经在他们的业务中使用了ML,从而解决了欺诈行为检测和物流链预测中的关键任务后端问题,并构建了具有创新性的面向消费者的服务,如推荐系统。随着数据集和计算资源在接下来二十年里的快速增长,很明显,ML很快将不仅为亚马逊提供支持,实际上可以为任何将决策与大规模数据绑定在一起的公司提供推动力。新的商业模式将会出现。“数据科学”这个短语开始被用来指代这种现象,反映了ML算法专家需要与数据库和分布式系统专家相互合作以建立具有可扩展性的、鲁棒性的ML系统,并且反映了所研究出系统的更大的社会和环境范围。
在过去几年里,思想和技术趋势的这种融合被重新命名为“AI”。而这个品牌重塑还有待商榷。
从历史上看,“人工智能”这个词在20世纪50年代后期被创造出来,表达了在软件和硬件中实现具有人类水平智能的实体的强烈愿望。我们将使用“模仿人类的人工智能(human-imitative AI)”一词来指代这一愿望,强调人工智能实体似乎应该是我们中的一员,即使不是在物理层面上,至少在精神上如此。这主要是在学术界范畴内。虽然诸如运筹学、统计学、模式识别、信息理论和控制理论等相关学术领域已经存在,并且常常受到人类智能(和动物智能)的启发,但这些领域只能说是集中在“低水平”的信号和决策上。例如,松鼠能够感知它所居住的森林的三维结构,并具有在树枝之间跳跃的能力,对于这些领域来说是很有启发性的。“人工智能”旨在聚焦于一些不同的事物——人类进行“推理”和“思考”的“高水平”或“认知”能力。然而,60年后,高水平推理和思想仍然难以捉摸。目前被称为“人工智能”的发展主要集中在与低水平模式识别和运动控制相关的工程领域,以及统计学领域中,统计学专注于找到数据中的模式并进行有根据的预测,假设和决定的测试。
事实上,20世纪80年代早期由David Rumelhart重新发现的著名的“反向传播”算法,现在被视为所谓“AI革命”的核心,其实最早出现在20世纪50年代和60年代的控制理论领域中。其早期应用之一是优化阿波罗太空船登陆月球任务的推力。
虽然自20世纪60年代以来,该领域已经取得了很大的进步,但是可以说这并非来自于对模仿人类AI的追求。相反,就像阿波罗宇宙飞船的例子一样,这些思想经常被隐藏在幕后,并且一直是研究人员聚焦于特定工程挑战的结果。虽然对于公众而言这些是不可见的,但是在文档检索、文本分类、欺诈检测、推荐系统、个性化搜索,社交网络分析、规划、诊断和A/B测试等领域中的研究和系统建设已经取得了重大成功。这些进步推动了谷歌、Netflix、Facebook和亚马逊等公司的发展。
人们可以简单地将所有这些都称为“AI”,而且事实上人们似乎已经这样做了。这样的标签可能会让优化或统计学的研究人员感到意外,他们一觉醒来后发现自己突然被称为“AI研究人员”。但是,除了给研究人员贴标签之外,更大的问题是,使用这个单一的、定义不明确的缩写词会使人们对当前情况下知识和商业范围的问题难以有清晰的认识。
在过去的二十年里,人们在工业和学术界对模仿人类AI加以补充的愿望已经取得了重大的进步,这通常被称为“智力增强(Intelligence Augmentation,IA)”。在这里,计算和数据被用于创建增强人类智力和创造力的服务。搜索引擎可以被看做是IA的一个例子(它增强了人类记忆和事实性知识),自然语言翻译也是如此(它增强了人类的沟通能力)。基于计算的声音和图像生成如同是艺术家的调色板和创造力增强剂。虽然这种服务可以令人信服地涉及到高水平的推理和思考,但目前它们并没有这样做,它们主要执行各种类型的字符串匹配和数值运算,以捕捉人类可以利用的模式。
让我们广泛地设想一下“智能基础设施(Intelligent Infrastructure, II)”规则,即能够使人类环境更具有支持性、更有趣的和安全的计算、数据和物理实体网络。这样的基础设施已经开始在交通、医学、商业和金融等领域中出现,对人类个体和社会影响巨大。这种有时出现在关于“物联网”(Internet of Things)的对话中,但这种成就通常指的是仅仅将“事物”接入到互联网上的问题,而不是指与这些“事物”相关的更大的挑战——能够分析这些数据流以发现关于世界的事实,并且在比仅仅是“bit”更高的抽象层次上与人类和其他“事物”进行交互。
举个例子,我们可以想象我们生活在一个“社会规模的医疗系统”(societal-scale medical system)中,它在医生和位于人体内部和周围的设备之间建立了数据流和数据分析流,从而能够在进行诊断和提供护理的过程中帮助人类智能。该系统将包含人体细胞、DNA、血液检查、环境,群体遗传学和大量关于药物和治疗的科学文献信息。它不仅关注于单个病人和医生,还关注所有人类之间的关系——就像当前的医学测试允许对一组人类(或动物)进行实验,以带入到对其他人类的医疗中。它将以当前的银行系统在金融和支付领域集中应对此类挑战的方式来帮助保持相关性、来源和可靠性。而且,尽管人们可以预见到这样一个系统会出现许多问题——涉及隐私问题、责任问题、安全问题等等,但是这些问题应该被恰当地视为挑战,而不是障碍。
我们现在面临一个关键问题:现在所研究的经典模仿人类AI是专注于这些更大挑战的最佳途径还是唯一途径?最近,一些最受欢迎的关于ML的成功故事实际上存在于与模仿人类AI相关的领域,比如计算机视觉、语音识别、游戏和机器人技术。因此,或许我们只是应该等待这些领域的进一步发展再做定论。这里有两点需要说明。首先,尽管人们不会从阅读报纸中知道这一点,但是在模仿人类AI方面的成功实际上是有限的,我们距离实现模仿人类AI的愿望还很远。不幸的是,在模仿人类AI领域取得哪怕有限的进展所带来的兴奋(和恐惧)导致了行业的过度兴奋和媒体的过度关注,而这在其他工程领域并不存在。
其次,并且更重要的是,这些领域的成功既不足以解决重要的IA和II问题,也不是必需的。在充分性方面,考虑一下自动驾驶汽车。要实现这样的技术,需要解决一系列工程问题,而这些问题可能与人类所具备的能力(或人类能力不足)关系不大。整体运输系统(一个II系统)可能更类似于目前的空中交通管制系统,而不是当前正处于松散耦合的、前向的、人类驾驶员注意力不集中的数据收集阶段的系统。它将比当前的空中交通管制系统复杂得多,尤其是在使用大量数据和自适应统计建模以进行细粒度决策的情况下。正是这些需要站在最前线的挑战,以及在这样的努力下对模仿人类AI的专注,可能会让人分心。
至于必要性方面的论证,有时人们认为模仿人类AI愿望包含了IA和II愿望,因为模仿人类AI系统不仅能够解决AI的经典问题(例如,图灵测试),这也将是我们解决IA和II问题的最佳选择。这样的论点几乎没有历史先例。土木工程是通过想象一个人造的木匠或砌砖工的建造物来发展的吗?化学工程的发展是通过设计一个人造的化学家实现的吗?甚至更有争议的是:如果我们的目标是建造化工厂,我们应该先创造出一个人造化学家,然后再由他来研究如何建造一个化工厂吗?
一个相关的论点是,人类智能是我们所知道的唯一一种智能,并且也是应当将旨在模拟它作为研究的第一步。但是人类实际上并不是很擅长某种推理——我们有自己的过失、偏见和局限。此外,至关重要的是,我们并没有进化到能够执行现代II系统必须面对的那种大规模决策,也无法应对在II环境中出现的那种不确定性。人们可能说,AI系统不仅会模仿人类智能,而且还会“纠正”它,并且还会扩展到任意大的问题上。但是我们现在正处于科幻小说的领域——虽然这种推测性的争论在小说的背景下具有娱乐性,但它不应该成为我们在面对即将出现的关键IA和II问题时向前迈进的主要策略。我们需要根据自己的优势来解决IA和II问题,而不是仅仅将其当做是模仿人类AI 方法的必然结果。
不难看出,在II系统中,算法和基础设施挑战并不是进行模仿人类AI研究的核心主题。II系统需要具备管理分布式知识库的能力,这些知识库正在迅速变化,并且可能在全球范围内具有不连贯性。这样的系统能够做出及时的分布式决策以处理云边交互,同时也必须处理长尾效应(long-tail phenomena),即大多数数据掌握在少数人手中,而大多数人掌握很少的数据。他们必须解决跨管理和竞争界限以共享数据所存在的困难。最后,非常重要的一点是,II系统必须将激励和定价等经济思想纳入统计和计算基础设施领域,从而将人与人、人与有价值的货物联系起来。这样的II系统不仅可以提供服务,还可以创造市场。有些领域,如音乐、文学和新闻等,迫切需要这样的市场出现,在这一市场中,数据分析将使生产者和消费者联系在一起。这一切都必须在不断发展的社会、道德和法律规范的背景下完成。
当然,经典的模仿人类AI问题依然非常有趣。然而,目前的重点是通过收集数据、部署“深度学习”基础设施以及模仿某些狭义的人类技能的系统演示,进行AI研究,这些方法很少涉及到新出现的解释性原则,往往会转移人们对经典AI中重大开放问题的注意力。这些问题包括将意义和推理纳入系统以执行自然语言处理的需要,推理和表示因果关系的需要,开发计算可追踪的不确定表征的需要,以及开发制定和追求长期目标的系统的需要。这些都是模仿人类AI中的经典目标,但在当前“AI革命”的喧嚣中,人们很容易忘记这些还未解决的问题。
IA依然会非常重要,因为在可预见的未来,计算机无法像人类一样,对现实世界的情况进行抽象的推理。我们需要利用人与计算机之间成熟的相互,来解决最紧迫的问题。我们希望计算机能够触发人类创造力的新水平,而不是取代人类的创造力(不管这意味着什么)。
正是John McCarthy(目前是达特茅斯大学的教授,之后在MIT任职),他创造了“AI”这个词,这显然是为了区别于Norbert Wiener(当时是麻省理工学院的一位老教授)的早期研究议程。Wiener创造了“控制论”来指代自己的“智能系统愿景”,这一愿景与运筹学、统计学、模式识别、信息论和控制理论密切相关。另一方面,McCarthy强调了与逻辑的联系。一个有趣的反转是,Wiener的知识体系被囊括在McCarthy的术语旗帜下,在当今时代占据主导地位(然而,这种情况肯定只是暂时的,相比于其他领域,AI这个钟摆的摆动幅度要大得多)。但我们需要超越McCarthy和Wiener的特定历史视角。
我们需要认识到当前关于AI的公众话题(它侧重于狭义的行业子领域和学术子领域)会使我们对AI、IA和II的完整范围带来的挑战和机遇视而不见。
这个范围不是关于实现科幻梦想或超级人类机器的噩梦,更多的是关于人类理解和塑造技术的需求,因为它在日常生活中变得更加现实和富有影响力。此外,在这一理解和塑造中,需要来自各行各业的不同声音,而不仅仅是技术上的对话。将注意力狭隘地集中在模仿人类AI上,使人们难以听到更多的声音。
尽管工业界将持续推动很多方面的发展,但学术界也会继续发挥重要作用,不仅在提供一些最具创新性的技术思想方面,而且还将把计算和统计学科的研究人员与其他学科的研究人员聚集在一起,这些研究人员的贡献与观点是我们迫切需要的,特别是社会科学、认知科学和人文科学界的。
另一方面,虽然人文和科学是我们前行的关键,但我们也不能假装我们谈论的不是一项规模和范围都前所未有的工程尝试,当今社会正致力于构建新的人工制品。这些人工制品应以按照要求进行工作为前提而被建造。我们不想建立一个帮助我们进行医学治疗、提出运输建议、获取商业机会的系统,因为我们会发现诸如此类的系统实际上根本不起什么作用,并且这些系统犯下的错误会对人类的生命和幸福造成危害。在这方面,正如我强调的,对于聚焦数据和学习的领域,尚有一门工程学科还未出现。尽管这些领域看上去令人兴奋,但它们还不能被看做是一门工程学科。
此外,我们应该接受一个这样的事实:我们正目睹一个崭新的工程学分支的诞生。“工程(engineering)”这一词通常在学术界和更广阔的范围内被狭义地应用,通常含有描述冷酷、无情的机械和失去人类控制等负面含义。
当今时代,我们真正有机会来设想一个历史上从未有过的新事物——一门以人为本的工程学科。
我们拒绝为这门新兴的学科命名,但如果“AI”继续被用作是通向未来发展的指向性术语,那么我们会逐渐意识到这一词的真正局限性。让我们扩大范围、淡化炒作,真正认识到前方道路所面临的严峻挑战。