人工智能的前生、今世与未来
2018-03-23汪子尧
汪子尧,贾 娟
(1. 北京市朝阳外国语学校,北京 100012;2. 北京邮电大学电子工程学院,北京 100876)
0 引言
人工智能(Artificial Intelligence,AI)是计算机科学的一个重要分支,它试图通过计算机来模拟人的思维过程和行为,该领域的研究包括智能机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,它的出现和发展已经渗透到了我们生活的方方面面。
尤其是2016年3月AlphaGo大败李世石,让人工智能在全球范围内产生了石破天惊式的巨大影响力。随后,进一步演化之后的AlphaGo Master逐一打败人类当前活跃着的所有围棋高手。
不久之前的2017年10月,DeepMind团队重磅发布的新版AlphaGo Zero,再次打破人类对人工智能的认知和想象,它实现了AI发展中非常有意义的一步,那就是“无师自通”,它实现了从零开始,不需要任何棋谱的指引,也不需要参考任何人类的先验知识,完全靠自己通过增强学习(Reinforcement Learning)达到百战百胜。
今天的人类不得不敬畏人工智能的成果,并对最新的成果褒贬不一,甚至分裂成针锋相对的多个阵营,我们有必要立足于深度学习和增强学习的最新进展,来回顾、反思和展望一下人工智能的前生、今世和未来。
1 人工智能的长期演进历史回顾
人工智能发展至今,已经有六十余年的历史,其发展过程可大致概括为跌宕起伏的四个阶段,一些重要的里程碑事件如表1所示。
1.1 人工智能的诞生
1950年,伟大的计算机科学家艾伦·图灵(Alan Turing)发表了一篇划时代的论文,预言了创造具有真正智能的机器的可能性。考虑到“智能”不易衡量,他提出了著名的图灵测试,通过机器伪装人类对话的能力来衡量机器的智能水平[1]。
表1 人工智能发展重要里程碑事件Tab.1 Milestone of Artificial Intelligence Development
1956年达特茅斯会议举行,约翰·麦卡锡、马文·闵斯基、克劳德·香农、艾伦·纽厄尔、赫伯特·西蒙等顶尖科学家汇聚一堂,共同确定了人工智能的名称和任务,标志着人工智能这门学科的正式诞生。与会的每一位科学家都在人工智能发展的第一个十年中做出了重要贡献[2]。
1.2 人工智能第一次浪潮和寒冬
达特茅斯会议推动了全球第一次人工智能浪潮的出现,从1956年到1974年,乐观的气氛弥漫在整个学术界和工业界,在算法方面出现了很多世界级的发明,其中包括增强学习的雏形(即贝尔曼公式)以及深度学习的雏形(感知机)[3]。这些算法的提出无疑推动了人工智能的发展,而增强学习的算法也正是谷歌AlphaGo算法的核心思想[4]。
除了算法和方法论方面的新进展外,在第一次浪潮中,科学家们1964年发明的名为STUDENT的人工智能系统在那时候就能实现应用题的证明,更值得一提的是1966年研制的ELIZA已可以实现简单人机对话[5]。人们认为,按照这样的发展速度,人工智能早晚能够取代人类!
然而,人工智能却在接下来的1974年到1980年间陷入了寒冬,这是因为人们逐渐发现逻辑证明器、感知器、增强学习等等只能做一些很窄的特定领域的简单任务,稍微超出些范围就无法应对。这里面存在两方面局限:一方面,人工智能所基于的数学模型和数学手段被发现有一定的缺陷,例如连最简单和常用的异或(XOR)映射都难以处理;另一方面,有很多算法的计算复杂度以指数程度增加,所以成为了不可能完成的计算任务。于是人工智能跌入了谷底。
1.3 人工智能第二次浪潮和寒冬
与利用推理等简单规则的第一次人工智能浪潮不同,第二次人工智能开始走向专业化,侧重于借用领域专家的知识来武装自己。20世纪 80年代,卡耐基·梅隆大学为DEC公司制造出了专家系统,这个专家系统能够帮助DEC公司每年节约4000万美元左右的费用,特别是在决策支持方面能提供有价值的内容。受此鼓励,包括日本、美国在内的很多国家都再次投入巨资开发所谓第5代计算机,亦称为人工智能计算机[6]。
这一时期,人工智能数学模型方面有了新的突破,其中包括著名的多层神经网络和 BP反向传播算法等,这些算法都突破了之前的瓶颈,可以解决一些实际问题,再一次唤起了人们研究的热情,于是,人工智能迎来了第二次热潮。
但从80年代末到90年代初,专家系统所存在的应用领域狭窄、知识获取困难、维护费用居高不下等问题逐渐暴露出来,日本人宏伟的第五代计算机计划也宣告失败。AI遭遇了一系列财政问题,进入第二次低谷[7]。
1.4 人工智能的第三次浪潮
从90年代中期至今,随着计算机性能的高速发展、海量数据的不断积累以及 AI研究者的不懈努力,人工智能在许多领域不断取得突破性成果,掀起新一轮高潮[8]。1997年,IBM的国际象棋机器人深蓝(Deep Blue)战胜国际象棋世界冠军卡斯帕罗夫,引起世界范围内轰动。2006年,Geoffrey Hinton提出深度学习[9]。在接下来的若干年,借助深度学习技术,包括语音识别、计算机视觉等在内的诸多领域都取得了突破性的进展。2016年3月,Google的围棋人工智能系统AlphaGo与围棋世界冠军李世石进行人机大战,并以4:1的总比分获胜。2017年5月AlphaGo Master对阵当今世界围旗第一人柯洁连胜三局,这一系列的事件都使人工智能成为当下炙手可热的研究领域。
人工智能之所以能在近年来掀起新一轮高潮,主要归功于三大驱动要素:算法、大数据、计算力。
首先,机器学习算法一直是人工智能发展的核心推动力。尤其是深度学习首先在语音识别、图像识别领域取得了突破性进展,随后在自然语言理解的诸多领域都取得了可喜成果,直接推动了本轮人工智能高潮。
其次,深度学习的多层神经网络结构复杂、参数众多,需要大规模的数据才能训练生成有效的模型。得益于互联网、社交媒体的发展,全世界的数据规模呈现爆发式增长,人类进入大数据时代。如此海量的数据,为人工智能的发展提供了源源不断的训练和测试样本。
此外,深度学习使用海量数据训练复杂的多层神经网络模型,需要强大的计算能力支撑。之前业界采用传统的 CPU进行模型训练,花费的时间漫长。GPU的应用,将深度学习的效率提高了数十乃至上百倍。紧接着FPGA以及TPU等各种定制芯片纷纷被用于加速深度学习。再加上分布式并行计算技术的进步,使大量芯片可以同时用于模型训练。由此形成的强大计算能力,强有力地推动着人工智能向前高速发展。
2 当前人工智能的两条技术路线之争
人工智能虽然取得了辉煌成就,但是仍然有许多问题值得我们去冷静思考和回答。
关于人工智能,长期存在两种不同的目标或者理念。一种被称为“弱人工智能”,类似于“高级仿生学”,即希望借鉴人类的智能行为,研制出更好的工具以减轻人类智力劳动。另一种被称为“强人工智能”,实则可谓“人造智能”,是希望研制出达到甚至超越人类智慧水平的人造物,具有心智和意识,能根据自己的意图开展行动。
人类与动物之间的差别,在于人类有发现问题、定义问题、解决问题的能力。发现问题和定义问题,称为隐性智慧,解决问题被称为显性智慧。隐性智慧,例如意识、灵感、想象力、审美等等能力支撑,比较隐形。显性智慧是指获取信息、生成知识、实践能力等等,是看得见摸得着的能力。
弱人工智能,就是人类的显性智慧,是在工作的框架内,在目标的引导下,去解决问题。弱人工智能本身不能发现问题,也不能定义问题,而是由人来做这两件事,并由人教人工智能去解决问题,人告诉人工智能问题是什么,还要给人工智能提供必要的知识。所以人工智能没有可能超越人类,机器没有意识没有灵感,没有想象力没有审美,缺乏这些基本的隐性知识。
AlphaGo能打败李世石,是因为有明确的规则,状态也有限,但它可以利用人给他定义的规则、知识,然后利用大量的案例,和超强的计算能力打败人类。凡是基于确定的算法规则的东西,拥有超级计算能力的人工智能打败人类是迟早的事情,但是如果没有明确的算法,或者规则掌握在人类手中的话,那人仍然处于有优势的一方。
强人工智能,便是互联网上流传甚广、完全智能化的有自我意识的人工智能,是对脑科学、神经科学的研究,通过对人脑的高级神经活动规律的研究,去分析创意、灵感、想象力、情感这些东西到底从何而来。物理学家霍金也发表言论称“必须警惕人工智能”[10]。但大多数业界专家认为,这项全民关注的技术目前还处于初级阶段[11],尚未形成体系化的理论科学[12],仍有很多难以理论化解决的难题[13],因此强人工智能在几百年以内不会发生。人工智能技术现在所取得的进展和成功,是缘于“弱人工智能”而不是“强人工智能”的研究。强人工智能这一技术路线在过去几十年里投入很大,但是突破十分有限,未来的演进路线仍然十分漫长。
3 人工智能在不同应用领域表现出来的优势和短板
人工智能的应用领域十分广泛,主要有计算机视觉、自然语言处理和机器人科学、专家咨询系统、语音识别和机器翻译等等[14]。
计算机视觉从 2010年之后由于深度学习的兴起及运用,已经取得了一系列突破,经过大量数据训练之后,在辨识物体方面,一部分的机器算法甚至已经可以超过人类的辨识度[15,16]。而在语音识别方面,从语音到文字的相互转化也已经在多种语言中得到了成功运用。相比于计算机视觉和语音处理问题,当前的机器翻译尽管已经取得了很大进展,但仍然会错漏许多语言中的细节[17]。当前机器人科学发展迅速,不过生产出的只是能完成特定任务的专用工业机器人,与人工智能最终目标——有完全智能的机器人仍有较大差距。
现在的人工智能尽管在各个领域都取得了重大成果,但对现在的人工智能和机器人而言,关键问题是缺乏物理的常识和社会的常识[18]。一张图片中的信息,只有百分之五可以直接获得,而其余的百分之九十五,要靠推理才能够获得,这部分推理信息对于人类来说极易获得,而机器获取起来就极为复杂,目前的计算机视觉也只能简单地分辨一些图片,而不能真正理解图片。而在自然语言处理方面,人类将一种语言翻译成另一种语言建立在对语言内容的理解上,然后用另一种语言去表达理解的内容,而机器则用了截然不同的方法,大多是取决于语料库的丰富程度,将语句分块进行转换,所以经常出现很低级的语法错误。对于人类来说,我们在从小到大的学习过程中学会了如何辨别这些复杂的语境,但计算机目前还远不能做到这一点。
4 人工智能的未来愿景
人工智能在专业应用领域发展迅速,许多技术尽管现在距离实用差距很大,但在未来十到十五年极有可能实现。例如未来十到十五年,自动驾驶汽车甚至无人驾驶的空中出租车都有可能实现[19],业界有许多公司和机构正在从事这些方面的研究,以期最终推出合适的解决方案。期许这些前沿技术尽快为人们所用[20]。
预期在未来的十到十五年,人工智能仍将会是弱人工智能,只能够在某一专一领域发挥作用,还不能像人类一样有很高的创造性和理解能力。要想创造出可以和人类进行人机互动的具有真正智能的AI系统,让机器人具备自我学习能力,并且发展出自我意识,或许将要花上几十年甚至数百年的时间。
[1] 袁为. 人工智能之父: ·阿兰图灵[J]. 中国青年科技, 2003,(11).
[2] 张体德, 郭燕, 吕国娜, 刘树俊, 杨涛. 人工智能的发展和现状综述[J]. 福建质量管理, 2017, (4).
[3] 夏之初. 人工智能技术发展及应用现状综述[J]. 数字化用户, 2017, (20).
[4] D. Silver, A. Huang, C. J. Maddison, A. Guez, L. Sifre, G.Van Den Driessche, J. Schrittwieser, I. Antonoglou, V. Panneershelvam, M. Lanctot et al., "Mastering the game of Go with deep neural networks and tree search", Nature 529, vol.7587, pp. 484-489, 2016.
[5] 胡勤.人工智能概述[J]. 电脑知识与技术: 学术交流, 2010,(13).
[6] 田金萍. 人工智能发展综述[J]. 科技广场, 2007, (1).
[7] 林尧瑞, 马少平编著. 人工智能导论. 北京: 清华大学出版社, 1989. 05.
[8] 李红霞. 人工智能的发展综述[J]. 甘肃科技纵横, 2007,(5).
[9] Hinton, G. E., Osindero, S. and Teh, Y., A fast learning algorithm for deep belief nets. Neural Computation 18:1527-1554, 2006.
[10] 殷越铭, 樊小萌, 邢贝贝. 人工智能概述及展望[J]. 科技与创新, 2017, (20).
[11] 钟义信. 从“机械还原方法论”到“信息生态方法论”——人工智能理论源头创新的成功路[J]. 哲学分析, 2017,(5).
[12] 钟义信. 高等人工智能:人工智能理论的新阶段[J]. 计算机教育, 2012, (18).
[13] 钟义信. 人工智能理论:从分立到统一的奥秘[J]. 北京邮电大学学报, 2006, (3).
[14] 刘蕊.人工智能的软件基础层及应用综述[J]. 通讯世界,2017, (23).
[15] 李彦冬, 基于卷积神经网络的计算机视觉关键技术研究[D], 电子科技大学, 2017.
[16] 艾瑞咨询系列研究报告[R]. 2017 (12).
[17] 张国英, 何元娇. 人工智能知识体系及学科综述[J]. 计算机教育, 2010, (8).
[18] 肖斌, 薛丽敏, 李照顺. 对人工智能发展新方向的思考[J].信息技术, 2009, (2).
[19] (美)凯 瑟琳 · 赫利克著, 邹慧君, 梁庆华译. 人工智能. 上海: 上海科学技术出版社, 2017.08.
[20] 冉梦琦. 人工智能技术发展及应用研究综述[J]. 青春岁月,2016, (6).