与人共舞:人工智能成就梦幻世界
2020-11-02罗保林林海
罗保林 林海
按照进化论的观点,人是地球上的生物在自然选择、进化过程中形成的,历经猿人、能人、直立人、早期智人、晚期智人等阶段。而今,从赤道到两极,地球上凡有陆地的地方大多都有人类活动。随着时间的推移,人类开始意识到自身发展的局限,有一天竟然异想天开地要去创造智能。终于,人工智能跃然而出!
1956年,在达特茅斯学院召开的一个夏季讨论班上,以约翰·麦卡锡等为首的一批富有远见卓识的年轻科学家在一起聚会,共同研究和探讨用机器模拟智能的一系列有关问题,并首次提出了“人工智能”这一术语,标志着人工智能这门新兴学科的正式诞生。从此,人工智能一直以远超人类想象的速度发展着,它们开始逐渐进入人类生活的方方面面。
人工智能——关于知识的科学
简单来说,人工智能是关于知识的科学,我们将通过两个方面的问题对此探讨。首先,知识是怎样被表达的?在人类的头脑里,知识是怎样的一种存在?通过什么样的表达方式能够让机器拥有知识?其次,知识是怎样被获取的?我们人类通过什么方法获取知识?什么样的操作方法才能够让机器从浩如烟海的大量信息中自动获取知识?
在计算机的编程语言里,把概念称为“类”,而某个概念所代表的一个个具体的事物,则被称为这个类的“实例”。一个概念,有许多属性。概念的属性里有一种特别重要的属性,叫作关系。一个概念,有它的内涵和外延。内涵就是指这个概念代表的事物所共同具有的本质属性的总和。概念的内涵和外延,不一定能够确切地被描述,在许多情况下,它们都是模糊的。比如,关于大小、轻重、冷热、快慢等概念的内涵和外延,就都是模糊的。
怎样表达知识,可以归结为怎样表达概念。表达概念的方法有许多种,如古典的产生式表示法和嗣后发展的框架表示法、状态空间表示法,以及现代的知识图谱表示法。
知识的表达,就好像树上的苹果,已经挂在枝头了。而知识的获取,就好像我们从树上摘取苹果,再将它们存放在小篮子里。所谓知识的获取就是我们从结构化的知识中,获取我们所需要的知识,生成新的知识。
知识获取的一个基本方法是利用搜索技术。我们的搜索是盲目的。而在搜索的过程中,我们不断地深入,直到碰到死胡同才返回。这样的搜索方法就是盲目的深度优先的搜索方法。
盲目搜索方法的效率是比较低的。于是我们想到是否可以一边搜索,一边对搜索方向的好坏进行评估。使用系统相关的信息对搜索过程的好坏随时进行评估,这样的搜索方法叫作启发性的搜索方法。从最简单的跳棋到国际象棋、中国象棋,直至最复杂的中国围棋,机器都成功地战胜了人类最顶尖的棋手。这里,机器所使用的就是启发性的搜索方法。谷歌的阿尔法围棋将深度学习的方法引入到蒙特卡洛方法中,设计了一个策略网络用来评估可能的落子点,还设计了一个估值网络来对棋局的胜负可能进行评估,这样就可以在极短的时间内,十分高效地对非常复杂的棋局进行计算,找到最可能获胜的博弈方法。
知识获取的另一个主要方法是群智能算法,这是受到生物界成功生存的策略启发而产生的一种算法。目前,得到广泛应用的群智能算法有遗传算法、粒子群优化算法和蚁群算法。
上述的这些人工智能获取知识的技术主要都是由人工编程,然后通过机器的计算获取新知识。而我们更感兴趣的是如何让机器自主地学习知识,以及如何模拟人类的神经网络来获取知识。
机器学习使人工智能的发展上了一个新的台阶。以往,知识的获取都是经人工编程之后,機器按照人工设定的步骤和方法来获取知识,而机器学习则是在给机器提供一个学习模型之后,机器能够对现有的数据和知识自主地进行分析和抽象,建立起知识的新模型,估计模型的参数,从数据和原有的知识里挖掘出对人类更有价值的知识。其结果是能够利用原有的知识和经验使得机器系统得到自我改善,变得更加“聪明”。建立在大量数据基础上的统计学和计算机科学的融合,给机器学习提供了强大的动力。与此同时,深度学习也给机器学习带来了全新的面貌。目前,机器学习包括有监督的机器学习、无监督的机器学习和弱监督的机器学习。
随着神经科学和脑科学的发展,人们对于人类的智能机制有了一定的了解,由此在结构上让机器对人脑进行模拟,这就是人工神经网络和深度学习。
人类大脑里面的神经元的数量极其庞大。每个神经元都和周围的神经元相互连接,形成了大脑极其复杂的结构,支撑着人类的智能。
神经元的结构比较简单,而由神经元所组成的神经网络,其结构却极其复杂。神经网络可以看作是分层的,由许多层的神经元所组成。处在某一层的神经元,从前一层的神经元那里得到输入信号,再经过自己的加工和处理之后,输出到下一层的神经元。如果神经信号是一层一层地向后传递的,那么就把这个神经网络叫作前馈型的神经网络。而如果把某一层输出的神经信号引回到前面某一层的输入端,那么就把这种神经网络叫作反馈型的神经网络。
模拟前馈型神经网络的算法叫作BP神经网络算法。BP神经网络算法是一个多层结构的算法,每一层都有众多的神经元。除了第一层输入层和最后一层输出层之外,BP神经网络中间的各层叫作隐藏层。
BP神经网络算法的隐藏层不能太多,以免影响了它的性能和应用。为此,我们需要对其进行改进,增加隐藏层的层数,也就是深度,这样的神经网络被称为深度神经网络。卷积神经网络就是一种深度神经网络。卷积神经网络在图像处理的各个领域,特别是人脸识别上,取得了巨大的成功。
还有一种道理并不深奥而功能强大的深度神经网络,叫作生成对抗网络。生成对抗网络经过训练后,能够根据文本来生产所需要的图像,也能够根据要求生成各种文本,如新闻报道、学术报告、诗歌、歌词等。
从信息系统、专家系统到人工智能
1955年,美国数学家约翰·麦卡锡联合克劳德·香农(信息论创立者)、马文·明斯基(人工智能大师,《心智社会》的作者)、纳撒尼尔·罗彻斯特(IBM计算机的设计者之一)发起了达特茅斯项目。第二年夏天,他们接着举办了“人工智能夏季研讨会”,正式启动达特茅斯项目,首次提出了“人工智能”这一概念,正式确立了一个对人类行为、意识和思维过程进行模拟的新科技领域,并将数学逻辑应用到了人工智能的早期形成中。
人工智能领域必不可少的基础工具是电子计算机。电子计算机是1941年在美国和德国同时出现的。计算机以信息为工作对象,具有对信息进行存储和处理的功能。原始的计算机体积极其庞大,而且如果想要改变处理信息的程序,就要更改复杂的电子线路。后来,程序也可以像数据一样被记录在存储器里了,随着电子器件的进步,计算机的体积逐渐缩小了。
美国的应用数学家诺伯特·维纳不但创立了信息论,而且建立了系统的反馈理论。在20世纪50年代初,人们在反馈理论的基础上建立了各种自动控制系统,用于控制环境温度、控制水位、控制速度和位置等。自动控制系统是人工智能迈出的第一步,它使得机器看起来好像会思考了。
1955年末,艾伦·纽威尔和赫伯特·西蒙编写了一个名为“逻辑理论家”的程序。该程序能够在解决问题的各个路径中选择最具潜力的路径,被认为具有一定的智能,是人工智能发展过程中的一个里程碑。1956年,在麦卡锡等提出了“人工智能”这一概念之后,一些大学纷纷设立了人工智能研究中心,寻求更有效的算法,包括进一步优化“逻辑理论家”程序和建立具有自学习功能的系统。1957年,“逻辑理论家”的开发团队推出了新程序——“通用解题机”。这个新程序扩展了维纳的反馈理论,可以解决很多常识问题。两年后,IBM开发了一个用于证明幾何定理的程序。1958年,麦卡锡宣布开发了LISP语言。该语言很快就为大多数人工智能开发者所采用。1963年,麻省理工学院得到美国政府的资助,研究开发了机器辅助识别系统,加快了人工智能发展的步伐。
随着计算机体积的缩小、能耗的下降、计算速度的提高和存储容量的拓展,计算机处理信息的能力在不断地增强。20世纪70年代,在一般的信息系统基础上出现了专家系统。专家系统可以从大量的数据中找出某些规律,解决不确定解的问题,预测在一定条件下某种解的概率。专家系统的市场应用很广。1978年,我国就推出了“关幼波肝病诊断与治疗专家系统”,根据专家的经验,帮助医生诊断疾病。此外,还出现了帮助寻找矿藏的专家系统,用于股市预测的专家系统,等等。
20世纪70年代人工智能领域风起云涌,出现了许多新理论和新方法。例如,在机器视觉方面,根据图像的阴影、形状、颜色、边界和纹理等基本信息,计算机经过分析和推断,可以辨别出该图像可能是什么物体。1972年开发出的PROLOG语言在人工智能研发中得到了广泛的应用。
20世纪80年代,人工智能的发展提速,更多地进入了商业领域。专家系统的需求迅速攀升,出现了为大型计算机编程的专家系统,以及为专家系统查找和改正错误的专家系统。许多制造业的实体公司依赖专家系统而运行,资本和人才纷纷涌向人工智能相关的研发机构和企业。当时,有许多人工智能研究的成果进入了市场,尤其是机器视觉更是取得了较大进展。在生产线上安装的机器视觉系统,能够分辨物体形状的不同。但是在80年代的后期,人工智能产业也出现了泡沫。通常,由一项新技术所形成的产业典型的发展曲线是Z字形的,而人工智能产业的发展则呈现出相连的双Z字形。开始时有一个缓慢的启动,积累到一定程度即出现第一个高潮。这时候,由于过度炒作,资本大量涌入,兴起了很多公司。但是社会需求的不足引发了经济泡沫,造成了产业的滑坡,一些公司纷纷破产,发展陷入低谷。然后,经过洗牌和清理,能够坚持下来的公司获得了转机,事业慢慢地有了起色,之后才迎来高速的发展。在这次泡沫破裂中,美国国防部高级研究计划署支持的所谓“智能卡车”项目,也由于项目缺陷和成功无望被停止提供项目的经费。
然而,尽管经历了种种挫折,人工智能仍在慢慢地恢复发展,新的技术不断被开发出来。在美国首创的模糊逻辑,可以从不确定的条件中作出抉择;还有神经网络,被视为实现人工智能的可能途径。基于模糊逻辑,人工智能技术简化了摄像设备。人工智能技术还被用于导弹系统和预警显示和其他先进武器,这些智能设备在战争中经受住了考验。语音和文字识别等人工智能技术也大量地出现在了普通民众的生活中,并持续、不可避免地改变着我们的生活。
人工智能产业三大支柱——大数据、算法和智能芯片
当前,人工智能之所以进入了蓬勃发展的时期,是因为它具备了发展的三个必要条件,或者称为三大支柱,即大数据、算法和智能芯片。
由于互联网的发展和普及,我们目前已经积累了大量的数据,而且每天还有新数据产生。这些数据涉及各行各业,完全不是过去一般意义上的统计数据可以相提并论的。大数据是非结构化的数据,不是按照一定的规则和意图从自然和社会中摘取的片面数据,能更加生动、全面地反映自然和社会生活的种种关系。通过数据挖掘,我们可以从浩瀚的信息中获得有用的知识。
在交通领域,我们可以通过大数据记录每个交通参与者的行踪。人们每天在什么时间,乘坐何种交通工具,经过怎样的路线,从哪里去哪里,都一清二楚。人工智能借此找到规律,以规划和管理城市的交通。在医疗领域,大数据中记录着就医者的各项生理和病理指标,诊断和治疗的过程,以及所用的药物和医疗措施。通过大数据,医生可以为患者找到最佳的诊疗方案,避免过度治疗和治疗不足。人工智能还可以支持最佳抉择,避免医疗事故,评估药物的不良反应。大数据使得医疗过程更加透明,能够促进社会公平,让患者获得更好的服务。
人工智能发展的另一个支柱是算法。所谓算法,就是通过对数据的处理,引导出一个有用的结论。以往传统的算法,主要是基于数理逻辑的一种演绎性推理,智能性是很有限的。客观世界是极其复杂的,各种事物存在着或明或暗的联系,因而人们所面对的数据,也具有一定的模糊性和不确定性。人类的思维,有逻辑性的一面,也有非逻辑性的一面。例如,思维中的联想、比拟、归纳,以至于直觉和灵感,就不是数理逻辑能够解决的。在人工智能的发展史上,定理的机器证明带来了第一次高潮,专家系统的模糊抉择带来了第二次高潮,现在,一次新的发展高潮是由神经网络算法和深度学习所带来的。
大数据的处理和神经网络深度学习的算法都需要智能芯片的支持。中国科学院计算技术研究所于2017年发布了全球新一代人工智能芯片——“寒武纪”系列,其中有3款面向智能手机等终端的“寒武纪”处理器,2款面向服务器等云端的“寒武纪”高性能智能处理器,以及1款专门为开发者打造的人工智能软件平台。“寒武纪1A”处理器已经被华为应用到麒麟芯片中。(节选自《与人共舞——人工智能成就梦幻世界》)
作者简介:
罗保林,毕业于清华大学,在中国科学院获工学博士学位,中科院过程工程研究所研究员、博士生导师、中国科普作家协会会员。
林海,1963年就读于清华大学无线电系,毕业后在电视、雷达、计算机、自动控制等领域从事研究工作,曾任计算机与自动化专业教授。1987年因雷达信息处理获国家技术发明二等奖。退休后从事文学创作和科普写作,现为中国科普作家协会会员。
内容简介:
随着计算技术的飞速发展,人工智能似乎在顷刻之间就悄悄地来到我们身边,一时间我们的周围到处舞动着人工智能,令人眼花缭乱。从手机到3D打印,从谷歌眼镜到全息投影,就连美图App一键整容都要依靠人工智能。而且,人工智能的快速发展超乎人类的想象,一时间,人机交互、无人驾驶、虚拟现实等智能设备扎堆出现,智能机器人频频亮相。