APP下载

走进人工智能

2017-03-13董杉

科学24小时 2017年3期
关键词:标签分类监督

董杉

2016年3月,人工智能AlphaGo挑战人类围棋世界冠军李世石。比赛结果却出人意料地几乎一边倒,围棋高手李世石的智商几乎被Alpha Go碾压。曾经被视作人类智慧在棋类游戏上的最后堡垒——围棋,被人工智能彻底攻破,舆论一时哗然,人工智能也成为全世界关注的焦点。

人工智能是什么

那么问题来了,大家是否知道到底什么是“人工智能”?是计算机?是软件程序?还是机器人?

人工智能,全称为Artificial Intelligence,英文缩写为AI。其实从字面上我们就可以解读出两层含义:其一是“人工”;其二是“智能”。“人工”非常好理解,指的一定是经过人类活动创造出来的成果。但是“智能”是什么呢?这其实是一个非常难以准确描述的概念。事实上直至今日,人类对于到底什么是智能还知之甚少。

在人类智慧的范畴内,智能涉及到的意识、自我、思维等,仍然是自然科学、哲学乃至神学研究的焦点之一。因此,对于人工智能我们只能定义为研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门技术科学。而电子计算机、软件程序及机器人与人工智能之間的确存在着密切的关系。简单地说,电子计算机为人工智能提供了硬件基础,软件程序是人工智能实现的主要方式,而机器人则是人工智能的应用成果。

一路走来的人工智能

数千年来,人类对于人工智能的研究从未停止过,西方的《荷马史诗》中有关于大型三足机器人的描述,中国古代也有能工巧匠制造自动设备的记载。然而直到20世纪40年代,电子计算机的发明提供了硬件基础,真正意义上的人工智能才逐渐出现。

第一次高潮

20世纪50年代早期,人们开始注意到人工智能与机器之间的联系。1955年年末,第一个AI程序“逻辑专家”(Logic Theorist)诞生,对AI研究领域产生巨大影响,成为AI发展史中一个重要的里程碑。1956年,美国达特茅斯学院数学系助理教授麦卡锡(John McCarthy)等一批志同道合的年轻科学家们召开了一个研讨会,这次会议起了一个在当时看来别出心裁的名字——人工智能夏季研讨会。会议持续了一个月,以大范围的集思广益,催生了后来人所共知的人工智能革命,因此被公认为是现代人工智能研究的起源。

人工智能夏季研讨会后的10年,AI研究开始快速发展,因此这10年也被称为人工智能研究的第一次高潮。当时的研究多被称为机器学习(machine learning),主要集中在利用统计与概率的方式协助处理数据。

1957年,美国计算机科学家罗森布拉特(F.Roseblatt)提出了感知器(Perceptron)概念,这是最早的人工神经网络,具有划时代的意义。单层感知器是一个具有一层神经元,采用阈值激活函数的前向网络。通过对网络权值的训练,可以使感知器对一组输入矢量的响应达到元素为0或1的目标输出,从而实现对输入矢量分类的目的。

第一次寒冬

但是在第一次高潮之后,人工智能的发展却远远滞后于当年的预测。一方面,人们发现人工智能所基于的数学模型和数学手段有一定的缺陷,如逻辑证明器、感知器、增强学习等只能做非常简单、专业且很窄的任务,稍微超出范围就无法应对。另一方面,有很多计算复杂度以指数程度增加,成了不可能完成的计算任务。1973年,《莱特希尔报告》用详实的数据说明,几乎所有的人工智能研究都远未达到早前承诺的水平。于是在1974年到1980年,人工智能的发展迈入第一次寒冬。

第二次高潮

20世纪80年代,随着第五代计算机的研制成功,人工智能获得了进一步的发展。误差反向传播算法(Error Back Propagation, BP)和Hopfield多层神经网络模型的提出,使人工神经网络研究与应用再度出现了欣欣向荣的景象,人工智能走出寒冬迎来第二次高潮。

然而,1987年到1993年,个人计算机的出现,却让人工智能的热潮降温。当时苹果、IBM公司开始推广第一代台式机,计算机开始进入寻常百姓家,其费用远远低于人工智能专家系统所使用的Symbolics和Lisp等机器。相比于个人计算机,专家系统被认为古老陈旧且难以维护。20世纪90年代中后期,人工智能走入一个平缓发展的时期。

近年来,随着科技的不断进步,特别是互联网的蓬勃发展与大数据概念的出现,极大地加速了人工智能的发展。不过,任何智能的发展都需要一个学习的过程,依赖于大量数据的训练。由于各类感应器和数据采集技术的发展,我们开始拥有以往难以想象的海量数据。同时,也开始在某一领域拥有深度、细致的数据。如果把人工智能看成一个婴儿,某一领域专业、海量、深度的数据就是喂养这个婴儿的奶粉。那么,奶粉的数量决定了婴儿是否能长大,而奶粉的质量则决定了婴儿后续的智力发育水平。

避免下一个寒冬

很多从事人工智能领域开发的科学家均乐观地认为,我们已经处于人工智能的第三次高潮期,且在未来相当长的一段时间内,人工智能的发展不会再遭遇新的寒冬。然而,在乐观预期的同时,困境和挑战也始终存在。

中国科学院副院长、中国科学院院士谭铁牛就提出,要警惕人工智能进入下一个寒冬。因为一方面,人工智能热门技术目前正处于“期望膨胀期”,接下来可能进入“幻灭期”;另一方面,当前的研究热点过于集中在深度学习,但是深度学习不等于AI,它只是人工智能领域机器学习方向的一种方法,也存在明显的局限性。如果不能找到新的更优模型的研究方向,那么将来必定会成为人工智能研发的新瓶颈。

人工智能走向未来

毋庸置疑,研发技术突飞猛进中的人工智能,正逐渐被应用于人类生产、生活的方方面面。从Windows10自带的人工智能小娜,到Google无人驾驶汽车,拜人工智能所赐,曾经科幻电影中的场景正在一步步走入我们的生活。

那么,将来人工智能的发展方向是什么呢?简单地说,就是人工智能会逐渐向人类的智慧水平看齐。而想实现这个目的,人工智能就需要从目前比较成熟的监督学习,更多地向无监督学习发展。

这两者有什么区别呢?学习的过程,用一个成语来概括就是举一反三。以高考为例,高考的题目在上考场前我们从来没有做过,但在高中我们做过很多题目,懂得解题方法,因此在考场上面对陌生问题也能获解。人工智能的学习思路也类似:利用一些训练数据,找到方法分析未知数据。最简单也是最普遍的一类人工智能学习算法,就是分类。

对于分类,输入的训练数据有特征,有标签。所谓的学习,其本质就是找到特征和标签间的关系。这样,当有特征而无标签的未知数据输入时,我们就可以通过已有的关系得到未知数据的标签。在上述的分类过程中,如果所有训练数据都有标签,则为有监督学习。如果数据没有标签,显然就是非监督学习了,即聚类。目前,分类算法的效果还是不错的,但相对而言,聚类算法就有些惨不忍睹了。正如我们做题时,答案(标签)是非常重要的。假设两个智力完全相同的人参加高考,一人正常答题,另一人做的所有题目都没有答案,那么想必第一个人会取得较好的高考成绩,第二个人则会发疯。

因此,在监督学习的模式下,人工智能会表现出很好的分类与预测能力。而非监督学习本身的特点使其难以得到如分类一样近乎完美的结果。但是对人工智能来说,只有在非监督学习下,才有可能实现如人类一样自主思考,实现知识的表示与推理。

猜你喜欢

标签分类监督
什么是四个监督?
按需分类
教你一招:数的分类
说说分类那些事
让衣柜摆脱“杂乱无章”的标签
落实依法监督、科学监督、高效监督
科学家的标签
给塑料分分类吧
科学家的标签
标签新闻