浅析人工智能主要技术方向以及在智能机器人上的应用
2018-12-24武子睿
武子睿
(北京理工大学附属中学,北京,100089)
0 前言
现如今智能机器人已经从科幻电影中的形象发展成为走进千家万户的产品,而AlphaGo大战人类顶级围棋手则标志着人类的智慧正在被机器超越。其中,人工智能技术,被认为是这类机器的核心。人们将人工智能大致划分成两个类别:弱人工智能与强人工智能。弱人工智能是指不具有推理分析能力,只能使其看起来像是智能的,而实际却只能通过一系列创造者设定好的程序运行,现在主流的科研集中在弱人工智能上,并已经取得了可观的成果;强人工智能与前者相反,人们一般认为这种机器是具有推理和解决问题的能力的,是有知觉、自我意识的,历史上曾有过不少科学家尝试开发出真正的强人工智能,但他们最后都没有得到实质性的突破,所以这样的机器现在还只停留在理想阶段。在弱人工智能技术不断发展的基础上,智能机器人的技术也在不断的进步、更新。智能机器人,即运用人工智能技术,表现出部分“人”的特征的机器,现代智能机器人主要通过感知、交互、运动三大能力来完成所希望达到的功能。可以说,智能机器人的智能化程度取决于人工智能的发展进程,而人工智能各主要研究领域的一个典型应用场景就是智能机器人。
1 人工智能技术发展历程
自1956年达特茅斯会议上,第一次提出人工智能这一概念以来,其发展历程已经跨越半个世纪。20世纪70年代,史上第一个专家系统—DENDRAL系统出现,该系统可通过分析质谱信息从而确定化合物分子结构。在DENDRAL 系统诞生后,又有许多系统相继而出,人工智能技术一度成为了热门。70年代后期,学界对人工智能的发展过于乐观,而彼时的计算机性能不足以支撑机器学习和人工神经网络的计算复杂度,由此导致绝大多数人工智能领域的研究进入瓶颈期。社会层面上对人工智能的关注大大下降,政府和科研机构对该项研究的支持程度也日益减少,这段时期被称为AI衰退期。80年代的神经网络国际会议标志着人工智能的复苏,BP算法和决策树算法的提出,使得人工智能的发展进入新纪元。十几年来的飞速发展,使得人工智能技术重回大众视野:1997年,IBM的超级计算机“深蓝”战胜了当时的国际象棋大师Garry Kasparov;2016年3月,Google开发的AlphaGo以4∶1的成绩战胜了世界围棋冠军李世石,对世界冠军的胜利大大鼓舞了人工智能研究者的信心,也预示着人工智能即将进入千家万户,用自己的“智慧”改变人们的生活。
2 人工智能的主要技术方向
■2.1 计算机视觉
2.1.1 计算视觉的技术背景
计算机视觉是计算机对生物视觉的一种模拟,它主要通过对外部图像进行处理,来让计算机能够感知环境。在计算机视觉的发展过程中,逐渐分化出了一个主要的研究领域,主要包括图像处理技术、模式识别与图像理解技术。
2.1.2 计算机视觉的发展历程
计算机视觉的开端始于20世纪50年代,人们对二维图像的分析和识别,如光学字符的识别、显微图片、工件表面的分析等。70年代中期时,美国麻省理工学院的人工智能实验室开设了计算机视觉的课程,吸引力许多国际知名学者参与计算机视觉的理论、算法研究。David Marr 教授在1977年提出了不同于“积木世界”分析方法的计算机视觉理论,为80年代计算机视觉领域发展提供了一个十分重要的理论框架[1]。20世纪80年代,计算机视觉迅速发展,主动视觉理论框架、基于感知特征群的物体识别理论框架等新兴理论不断涌现出来。到了90年代,计算机视觉技术开始在工业中的到广泛的应用。今天,随着计算机视觉与计算机图形学的不断融合与互相影响,基于图像的绘制逐渐成为了研究热点。
2.1.3 计算机视觉在智能机器人上的应用对于智能机器人来说,视觉一直是一中十分重要的对外界进行感知的途径,因此,计算机视觉被广泛的应用在生产、生活中,来帮助机器人对目标的位置,形态进行分析。在生产中,搬运机器人需要搬运各种不同大小、规格、质量的工件,来减少工人的劳动强度,在搬运过程中,机器人需要对工件的位置进行分析,并依据位置数据对机器人操作进行调整,来提高机器人工作的准确性、稳定性[2]。在家庭生活中,计算机视觉技术主要被应用在精确的抓取物品以及对人体姿态的识别与分析上。在抓取物品时,机器人需要对物品进行准确的定位,并运用计算机视觉技术协助机械设备进行调整[3],在人体姿态识别分析上,人们通常采用关节点的分离与识别来构建用户的人体骨架模型,从而识别用户的姿态动作。
■2.2 机器学习
2.2.1 机器学习的技术背景
机器学习,是指计算机在算法的作用下,通过对大量数据的自动学习,从而得到数据集中蕴含的内在规律,并在实际中加以应用,为人类提供帮助。普遍分为有监督学习和无监督学习两大类[4]。
BP算法是机器学习中较为经典的一个算法,这种算法属于监督学习,主要通过期望输出对实际输出的反馈不断调整每个神经元信号的权值来不断逼近期望输出。这种算法容易陷入局部最优和过拟合的情况中。
2.2.2 机器学习的发展历程
机器学习的概念最早在1943年,Warren McCulloch和Walter Pitts提出的神经网络层次结构模型中出现,而在1957年,第一个计算机神经网络算法的出现,使得机器学习逐渐成为了计算机科学领域中的一个重要分支。1969年,在一部机器学习著作《Perceptron》中的XOR问题让人们对机器学习的研究进入了冷静期,直到1980年夏天在美国卡内基·梅隆大学举办的机器学习国际研讨会,机器学习的发展才重新回到正轨。随着人们研究的不断深入,新的模型结构与学习算法正在不断的涌现出来,如Liu Yan等人提出的DDBNs算法被成功的应用在了图像的分类上。现如今,机器学习已经成为各大高校中一门重要学科,融合了多种学习算法而形成的集成式学习系统在不断兴起。
2.2.3 机器学习在智能机器人上的应用
在智能机器人的技术中,寻路技术一直是受人们广大关注的话题。如何使机器人顺利的避开障碍物,自主寻路来到目标地点,准确的夹取或放下物品是当下研究的重点[5]。机器学习技术不断发展的今天,许多研究者采用学习技术来赋予机器人在复杂环境中寻找道路的能力[6]。
人们通常采用强化学习作为寻路算法的核心,它主要采用在机器人运动过程中对实际运动路径的奖惩措施来实现网络中权重大小的调节[7]。
■2.3 自然语言处理
2.3.1 自然语言处理的技术背景
自然语言处理就是一门研究计算机和人类自然语言之间相互作用的学科。它主要研究以下两大方面:自然语言理解和自然语言生成。
(1)自然语言理解
要实现人与计算机之间直接的自然语言沟通,首先遇到的第一个难点就是如何使计算机理解人类所表达的意思。它主要分为语言的分析和语义的理解。在拆分句子时。人们主要采用编码的方式,将计算机难以理解的自然语言,转换为可以理解并进行处理的编码,我们一般会使用大量的训练数据来训练编码器,从而得到可靠的权重。在语义理解时,人们主要通过建立语言模型,从语法、词法、词义等多方面来理解语言中所表达的含义。
(2)自然语言生成
自然语言生成是研究使计算机可以像人类一样将事物表达为人可以听懂并理解的自然语言的学科,也即,能够根据计算机中的信息,自动生成出一段可理解的文本。它的工作与前文所提到的自然语言理解正好相反,它需要将一段编码反编译为文本信息。如何使编译出的文本符合人们日常生活所用的习惯是现在研究的难点与重心。
2.3.2 自然语言处理的发展历程
20世纪40年代末期,有关自然语言理解的相关领域就已经开始发展,那时,计算机刚刚开始发展,人们首先遇到的难题集中在机器翻译上。在60年代,学界对机器翻译曾有过大规模的研究工作,但是,当时的人们低估了自然语言的复杂程度,耗费巨资但没有得到很大的成果。从90年代起,自然语言处理领域逐渐发生了巨大的变化。人们开始将眼光着眼于大规模真实文本的处理,而不是仅仅限于几个简单的句子的处理,且在此同时,对语义理解的要求也逐渐升高。20世纪以来,基于人工神经网络的自然语言处理研究不断发展,深度学习开始被应用于这方面研究[8],如今,在深度学习技术的不断完善与GPU技术的不断深化的共同作用下,人们对于自然语言理解已经有了不错的成果,而对于自然语言生成,我们还有很长的路要走。
2.3.3 自然语言处理在智能机器人上的应用
自然语言对于智能机器人的应用主要集中在与人类对话、交流和对指令的理解分析上。这种技术可以使机器人能够更加“人性化”的对外界信号进行反应,同时,机器人也可以更好的理解人类所下达的命令,从而减少人类表述指令的难度。
机器人的对话交流主要通过将音频传入设备发出的音频信号数字化,并应用自然语言处理技术对信号编码,转化成计算机可以理解的语言,接着对信号进一步分析,理解其中所表达的含义并进行相关的处理,再经过自然语言生成技术将处理结果表达为文本,经由扬声器输出,如此往复来达到人机交互的目的。而指令理解通常需要对特定的指令语句进行模型分析,建立对应的语法、语义分析法则。如,在家庭机器人的寻路过程中,通过自然语言处理,将用户所表达的路径信息转化为实际的命令,在配合前文所述的其他技术,让机器人运动到指定的地点。
3 总结
本文中,我们主要从机器学习、计算机视觉以及自然语言处理等几个方面探讨了人工智能技术的发展历程、现状及未来的发展方向,并以智能机器人为例说明以上几个领域在智能机器人技术中的应用。
人工神经网络与机器学习的突跃为人工智能技术带来了一次巨大的技术革新,而计算机视觉以及自然语言处理分别为其提供了必要的支持,这些技术在不断的共同进化中,也为我们的生活带来了无与伦比的好处,如今,智能机器人已经大量应用于实际生活,并为我们提供着方便、快捷的服务。
未来人工智能的发展面临着以下的几个问题:相关算法的时间复杂度和精度可能依然无法满足人们的需要,我们仍需发现更加高效、准确的算法来实现我们的目的;如今的人工智能技术还停留在弱人工智能的层次,要真正实现可以自主思考的强人工智能,我们还需要一次新的技术革新。