人工智能技术体系架构探讨
2016-12-30徐贵宝中国信息通信研究院技术与标准研究所高级工程师
徐贵宝 中国信息通信研究院技术与标准研究所高级工程师
网络技术——互联网新技术、新应用专题
人工智能技术体系架构探讨
徐贵宝 中国信息通信研究院技术与标准研究所高级工程师
通过人工智能的定义及其与人类智能的关系,讨论了人工智能的内涵。在此基础上,提出了一个包含核心层与关键技术层两层的人工智能体系架构,并对体系架构中的算法理论、感知环节、思考环节、行动环节等进行了描述。
人工智能;技术体系架构;核心层;关键技术
1 引言
人工智能概念是在1956年达特茅斯会议上首次正式提出的,但当时并没有给出具体的定义。此后的60年时间里,出现过各种各样的概念,但这些概念并没有获得业界的普遍认可。在此期间,人工智能经过不断的发展,从计算智能时代发展到感知智能时代,现在发展到认知智能时代;主流学派从符号学派到控制学派,然后又到连接学派;主流技术方案从机器定理证明到专家系统,再到神经网络、深度学习。但是,不管是哪个时代、哪个流派,都没有提出过人工智能的技术体系架构,这不仅造成了人工智能领域散乱发展的形象,也造成了各领域对人工智能无法形成清晰的认识,虽然目前人工智能正在进入新一波发展浪潮,但仍然存在无法快速进行产业转化的发展困境。因此,非常有必要梳理出来一个人工智能的技术体系架构,从而使得业界能够对人工智能有一个总体的认识,进一步推动人工智能的技术应用和产业发展。
2 人工智能的内涵
2.1 人工智能的定义
为了便于分析和理解人工智能的技术体系架构,先来看一下人工智能的概念。
麦卡锡在1956年的达特茅斯会议上提出人工智能概念时,曾经表示:“人工智能就是要让机器的行为看起来就像是人所表现出的智能行为一样”,这可以说是人工智能概念的最初解释。
美国全国科学院院士、动态规划的创始人贝尔曼1978年提出,人工智能是那些与人的思维、决策、问题求解和学习等有关活动的自动化。
斯坦福研究所人工智能中心主任N.J尼尔逊1998提出,人工智能是关于知识的学科——怎样表示知识以及怎样获得知识并使用知识的科学。
谷歌未来科学家雷·库兹韦尔认为,人工智能是一种创建机器的技艺,使机器能够执行需要人的智能才能完成的功能。
百度百科中关于人工智能的定义是:“人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。”
从定义中可以分析出,人工智能的主体是“机器(或者计算机)”,客体是“人类的智力与行为能力(具体来说就是人类的感知、思考、行动等能力)”,途径是“模拟、延伸和扩展”,目的是“使机器(或计算机)能够执行需要人的智能才能完成的任务”。因此,不妨对人工智能提出如下定义:“人工智能是用机器模仿和实现人类的感知、思考、行动等人类智力与行为能力的科学与技术,目标在于模拟、延伸、拓展人的智慧与能力,使信息系统或机器胜任一些以往需要人类智能才能完成的复杂任务”。
2.2 人工智能与人类智能的关系
人类智能可以完成的复杂任务主要包括感知、思考、行动3个环节,人工智能实际上是机器(或计算机)对上述环节的模拟、延伸和拓展,也就是机器智能。不妨以功能比较全面的机器人作为人工智能的典型示例,将其与人类来做一个对应,从而对人工智能的内涵加以明确。
人类智能的感知环节包括视觉感知、听觉感知、嗅觉感知、味觉感知、触觉感知等,对应的人工智能就是机器视觉感知、机器听觉感知、机器嗅觉感知、机器味觉感知、机器触觉感知等。
人类智能的思考环节包括学习、思维、理解等,对应的人工智能就是机器思维、机器理解、机器学习等。
人类智能的行动环节包括语言、表情、动作等,对应的人工智能就是声音合成、情感计算与智能控制。
因此,如果将人类智能看作是以人脑为基础的神经计算与控制,人工智能实际上就是以机器存储为基础的机器计算与控制。人工智能与人类智能的关系参见图1。
3 人工智能技术体系架构
3.1 基本架构
按照人工智能的定义及其与人类智能之间的关系,人工智能就是要模拟与实现人类智能,这就涉及到机器在感知、思考、行动这几个主要环节的能力实现方面所涉及到的关键技术。
在感知环节,所涉及的关键技术包括机器听觉、机器视觉、机器嗅觉、机器味觉、机器触觉等。
在思考环节,所涉及的关键技术包括机器学习、机器理解、机器思维等。
在行动环节,所涉及的关键技术包括声音合成、情感计算、智能控制等。
对于人类智能——也就是基于人脑的神经计算和控制来说,其能力和智力的提升主要是依赖学习和理解,而学习与理解的核心是算法。对于人工智能——也就是基于机器存储为基础的机器计算与控制来说,其能力与智力的提升也主要是依赖机器学习和机器理解,因而其核心也是机器算法和理论。
根据上述人工智能的内涵及上述论述,可以考虑列出一个人工智能技术体系架构,具体参见图2。该架构包括两个层面,其中感知、思考、行动等环节的模拟和实现技术属于关键技术层,算法理论属于核心技术层。
图1 人工智能与人类智能的关系
3.2 算法理论
之所以将算法理论列为人工智能技术体系架构的核心层,主要是人工智能首要考虑的问题就是算法。算法理论主要涉及最早出现的机器定理证明和后来出现的专家系统、神经网络、深度学习,以及刚刚开始发展的类脑智能等,算法理论模块参见图3。
人工智能中最先应用的算法是机器定理证明以及其他类似问题的求解,这是由于在人工智能发展初期,符号主义学派认为人的智能主要体现在具有推理和思考能力,因此也就自然而然地将机器定理证明作为了人工智能研究的第一个切入点,并将相关成果应用于问题求解、自然语言理解、程序验证和自动程序设计等方面。至于回归算法、基于实例的算法、贝叶斯方法、正则化方法、聚类算法、基于核的算法、降低纬度算法以及专家系统等,都是不具备学习能力的算法。集成算法是将多种算法结合起来,综合运用于人工智能之中。
决策树学习、关联规则学习等属于具备学习能力的算法,但效率上相对较低。人工神经网络是借鉴了人类神经计算的原理而形成的算法,其效率得到了大幅度提高。深度学习是在人工智能神经网络的基础上,通过构建多隐层神经网络模型和海量训练数据,来学习更有用的特征,最终提升分析准确性,具备了自动学习数据特征的能力,尤其适用于包含少量未标识数据的大数据集。由于深度学习采用层次网络结构进行逐层特征变换,将样本的特征表示变换到一个新的特征空间,从而使分类或预测更加容易,也使其成为了推动本次人工智能浪潮的热点。
图3 算法理论模块
图2 人工智能技术体系架构
由于神经网络和深度学习都只是刚刚采用了一点点的脑科学与神经科学中的研究成果,就使得人工智能发展获得了如此显著的进步,因此人们相信,大脑中还有非常非常多的计算与控制机制可供人工智能借鉴,这也是业界普遍关注类脑智能的最主要原因。目前的类脑智能研究,主要是借鉴大脑中“内存与计算单元合一”等信息处理基本规律,在硬件实现与软件算法等多个层面,对于现有的计算体系与系统做出本质的变革,从而实现在计算能耗、计算能力与计算效率等诸多方面的大幅改进。就网络连接模式比较而言,深度学习是从宏观角度利用了脑区间的链路及其协同特性,而类脑智能则是从微观角度利用神经元、突触的工作机制及其特性,深度学习与类脑智能的比较参见图4。
图4 深度学习与类脑智能的比较
3.3 感知环节
感知环节包括及其感知所涉及的关键技术,主要实现对人的感知能力的模拟和拓展,包括对人的听觉、视觉、触觉、嗅觉、味觉等,实现数据的采集和初步处理(见图5)。由于技术发展的阶段性问题,人工智能在很多方面并没有完成人类感知的所有功能;另一方面,由于人类通过技术实现可以让机器设备探测到一些人类所不能感知到的现象,因此目前机器感知能力已经有很多方面甚至超越了人类,今后还会有越来越多人工智能发展出比人类更强的机器感知能力。
机器听觉技术主要实现声音识别,现阶段主要是人类语音识别,而且语音识别已经成为车载语音、智能家居、人机交互、机器同声传译等应用的基础。
机器视觉技术主要实现图像识别和视频识别等,是在自动驾驶、物体检测等领域发展的基础。在图像识别领域,指纹识别已经是一种非常成熟的技术,目前的重点是人脸识别和虹膜识别。在视频识别领域,主要关注的是动态图像,目前的重点为体感识别。
机器触觉技术是一种复合传感技术,是机器通过自身表面的温度觉、力觉等传感器提供的复合信息,来识别物体的冷热、尺寸、柔软度、表面形状、表面纹理等特征。相关技术包括压电式触觉传感技术、压阻式阵列触觉传感技术、成像型触觉传感技术、超大规模集成计算传感阵列技术等。目前,温度感知和压力感知技术已经基本成熟,并获得了广泛应用;材质感知等技术尚处于研究过程中。
图5 感知环节关键技术
嗅觉感知和味觉感知技术主要是分子层面的感知识别,将会在危险物检测、矿床探测、食品卫生服务等领域大显身手。但目前嗅觉感知技术刚刚开始发展,而味觉感知技术还未开始研究。
3.4 思考环节
思考环节主要是对利用算法理论的实现人工智能对知识的学习、对问题的思考和对现象的理解等。因此,该环节主要包括机器学习、机器思维、机器理解等部分(见图6)。
机器学习部分主要是将所获得的数据信息利用贝叶斯方法、关联规则学习、神经网络、深度学习、类脑智能等高级算法理论来进行处理,挖掘出有价值规律性的知识,提升人工智能的思维和理解能力。
机器理解部分主要是利用一些高级算法来理解所获得的数据含义,主要包括声音理解、自然语言理解、图形图像理解、运动影像理解、行为动作理解等。目前,RNN(回归神经网络)、DNN(深度神经网络)、LSTM(长短记忆神经网络)已成为常用的语音识别算法。而在诸多机器视觉技术中,卷积神经网络(CNN)被人们普遍认为是一种更容易被训练并且具有更好泛化能力的前馈网络,已经广泛运用于自然图像、指纹、人脸以及物体的检测之中。
图6 思考环节关键技术
机器思维部分主要是在已经获得的知识的基础上,利用回归算法、基于实例的算法、贝叶斯方法、正则化方法、聚类算法、基于核的算法、降低纬度算法、专家系统以及决策树学习等算法进行推理,从而得出问题求解、智能搜索、自动规划、辅助决策、程序验证和自动程序设计等需要解决的问题的答案。
3.5 行动环节
行动环节主要是实现思考环节的结果输出、执行与控制,包括决策执行、声音合成(尤其是自然语音合成)、智能控制、情感表达等(见图7)。
图7 行动环节关键技术
决策执行概念比较宽泛,依据各自不同的需求执行具体的动作。
声音合成技术目前已经基本成熟,通过数字化频率控制,可以将声音惟妙惟肖地模仿出来。尤其是自然语音合成(TTS)技术能将任意文字信息实时转化为标准流畅的语音朗读出来,其技术原理如图8所示。自然语音合成技术在与声纹技术的结合后,还可以逼真地模仿出各个人物的声音。
智能控制包括平衡控制、动作控制等。智能控制(尤其是工业智能控制)在与通信系统的结合后,甚至已经能够实现远程智能控制与服务。目前,智能控制技术已经在生产制造领域已经获得了较大范围的应用,智能设备以及各类生产型机器人开始在工厂车间出现,甚至出现了无人车间、智能空调、扫地机器人以及其他一些社会服务性机器人也已经陆续产品化。
情感表达主要是让机器人能够表达人类的喜、怒、哀、乐、悲、忧等情感,主要用于类人服务机器人,也是目前人工智能领域的研究热点之一。但由于人类情感表达方式比较复杂,情感识别比较困难,情感计算技术还未获得本质的突破,情感表达技术还与材料等有很直接的关系,因此情感表达技术虽然已经开始研究,但还尚未取得显著的进展。
图8 自然语音合成技术原理
4 结束语
通过建立人工智能技术体系架构,可以理清人工智能技术发展的瓶颈,明确人工智能技术发展路线,促进人工智能的应用,使人工智能研究和应用领域形成共识,从而推动人工智能的持续发展。
[1]KurzweilRay.奇点临近[M].李庆诚,董振华,田源译.北京:机械工业出版社,2011,10,1.
[2]徐贵宝.语音控制互联网交互及其关键技术研究[J].电信网技术,2013,01∶31-35.
Atechnological architecture of artificial intelligence
XUGuibao
The connotation of artificial intelligence is clarified firstly by discussing of the definition of artificial intelligenceand its relationship with the human intelligence. Then with this base, a two- layer technological architecture of ArtificialIntelligence is brought with the core layer and the key technology layer. Final, blocks of algorithm and theory, perception,thinking, action are described in detail.
artificial intelligence;technological architecture;core layer;key technology(
2016-11-20)