人工智能及其关键技术
2021-07-29广州科技职业技术大学自动化工程学院罗国荣
广州科技职业技术大学自动化工程学院 罗国荣
近年来,随着社会生产和社会服务的需求,人工智能也成为学者研究的热点之一。本文首先介绍人工智能的概念,梳理人工智能发展历程;其次,概括人工智能产业生态及关键技术。
人工智能是包含计算机、生物、数学、思维、逻辑、控制等多学科的一门新科学,目的是计算机或者机器能像人类一样能进行思考和学习,并完成需要人类智能才能完成相关的工作任务,如人类的语言识别、图片识别、无人驾驶、工业机器人等。它是拓展人类的感知和思维的一种方式,是人工制造出来的计算机系统,主要用于提高人类社会生产效率和人类社会生活水平。目前,人工智能在许多领域取得了显著的成绩。
1 人工智能的发展历史
人们对人工智能的研究到目前为止已经有60多年的历史了,其发展过程曲折,有起有伏。1950年阿兰·图灵提出了一个“图灵测试”,为人工智能的思维方式展奠定了良好的基础;1956年,约翰·麦卡锡在达特茅斯学院提出了“人工智能”一词,正式确立了AI这一术语,随后人工智能得到较快的发展。但发展到70年代,由于当时的计算机性能不足、数据少,复杂问题难以解决等原因,导致人工智能的研究学者失去信心,发展一度停滞不前,时间长达6年。直到1980年,卡内基梅隆大学开发了以人工智能为基础的“专家系统”,并成功应用于商业,又点燃了研究学者对人工智能的希望,进入一段平稳发展阶段。1997年,由于计算机技术和数据获取的快速发展,使得计算和数据获取能力大幅提升,促进了人工智能的发展,IBM以人工智能技术开发的计算机系统“深蓝”战胜了国际象棋世界冠军卡斯帕罗夫,引起了人们的极大关注,这一年被认为是人工智能发展的一个重要里程,之后人工智能的发展进入了快车道,加入人工智能的研究人员越来越多,开启了人类对人工智能的新一轮探索。
2 人工智能产业及关键技术
人工智能可分为运算智能、感知智能、认知智能三个阶段。运算智能主要是算法与数据库相结合,使得机器开始像人类一样会计算和传递信息;感知智能是数据库与浅层学习算法结合,使得机器能看懂和听懂,并做出判断、采取行动;认知智能使得机器能够像人一样思考,主动采取行动。人工智能涉及的面广,其产业链结构划分为AI基础技术层、AI技术层和AI应用层。
基础技术层涉及数据资源的获取、计算能力的提升和计算机硬件平台性能的提高。数据资源获取是人工智能机器学习训练的基本素材,获取数据并学习数据,使机器不断地积累经验,智力不断地贴近人类。数据资源需要物联网和大数据技术的支持,物联网领域涉及传感器技术和数据通信技术,传感器技术为人类获取可利用的数据提供了便利,使得数据得以爆炸式增长;数据通信技术特别是5G无线技术的发展,为数据的传输提供了坚实的基础。而大数据技术领域可细分为数据采集、数据规范、数据安全、数据储存与管理、数据分析与挖掘、数据运维和数据运用等七个方面,在数据的存储、分析方面直到重要的作用。
计算能力与计算机硬件密切相关,硬件资源包括芯片研发、存储设备开发等。其中,芯片是运算能力的核心,目前芯片厂家都在大力发展AI芯片,其中AI芯片主要类型有GPU、FPGA、ASIC和类人脑芯片四种。
AI技术层主要是研究人工智能框架与算法。其中框架有TensorFlow,Caffe,Theano,Torch,DMTK,DTPAR,ROS等框架。人工智能算法按照学习方式的不同,可分为传统机器算法和机器学习算法,其中传统机器算法是一种由人工编程和逻辑计算的算法,受控于程序的设计,不具备适应外部变化的能力,是一种弱人工智能。而机器学习算法又可细分为监督式学习、非监督式学习、强化学习等算法。人工智能算法的关系如图1所示。
图1 人工智能算法的关系
监督式学习算法根据已知的输入数据集和已知的数据响应结果训练模型,让模型调整自身的参数达到最佳的状态,并能够根据新的输入数据对未来的输出响应合理的预测。这种算法需要对输入数据集进行标识,通过标识让输入数据与输出响应进行关联,其可采用分类和回归技术开发预测模型。如图2所示。分类技术主要是针对具有离散特性的输入数据,这类算法有决策树、支持向量机、贝叶斯、K-近邻算法、逻辑回归、随机森林等。回归技术则是针对具有连续特性的输入数据,这类算法有线性回归、最小二乘回归、Loess局部回归、神经网络等。
图2 机器学习
无监督学习是从未知的输入数据集中挖掘数据集中隐藏的模式或内在结构,不需要对输入数据集进行标识,其算法主要包括聚类和降维算法。聚类是通过探索性数据分析发现数据中隐藏的模式或分组。降维是将原数据的特征空间的维度减小,以达到去除数据冗余、降低数据计算量和提高识别精度的目的。深度学习是机器学习的一个特殊分支,它模拟人类人脑神经网络,不需要手动输入数据的相关特征进行建模。常见的算法模型有卷积神经网络、循环神经网络和深度Q网络。
强化学习也是机器学习的一个特殊分支,它采用的是奖励惩罚机制,输入数据作为对模型的反馈,检查模型的对错,对就奖励,错就惩罚,模型作出调整后,再利用输入数据进行下一轮的对错检查,循环迭代。从而提高模型的准确度。其常见算法包括Q-Learning以及时间差学习(Temporal difference learning)。
人工智能按应用技术类型可分为计算机视觉、机器学习、自然语言处理和机器人。
计算机视觉主要是研究从图像数据源中通过图像识别技术识别出物体、场景和活动的问题。图像识别是计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。识别过程包括图像预处理、图像分割、特征提取和判断匹配。机器学习研究的是对大量已有数据的处理分析和学习,从而拥有预测判断和做出最佳决策的能力。其核心在于机器学习是能从数据中自动发现模式,模式一旦被发现便可用于做预测。自然语言处理研究伯是对人类语文的识别、理解、处理和运用,具体是通过建立语言模型来预测语言表达的概率分布,从而实现目标。如机器翻译、手写体和印刷体字符识别、语音识别后实现文字转换、信息检索、抽取与过滤、文本分类与聚类、舆情分析和观点挖掘等。机器人是将传感器、机器视觉、自动规划、自动控制等技术融合的综合体,它有能力与人类一起工作,能在各种未知环境中灵活处理不同的任务。
总结:人工智能是一门新兴学科,它是多门学科的交叉学科。人工智能作为互联时代前沿的新兴技术,将逐步渗透至各行各业,到目前为止,人工智能还存在着许多的问题,但是人工智能还是存在着很大的发展空间,而要使得存在的问题得到解决,那么就需要我们的科研人员一起去为了目标努力。