APP下载

探讨新时代背景下新兴技术在人工智能中的应用

2018-08-13梁子鑫

软件 2018年7期
关键词:图像识别人脸识别深度

梁子鑫



探讨新时代背景下新兴技术在人工智能中的应用

梁子鑫

(北京工业大学,北京 100124)

近年来随着移动互联网、云计算、物联网、大数据以及智能制造技术的不断发展和突破,人工智能技术得到了迅猛的发展,各行各业都开始逐渐出现能够替代或者辅助人类完成复杂任务的一些技术或机器,给人们带来了极大地便利。本文从人工智能基础理念出发,对人工只能发展现状、主要应用领域以及新时代常见的人工智能基础进行了阐述,最后重点针对深度学习在人工智能中的应用进行了分析。

人工智能、深度学习,人脸识别,图像识别

0 引言

2016年,谷歌旗下DeepMind公司开发的AlphaGo横扫围棋界各大高手,将人工智能技术淋漓尽致展现在公众面前,成为2016年度热度最高的科技话题。随着近几年科技的迅速提高越来越多人工智能产品走进生活方方面面,例如家用机器人、医疗机器人、工业机器人等,为生活带来极大便利同时为人类发展做出了一定贡献[1]。

人工智能(Artificial Intelligence, AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,是指由人工制造出来的系统所表现出来的智能。人工智能目前在计算机领域内,得到了愈加广泛的发挥。并在机器人、经济政治决策、控制系统、仿真系统中得到应用。通俗来讲就是利用计算机来模拟人类某部分思维过程的行为,然后通过生产出与人类智能相似的智能机器学科。人工智能从诞生以来其应用领域在不断的扩大,不难想象未来人工智能的产品将会是人类智慧的容器,将会带领我们走进一个全新的时代,改变生活方方面面[2]。

1 人工智能发展及应用

人工智能真正诞生于20世纪的40-50年代,这段时间里数学类、工程类、计算机等领域的科学家探讨着人工大脑的可能性,试图去定义什么是机器的智能。在这个背景下,1950年Alan Turing发表了题为“机器能思考吗”的论文,成为划时代之作,提出了著名的图灵测试去定义何为机器具有智能,他说只要有30%的人类测试者在5分钟内无法分辨出被测试对象,就可以认为机器通过了图灵测试。

图1 图灵测试示意图

到1956年举办的达特矛斯会议,人工智能达到了第一次发展黄金时期。会议上,John McCarthy第一次提出了人工智能的概念,会议后大批研究者开始涌向这个研究领域,展开计算机、人工智能的研究。到了70年代,由于计算机技术的限制,导致一些大计算量以及复杂计算无法开展,人工智能热度得到了暂时下降,在这一阶段,有一些研究人员将人工智能分为了难以实现的强人工智能和可以尝试的弱人工智能。随着70年代后期,专家系统的实现,研究人员开始关注于利用数字化的知识去推理,模仿某一领域的专家去解决问题,随后“知识处理”开始变得火热,成为了人工智能研究重点[3]。

专家系统之后,人工智能的研究开始转向机器学习,机器学习的目的就在于让机器具备自动学习的能力,通过算法使得机器从大量历史数据中学习规律并对新的样本作出判断识别或预测[4]。在这一阶段IBM成为了全世界研究人工智能技术的领袖,1996年深蓝(基于穷举搜索树)战胜了国际象棋世界冠军卡斯帕罗夫,2011年Watson(基于规则)在电视问答节目中战胜人类选手,特别是后者涉及到放到现在仍然是难题的自然语言理解,成为机器理解人类语言的里程碑的一步。

2000年之后,深度学习的理念开始逐渐出现在人工智能研究中,尤其是2013年,麻省理工学院技术评论将深度学习评为十大突破性技术之首后,全世界开始掀起了深度学习的人工智能浪潮。在这一方面,谷歌的DeepMind站在了人工智能深度学习的前沿,其旗下AlphaGo更是人工智能的代表性产品[5]。

当前,人工智能无异于互联网行业最热的词汇,其在无人驾驶、智能机器人、图像识别以及语音识别领域的广泛应用全方位的改变着我们的生活方式,为接下来科技的革新以及经济发展带来了新的挑战和机遇。

2 深度学习在人工智能中应用

2.1 深度学习基本概念

机器学习的发展分位两个阶段,起源于上世纪20年代的浅层学习(Shallow Learning)和最近几年才火起来的深度学习(Deep Learning)。浅层学习的算法中,最先被发明的是神经网络的反向传播算法(back propagation)主要是因为当时的训练模型是只含有一层隐含层(中间层)的浅层模型,浅层模型有个很大的弱点就是有限参数和计算单元,特征表达能力弱。目前制约机器学习的几大条件包括算法速度以及易用性和系统性能等。目前国际以及国内很多组织都开展了公众机器学习平台,例如百度的“深盟”以及腾讯阿里等都相继展开深度学习技术的研究。目前,典型的深度学习模型结构上可以分位3类:

(1)生成性深度结构

目前生成性深度结构中研究比较广泛的深度学习结构有深度信念网络(Deep belief network)等。如图2所示,深度信念网络结构是由一系列受限制的玻尔兹曼机(RBM)组成,玻尔兹曼机是一个随机无向图模型,模型内可见层和隐藏层单元彼此互相连接,然后层内没有连接,,隐层单元可获取输入可视单元的高阶相关性,为了得到生成性权值,在模型预训练中采用了无监督贪心逐层实现的算法来实现。深度信念网络可以得到观测数据以及各节点的联合概率分布,有利于先验概率和后验概率的估计[6]。深度信念网络具有应用广泛而且灵活性较强和易于拓展的优点,但是深度信念网络的输入只是简单的图像矩阵一维向量化,没有考虑到图像的二维结构。

(2)区分性深度结构

卷积神经网络(CNN)是已知公认的第一个成功训练多层网络结构的学习算法,利用了BP算法进行设计并训练。卷积神经网络是一种适应二维人脸图像识别场景的有用算法,近几年被广泛应用在人脸识别问题上。主要用于识别位移以及缩放和其他一些形式扭曲不变性的二维图像。因为卷积神经网络特征监测层是利用训练数据进行学习因此可以避免显式的特征提取,可以隐式的利用训练数据进行学习[7]。尤其是多维输入向量的图像可以直接输入网络,避免了特征提取和分类过程中数据重建的复杂度。图3所示为图像分类的两层卷积神经网络示意图。

(3)混合型结构

混合型结构的学习过程包含生成性部分和区分性部分,通常会利用最优化和区分性深度网络模型来进行解决。区分性网络寻优过程通常是由是附加一个顶层变量来估计任何深度生成模型或者非监督深度网络中的参数。可以利用BP算法来对深度信念网络的权值进行优化,初始权值可以通过玻尔兹曼机和深度信念网络预训练中得到,而不用进行随机产生[8]。这种混合型网络通常要比仅使用BP算法单独训练的网络性能要优越很多,此外,与与前馈神经网络相比,其训练和收敛时间得到了很大提高。

图2 深度信念网络结构

2.2 深度学习重要应用领域

深度学习首先在图像、声音和语义识别取得了长足的进步,特别是在图像和声音领域相比传统的算法大大提升了识别率,深度学习是仿人来大脑神经感知外部世界的算法,而最直接的外部自然信号莫过于图像、声音和文字(非语义)[9]。

(1)图像识别

图像识别是深度学习最早尝试的领域,Yann LeCun教授早在1989年就开始了卷积神经网络关于图像识别的研究,最开始,用来识别一些小规模(手写字)的图像,并取得了一定的成果,但是接下来几年关于大规模图片也就是像素丰富的图片上一直没有突破口。随后,直到2012年,Hinton教授和他的团队成员在ImageNet取得了突破性成果,图像识别的精度提高了很多。2014年,香港中文大学教授汤晓鸥教授领导的计算机视觉研究团队开发了名为DeepID的深度学习模型,并在LFW(Labeled Faces in the Wild)数据库上进行了识别验证,最终验证结果为获得了99.15%的识别率,其中人类用肉眼在LFW上的识别率为97.52%,也就是说深度学习在图像识别的学术研究层面上精确度已经超过了人用肉眼的识别的精确度。

(2)语音识别

语音识别的建模方面,从最初到现在基本上都是利用混合高斯模型来进行建模,随便利用混合高斯模型可以降低语音识别的错误率,但是由于其复杂的建模程序以及实际环境的不可控因素使得模型面向商业级别的应用仍然困难,也就是说在实际由噪音的环境下语音识别程度并不高,还未达到可使用级别。随着深度学习在语音识别建模中的应用,识别错误率在以往最好的基础上相对下降30%以上,已达到商业可用的水平。在将深度学习应用到语音识别中去最早是由微软的俞栋博士和邓力博士提出,并取得了成功。随后科大讯飞、云知声、思必驰等相继开发语音识别技术并投入使用。

(3)自然语言处理

目前,深度学习在自然语言处理方面取得的成绩还达不到在图像识别以及语音识别的技术。目前关于自然语言处理模型的主流让然是基于统计的模型。首先通过语义分析提取关键词,接下来进行关键词匹配,然后利用算法判定句子功能,最后再从提前准备的数据库里提供用户输出结果。很明显,在自然语言处理上还谈不上智能,只能说是搜索功能比较强大,而缺乏真正的语言能力。目前,苹果的Siri、微软的小冰、图灵机器人、百度度秘等巨头都在发力智能聊天机器人领域,相信在未来几年,深度学习在自然语言处理方面将会取的跟图像识别以及语音识别一样的成绩。

图3 图像分类的两层卷积神经网络

3 深度学习在人脸识别技术中的应用

传统的人脸识别方法主要有主动形状模型(ASM)以及主动表观模型(AAM),此外有基于局部和全局的一些方法,如利用局部描述子Gabor,局部二值模式(LBP)进行识别以及特征脸方法和线性判别分析(LDA)等。但是由于众多外界环境或图片自身因素,例如拍照时光照、脸部姿态、表情变化、脸部遮挡等,使得传统的人脸识别方法由于模型局限性大大降低了识别的精度和准确度。

随着深度学习技术的成熟以及应用,使得学习算法可以直接从原始图像开始就进行判别性的人脸特征的学习,而且得益于现代大量人脸数据的支持,使得基于深度学习的人脸识别精度已经超过了人类自身眼睛的识别精度。深度学习通过借助图形处理器组成的运算系统然后进行大数据分析,而图像识别中人脸识别则是人工智能的一个重要评价标准,充分证明了深度学习对人工智能发展的推动作用。

通过对近几年国际上以及国内一些成功的将深度学习应用到人脸识别案列分析,例如DeepFace、DeepID、FaceNet等,这些算法都是用大量的训练数据进行算法训练,让算法从数据中学习光照、特征、表情等一些特性,最后这些算法都在LFW数据库中进行了验证,其中准确率最高的FaceNet其识别准确度达到了99.63%,超过了人眼的识别结果。其中具体算法识别情况如表1所示。

表1 深度学习在LFW中识别率

Tab.1 Recognition rate of deep learning in LFW

深度学习的出现使得人脸识别的人工智能技术获得了突破性进展,目前应用在人脸识别的深度学习算法主要用7种,分别为:基于卷积神经网络(CNN)的人脸识别方法,深度非线性人脸形状提取方法,基于深度学习的人脸姿态鲁棒性建模,有约束环境中的全自动人脸识别,基于深度学习的视频监控下的人脸识别,基于深度学习的低分辨率人脸识别及其他基于深度学习的人脸相关信息的识别[10]。

尽管目前深度学习在人工智能中获得了巨大的推广和应用,但是目前仍然存在不少急需解决的问题。首先深度学习面临着大数据训练的问题,众所周知,目前性能较好的深度学习算法其训练数据量已经达到了百万、千万级别甚至更高。而现有的一些技术在大数据中已经不太适用,因此下一步如何进行处理这些大量训练数据的大规模集群设备高效的构建成为了深度学习一个必须研究的方向;其次,目前广泛应用的深度学习算法常常依赖大数据的训练样本,但是在实际应用中,有很多问题没有众多标签数据,因此,接下来有必要进行深度学习小数据训练样本的研究,构建能够动态自主学习的深度学习方法同样是未来需要研究的方向;第三,理论问题,跟传统的一些浅层学习算法(例如支持向量机、随机森林等)比起来,深度学习还有这不少理论问题没有解决,例如如何通过理论进行最优的超参数选择;如何采用理论指导的快速训练方式;如何针对不同实际问题设计出最佳的网络结构等。

4 结论

科技的迅猛发展使得人工智能在我们生活中扮演者的角色越来越重要,而且已经开始渗透生活的方方面面。目前,人工智能发展开始进入了一个全新的时期,人工智能带来的意义可能远超第一次与第二次工业革命,改变人类未来的生活。本文从人工智能基础理念出发,对人工只能发展现状、主要应用领域以及新时代常见的人工智能基础进行了阐述,最后重点针对深度学习在人工智能中的图像识别、语音识别以及自然语言处理方面应用进行了分析,最后对深度学习在图像识别中的应用进行了详细分析。我们应该紧紧抓住人工智能发展的机遇,加大人工智能学科投资与研发力度,让人工智能更好的服务我们的生活。

[1] 闫德利. 2016年人工智能产业发展综述[J]. 互联网天地, 2017(2): 22-27.

[2] 张彬. 探讨人工智能在计算机网络技术中的应用[J]. 软件, 2012, 33(11): 265-266.

[3] 邓晔. AI数据中心成为人工智能应用的重要基石[J]. 中国公共安全, 2017(10): 59-64.

[4] 李君. 互联网信息时代的人工智能应用[J]. 电子技术与软件工程, 2017(9): 250-250.

[5] 尹宝才, 王文通, 王立春. 深度学习研究综述[J]. 北京工业大学学报, 2015(1): 48-59.

[6] 郑胤, 陈权崎, 章毓晋. 深度学习及其在目标和行为识别中的新进展[J]. 中国图象图形学报, 2014, 19(2): 175-184.

[7] 池燕玲. 基于深度学习的人脸识别方法的研究[D]. 福建师范大学, 2015.

[8] 杨巨成, 刘娜, 房珊珊, 等. 基于深度学习的人脸识别方法研究综述[J]. 天津科技大学学报, 2016, 31(6): 1-10.

[9] 2017世界机器人大会: 机器人与人工智能深度结合有待推进[J]. 软件, 2017, 38(08): 141+175.

[10] 人工智能5件大事: 能给工业4.0带来什么? [J]. 新型工业化, 2017, 7(12): 71-73.

Application of New Technologies in Artificial Intelligence under New Era Backgroud

LIANG Zi-xin

(Beijing University of Technology, Chaoyang District, Beijing 100124)

Abstract: in recent years, with continuous development and breakthrough of mobile Internet, cloud computing, Internet of things, big data and intelligent manufacturing technology, artificial intelligence technology has been developed rapidly. Some technologies or machines have emerged to replace or assist human to complete complicated tasks in all walks of life, which brings great convenience for people. Based on concept of artificial intelligence, the article summarizes development and main application of artificial intelligence, then analyzes application situation of deep learning in image recognition, speech recognition and natural language processing. Finally, it analyzes application of deep learning in face recognition for reference.

Artificial intelligence; Deep learning; Face recognition; Image recognition

TP18

A

10.3969/j.issn.1003-6970.2018.07.035

梁子鑫(1997-),男,本科。研究方向:人工智能,信息安全。

本文著录格式:梁子鑫. 探讨新时代背景下新兴技术在人工智能中的应用[J]. 软件,2018,39(7):166-169

猜你喜欢

图像识别人脸识别深度
人脸识别 等
深度理解一元一次方程
揭开人脸识别的神秘面纱
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
深度观察
深度观察
图像识别在物联网上的应用
深度观察
图像识别在水质检测中的应用