APP下载

深度学习在图像识别中的应用研究

2019-09-10李春晓尹振红

卫星电视与宽带多媒体 2019年19期
关键词:卷积神经网络图像识别深度学习

李春晓 尹振红

【摘要】深度学习是机器学习研究中的一个崭新的领域,它是通过模拟人类大脑的认知环节,构造结构化模型来提取特征的。整个训练过程只需要计算机的配合工作,无需人工参与就能够得到我们想要的图像识别效果。本文的主要研究方向是探究深度学习在图像识别方面的应用。

【关键词】深度学习;图像识别;卷积神经网络;深度信念网络

近年来,随着社会的进步和科学技术的发展,深度学习已经成为机器学习和人工智能研究的最新趋势之一,并已成为当今社会最热门的研究方向之一。深度学习的发展无论对计算机视觉领域还是对机器学习领域的研究都产生了巨大的影响。如今,新的深度学习技术正在不断诞生。其对大众的生活已经产生了深远的影响。本论文将通过研究深度学习在图像识别方面的应用,探索其发展的内涵。

1. 深度学习

1.1 深度学习原理

深度学习是机器学习的方法之一。其概念是由Hinton等人于2006年提出的,它起源于人类对于人工神经网络的研究。深度学习的原理简单来说就是通过组合简单的特征,形成其它更加复杂、抽象、无法明确限定的特征。它是一种基于对数据进行表征的学习方法。深度学习的具体学习过程可以理解为,计算机通过深度学习网络层级之间的参数迭代更新,使训练结果无限逼近真实值,从而达到训练目标。学习的主要途径就是通过梯度下降,在学习的过程中使用统计学知识进行算法优化。目前,深度学习已在计算机视觉,自动控制,自然语言处理和自动驾驶等领域得到广泛应用。

1.2 深度学习的发展

我们将机器学习的发展历程大致分为两个阶段,一个是浅层学习阶段另一个就是深度学习阶段。由于浅层学习无法解决那些结构更加抽象、無法形式化描述的问题。因此,促进了我们对深度学习算法的探究。

深度学习的蓬勃发展,给很多领域诸带来了积极影响。例如,对于卷积神经网络的应用,就对图像识别技术的发展起到了促进的作用。此外,深度学习的引入也对提升语音识别的正确率做出巨大的贡献。同时,它在车辆检测、交通标志识别上也取得了重大成就,甚至在交通标志分类上超越了人类。

1.3 深度学习的展望

现如今深度学习飞速发展并被广泛应用于各个领域,但是我们对于深度学习的研究仍处于发展阶段,还存在许多问题需要我们进一步解决。比如在模型结构上,人脑是一个立体结构,它同时兼顾着平面层的分布以及纵向的排列,但是当前我们运用的网络结构只有平面结构。因此为了进一步研究深度学习,我们势必要找到一种更加空间化的模型结构。另外,我们希望能在提升训练精度的情况下保持速度,但是由于深度学习的结构网络复杂,模型结构层次多,在海量数据的影响下,训练速度很容易受到影响。所以如何在保证训练精度的前提下仍能提高速度,仍需要我们更深层的研究。

2. 图像识别

2.1 图像识别技术的发展

随着科技的不断进步以及人类社会活动的多元化发展,图像识别技术的应用在我们的日常生活中愈加广泛。例如,用于医疗上的细胞病理图像识别;用于农业上的农作物病害图像识别;用于交通管制上的交通标志图像识别等等。总体来说,我们的日常生活已经离不开图像识别技术的应用及发展。从现代科技发展角度来看,科技的飞速革新必然会给图像识别技术提供更加全面的应用平台,同样的这也将给图像识别技术提出更高、更严格的要求。

2.2 图像识别技术

在我们的日常生活中,从外界获取信息的方式多种多样。例如,感知气味的嗅觉、聆听声音的听觉、品尝味道的味觉等等,但是在所有途径中我们最常用到、最不能缺少的莫过于视觉。正常人的生活离不开行走、吃饭、阅读等等,这些都要用到视觉。我们总说眼睛是“心灵之窗”,由此可以看出视觉对于我们的生活是多么的重要,它使我们的生命增添了色彩。而图像则是记录人类视觉信息的主要途径,其在我们的发展中扮演了重要的角色。

图像识别技术也就是图像的模式识别技术,它的工作模式是对图像信息进行模式化处理,建立模型、提取特征进而对图像进行分析处理,根据图像的特征信息进行识别和分类,最终达到我们想要的理想效果。

3. 基于深度学习的图像识别技术实验探究

3.1 AlexNet深度学习网络

AlexNet深度学习网络在整个深度学习网络中使用了5个卷积层和3个全连接层,其可以进行1000类别的识别。不同于其它深度学习网络,该深度学习网络同时使用了深度学习网络并行,将整个深度学习网络划分了两路,分别在不同的GPU上面进行深度学习网络训练,然后进行梯度的汇总和更新操作,由于深度学习网络的加深,该深度学习网络在图像识别任务中获得了更高的识别精度。AlexNet深度学习网络如图所示:

3.2 实验分析

3.2.1 实验平台介绍

电脑配置如下,处理器:Intel Core i5-3317,CPU主频:1.70GHz,系统内存:10GB,4核处理器。通过利用Python语言编程并使用TensorFlow作为研究的深度学习框架,在CPU上进行训练和测试。

3.2.2 实验过程及结果

该实验对12500张包含猫狗的图像进行图像识别,这里的12500张图像中10000张为训练集,2500张为测试集,每张图像进行相应的标注,0代表猫,1代表狗。利用Python语言,基于TensorFlow编程实现AlexNet深度学习网络,先利用10000张图像进行训练,训练完成后利用2500张图像进行测试。

再用训练出来的深度学习参数对2500张图像进行识别,这2500张图中有1250张猫和1250张狗的图像,下表给出测试集的识别结果。

利用训练后的深度学习数据对2500张图像进行猫狗识别,2071张图像被正确识别,识别率为82.84%。

3.2.3 实验结果分析

利用深度学习方法对包含猫狗的图像进行学习,之后对测试集图像进行识别,识别率可以达到82.84%,说明本文使用的AlexNet深度学习网络可以较好的对猫狗图像进行识别。但是识别率不是很高,主要原因是训练数据太少,可以通过扩大训练集数据量,或者进一步改进深度学习算法提高识别的准确率。

4. 结语

同其它识别技术相比,文本识别技术对深度学习网络的网络层数需求相对较少,网络所需要的计算资源也比较少,因此模型训练的时间就会相对较短。当前,深度学习技术的发展将人工智能向前推进一大步,目前基于深度学习的应用已经逐渐的在人们生活中崭露头角,各种智能化产品的出现,极大的促进人类获得更加优质的生活。但是目前的智能化技术仍然处在初级的智能化,我们仍有很长的路要走,因此还需要继续对深度学习技术进行研究,努力使得深度学习技术可以像人类一样去识别判断。如果真的有那么一天,人类才算真正的迈进了智能化时代。

参考文献:

[1]周子焜.机器学习在图像处理中的应用[J].电子制作,2018(18).

[2]李轶轩.基于深度学习的青光眼形态特征自动识别方法研究[D].北京工业大学,2018:1-75.

[3]王雨辰.基于深度学习的图像识别与文字推荐系统的设计与实现[D].北京交通大学,2017:1-73.

[4]杨金鑫.基于深度学习的细胞图像分割与识别算法研究[D].北京邮电大学,2017:1-45.

[5]Redom J,Divvala S,Girshick R,et al.You Only Look Once:Unified,Real-Time Object Detection[J].Computer Science,2016.

[6]Szegedy C,Reed S,Erhan D,e tal.Scalable,High-Quality Object Detection[J].Computer Science,2015

猜你喜欢

卷积神经网络图像识别深度学习
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
图像识别在物联网上的应用
图像识别在水质检测中的应用
基于深度卷积神经网络的物体识别算法
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究
基于深度卷积网络的人脸年龄分析算法与实现
基于卷积神经网络的树叶识别的算法的研究