APP下载

基于卷积神经网络的图像大数据识别

2019-05-16吴海丽

关键词:图像识别分类器神经元

吴海丽

(太原学院计算机工程系,山西太原030012)

深度学习是一种在浅层网络的基础上发展而来的机器学习模型,其本质就是学习数据的本质特征,通过网络对于数据的逐层表示并进行降维,从而获得能揭示事物本质的核心特征。目前,深度学习已经在计算机视觉、无人驾驶、博弈论、自然语言处理和网络优化等方面获得了广泛的关注[1]。

卷积神经网络是计算机视觉中应用最广泛的一种深度学习网络,目前已经在各类领域中的各类图像识别任务中获得了较好的效果,如人脸识别、指纹识别、车牌识别、目标跟踪等[2-6]。然而,光照和视角的变化仍然给图像识别带来了一定的挑战,为了解决该问题:康晓东等[7]提出了一种结合图像特征数据和深度信任网络的彩色图像识别方法,在构造图像色彩数据场的前提下,通过小波变换描述图像的多尺度特征,最后通过无监督训练深度信任网络,但识别率有待进一步提高。江帆等[8]提出了一种基于CNN-GRNN模型的图像识别方法,设计了一种新的图像识别模型,通过卷积网络提取图像中的多层特征,并采用广义回归神经网络代替反向传播神经网络,从而提高分类器的泛化能力和鲁棒性。

以上这些方法主要研究图像识别方法,然而,当数据量过大时,防止网络过拟合的能力减弱,为此本文设计了一种改进的卷积神经网络图像大数据识别模型,通过在分类器中引入Dropout结构来提高网络的学习能力,最终提高网络的识别结果。

1 基于卷积神经网络的图像数据识别

1.1 卷积神经网络

卷积神经网络是随着深度学习的发展而进一步广泛应用的,在图像处理方面得到了广泛的应用。通过将卷积模板与上一层的每个特征图进行卷积,可以得到下一层的特征图,每一层的特征图都是由多个二维的平面组成。卷积神经网络是由输入层、隐含层和输出层组成。输入层主要接收未经处理的原始图像,而隐含层是多个非线性结构的神经元层,该层也可以包括卷积层、子采样层和单层的感知器。输出层则是对特征进行分类。每个神经元的结构如图1所示。

图1 卷积神经网络神经元结构

其中,SUM表示输入元素(多个维度x1,x2,x3和神经元的阈值)的加权和,F(z)表示激活函数,激活函数通常取Sigmoid函数和Tanh函数,Sigmoid函数的值域为(0,1)而Tanh函数的值域为(-1,1)。

深度卷积网络的特征提取主要是在卷积层进行的,通过对卷积层进行优化可以提高分类的准确率,一个具有7个输出类型的典型的深度神经网络如图2所示。

图2 具有7个输出类型的深度神经网络

其中,Input表示输入层,而输出层的A、B、C、D、E、F和G表示输出的7种类型,C1、S2、C3、S4是隐含层神经元,C1为第一个卷积层、S2表示第二个下采样层、C3为第二个卷积层,而S4表示第4个下采样层。

1.2 软最大化分类器

软最大化分类器可以简称为Softmax,该分类器在机器学习和深度学习中应用广泛。对于多分类的问题,分类器最后的输出有效地判断出样本所属的类别,而Softmax函数则可以将所有的输出归一化到(0,1)之间,从而将某样本归为最近于1的类别所属的分类,软最大化方法采用的归一化公式如下:

其中,Yi表示原始的第i个输出对于具有n个输出的软最大化层。

对于这n个输出,选取最接近于1的值s作为最终的识别类别:

1.3 改进的卷积神经网络模型

现有的深度神经网络模型往往通过全连接并通过BP网络进行分类,采用加入Dropout机制的软最大化分类器,该网络具有更好的函数逼近能力。

从图3中可以看出,提出的改进的卷积神经网络模型,该模型是由两个部分构成:卷积神经网络和改进的分类器网络。其工作原理为:首先将原始的输入图片输入到整个模型的输入层,然后经过整个卷积层,即一系列的卷积和下采样,得到特征图像;接着,通过一个全连接层构成一维的列向量,将该向量连入改进的分类器网络,从而得到最终的分类结果。

图3 文中所提模型

1.3.1 特征的生成

特征的生成过程可以描述为下列步骤:

(1)原始数据的输入:特征生成部分是一种端到端的模型,因此,可以直接将图片输入到模型中,而无需太多的预处理操作。

(2)隐含层是由卷积层和降采样层组成。卷积层是利用多个卷积核对上一层的特征图进行卷积操作,从而获得多个特征图像,卷积操作的公式为:

其中,x(n)和h(n)分别是卷积操作的输入和权。

因此,对于某个原始的图片map,假设上一层的特征图的输出为,而当前层的第i个特征map的输入为,权值为,且阈值为,则输出特征图表示为:

(3)池化层:池化层的目标是进行下采样,目的是进一步的降下维,池化层神经元的输出为:

其中,down()表示第l-1层的第j个特征map的下采样。

(4)全连接层:全连接层的作用是将上一层的二维结构转为单个向量的输出,当输入表示为x,输入权矩阵W和偏置向量b时,则表示为全连接层的每个神经元的输出hw,b(x)可以表示为:

1.3.2 改进的分类器

为了进一步提高所提模型的识别能力,本文在软最大化分类器的基础上进一步采用了Dropout机制。它的运行机制如下:在训练过程的每轮迭代中,随机地选择神经网络中某些层的单元并丢弃,然后开始网络的训练和优化。训练过程中每个神经元都以p的概率被保留,而以1-p的概率被丢弃。而在测试阶段,每个神经元都存在,权重参数w乘以p,则得到的Dropout的期望值为px。

采用改进的软最大化分类器作为分类器。在传统的软最大化分类器的基础上,更好地防止完了过的过拟合能力,获得更好的识别结果。

改进的分类器如图4所示。

图4 分类层网络结构

2 仿真实验

为了验证所提方法,对MNIST数据集,采用Matlab2012环境对所提的方法进行验证。实验中所采用的参数为:首先对原始图片进行预处理,将图片变换为128*128,然后将其作为输入层的输入,卷积层1采用的卷积核为6个通道的5*5的模板,接下来是池化层1,采用2*2的模板进行池化,卷积层2采用12个通道的5*5的模板,接下来是2*2的池化层2,然后是全连接层为150个。网络训练完1次和2次后得到的均方误差如图5(a)和(b)所示。

图5 均方误差预测结果

为了进一步验证所提方法的优越性,将所提的方法与原始的卷积方法、文献[7]方法和文献[8]所提的方法进行比较,结果如表1。

表1 各类方法的比较结果

从图5和表1均可发现,所提的方法具有较高的识别率,同时与其它方法相比,具有更低的误识率,在更短的时间内,能达到更低的分类均方误差。

3 结语

为了实现图像大数据的识别,提出了一种改进的深度卷积网络图像识别模型。该模型通过引入Dropout机制来建立软最大化分类器,实现对图像的有效识别。为了验证所提方法的有效性,采用MNIST图像识别数据库作为实验数据,在Matlab中进行仿真,实验结果表明所提的方法具有更高的识别准确率。同时与其它方法相比,所提的方法具有更低的误识率,在更短的时间内,能达到更低的分类均方误差。

猜你喜欢

图像识别分类器神经元
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
图像识别在物联网上的应用
图像识别在水质检测中的应用
跃动的神经元——波兰Brain Embassy联合办公
基于差异性测度的遥感自适应分类器选择
基于实例的强分类器快速集成方法
ERK1/2介导姜黄素抑制STS诱导神经元毒性损伤的作用
毫米波导引头预定回路改进单神经元控制
侧脑室注射DIDS对缺血再灌注脑损伤大鼠神经元凋亡的拮抗作用