APP下载

基于深度神经网络训练与优化算法的图像分类

2023-03-29张甜甜

计算机仿真 2023年2期
关键词:阳性率神经网络分类

张 涛,唐 华,张甜甜

(湖北工业大学信息技术中心,湖北 武汉430068)

1 引言

计算机的快速发展以及大数据时代的到来,人们对各种图像的需求量也随之加大,为应对需求,各大软件提供的图像数量也不断增加[1-2]。为快速分类图像,节省传统方式所消耗的人力、物力以及时间等,将图像根据不同的类型、特点等因素划分开来[3]。图像分类作为图像应用领域的研究热点,对图像的存储、信息安全等都有着积极的作用[4]。

文献[5]提出基于优化视觉词袋模型的图像分类方法,该方法在Means算法的基础上聚类处理提取的SIFT特征,构建视觉测点,对图像类别与视觉单词之间存在的相关性和视觉单词之间存在的语义相似性进行计算,在图像分类过程中引入加权系数对重要程度进行衡量,根据衡量结果实现图像分类,该方法对特征纹理不多的图像进行分类时会产生错误匹配,无法获得图像的深度特征,导致图像分类结果的真阳性率较低。文献[6]提出基于多分辨率Trace变换的图像分类方法,该方法利用变换后的Trace进行图像分类。首先,为获取高频边缘以及低频特征的不同频率子图,在Trace变换中投入变换后的小波,并对所采集的图像非下采样小波变换,获取所采集图像的边缘信息以及融合特征;最后利用获取到的图像融合特征完成对图像的分类操作。该方法的假阳性率较高,导致图像的分类效果不理想。文献[7]提出基于GLCM-GMRF纹理特征和深度置信网络的图像分类方法,该方法以图像的纹理特点作为先决条件,反射各个像素之间的关系以及不同类型图像的独有特点,根据GLCM-GMRF特点、DBN SAR方法以及RADAR-SAT-2数据,分别利用GLCM以及GMRF获取空间灰度特点,并根据获取到的特点构建邻域像素组合以完成图像分类。该方法在图像分类过程中获取的灰度特点无法描述图像的深度特征,导致该方法假阳性率较高。

综上所述,为更准确地进行图像分类,提出基于深度神经网络训练优化与算法的图像分类方法。实验表明,该方法真阳性率相对较高、假阳性率相对较低。

2 图像分割与图像去噪处理

2.1 图像分割方法

基于FCM算法对图像进行分割处理,具体操作步骤如下:

1)为了处理量子化粒子并完成种群位置初始化操作,利用量子位实数编码将c个随机获得的样本数据组建成最初的聚类中心向量,并用其代表粒子位置,重复执行r次;

2)随机选择粒子的全局和个体最优位置;

3)通过下式计算粒子对应的适应度

(1)

4)通过下式对粒子在深度神经网络中的位置进行更新:

Δθij(t+1)=ωΔθij(t)+c1r1(Δθl)+c2r2(Δθg)

(2)

式中,Δθg表示种群的最新最优位置和当下全局最优位置两者间的角度之差,[0,1]区间的随机数是r1、r2,常数由c1和c2表示,Δθij(t)表示粒子的最新个体最优位置和当下最优位置两者间的角度之差,其计算公式如下:

5)根据量子理论在粒子个体最优位以及当前转角向量不变的情况下交换概率;

6)为达到最大迭代数或者符合收敛条件,将对第3)步进行循环操作;

7)对FCM算法的参数进行初始化操作,并将最优个体的解码数据作为初始聚类核心;

8)根据上述方法对图像进行分割操作;

9)结束图像分割。

2.2 图像去噪

在进行图像去噪时,学习型字典大多利用所采集图像的局域投入训练[9]。所研究方法利用全局以及学习型两类字典来对图像进行去噪操作。以上两类字典在图像内容有所变化时,图像性能也会随之变化。为提升图像的去噪效果,在所采集图像的纹理数量居多时可利用学习型字典;相反,如结构占比高时,则利用全局字典对图像进行去噪操作。

基于深度神经网络训练与优化算法的图像分类方法在图像分割的基础上对图像进行去噪处理。把所采集的图像通过方法2划分为两个部分,分别是纹理和结构。根据不同的方法对上述两个部分进行去噪,从而达到预期效果。但是这种方法也存在一定的问题,例如学习型字典的速度相对较慢。为解决此问题,利用双稀疏方法将学习型、固定两类字典进行结合,并保证在不影响去噪效果的基础上,对去噪流程进行了优化,具体步骤如下:

1)通过MCA算法提取所采集图像的纹理;

2)利用双稀疏字典将1)中提取的纹理进行去噪操作;

3)根据差值法提取图像结构,采用K-SVD对该结构去噪;

4)完成图像的去噪。

采用与上述K-SVD不同的方法获取字典,由双稀疏字典产生的函数计算方法为:

(3)

(4)

(5)

当实验所采集的样本信号较大时,上述式(4)的复杂度以及计算量相对增加。为解决该问题,对公式进行优化

(6)

(7)

(8)

进一步对上式进行优化

(9)

上述公式中EK和实验中采集的样本的长度一致,通过求解上式,实现图像的稀疏去噪。

3 图像分类方法

基于深度神经网络训练与优化算法的图像分类方法,利用深度神经网络提取图像的深度特征,并在多核学习的基础上实现深度特征的融合,采用支持向量机构建分类器,实现图像的分类。具体如下:

3.1 深度特征提取

为了深度提取图像特征,需要构建一个卷积神经网络,随后抽取卷积层中的特点作为深度特征。

1)通过下式(10)(11)构建数据集并对采集的图像进行标记;

lm=[lm1,lm2,…,lmN]

(10)

La=[La1,La2,…,LaN]

(11)

式中,N代表图像类型的数量,lm 代表数据集合,La代表对图像进行标记的标签,lmi=(i=1,2,…,N)代表第i类集合,Lai代表标签的集合。

2)将样本分为训练集合和实验集合两部分,分别用Tr和Te来表示。将所有图像设为n,再取出一部分用m表示,作为第一部分,剩下的n-m则为第二部分。由此得出如下两个公式

Tr=[Tr1,Tr2,…,TrN]

(12)

Te=[Te1,Te2,…,TeN]

(13)

式中,TrN代表拥有m图像的第i类训练集合,TeN代表拥有n-m图像的第i类实验集合。

3)构建卷积神经网络,由L1~L5标记1-5层,第1、2、5层分别涵盖卷积层以及池化层,第3、4层都只有一个卷积层,由fc6、fc7表示的6、7为全连接层。

4)根据所收集的实验样本进行实验。将样本数据放置到步骤3)中开始实验并输出数值,如果l层是卷积层,得出如下公式

(14)

如果l层是池化层或者全连接层,分别得出如下公式

(15)

如果卷积神经网络训练中实验样本为Ii(i=1,2,…,N×m),那么在神经网络训练中,N为采集的图像,m代表所有种类都需要有投入实验的图像。与此同时,Ii事实上不只有一个标签

(16)

(17)

根据所有样本误差,得出如下公式

(18)

(19)

将E0最小化,同时利用梯度下降法更新W,如下式

(20)

5)获得第6、7层的结果分别为fe_fc6、fe_fc7,输出的结果中均分别包含该层所有特征图像。

6)把第5)步中获得的两种不同的输出结果作为高层特征,完成图像深度特征的提取。

3.2 多核学习下深度特征的适应与融合

多核学习的意思是将最优基本核以及核函数进行比较,并将比较出的最优核函数分类以获取最优结果[10-11]。首先构建一个多核学习环境,再将提取的深度图像特征放入进行自我适应与融合操作。在这个操作中,复杂程度和多核学习的整合分类可能会受到参数的影响,为解决这一问题,对参数的选取进行筛选,选取少量且较好的参数作为基本核函数[12],公式如下

(21)

式中,μ为带宽数,xi与xj分别代表卷积层特点中第i、j张图像。

建立一个由M=10组成的融合核。融合已添加固定核函数且拥有不同高层特征的两类图像。计算方式如下

(22)

实验所选图像参数的表达缺陷问题被更改为核函数权重以及基本核的选取问题。在这个过程中,根据半无限线性规划训练法优化该函数组合并获得了最优核函数,利用最优核函数实现深度特征的适应与融合。

3.3 支持向量机的高分辨图像分类器

采用支持向量机构建图像分类器:

(23)

式中,g(xj)代表MKL-SVM中第j个预计的图像标签参数,Num代表采集参数的数量,在不同情况下输入Num有不同的表达方式,在测试集和训练集时分别为N×(n-m)、N×m。ai、yi分别表示被优化后的参数和投入训练中采集样本的数量,Km(xi,xj)在该公式中代表核函数。

为获得图像分类的结果,将融合后的测试集中图像的特征输入MKL-SVM高分辨图像分类器中,完成图像分类。

4 实验与结果

为了验证基于深度神经网络训练与优化算法的图像分类方法的整体有效性,需要对基于深度神经网络训练与优化算法的图像分类方法进行测试。本次实验的实验环境参数如下:处理器:英特尔E5-2603 v2@1.80GHz八核、内存:380GB、硬盘:IT HDD、操作系统:Ubuntu 16.04 LTS 64位、编程语言:Python2.7、学习库:OpenCV、深度学习框架:Keras。分别采用基于深度神经网络训练与优化算法的图像分类(方法1)、基于优化视觉词袋模型的图像分类方法(方法2)和基于多分辨率Trace变换的图像分类方法(方法3)进行测试,对3种方法的真阳性率以及假阳性率进行对比,测试结果如图1和图2所示。

图1 方法1、方法2、方法3的真阳性率

图2 方法1、方法2、方法3的假阳性率

分析图1、图2中的数据可知,在多次迭代测试中,方法1的真阳性率高于方法2和方法3的真阳性率,而假阳性率低于方法2和方法3的假阳性率,表明方法1的分类效果优于其它两种方法。因为方法1在深度神经网络充分获取了图像的深度特征,同时对图像的不同特点进行自我适应及融合等,将融合后的特征输入图像分类器中,实现图像分类,在提高图像分类效果的同时又能保证分类的准确性。

5 结束语

图像分类作为计算机视觉领域的重要研究之一,在计算机的高速发展状态下得到了极大重视。伴随着人们对图像日常应用要求的提高,传统的图像分类方法已经无法满足人们对图像的大量需求。在上述背景下研究图像分类方法,可以提高图像分类的准确率以及分类效果等。当前图像分类方法存在真阳性率低、假阳性率高等问题,提出基于深度神经网络训练与优化算法的图像分类方法,通过深度神经网络训练与优化算法的方法选取大量具有不同特征的图像进行训练,在提高了图像分类效果的同时又降低了图像分类的错误率。

猜你喜欢

阳性率神经网络分类
分类算一算
神经网络抑制无线通信干扰探究
分类讨论求坐标
数据分析中的分类讨论
教你一招:数的分类
不同类型标本不同时间微生物检验结果阳性率分析
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
密切接触者PPD强阳性率在学校结核病暴发风险评估中的应用价值
肌电图在肘管综合征中的诊断阳性率与鉴别诊断