APP下载

基于迁移学习的细粒度图像快速识别方法

2022-10-25孙令翠冯辉宗朱世宇

计算机仿真 2022年9期
关键词:细粒度图像识别静态

孙令翠,冯辉宗,朱世宇

(1. 重庆工程学院计算机与物联网学院,重庆 400056; 2. 重庆邮电大学自动化学院,重庆 400065)

1 引言

一般情况下,很难辨识细微个体间的微小差异,对局部特征进行定义较为困难,会耗费大量的精力,因此细粒度图像识别存在一定的难度。而现阶段由于深度学习技术的发展,在图像识别领域获取了巨大成功,导致越来越多的特征可以通过卷积神经网络来实现,不过该方法需要先收集图像数据,这一步骤非常耗时,仍然有优化和改进的余地。其次,若直接在细粒度图像数据集中进行卷积神经训练,则会因为缺乏数据样本,从而致使过拟合现象发生,降低模型精度。

所以,文本提出一种基于迁移学习的细粒度图像快速识别方法,通过较少的训练数据,在不借助其它标注信息的情况下,只凭借种类标签即可实现分类任务,使用迁移学习中的给定目标域以及源域,利用类内数据集作为载体,利用卷积神经网络模型预训练,最后以多层感知器模型解决分类问题,实现图像快速识别。相比常规识别方法只能在不同领域中对差别较大的图像进行识别,所提方法可以精准识别同类图像。

2 基于迁移学习的图像目标标记训练

在迁移学习中给定无标记目标域以及标记源域,它们的数据分布()以及()不同,即()≠()。通过学习,实现数据分布的自适应是迁移学习中最经常使用的办法,此方法是假设目标域以及源域数据概率的分布不同,利用一些变换直接把不相同数据分布之间的距离拉近。

所有领域的自适应为:假设以及特征空间是相同的,即=,同时,类别空间也一样,=。不过两个域的边缘分布是不同的,即()≠()。而迁移学习目标是通过标记数据对分类器学习,从而预测目标域的标签

()=()

(1)

式中:代表变换矩阵,代表源域以及目标域所合并数据,代表矩阵,具体公式为

(2)

式中:代表源域样本的个数,代表目标域样本的个数。

(3)

(4)

3 细粒度图像分类

迁移学习需要以庞大数据集作为载体,通过卷积神经网络模型进行预训练,实现高精度分类。该模型结构中,其全连接层和卷积层作为展示功能使用,softmax分类器存在于全连接层中,训练是通过正向传播以及反向调节完成操作的。在网络处理中,类训练样本所设定的个数是,因此,单向输入的样本能够表示成(()()),()以及()代表样本中已经被标记的类别。运用数字1代表目前层,此层输入的特征向量能够利用-1代表,输出的特征向量能够利用代表,另外,在该结构中,滑动滤波器权值以及偏置为。所有层的输入特征具体公式为

=(),=-1+

(5)

一般情况下,(·)代表sigmoid函数。而样本集{(,),…,(()())}中样本个数是个,卷积神经网络的模型代价函数为

(6)

(7)

(8)

式中:代表学习速率,∂表示迭代因子。利用残差作为代价,通过分析计算实验函数偏导,从而使误差达到最小,以此完成全部模型的设计,并且确保所构建模型的训练质量。在最底部的全连接层中,相应的标签可以利用多值完成展示。然后把输入至测试中,凭借softmax的分类器编程,从而估计处于不同的分类结果概率,且通过=(=|)代表最终分类结果。

4 细粒度图像快速识别研究

4.1 多层感知机模型构建

通过上述的softmax分类器函数可以得到多次感知机(MLP)分类模型,具体如图1所示。

图1 多层感知机模型

多层感知机的数据输入,是通过卷积神经网络在细粒度图像数据集中所得到的特征,输入层相应的是细粒度分类数据集中的类别数,再通过softmax函数的概率p作为输出层,就能够获取全部类别识别预测概率值。

4.2 度量指标以及损失函数分析

在对图像识别的过程中,上述细粒度模型要解决多分类的问题,类别d能够获取O个不同的数值,设定Stanford Dogs的识别任务中d∈{1,2,3,…,120}。通过softmax函数变换模式,以此获得所有图像种类的预测概率,具体公式为

(9)

式中:代表输出层第个神经元输入,代表模型预测的概率。

一般利用独特的编码代表目标类别,该编码形式把正确类别置1,而其它类别置0,而对于的识别任务,对应目标的类别编码是:(1,0,0,…,0),…,(0,0,0,…),长度是120维向量。利用损失函数实现有效编码,能够获得损失函数的具体公式为

(10)

在损失函数中添加权重的衰减项,能够获取正则化项,以此可以得到具体公式为

(11)

式中:代表训练集中的数据数目,代表网络权重参数。

将预测正确率当成模型的性能度量指标,具体正确率的公式为

(12)

式中:代表目标实际标签,()代表模型的预测结果数值。

4.3 图像识别实现

针对上述获取的损失函数,利用迁移学习将损失函数值达到最小化,再通过梯度下降来迭代权重,以此进行更新,从而找出近似解完成最优图像识别。利用梯度一阶矩以及二阶矩的估计,动态调整全部参数学习率,具体的权重迭代结果如下所示:

假设处于时刻时,目标函数相对于参数一阶导数是,具体公式为

=*-1+(1-)*

(13)

(14)

然后通过计算,可以得到具体公式为

(15)

(16)

最终获得梯度的更新方法,具体公式为

(17)

最后通过不同梯度实现静动态个体的参数调整,以此即可实现图像的细粒度识别。

5 仿真证明

为了验证本文细粒度图像识别方法是否能够达到实际应用标准,采用静态与动态图像进行识别对比分析,提升实验样本的多样化,从而能够更加有效地验证方法的适用性。本实验主要是通过摄像机拍摄方式获得目标样本,样本中共有1000张图片,静动态图像各500张。实验中,为了保证实验结果的准确性与有效性,采用Matlab软件对实验数据与图像进行处理。

5.1 图像识别

在细粒度图像识别实验中,静动态图像各随机选取一张,其中,静态图像中目标包括菠萝与凤梨;动态图像中目标包括老虎、狮子以及狗。利用本文方法分别对目标图像进行识别,观察是否能区分这些图像中的细小差异,具体如图2所示。

图2 细粒度图像识别结果

通过观察图2能够看出:在静态实验图像识别中,本文方法可以明确地将菠萝与凤梨进行识别,并以标注框信息方式进行识别结果标注,能够准确识别出菠萝与凤梨个体,细粒度图像分类后清晰地保留了二者的表面信息,菠萝叶子边缘呈现锯齿形状,而凤梨叶子光滑,以此作为识别依据;在动物图像中,同样对狗、老虎、狮子进行了有效识别,并能够正确标注名称。相比之下,静态图像识别效果要优于动态图像,这是因为抓拍运动个体,难免会出现重影、模糊等问题,导致图像边缘不清,少量目标像素被分割为背景从而影响图像识别效果。

5.2 迭代速率

为了验证本文方法的迭代速度是否能够满足现实需要,对拍摄的1000张图像进行识别,通过迭代周期和识别精度,得到本文方法的迭代速度,迭代速率结果如图3所示。

图3 细粒度图像识别迭代速率

通过观察图3能够看出,静态图像的迭代周期相比于动态图像要少,当迭代周期为9次时,其已经能够对静态图像实现完全识别,而动态图相关则需要迭代周期达到11次时才能实现对图像的完全识别,表示能够在相同时间内识别出更多的静态图像,且在同一迭代周期内,静态图像的识别精度也略微高于动态图像,迭代速度也较为理想。这是因为迁移学习法可以通过计算获得庞大的数据载体,从而利用卷积神经网络的模型完成预训练,以此能够估计处于不同的分类结果概率,实现图像快速分类识别。

5.3 识别精度

为了进一步验证本文方法的有效性,将图像识别精度作为实验指标,验证其对静态图像与动态图像的识别精度,结果如表1所示。

表1 图像识别精度

分析表1中的数据可知,采用本文方法对静态图像与动态图像进行识别时,识别精度均高于90%,识别精度较高。相比较之下,静态图像的识别精度高于动态图像,其识别精度最高值为96.3%,这是由于动态图像中影响因素较多,会对识别结果造成一定程度的影响,但是动态图像的识别精度同样能够达到较高的水准,充分说明该方法的识别效果较好。

6 结束语

本文提出基于迁移学习的细粒度图像快速识别方法,以庞大的数据作为载体,实现卷积神经网络的模型预训练,解决细粒度分类效率低、精度差问题,最终通过梯度一阶矩以及二阶矩完成识别。实验结果表明,本文方法分类精度、效率都达到理想结果,方法适用性高,但是相比之下,动态图像识别效果要低于静态图像,这是因为无法精准分析其细节特征,所以未来将引入监督学习方法,保留和补全图像边缘细节,以提升识别精度。

猜你喜欢

细粒度图像识别静态
支持向量机的舰船图像识别与分类技术
浅谈图像识别技术在打击绿通假证逃费中的应用
最新进展!中老铁路开始静态验收
静态随机存储器在轨自检算法
基于Resnet-50的猫狗图像识别
猜猜他是谁
在线评论情感分析研究综述
基于型号装备?角色的IETM访问控制研究
基于web粒度可配的编辑锁设计
基于文本挖掘的微博文本情绪分析技术研究