APP下载

基于贝叶斯算法的弱监督细粒度图像分类方法

2022-10-25崔西宁孙红雨李克龙

计算机仿真 2022年9期
关键词:细粒度贝叶斯分类

崔西宁,孙红雨,李克龙

(1. 山东科技大学,山东 青岛 266590; 2. 西北师范大学,甘肃 兰州 730000)

1 引言

图像分类是一种常见的图像处理方法,根据图像信息的不同特征对不同类别的对象进行划分。通过计算机对图像进行定量分析,将图像或每个像素或区域分成若干类别,以代替人类的视觉判读。

细粒度图像分类是近年来计算机视觉、模式识别等领域的研究热点之一,其为一种类似于传统图像分类任务的分类方法。由于细粒度图像的信噪比很小,而具有足够分辨力的信息通常只存在于很小的局部区域,因此细粒度图像的分类比一般的图像分类更具挑战性。该方法只需对图像进行分类就可以解决局部区域的定位问题,并在保证分类精度的前提下,可以有效地减少计算量。

细粒度图像的分类是一项具有挑战性的任务。常用的弱监督细粒度图像分类方法主要有基于卷积神经网络的细粒度图像分类方法和基于多通道视觉注意力的细粒度图像分类方法等。为了达到较好的分类效果,通常需要同时对特征进行分类和提取。首先,图像中存在许多噪声问题,如光强不一致、图像背景复杂、目标遮挡等。这种情况严重影响了区域测试。在细粒度分类问题中,鉴别信息往往存在于细粒度的局部区域,导致类间差距大、类间差距小的现象。因此,上述两种传统方法充分利用了细粒度分类问题的特点得到了分类所需的信息。但因细粒度图像具有类内差距大、类间差距小的特点,导致传统方法的分类效率难以有所突破。

为此,本文基于贝叶斯算法设计了新的弱监督细粒度图像分类方法。贝叶斯算法是一种基于概率和统计知识的分类算法,通过对贝叶斯算法的设计和分析,可分析图像区域和强区分域之间几何关系的不同,在不同的分类能力中找到强区分域,从而提高细粒度图像分类的精度。

2 弱监督细粒度图像分类方法设计

常规的人工图像特征在表达图像信息方面的能力有限,且缺乏足够的区分度,难以达到理想的分类效果,限制了细颗粒图像分类的发展。但贝叶斯算法的出现,成为提高细粒度图像分类性能的一个重要因素。

为此,对弱监督细粒度图像分类方案进行了优化设计,在充分分析弱监督细粒度图像特征的基础上,设计了一种基于贝叶斯算法的分类器用于细粒度图像分类工作,以提高图像分类方法的分类效率。

2.1 设计弱监督过程

监督学习的基本方法是在训练函数的基础上,将样本特征映射到带有负数的分类空间。期望函数对未知数据保持良好的泛化性能。如果已知数据和未知数据之间没有假定的关系,则由已知数据训练的分类器可以正确预测未知数据的类别。根据上述监督学习理论设计弱监督过程的基本结构如图1所示。

图1 弱监督过程简图

弱监控过程主要利用其自身的学习特性来完成对目标全局和局部特征的学习,不需要输入特定区域的位置信息。该过程主要分为两个阶段:预处理阶段和特征聚类阶段。在图像预处理阶段,从输入图像中生成大量的候选区域,并对这些区域进行滤波以保留具有前景的候选区域。根据特征的聚类结果,得到不同的聚类簇,并将每个簇作为区域检测器,从而实现对测试样本的局部检测。

2.2 弱监督显著性细粒度区域定位

输入细粒度图像中的任意一个目标类,在弱监督模型中,计算这一目标类的原始分数,并令其梯度等于0。然后将信号反向传播给特征图,并实施合并,从而获得热力图。最后将热力图与定向反向传播进行逐点叠加,即采用双线性插值对输入图像进行上采样,将定向反向传播和视觉效果相融合,得到显著性图。

在此基础上,利用自适应最大类间方差法,通过计算得到的阈值,将显著性特征图转化为二值化蒙板。由此对背景与前景进行区分,增大背景与前景的方差,更能突出图像这两部分的区别,设置1表示位置作为前景,0表示位置作为背景,再根据前景图采用八连通区域标记算法,确定目标区域,标注目标坐标。

为使特定图形产生的热度图在原始图形上能更直观地表现出来,采用了双线插值法,生成与原始图形尺寸相同的热度图,并与原始图形相结合,能够从原始图形中显示出不同特征的部分,大部分是在前景中,只有个别的在背景中。

双线性插值的操作示意图如图2所示。

图2 细粒度图像的双线性插值操作

为了得到未知函数在点处的值,假设函数在、、和四个点的值。在轴方向进行插值操作,计算公式如下

(1)

其中,=(,),。然后在轴方向进行插值操作,计算公式如下

(2)

综合上述轴、轴插值操作得出双线性插值结果。对于一张大小为*的显著性图,即对应*位置点,计算出一个自适应的阈值根据阈值设计,将显著性图转为二值图,公式如下

(3)

式中,为二值化数值,为第通道的特征图,为计算出的阙值。

扫描利用式(3)得到的二值图,并筛选出待合并的像素点,对其实施有效标记。根据获得连通区域标记,获得目标区域的定位结果。

2.3 细粒度图像特征提取与量化

细粒度图像的各个部分所包含的信息量是不同的,因此,其对各种细颗粒图像的准确识别贡献也不同。信息丰富的局部区域包含更多的特征信息,有助于提高对不同细粒度图像的正确识别能力。因此,在最终的特征表达中,强调用更有效的信息分析局部区域的细粒度特征,用较少的信息弱化局部区域特征。

为了进一步提高模型的分类性能,有效地整合了不同判别区域的特征信息,并对细粒度特征进行了不同尺度的加权和约束。

在细粒度图像中采用不同的特征权重可以保证关键特征信息的处理,减少无效特征信息对最终分类结果的干扰,从而大大提高了分类性能。

假设输入一段细粒度图像序列,将其记为,其中,表示第个序列,总共包含个序列。利用3个尺度图像的特征作为输入序列,即的取值为3,则存在

=(+-1+)

(4)

式(4)的计算结果表示在序列中隐藏层的输出,分别为输入层到隐藏层以及隐藏层到隐藏层的权重矩阵,为隐藏层的偏置,而表示激活函数。

在上述研究的基础上,经过细粒度图像的特征提取与量化,得到的输出结果为

=(+)

(5)

式(5)中,表示隐藏层到输出层的权重矩阵,分别表示输出偏置和激活函数。在取值为3的情况下,得出的即为最终的特征量化结果。

2.4 设计贝叶斯分类器

结合上述提取的细粒度图像特征,基于贝叶斯定理,通过训练大量样本来估计后验概率。

使用贝叶斯分类器必须满足以下两个条件:一是判断分类的类别数是确定的,二是对于每个类别总体的概率分布是已知的。在满足上述两个条件的情况下,设计贝叶斯分类器的工作模式,如图3所示。

图3 贝叶斯分类器工作模式图

按照图3中的工作模式,定义(|)表示在已知事件发生的前提下,事件可能发生的概率,其求解公式为

(6)

贝叶斯分类器的最终任务就是将给定的样本对象划分到后验概率最大的类中,其过程如下

(7)

式(7)中,为细粒度图像的类集合,(|)表示样本的属性服从高斯分布对应的函数。然后基于贝叶斯算法的运行机理,得到分类过程如下

(8)

式(8)中,()表示事件发生的概率,为细粒度图像属性的权值。

2.5 实现弱监督细粒度图像分类

用上述设计的贝叶斯分类器对提取并量化的弱监督细粒度图像特征进行代入,对相关概率和不相关概率进行综合判断,得到合适的检索结果。设用户反馈的相关图像集合为,不相关图像集合为,使用统计方法可以估计出概率。定义贝叶斯分类判决式为

()=lg[(|)]-lg[(|)]

(9)

式(9)中,(|)和(|)分别表示输入的弱监督细粒度图像为符合或不符合对应图像类型。式(9)得出的计算结果越小,表示越符合用户的检索要求,即属于对应的分类类型。

3 对比实验分析

以测试的基于贝叶斯算法的弱监督细粒度图像分类方法的分类效果为目的,设计对比实验。实验中,将传统的基于卷积神经网络的细粒度图像分类方法(方法1)和基于多通道视觉注意力的细粒度图像分类方法(方法2)作为对比方法。实验过程中,需保证不同方法的运行环境均相同。

3.1 实验环境

实验环境基于Python语言开发,并利用开源Google TensorFlow框架Keras实现了贝叶斯算法结构。以开放源代码TransE和TransR为基础,采用Gensim语言实现了Word2Vec的文本分式表示学习算法,实现了知识库表示学习。实验过程中,用代码的形式将三种图像分类方法代入到主测机上。

3.2 细粒度图像数据集样本与验证标准

为提高实验结果的可靠性,选择caltech-101图像库和caltech-256图像库进行分类识别实验。其中,caltech-101图像库包含动物、建筑物、车辆、花卉植物的101幅图像,每个图像包含31-800幅图像;caltech-256图像库包含256个图像,每个图像至少包含80个图像。

本实验在图像分类方面采用了一种通用的方法,将图像集中的每种图像随机分为训练图像和测试图像。实验从数据库中选取500幅细粒度图像,其中动物图像101幅,建筑物图像122幅,植物图像92幅,车辆图像98幅,人物图像87幅。

3.3 设置评价指标

在细粒度图像分类性能检验中,主要应用的指标为分类效率。该指标由分类精度和分类时间开销两部分组成。其中,分类精度主要是分类样本中正确分类样本数量占总实验数量的比值。而分类时间开销为样本图像输入到分类结果输出的时间。

为了保证时间开销的统计精度,采用调取图像分类运行后台数据的方式得出测试结果。为了避免实验操作对实验结果产生的影响,进行多次实验,并通过求解平均值的方式得出分类精度的计算结果。

3.4 弱监督细粒度图像分类效率对比结果

为避免实验结果过于单一,在相同的实验环境下,重复进行4次实验。

3.4.1 细粒度图像分类精度对比结果

将三种不同分类方法输出的图像分类结果与设置的数据标准进行比对,得出有关于图像分类精度的对比结果,如表1所示。

表1 图像分类精度对比数据表

结合表1中的数据可以得到,基于卷积神经网络的细粒度图像分类方法和基于多通道视觉注意力的细粒度图像分类方法的分类精度分别为0.9305和0.9705,而本研究设计的基于贝叶斯算法的弱监督细粒度图像分类方法的平均分类精度为0.9885,明显高于两种对比方法。

3.4.2 细粒度图像分类时间开销对比结果

对图形分类起止时间的调取和计算,得出不同分类方法时间开销的测试对比结果,如表2所示。

表2 时间开销对比数据表(s)

根据平均值的计算原理可知,基于卷积神经网络的细粒度图像分类方法的平均时间开销为11.575s,基于多通道视觉注意力的细粒度图像分类方法的平均时间开销为9.575s,而本文方法的平均时间开销为5.55s。

综上所述,相比于两种传统的细粒度图像分类方法,本文方法的分类精度有所提高,且消耗的分类时间有所缩短。因此可知,基于贝叶斯算法的弱监督细粒度图像分类方法的分类效率有所提升。

4 结束语

图像作为最直观的信息来源之一,在军事、医学、科技和人们日常工作、学习和生活中都产生了重要影响。目前,挖掘图像细粒度信息已难以满足社会生产及人们的日常工作需求,对细粒度图像展开有效分类至关重要。

本研究基于贝叶斯算法的应用,在传统分类方法的基础上,将细粒度图像的分类精度进一步提高,并通过实验证明了该方法具有较高的应用价值。

猜你喜欢

细粒度贝叶斯分类
基于贝叶斯定理的证据推理研究
基于贝叶斯解释回应被告人讲述的故事
在线评论情感分析研究综述
基于型号装备?角色的IETM访问控制研究
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究
按需分类
基于web粒度可配的编辑锁设计
教你一招:数的分类
说说分类那些事