APP下载

基于Gamma隶属度的车辆图像检索算法

2019-05-05胡明娣霍艳艳

西安邮电大学学报 2019年1期
关键词:查全率查准率广义

胡明娣, 霍艳艳

(西安邮电大学 通信与信息工程学院, 陕西 西安 710121)

图像检索是在图像库的众多图像中,搜索包含指定特征或指定内容的图像[1]。随着车辆的增多,交通肇事行为也急剧增长,使得交通管理部门存在海量的图像数据,需要快速并准确地进行统计和筛选。因此,对目标车辆图像进行检索已成为图像检索的重要研究方向。

自然场景下,车辆颜色是车辆最为显著的特征[2],且车辆颜色较为符合人眼视觉感知,所以基于颜色特征的车辆图像检索方法使用最为普遍[3]。全局颜色直方图方法[4],即一维颜色直方图法,是对颜色特征的统计,当图像颜色的空间位置信息丢失时,直方图与图像会出现一对多的情况,并且,在颜色特征统计过程中,特征维数过高。利用轻量卷积神经网络的车辆颜色检索方法,采用空间金字塔匹配(spatial pyramid matching,SPM)策略划分特征图[5],对每个SPM子区域进行编码,从而生成特征向量,但此方法需要对较大图像库进行训练,不满足快速检索需求。对于这种情况,可采用模糊理论[6]构建合理的隶属度函数,实现对车辆色度空间模糊信息的分明刻画,对颜色描述更精确。基于梯形或三角形隶属度函数检索方法,采用模糊直方图构造算法和模糊C均值聚类算法对图像颜色进行聚类[7-8],对量化的色度区间边缘进行模糊判断,虽然可以满足快速检索的要求,但查准率较低。

运用非均匀量化、三角形和梯形模糊隶属度对车辆图片颜色进行量化,可在欧氏距离和加权距离相似度量下,对车辆图像库进行检索[9];将Vague集引入模糊量化,通过梯形隶属度函数得到任意颜色在模糊区域的Vague隶属度值,根据欧式距离得到相似图像[10]。上述隶属度函数在对颜色进行分类时,区间宽度是由人为设置,具有较大的主观性。

为了提高基于颜色特征的车辆图像检索的准确率,本文提出一种基于Gamma隶属度的车辆图像检索算法。利用广义直方图提取的图像颜色特征,包含颜色空间位置信息,对合成分量L使用Gamma函数刻画隶属度值,从而进行相似度测量。此隶属度值的获得完全由图像自身的直方图信息获得,区别于三角形隶属度中模糊区间的人为主观性。

1 基于Gamma隶属度的图像检索算法

1.1 颜色特征提取

广义直方图[11]根据像素点间的空间相关性,较好地表达了像素的空间信息,改善了传统直方图缺少颜色空间信息的问题。一般情况下,通过广义直方图可提取图像颜色特征,获取过程如图1所示。

图1 获取广义直方图流程

图像中任意一点的像素点值,可用该点像素邻域内所有颜色像素点值的平均值表示。图像平滑效果随邻域范围的增大而增强,但是,当邻域过大时,平滑图像将会丢失图像的边缘信息。因此,采用均值滤波[12]获取平滑图像时,可选取适合邻域范围的3×3平滑模板进行图像平滑,3×3模板如图2所示。

f(i-1,j-1)f(i-1,j)f(i-1,j+1)f(i,j-1)f(i,j)f(i,j+1)f(i+1,j-1)f(i+1,j)f(i+1,j+1)

图2 3×3的平滑模板

设M×N的图像P中,任意一点(i,j)处的像素点值为f(i,j),经3×3模板平滑后像素点值为

(1)

当图像P中所有像素点值经过3×3模板平滑后,得到平滑图像Q,图像P和图像Q对应的像素点值组合形成的二元组(P,Q),为图像P的广义图像,提取广义图像的颜色特征即得到广义直方图。在广义直方图像提取颜色特征时,选用更符合人眼视觉的HSV空间,按照人的视觉感知,对分量H、S和V进行非均匀量化[13],其表达式分别为

(2)

其中,h为色调,s为饱和度,v为亮度。为方便计算,将分量H,S,V合成特征[13]

L=9H+3S+V,

(3)

图像P的特征记为Lp,图像Q的特征记为Lq,其广义直方图的特征可表示为

LPQ=LP+LQ=9HP+3SP+VP+9HQ+3SQ+VQ,

(4)

取值范围为[0,143]。

根据式(4),对图像库图像A的LPQ进行特征提取,得到广义直方图h1,同理,可获得目标图像B的广义直方图h2。

1.2 隶属度值获取

从Gamma分布中得到的Gamma隶属度函数,是对模糊信息的一种分明刻画[14]。Gamma分布的概率密度函数[14]为

(5)

其中,γ是形状参数,m是位置参数,β是尺度参数,Γ是Gamma函数。

当β=1,γ=1,m≠0时,式(5)可表示为[14]

f(x)=exp[-(x-m)]。

(6)

将颜色划分为144个颜色区间,对应为直方图颜色bin。在图像检索过程,以目标图像广义直方图第n个bin的值h2(n)替代m,即图像库图像广义直方图第n个bin值为h1(n)(n=1,2,…,144),则h2(n)和h1(n)相对于目标图像的隶属度值分别为

μ2(n)=exp{-[h2(n)-h2(n)]constL},

(7)

μ1(n)=exp[-|h1(n)-h2(n)|constL]。

(8)

constl为常数,控制隶属度值在[0,1]范围内,其表达式为

(9)

其中k=1,2,…,K,K为图像总数。

由式(8)可知,μ1(n)的取值与h2(n)有关,说明通过Gamma隶属度函数可获得广义直方图的隶属度值,从而改善了人为设定模糊区域的主观性问题。

1.3 基于Tversky的相似性测度

图像检索是度量两个图像之间的模糊相似性[15]。广义Tversky指数(generalized Tversky’ sindex,GTI)作为相似性度量函数,提供了基于人类感知的相似性评估集合理论指数[16],可表示为

(10)

z(h1,h2)=f(h1∩h2)+
αf(h1-h2)+βf(h2-h1)。

其中,α与β是赋予图像A与B独特的特征权重,当α>β时,检索结果突出A的独特特征。h1∩h2是图像A和B的共同特征,h1-h2指在图像A中存在但在图像B中不存在的特征。

对μ1(n)和μ2(n)进行相似性测度,式(10)可改写为

(11)

其中,

当直方图颜色bin的隶属度值相近时,表示两个图像的共同特征较多,而独特特征较少,意味着两个图像是相似的。在该算法中,图像A与图像B的特征权重α与β均为0.5,则式(11)可简化为

(12)

由式(8)和式(12)可推知,当两幅图像完全相同时,G值为1。

基于Gamma隶属度的图像检索算法,将图像通过3×3模板进行平滑处理获得广义图像,在HSV空间中提取图像颜色特征获得广义直方图;使用Gamma隶属度算法获得图像直方图颜色bin的隶属度值,并通过Tversky进行相似性测度,根据相似度量值排序输出检索结果。算法流程如图3所示。

图3 算法流程

2 实验及结果分析

采集291个品牌的3 237个车系全部颜色的所有车辆图像,构建车辆图像库。该车辆图像库包括正视图、侧视图和后视图等3种不同视角下的车辆视图,如图4所示。检索前将图像进行裁剪处理,统一车辆侧视图像素大小为180×80,车辆正视图及后视图像素大小为140×100。

图4 不同视角下的同一车辆图像

分别在Corel标准图像库和车辆图像库中提取车辆图像,以查准率和查全率[17]为评价指标,对比非均匀量化算法、三角形隶属度量化算法及本文算法的检索效果。

实验1在Corel标准图像库中随机选取10张图像,分别使用3种算法进行相似检索。3种算法的查准率与查全率结果分别如表1和表2所示。

由表1和表2可以看出,非均匀量化算法的查准率为70%,查全率为42%;三角形隶属度量化算法的查准率为75%,查全率为45%;本文算法的查准率为85%,查全率为51%。

实验2在车辆图像库随机选取10张图像,分别使用3种算法进行相似检索。3种算法的查准率与查全率结果分别如表3和表4所示。

由表3和表4可以看出,在车辆图像库进行检索时,非均匀量化的查准率为83%,查全率为16%;三角形隶属度量化算法的查准率为84%,查全率为17%;本文算法的查准率为92%,查全率为18%。

表1 3种算法的查准率

表2 3种算法的查全率

表3 3种算法的查准率

表4 3种算法的查全率

由上述两组实验数据可以得出,基于Gamma隶属度的车辆图像检索算法的查准率与查全率均高于非均匀量化算法和三角形隶属度量化算法,检索效果较好。

3 结语

基于Gamma隶属度的车辆图像检索算法,利用广义直方图在HSV空间提取图像颜色特征,获得特征分量L,对其利用Gamma函数寻找隶属度值,改善了传统隶属度值获取的主观性问题。最后,根据基于Tversky的相似性测度进行检索并输出相似图像。对比实验结果表明,基于Gamma隶属度的车辆图像检索算法的查准率与查全率均高于非均匀量化算法和三角形隶属度量化算法,检索效果较好。

猜你喜欢

查全率查准率广义
Rn中的广义逆Bonnesen型不等式
从广义心肾不交论治慢性心力衰竭
海量图书馆档案信息的快速检索方法
基于数据挖掘技术的网络信息过滤系统设计
王夫之《说文广义》考订《说文》析论
基于词嵌入语义的精准检索式构建方法
大数据环境下的文本信息挖掘方法
基于深度特征分析的双线性图像相似度匹配算法
广义RAMS解读与启迪
基于Web的概念属性抽取的研究