基于三支决策的分步约简纹身图像检索
2019-07-12胡明娣
胡明娣, 刘 标
(西安邮电大学 通信与信息工程学院, 陕西 西安 710121)
纹身图像检索技术是侦破刑事案件的手段之一[1],其方法最初主要是基于颜色、纹理和形状等底层图像特征[2-6]。为了适应纹身图像底层特征不够稳定的情形,人们引入了尺度不变特征变换(scale invariant feature transform, SIFT)特征[7-9],但在利用欧氏距离进行特征点匹配时,此法极易出错,致使检索精度不高。
在SIFT特征之外,加入纹身位置信息[10],可缩小检索范围,或将SIFT特征和全局形状特征相结合,可完善检索依据[11],此外,采用SIFT特征与词袋(bag-of-words, BOW)模型相结合的方法[12],还可避免由词袋量化引起的精确度损失。但是,这些基于SIFT特征的算法都未能顾及彩色纹身图像的颜色信息。对于彩色纹身图像,可结合SIFT特征和局部自相似性(local self similarity,LSS),实现图像特征描述[13],此法因颜色信息的引入,能使检索精度得以提高,但特征维度较大,提取效率不高,检索时间较长。
为了提高检索精度,同时缩短检索时间,本文拟给出一种基于三支决策[14-15]的分步约简纹身图像检索算法。计算经灰度化处理后待检索图像与图像库所有图像对应像素点灰度值的差异,统计差值小于某阈值的像素点在各图像中所占比例,据此以三支决策从图像库中筛选出相似图像并剔除不相似图像;提取剩余图像的SIFT特征,使用欧氏距离进行特征点匹配,再次以三支决策选取正确匹配点并剔除错误匹配点,提取其余特征点邻域色调-饱和度-亮度(hue saturation value, HSV)空间的颜色特征[16],并结合SIFT特征进行特征点匹配,进而确定出不同程度的相似图像。
1 算法分解
1.1 图像库约简
将彩色待检索纹身图像I和图像库中所有纹身图像,转化为灰度图像[13]。调整所有图像大小[17],使其与待检索图像保持一致。
将待检索图像I与图像库图像对应像素点灰度值相减得到值d,经实验设置阈值μ。若d≤μ,则把图像库图像相应像素点赋值为1,否则,赋值为0。统计图像库各图像赋值为1的像素点在该图像所有像素点中所占比例α。某图像与待检索图像I越相似,则其α值越大。
经实验寻找合适的阈值a和b。根据三支决策,若α≥b,则对应图像为相似图像,将其归入图像集P;若α≤a,则对应图像为不相似图像,将丢弃,若a<α1.2 特征点约简
对于待检索图像I以及图像集Q中的图像q,提取其SIFT特征,表征为若干128维向量。计算图像q∈Q与图像I中各特征点的特征差异,即欧氏距离
(1)
其中qk和Ik分别为图像q和图像I中各特征向量的第k个分量(k=1,2,…,128)。
对于图像q的Mq个特征点,依次计算他们与图像I各特征点的距离,并求出其最小距离与次小距离的比值r1。
为了使用三支决策,需要确定出阈值a1和b1。若某特征点对应的比值r1
对于图像q中满足a1≤r1≤b1的mq个SIFT特征点,取以其为中心,以41×41为大小的邻域窗口,根据原始彩色纹身图像,提取其HSV颜色特征[16]。所得36维特征向量与原SIFT特征,组成164维新特征向量。
利用类似于式(1)的计算方式,对于图像q剩余的mq个特征点,根据新特征向量,依次计算他们与图像I相应各特征点的距离,并求出其最小距离与次小距离的比值r2。另外确定阈值a2,若r2 优先选择P中的相似图像作为检索结果,且图像对应的α值越大,其优先级越高。若要求输出的图像在数量上超出了图像集P,则继续从图像集Q中选择相似图像作为检索结果,且图像对应β+γ值越大,其优先级越高。 通过实验确定约简步骤中涉及的参数。 选择70幅原始纹身图像,每幅图像经光照、模糊、和添加噪声等处理,得出8幅相似图像,另为每幅图像选择9幅干扰图像作为不相似图像,共同组成图像库。 随机选择一幅原始图像,计算其与图像库中其余图像灰度值的差值d,并针对不同的μ值,统计各图像对应的α值。分别求出所有相似图像和干扰图像各自α值的平均值α1和α2,它们分别代表正确或错误实现检索的概率。参数μ与α1和α2的关系如图1所示。 图1 参数μ的确定 由图1可见,在μ=5时,既能保证相似图像被正确检索的概率较高,又能确保干扰图像被错误检索的概率较低。因此,选择阈值参数 μ=5。 选定阈值参数μ=5后,以70幅原始图像为待检索图像,统计图像库中其他图像对应的α值,其中,相似图像α值最小者为0.06,不相似图像α值最大者为0.94。据此设定 a=0.05,b=0.95。 即当α≥0.95时,对应图像为相似图像;当α≤0.05时,对应图像为干扰图像;而当0.05<α<0.95时,对应图像与待检索图像的相似性待定。 另外,根据文献[8],可设定参数 a1=a2=0.4,b1=0.85。 在为确定参数值所用的图像库中,再添加2 319幅干扰图像,构成包含3 579幅图像的纹身图像库,以供对比实验所用。 对于70幅原始图像,分别使用SIFT算法、文献[13]算法和所给改进算法,在自建图像库中进行检索。输出结果包含不同数量图像时,各自查准率、查全率和平均精度均值的平均值如表1、表2和表3所示。其中,所用3种算法依次编号A、B和C。 表1 查准率对比结果 表2 查全率对比结果 表3 平均精度均值对比结果 由对比实验结果可见,改进算法的3种性能皆优于另外两种算法。 由于每幅图像所提取的特征点数不同,因此检索时间也不同。使用3种算法分别对70幅原始图像进行检索,计算每种算法的平均检索时间。结果显示,SIFT算法用时66秒,文献[13]算法用时97秒,而在不计调整图像大小所用时间外,所给改进用时仅37秒,明显快于前两种方法。 给出一种基于三支决策的分步约简纹身图像检索方法,在对图像库先行约简后,又约简了特征点的选取,在兼顾SIFT算法及其与局部颜色特征相融合算法有效性的同时,提高了图像检索的查准率和查全率。1.3 完成检索
2 实验分析
2.1 参数设置
2.2 算法评估
3 结语