一种基于Harris与SIFT算子结合的商标搜索方法
2014-09-17黄友文黄雅兰
黄友文,黄雅兰
(江西理工大学信息工程学院,江西赣州 341000)
一种基于Harris与SIFT算子结合的商标搜索方法
黄友文,黄雅兰
(江西理工大学信息工程学院,江西赣州 341000)
针对基于SIFT算子的商标图像搜索方法提取特征点耗时过长的问题,提出了一种Harris和SIFT算子相结合的商标图像搜索方法,利用角点计算量小、用时少且特征点分布均匀的优点,能够反映图像内容的结构,具有较好的稳定性。实验结果表明,与基于SIFT和基于Harris特征的商标检索方法相比,该方法既保留了Harris方法提取特征点的高效性,也解决了SIFT方法对特征点提取时间过长的问题,具有实时性。
SIFT;Harris角点;商标搜索
1 商标搜索方法
商标是人们生活中随处可见的一类图像,它给人们传递着重要信息。在现代商业体制中,商标是企业的一种品牌名称,它代表了一个企业的商品与信誉,是企业赖以存在的一种基本保障。因此在商标的分类及注册过程中,必须保证商标的唯一性。如何能够准确、快速地检索出一个商标图像与现有商标库中的商标图像是否重复,是一个值得研究的方向。目前,基于内容的图像检索[1]是根据图像的内容进行目标检索,而图像的内容可以由图像的特征来表征,因此,怎样对图像的特征进行提取才是研究的关键所在。
目前,基于 SIFT 算子[2]和 Harris算子[3]的图像匹配方法在国内外已经有了大量的研究。如刘立等人[4]提出的采用简化SIFT算法实现快速图像匹配;曹红杏等人[5]提出了利用SIFT特征进行图像的自动拼接,通过投影变换实现更精确的匹配;张春美等人[6]提出了改进SIFT特征在图像匹配中的应用,以关键点为中心,使用不同半径的圆环来构造SIFT特征描述符,从而保证了SIFT算法中的旋转不变性,而且减少了SIFT特征描述符的计算时间;冯政寿、王文清[7]提出了基于Harris与改进SIFT算法的图像匹配方法,使用Harris算子提取的角点作为图像的特征点,对每个特征点采用基于同心圆形窗口的64维特征向量表示,该算法能够在保证具有很好的匹配率的同时降低计算复杂度。SIFT算子具有良好的抗遮挡性、抗旋转性、抗噪声性,其应用领域不断扩大,比如图像拼接、图像分类等。然而,基于SIFT算子的商标检索方法存在特征点的提取时间过长、计算过于复杂等不足,从而影响了实时性。如刘瑞等人[8]提出的简化SIFT算法及其在商标图像检索中的应用,采用了圆环域结构替代原SIFT算法中的特征描述方法,虽然对特征点的计算时间减少了,但是并不能反映图像内容的结构;林传力等人[9]提出的基于SIFT特征的商标检索方法,虽然提取的特征准确稳定,但是提取特征点的时间过长,不能满足实时性的要求;而王振海[10]提出的融合HU不变矩和SIFT特征的商标检索方法是针对商标图像的形状特征提出的,能够反映图像的整体信息,但是没有解决实际应用中的实时性问题;王三虎等人[11]也提出了基于SIFT和角特征的商标检索算法,具有很好的准确率,但是对特征点既要计算SIFT特征描述符又要提取图像中的角点,花费的时间更长。因此,本文从减小计算量,提高抗畸变性能的角度出发,提出了一种结合Harris和SIFT特征的商标图像检索方法,实验结果表明,该算法鲁棒性好、检索精度高。
2 特征提取过程
SIFT算法的步骤是先对基本图像进行尺度空间的建立,然后在尺度空间中检测极值点,排除不稳定点与边缘点之后的点集称为关键点集合;计算关键点的方向是通过计算其邻域内梯度的最大方向,并把这个方向定义为关键点方向。SIFT特征点的生成过程包括两个部分:特征点的特征向量生成和特征点特征向量之间的匹配。本文采用Harris跟SIFT方法相结合的检测方法,使用提取的角点代替原SIFT特征方法中第一步和第二步所提取的关键点,其余步骤仍采用原SIFT算法的步骤。
2.1 特征向量的生成
2.1.1 特征点提取
SIFT方法的特征点提取过程如下:
1)尺度空间中极值检测。首先,基本图像与二维高斯函数进行卷积运算,即
式中:G(x,y,e)是尺度可变的高斯函数;(x,y)是图像中像素点的空间坐标;e是尺度坐标。建立DOG空间之后,在相邻的3个尺度空间中检测极值点。
2)关键点的精确。通过对关键点进行泰勒级数展开,并令其导数为0,可得到极值点的位置,即
式中:X=(x,y,e)T为尺度坐标;e为尺度因子。
本文方法的特征点提取过程如下:
Harris角点的计算公式为
式中:Harris算子是用Taylor展开去近似任意方向;Ix是x方向的差分;Iy是y方向的差分;w(x,y)是高斯函数。因为矩阵M的两个特征向量Ix和Iy与矩阵M的主曲率成正比,所以Harris角点的判定是由Ix和Iy的变化来判定,如果Ix和Iy变化均很大,则说明该点是角点,如果一个大一个小则为边缘点,如果Ix和Iy的变化均很小,则该点处于图像变化缓慢的区域。在判断像素点是否为角点时使用角点响应R,若R大于阈值,则该点为角点。
2.1.2 关键点方向的分配
对关键点为中心的邻域窗口进行直方图统计,计算其邻域像素点梯度的方向。将梯度直方图的360°范围以10°为间隔进行36等分,构造36个方向向量,并统计在各个方向上的像素点的个数。将方向向量按照像素点的数目大小进行排列,选取最大值所在的方向为关键点的主方向,同时为了提高匹配的鲁棒性,将像素点数目与最大值相近的方向向量选取为该关键点的辅助方向,实验表明,仅有较少的关键点被赋予多个方向,但可以明显地提高关键点匹配的稳定性。
2.1.3 特征描述符的计算
为了确保特征点具有旋转不变性,把坐标轴旋转到与关键点的主方向一致的位置上。然后在以关键点为中心的4×4的网络格子中,将每个格子内4个点的坐标按照高斯加权的方法相加,然后将其与特征点的对应方向进行加权可得到8方向的直方图,即得到了4×4×8=128维的特征描述向量。这种特征点的描述方法使得该算法具有较好的抗噪能力,也具有较好的容错性。最后将特征向量的长度归一化,去除光照变化的影响。
Harris算子只用到了灰度的一阶差分,所以计算简单而且对图像旋转、灰度变化、噪声影响和视点变换均不敏感,提取的角点具有全局性而且稳定性好。对角点采用SIFT的特征向量描述方法,既保证角点具有一定的抗缩放能力,还具有SIFT特征的抗旋转性及匹配的稳健性,又能够降低提取特征点的计算复杂度。
计算基于Harris和SIFT特征算法的步骤如下:
1)对原始图像进行Harris算子计算,生成Harris角点集;
2)计算角点的特征描述向量,为特征点分配方向值;3)生成特征描述子,利用特征描述符寻找匹配点。
2.2 特征向量的匹配
采用欧氏距离来度量两个特征向量之间的相似性,算法通过比较最邻近的欧氏距离与次邻近的欧氏距离之间的比值,只有当比值处于给定的范围时,该点才会被归入为匹配点集中。
本文算法应用在商标图像中,相比SIFT算法应用在商标图像中有以下优点:
1)由于SIFT算法在检测特征点的过程中,首先要多次计算高斯核函数与图像的卷积,运算量巨大,耗时很长。本文算法使用Harris角点代替极值点的生成过程,Harris角点算子的计算量很小,只需计算像素点的一阶导数和二阶导数,所以相比SIFT算子来说,节省了时间开销。
2)SIFT算法提取的特征点是在不同尺度上的极大值点,也就是具有局部性质,不能反映图像内容的结构。而本文方法提取的特征点是以图像的角点为基础,所以能够反映图像的结构,特征显著,从而可以有效地进行图像匹配。
3 实验结果及分析
采用Mircrosoft VC++6.0构建实验平台,将本文提出的算法与经典SIFT算法及Harris算法在提取商标图片的特征点方面进行了比较和分析。使用SIFT方法提取的特征点无法反映图像的视觉角点,而且提取特征点的时间过长;使用Harris角点的方法虽然计算时间大大减少,但是不具有鲁棒性和旋转不变性。
图1和图2分别为使用Harris方法和SIFT方法提取特征点的结果,而图3是使用本文方法提取特征点的结果。对商标图片提取的特征点进行分析后不难发现,本文的方法不但增加了提取的特征点的数量,而且减少了提取特征点所需的时间。
图1 Harris方法提取的特征点
图2 SIFT方法提取的特征点
图3 本文方法提取的特征点
使用Harris方法和SIFT方法及本文方法提取特征点的数量及时间如表1所示。
表1 三种方法的对比
由表1可以看出,本文方法提取的特征点数目比在同等条件下使用SIFT方法及Harris方法提取的特征点都要多,这是因为本文方法使用角点集代替了SIFT方法中极值点集,计算特征点的描述符时,也同样计算了占主方向80%以上的特征点的描述符,尽可能使描述特征点的方法更全面。同时,省去了原SIFT算法中的步骤1、步骤2,也即减少了建立图像高斯金字塔的过程,提取特征点的时间要远远小于原SIFT算法的提取特征点的时间,更具有实时性。
文章着重分析了本文提出的方法对图像噪声及旋转性的抵抗能力。图 4 为原商标图像旋转 0°,10°,20°,30°,40°,50°,60°后使用本文方法进行特征点提取的结果,表2显示了不同旋转角度下商标图像提取特征点的数量及时间,从实验结果可以看出,本文提出的算法对旋转了的商标图像具有较好的稳定性。
图4 经过旋转提取特征点示意图
表2 不同旋转角度下提取的特征点时间及数量
图5和表3为添加SNR在0~0.06 dB的高斯噪声后的图像经过本文算法处理后的结果,从实验结果可以看出,本文提出的算法对叠加了噪声的商标图像具有较好的稳定性。
图5 添加噪声后的图像提取特征点示意图
表3 不同噪声比例下图像提取特征点的时间及数量
图6和表4给出是在图像中既有噪声又旋转的情况下,采用本文方法提取特征点的结果。
表4 噪声叠加旋转图像提取特征点的时间及数量
从实验结果可以看出,本文提出的方法无论是对旋转了的图像还是对添加噪声的图像都具有较好的稳定性。
4 结论
SIFT算法能够提取大量具有尺度不变性、旋转不变性和光照不变性的特征点,是目前性能很好的能够用于图像匹配的局部算子。林传力[9]提出的方法需要花费大量的时间进行极值点的检测,虽然能够抗干扰、抗扭曲,但是时间冗余大;刘瑞[8]提出的方法其特征点不具有反映图像内容结构的性质;王三虎[11]提出的方法是在匹配时考虑权值衡量SIFT跟角点特征之间的比例关系,计算特征点的时间比SIFT算子的时间更长,其实时性更差。而本文的方法直接使用Harris角点替代原SIFT算法中检测极值点的过程,充分利用了角点能够反映商标图像内容结构的特点,既保证了提取的特征点正确稳定,又降低了提取特征点的时间复杂度。
:
[1]黄祥林,沈兰荪.基于内容的图像检索技术研究[J].电子学报,2002,30(7):1065-1071.
[2]LOWE D.Distinctive image features from scale-invariant key points[J].International Journal of Computer Vision,2004,60(2):91-110.
[3]HARRIS C,STEPHENS M.A combined corner and edge detector[C]//Proc.the 4th Alvey Vision Conference.Manchester,England:[s.n.],1988:147-152.
[4]刘立,彭复员,赵坤,等.采用简化SIFT算法实现快速图像匹配[J].红外与激光工程,2008,37(1):181-184.
[5]曹红杏,柳稼航,阮萍.基于SIFT特征的图像自动拼接[J].电视技术,2008,32(S1):146-148.
[6]张春美,龚志辉,孙雷.改进SIFT特征在图像匹配中的应用[J].计算机工程与应用,2008,44(2):95-97.
[7]冯政寿,王美清.基于Harris与改进SIFT算法的图像匹配算法[J].福州大学学报:自然科学版,2012,40(2):176-180.
[8]刘瑞,彭进业,李展.简化SIFT算法及其在商标图像检索中的应用[J].计算机应用研究,2010,27(5):1998-2000.
[9]林传力,赵宇明.基于Sift特征的商标检索算法[J].计算机工程,2008,34(23):275-277.
[10]王振海.融合HU不变矩和SIFT特征的商标检索[J].计算机工程与应用,2012,48(1):187-190.
[11]王三虎,姚望舒,凌兴宏.基于SIFT和角点特征的商标检索算法[J].计算机应用,2011,31(7):1841-1843.
Method of Trademark Search Based on Harris and SIFT
HUANG Youwen,HUANG Yalan
(School of Information Engineering,Jiangxi University of Science and Technology,Jiangxi Ganzhou 341000,China)
A new algorithm is proposed based on Harris and SIFT,in order to reduce the time of extract features in the method of trademark search based on SIFT.It makes full use of corner features’low calculation and less time-consuming,and evenly distribution.They can reflect the structure of the content of the image,also own good stability.As the experimental results show,this method not only retains the efficiency of extract Harris features,but also solves the excessive time on extract SIFT features when compared with the method of trademark search based on SIFT and the method of trademark search based on Harris,and it has well real-time performance.
SIFT;Harris;trademark search
TN911.73;TP391
A
【本文献信息】黄友文,黄雅兰.一种基于Harris与SIFT算子结合的商标搜索方法[J].电视技术,2014,38(3).
江西省教育厅科技项目(GJJ10156)
黄友文(1982— ),副教授,博士,主要研究方向为视频信号处理;
黄雅兰(1989— ),女,硕士生,主要研究方向为数字图像处理。
责任编辑:时 雯
2013-03-09