基于SVD的经编贾卡织物图像检索*
2015-09-21吕红梅
张 勇 ,吕红梅 ,马 俊
(1.武汉纺织大学 数学与计算机学院,湖北 武汉 430200;2.武汉纺织大学 图书馆,湖北 武汉 430200)
0 引言
随着图像获取技术的快速发展,数字图像在人们的生活中起着越来越重要的作用,数字图像处理技术已经深入到人们生活中的方方面面[1]。本文为了充分利用纺织企业现有大量经编贾卡织物的图像资源,组建了经编图案库,从经编贾卡图案智能检索入手,探讨在“互联网+”背景下,纺织图像检索的信息化建设,从而实现“以图找图”的技术革新。目前,国内外对于经编贾卡织物图像检索的研究正处于起步阶段,主要运用基于内容的图像检索[2],常用的有颜色特征提取[3-4],此方法虽然取得了一定成果,但仍有不足之处,主要问题是准确率不高、特征维数过高、检索速度较慢。
图像特征一般以高维向量表示,但对于大型的图像数据库,高维向量的存储以及高维空间中距离的计算,其空间复杂度和运算复杂度非常高。针对这一问题,本文采用奇异值分解(SVD)的算法用于经编贾卡织物的图像检索,既能降低特征的维数,又能包含织物图像的主要信息[5]。在MFC框架的基础上利用先进的机器视觉库OpenCV对贾卡图像进行分析研究。实验表明,该方法对于经编贾卡织物适用性好,检索效果良好,准确率高,具有一定的实用价值。
1 图像采集与预处理
本文采用CCD摄像机,采集图像标准大小为256×256,分别选取不同颜色和纹理的真彩色经编贾卡织物图像,同时为了检测本文算法的准确性和模拟实际的采样误差,对于同一幅织物样品,拍摄多张图像,本次试验样本库共有200幅织物图像[6-7]。
在获得图像之后,需要做一些前期处理,主要有:(1)图像去噪,即减少采集过程中带来的噪声干扰,选用中值滤波的方式,主要去除图像中的椒盐噪声;(2)对图像的尺寸进行缩放,为了加快计算速度,本文先将图像的大小缩放为 64×64;(3)将彩色图像灰度化,将亮度矩阵作为本文研究的输入矩阵。如图1所示为织物图像预处理过程,其中图1(a)表示去噪和尺寸缩放后的图像,图 1(b)为对图1(a)进行灰度化后的图像。
图1 织物图像预处理
2 奇异值分解(SVD)算法
随着数学方法的广泛应用,矩阵分解已发展为处理大数据的常用方法。在图像处理的应用中,通过矩阵分解既可以降低图像特征向量的维数,又能够减少存储空间。奇异值分解是一种数据降维的有效手段,一般地,大的奇异值对应矩阵中的主要信息,于是运用SVD进行织物的图像处理,提取其中的主要部分,是合理可行的[8]。
令 Am×n是实矩阵,且 rank(A)=k,于是存在对角矩阵 Dm×n和两个正交矩阵 Um×m和 Vn×m,使得下式成立:
如果矩阵A代表一幅织物图像,则式(1)就是对其进行奇异值分解。将矩阵对角线上的非零奇异值元素构成一个行向量,因此,每一个织物图像对应于唯一的奇异值特征向量。SVD后的奇异值具有如下性质:(1)稳定性:矩阵元素值的微小变化不会引起奇异值大的变化;(2)奇异值与对应矩阵元素值成比例变化;(3)位移不变性和转置不变性。基于奇异值分解的优点,本文选用奇异值分解进行织物图像的特征提取。
3 相关距离测度
织物图像经过奇异值分解后,将奇异值作为特征构造每幅图像的特征向量。于是织物图像的相似性问题就转化为比较两个特征向量的相关程度。本文采用计算相关系数的方法,相关系数可以用来量化两个特征向量的相关程度。在实际应用中,更常用的是采用去均值相关系数来判断两个向量的相关程度。如式(2)所示,其中x和y分别表示两幅图像的特征向量,x和y分别表示特征向量x和y的均值,r表示2个特征向量的相关系数,其取值范围为[0,1],相关系数越接近1,表示相似性越高。
4 实验与结果分析
本实验操作系统采用Windows7,4 GB内存,开发平台为vs2012,运用MFC创建可视化的操作界面,并采用OpenCV库进行织物图像的处理。本文设计的织物检索系统主要由选择图案、选择检索目录、开始检索、显示结果等几大部分组成。
为了检验本文提出算法的适用性,与常用的颜色直方图检索算法进行对比分析。实际的织物检索过程中,对于大量图像样本库,首先应对图像库中的所有图像进行SVD来提取特征并存放在数据库中,然后选定示例图片,按公式计算它与图像库中所有图像的相似程度。按相似度从大到小进行排序,取前N幅图像显示,并将相似度大小显示在图像下方。在本文的测试实验中,直接选定图像库所在目录进行检索,并选定相似度前12的图像加以显示。结果如图2所示。
图2 实验结果比较
同时,为了量化检索的效果,引入查全率和查准率的概念。查全率和查准率是判断检索效果的常用方法。查准率是指返回的结果中相关图像的数目和已检索出的图像数目之间的比值;查全率是指返回的结果中相关图像与所有相关图像的数目之间的比值。分别定义为:
图2 中,(a)、(c) 表示 SVD 图像检索的结果,(b)、(d)表示颜色直方图检索结果。根据图2可见,本文算法有良好的检索效果。比较第一组实验图(a)和(b),对于SVD图像检索,显示的12幅图像中,有9幅图像与原织物图像相似,查准率为75%,而颜色直方图检索结果中,仅7幅图像相似,查准率为58.3%。并且在SVD中能够将颜色不同、但织物花纹纹理相似的图像检索出来,从而克服颜色直方图不能体现局部纹理信息的缺点。比较第二组实验图(c)和(d)可以看出,SVD检索效果更加良好,可认为相似图像有11幅,查准率为91.7%,但颜色直方图检索中只有4幅相似图像,查准率只有33.3%。同时在图像信息的采集过程中,难免产生测试图像与样本库中图像方向和大小的不一致性,SVD也保持了对于图像位移和旋转的鲁棒性。如表1所示,列举了其中5组实验的查准率和检索时间。由表1可以看出,SVD对于贾卡经编织物的查准率要高于颜色直方图检索算法,SVD检索算法所花时间与直方图相比较长,但相对于实际运用,已能满足要求。
图3反映了奇异值方法中图像维数与平均查准率之间的变化关系,织物图像大小分别选用8×8、12×12、16×16、20×20、24×24、28×28、32×32…64×64 时,特征向量从8维递增到64维。可以看出当维数为36时,实验效果最佳。从而选择维数为36,进一步提高检索速度。
图3 维数——平均查准率曲线图
5 结束语
随着“互联网+”概念的进一步深入以及图像检索技术的进一步发展,纺织企业转型也迫在眉睫。本文对经编贾卡图像智能检索系统的开发研究填补了纺织企业在信息化方面的空白。“互联网+客户个性需求”将是多数纺织企业转型的方向,本文设计的系统能让企业快速检索出与客户所提供的经编贾卡图案相似的图案,实现“以图找图”,从而提高生产效率,进而可以满足个性化的市场需求,同时也可避免重复开发的成本。本文主要根据经编贾卡织物图案的特点,采用SVD提取图像特征,并用相关系数进行相似度测量,通过与常用的颜色直方图检索算法比较,证明了本文提出的SVD方法检索效果良好,查准率更高,具有一定的实用价值。
[1]沈兰荪,张菁,李晓光.图像检索与压缩域处理技术的研究[M].北京:人民邮电出版社,2008.
[2]曾奇森.基于内容的图像检索相关技术研究[D].南京:南京理工大学,2007.
[3]曹莉华,柳伟,李国辉.基于多种主色调的图像检索算法研究与实现[J].计算机研究与发展,1999,36(1),179-187.
[4]程涛.基于颜色和纹理特征的图像检索[D].西安:西北大学,2010.
[5]荆晓远,郭跃飞,杨镜宇.基于奇异值特征的图像预处理及人脸识别[J].信息与控制,1999,28(2):116-120.
[6]张勇,邓中民.染色助剂在棉纤维改性上的研究[J].成都纺织高等专科学校学报,2015,32(2):29-32.
[7]张勇,孙永陪.经编间隔织物运动鞋面料工艺设计[J].成都纺织高等专科学校学报,2015,32(3):97-100.
[8]周德龙,高文,赵德斌.基于奇异值分解和判别式KL投影的人脸识别[J].软件学报,2003,14(4):783-789.