基于多特征融合和二维投影非负矩阵分解的图像检索
2016-05-14韩震
韩震
摘要:文章提出了一种基于非负矩阵分解(Nonnegative Matrix Factorization.NMF)和多特征融合的图像检索模型。通过提取图像的颜色和纹理特征,进行NMF分解,得到NMF的基矩阵和样本的系数矩阵。利用二维主成分分析(2DPCA)的思想对系数矩阵降维,然后通过特征加权的方法比较检索结果。文章使用500幅人物图像组成的图像库进行试验,该方法利用了图像的多个特征和2DPCA思想,使得文章中的方法提高了检索的查准率,而且检索速度优于非负矩阵分解和二维主成分分析。
Abstract: This paper presents an image retrieval model based on non-negative matrix factorization (Nonnegative Matrix Factorization.NMF) and multi-feature fusion. By extracting color and texture features of images for NMF decomposition, the base matrix of NMF and the coefficient matrices of samples are obtained. The two-dimensional principal component analysis (2 DPCA) idea is used for dimension reduction of coefficient matrix, and then the retrieval results are compared by using the method of feature weighting. This article uses the image library containing 500 character image for test, which uses the multiple characteristics of the image and 2DPCA idea, improving the precision of retrieval in the article, and the retrieval speed is superior to the decomposition of nonnegative matrices and the two-dimensional principal component analysis.
关键词:多特征融合;二维主成分分析;非负矩阵分解
Key words: multi-feature fusion;two-dimensional principal component analysis;non-negative matrix factorization
中图分类号:TP391.4 文献标识码:A 文章编号:1006-4311(2016)08-0228-04
0 引言
近年来非负矩阵分解(NMF)的方法被广泛地应用于图像检索[1]、图像融合[2]、人脸识别[3]等领域。1999年Lee和Seung在Nature上提出了非负矩阵分解算法理论。在矩阵中所有元素均为非负并且任意一行元素的和不为零的条件下,该算法可以对其进行非负分解,分解的结果中不出现负值。因此,每幅图像可看作是基图像的线性组合。本文对每一个降噪后的图像分别进行分解,降低分解矩阵的维度,提高运算效率。
基于非负矩阵分解算法属于一种传统算法,通过计算基矩阵(投影矩阵)和系数矩阵才能得到分析结果。但是运用维数较高的系数矩阵进行迭代求解,计算过程相当复杂,且计算量也非常大,耗时又耗力。鉴于非负矩阵分解的不足,本文提出了二维投影非负矩阵分解(2-dimensional projective non-negative matrix factorization,2DPNMF)[4]的图像检索算法,该算法打破非负矩阵分解的损失函数的计算框架,在二维主成分分析环节引入了非负性约束条件,提出了系数矩阵的计算环节,只需计算基矩阵即可完成特征提取,所以2DPNMF算法的计算分析过程用时更短,速度更快。
1 多特征融合
基于内容的图像检索是在提取图像中底层特征的基础上进行的。而图像的底层特征有很多,包括颜色特征[5]、纹理特征[6]、形状特征[7]等。图像的颜色特征即视觉特征,是最直观的图像识别因素,也是识别图像色彩的主要依据,有很强的鲁棒性;纹理特征图像检索中都会用到的一个底层特征,彩色纹理相当于局部区域中像素之间关系的一种度量,能够描述像素邻域灰度空间分布规律,或者图像的色彩及结构特点。本文提取颜色和纹理特征。
1.1 颜色特征提取
熵是度量影像纹理的随机性。当空间共生矩阵中所有值均相等时,它取得最大值;相反,如果共生矩阵中的值非常不均匀,其值较小。
在对纹理特征提取的过程中,我们对灰度共生矩阵的计算结果做简单的处理。最简单的方法取不同方向(0°、45°、90°、135°)的偏移参数,作其灰度共生矩阵,分别求出特征指标,然后对这些特征指标计算均值和方差。这种处理方法抑制了方向分量,使得到的纹理特征与方向无关。
利用以上提取的四种特征构建特征向量。颜色特征和纹理特征组成一个七维矩阵,利用非负矩阵分解进行构建系数矩阵。
2 二维投影非负矩阵分解
本文在传统的二维主成分分析(2DPCA)方法和非负矩阵分解(NMF)方法的基础上,进一步优化调整非负矩阵分解最小误差框架,提出二维投影非负矩阵分解(2DPNMF)算法,通过计算最优的投影矩阵(基矩阵)即可得到分析结果,不必再计算系数矩阵,这样既简化了迭代更新计算流程,又缩短了训练时间,大大提高了计算分析速度。
Zass等[8]提出了非负稀疏主成分分析(Non-negative sparse PCA, NSPCA)NSPCA 不再考虑非负矩阵分解算法的两类损失函数,只是把非负限制加在了主成分分析目标函数上,从而从根本上打破了非负矩阵分解框架。NSPCA先把每幅p×q大小的二维图像Ak按行(或列)拉伸为一个pq维的向Vk,V=[V1,V2,…,Vm]为全部训练样本的集合,大小为pq×m假设训练样本集包含100张64像素×64像素大小的训练图像,V的维数为4096×100。
3 实验与分析
本实验通过采用国际通用500副人物图像作为实验数据库。实验使用Matlab7.0软件在WindowXP,3.0GHz,内存2.0GB计算机上进行。实验从以下三个方面进行:
①在图像库中,在不同压缩维数和训练样本个数下,分别将NMF算法分和现有2DPNMF算法进行比较,目的是比较在不同压缩维数和训练样本个数下两种算法的检索效果。
②在图像库中,选定,分别在多特征训练样本分析中,将2DPNMF算法与一、二维算法的特征和检索效果进行对比。
③在图像库中,比较NMF(一维特征)、NMF(二维特征)、2DPNMF(一维特征)、2DPNMF(二维特征)四中方法的运行速度和准确率。
3.1 实验数据
图像库中包含了500副人物图像,每幅图像的分别率均为112像素*92像素,本案例的要求是将其处理为100像素*100像素。图1是其中的7副图像。
3.2 查准率随压缩维数的变化
通过设定不同维数和训练样本个数,对比分析2DPNMF算法与NMF传统算法的检索效果。选择以上七张图像作为训练样本,其余作为测试样本,压缩维数从1*100变化如图2所示。
根据图2所示各种算法随压缩维数以及训练样本特征的变化,总结出以下结论:
①虽然训练样本特征个数不同压缩维数不同,但是本文的算法与传统NMF算法相比,检索效果进一步优化,更具实效性。
②训练样本特征相同时,2DPNMF算法的查准率高于传统NMF算法。
③随着训练样本的增加,样本之间的特征信息越来越丰富,2DPNMF算法的检索结果优于传统的NMF算法。
3.3 算法运算时间的比较
本节通过计算NMF算法、本文2DPNMF算法与不同颜色特征融合后的运算速度进行比较如表2所示。
通过表2可以看出,本文算法简化了NMF算法中的训练算法部分,减少了损失函数的计算时间,使得整个算法的运算时间得到了提高。
4 结论
本文提出多特征融合与二维投影非负矩阵分解结合的图像检索算法,该算法不仅融合了多种特征,更全面、准确的表达一副图像,而且融合了二维投影非负矩阵分解算法,直接基于二维图像,同时非负限制能够保护图像的局部信息。2DPNMF算法不同于传统的非负矩阵分解算法,二维投影非负矩阵分解算法不在考虑非负矩阵分解的损失函数,只需计算基矩阵即可完成特征提取,不必再构建系数矩阵,简化了计算流程。实验结果证明本文算法提高了检索效率和查准率,有很大的实用价值。
参考文献:
[1]王科俊.左春婷.非负矩阵分解特征提取技术的研究进展 [J].计算机应用研究,2014,04(15).
[2]蒋娇娇.非负矩阵分解算法的改进及应用[D].北京工业大学,2011.
[3]张素娥,周军.Gabor小波变换和NMF结合的人脸识别[J].计算机工程与应用,2015.
[4]C. Boutsidis,E. Gallopoulos. SVD based initialization: A head start for nonnegative matrix factorization[J]. Pattern Recognition,2007(4).
[5]张鑫,温显斌.基于颜色特征的图像检索方法研究[J].计算机科学,2012,11.
[6]刘丽.图像纹理特征提取方法综述[J].中国图像图形学报,2009,4.
[7]付伟.基于形状特征的图像检索技术研究[J].计算机科学与技术,2007,11.
[8]Zass R, Shashua A. Nonnegative sparse PCA.Advances in Neural Information Processing Systems. Cambridge, MA:The MIT Press, 2007,1561-1568.