APP下载

改进的流形学习图像稀疏降噪方法

2013-08-31张德国汤一彬朱昌平韩庆邦

实验室研究与探索 2013年7期
关键词:拉普拉斯流形字典

张德国, 汤一彬, 朱昌平, 韩庆邦

(河海大学江苏省输配电装备技术重点实验室,常州市传感网与环境感知重点实验室,江苏常州213022)

0 引言

图像降噪一直是图像处理领域中的热点问题,各国学者致力于通过各种信号处理手段获得更优质的图像。

近年来,随着对稀疏编码研究的不断深入,将该类方法应用于图像降噪领域取得了一定的成果。稀疏编码的目的是寻找一组可表示该数据矩阵基向量以及数据矩阵在该组基下的映射系数,并进行近似表示。图像降噪中,一般认为噪声是一种近似误差,因此稀疏编码理论较好地符合这种假设。如文献[1]将经典KSVD方法应用于图像降噪处理中并获得了比传统降噪方法更优的效果。虽然稀疏编码可有效地采用数据压缩的方法提取图像特征,其本质上是一种纯数学的方法,往往忽略数据间内在结构,从而不能充分地对信息加以利用。

信号处理中的流形学习理论,恰是一种挖掘数据内在结构的有效方法。该方法可发掘高维数据中隐含的变量(低维数据),而这些隐含变量则往往以组合型的非线性流形嵌套在高维欧式空间内[2]。在稀疏理论中,虽然稀疏信号的维数可能高于原始信号维数,但稀疏性的存在却可将该稀疏信号视为低维信号,从而保证流形学习方法在稀疏领域中的应用[3]。

本文将稀疏理论与流形学习相结合,提出基于拉普拉斯图谱嵌入的稀疏编码,利用拉普拉斯图谱的局部相关性,通过对权重矩阵改进,增强了表示数据间的关系,并通过稀疏理论进一步优化代表低维数据点的稀疏系数,从而实现图像降噪效果的提高。

1 基于拉普拉斯图谱嵌入编码

拉普拉斯图谱是流形学习算法中的一种数据结构构造方式。该方法通过建立无向有权图表来表示数据点间相互关系,依靠图形的嵌入结构寻找低维数据点的表示,并在低维数据空间的映射中保持该关系。其核心思想在于,对于高维空间上邻近的样本数据,其低维流形上也应该邻近,并趋向于具有相同的类别标记[4-5]。

1.1 稀疏图谱嵌入

对于给定的数据矩阵 Y= [y1,y2,…,yn]∈Rm×n,可通过拉普拉斯图谱构造数据的局部流形结构,并用一个简单的k阶近邻图来简化该拉普拉斯图谱法,进而产生权重矩阵L=H-W。其中,拉普拉斯矩阵W中各元素表示数据点间的对应距离。当两数据点yi与yj相近时,设置wij=1,否则wij=0。H为一对角阵,其对角线上元素设置为W矩阵中相应行元素wij的累加,即Hii=wij。由此可知,拉普拉斯矩阵为一对称、半正定矩阵,从而能够保证本文后续提出的流形模型属于凸优化问题范畴。

流形学习理论中,数据点之间越近,越有利于聚类。引入向量 x= [x1,x2,…,xn]T∈Rn×1,并构造函数式[6],

式中,向量x中各分量xi与数据点yi相对应。根据权重矩阵的设置,当邻近数据点yi、yj间距离较小时,式(1)数值变小,从而最小化目标函数可确保xi、xj对应的数据点yi、yj相近,有利于聚类。

更一般地,当引入向量x泛化为矩阵时,即X=[x1,x2,…,xn]T∈Rn×k,xi与数据点 y1相对应,同理可得:

由于数据矩阵 Y= [y1,y2,…,yn]∈Rm×n可用维数为m×k的字典D和维数为k×n的系数矩阵X相乘来表示[7-8],因此,将拉普拉斯图谱构造作为一种规则化条件加入稀疏理论时,可构造带约束的稀疏目标函数如下:

式中,α,β分别为加权系数。

1.2 稀疏系数重构

稀疏理论的具体算法实现,由稀疏系数获取与字典更新两部分组成[9]。在稀疏系数获取部分,一般首先固定字典,求解稀疏系数。其常用的算法有MP算法 (Matching Pursuit)[10],OMP 算 法 (Orthogonal Matching Pursuit)[11]和 BP 算法(Basis Pursuit)[12]。

1.2.1 系数获取

首先固定字典D,更新系数矩阵X,使每一个向量xi单独更新。由于字典D固定,故目标函数可改为:

本文中对于向量xi的求解,首先固定其他向量xj,j≠i,并通过优化该单个向量来解决优化问题。因此可将目标函数改写为向量形式:

并进行如下运算:首先对于单个向量xi采用稀疏系数获取算法,如MP、BP等,寻找在其他向量xj固定时的较优值,然后对xi+1按相同方法进行寻找。通过对向量x1,x2,…,xn多次迭代循环优化,直至目标函数取得一较小稳定值,此时即估计为最优解x*i,返回最优系数矩阵 X*= [,,…,x*n]。

1.2.2 字典更新

在字典更新阶段,同样首先固定系数矩阵X,对字典 D= [ d1,d2,…,dn]进行更新。由于系数矩阵固定,因此式(6)中第二、第三项均为固定值,目标函数可简化为求第一项的最小值。对目标函数简化,可得:

式中,常数c为对di的范数约束,一般置c=1。式(7)同样可采用多种算法求解,如基于迭代投影的梯度下降方法[13]等。本文选用拉格朗日乘数法求解上式最小值。令:

将式(9)进行化简,可得:

式中,Λ为一对角元素为λi的k×k阶对角矩阵,对式(10)中D与λ分别求偏导数并使之为零,即可求得极值点。对D求偏导数并使之为零,可得:

将式(11)代入式(10)得到目标函数:

2 权重矩阵重置

对于数据矩阵 Y= [y1,y2,…,yn]∈Rm×n,其在低维嵌入空间上的映射为矩阵X,稀疏编码可看做是把数据矩阵Y映射为矩阵X。根据流形学习的思想,若yi和yj邻近,则yi和yj关于字典D的基向量的线性组合系数xi和xj亦邻近[14]。邻近点的判别方法为考察对应稀疏系数的2范数是否小于某一设定门限,若xi-xj2≤δ,δ为门限值,则判定xi和xj为邻近点。

为使邻近点的约束条件在图像降噪中发挥更大作用,本文采用k近邻准则判别邻近点的同时,对权重矩阵进行重置。与yi最近的k个近邻点判定设置如下:若yi和yj互为邻近点,则在图论中将yi和yj对应边的权重置为wij=2;若yi为yj的单向邻近点,则对应边权重置为wij=1;若yi和yj互不为邻近点,则对应边权重置wij=0。重置后的权重矩阵通过调节邻近点的对应边权重,强调了单边和双边邻近点的区别,旨在提高其在流形学习中的图像降噪能力。

3 实验结果

在图像降噪实验中,测试图像大小为128×128的加白噪声图像。稀疏目标函数中嵌入系数α=0.1,k近邻点数置为5,稀疏系数获取部分采用OMP算法,循环迭代次数置为20,字典更新部分中字典的原子数为128。

图1~3 分别为对 Cameraman、Lena、Pepper的多种图像降噪方法比较。实验中,图像噪声方差为30。图中可见,加入了采用拉普拉斯图谱嵌入编码方法所获取的图像比传统K-SVD方法所得图像具有更高的峰值信噪比(PSNR)值,图像轮廓更为清晰,图像细节突出。而基于重置权重矩阵的嵌入编码方法也略优于传统嵌入编码方法。

图1 摄影者图像降噪比较

图2 丽娜图像降噪比较

图3 辣椒图像降噪比较

我们同时对不同噪声方差下的图像降噪效果进行统计,如表1所示。表中可见,对于同一幅测试图像,随着加入噪声方差的增加,图像的PSNR逐步降低。经降噪处理后,重构图像的PSNR显著提高,且噪声的方差越大,降噪处理前后PSNR提高幅度越大。拉普拉斯图谱嵌入的降噪效果优于K-SVD降噪,噪声方差为20、30、40时,采用重置权重矩阵的拉普拉斯图谱嵌入的图像降噪效果分别比K-SVD平均提高了约0.18,0.28,0.23 dB。同时可见,重置权重矩阵比传统权重矩阵方法有小幅提高,这是因为在图论中,单边邻接点存在的比重相对于双边连接和不连接的比重小。此外可见,噪声方差为10时,K-SVD降噪效果优于拉普拉斯图谱嵌入方法。这是由于在噪声方差较小时,式(4)的目标函数对于强制加入的流形学习项的优化比重增加,使得优化结果有所偏离,从而导致效果不佳。

表1 图像降噪PSNR比较

4 结语

本文将稀疏重构与流形学习算法结合运用于图像降噪方面,提出了基于重置权重矩阵的拉普拉斯图谱嵌入的稀疏编码。该方法利用拉普拉斯图谱的局部相关性,通过对权重矩阵的改进,增强数据间的关系表示,同时又通过稀疏理论进一步优化代表低维数据点的稀疏系数进行数据压缩,从而进一步提高了图像降噪效果。

[1] Aharon M,Elad M,Bruckstein A.K-SVD:An algorithm for designing overcomplete dictionaries for sparse representation[J].IEEE Transactions on Signal Processing,2006,54(11):4311-4322.

[2] Hadsell R,Chopra S,LeCun Y.Dimensionality reduction by learning an invariant mapping[J].IEEE,Computer Vision and Pattern Recognition,2006,2:1735-1742.

[3] Belkin M,Niyogi P,Sindhwani V.Manifold regularization:A geometric framework for learning form labeled and unlabeled examples[J].The Journal of Machine Learning Research,2006(7):2399-2434.

[4] Gao S,Tsang I,Chia L,et al.Local features are not lonely-Laplacian sparse coding for image classification[C]//IEEE Conference on Computer Vision and Pattern Recognition,2010,3555-3561.

[5] Belkin M,Niyogi P.Laplacian eigenmaps and spectral techniques for embedding and clustering[J].Advances in Neural Information Processing Systems,2002(15):585-592.

[6] Roweis S,Saul L.Nonlinear dimensionality reduction by locally linear embedding[J].Science,2000,290(5500):2323-2326.

[7] Rubinstein R,Bruckstein A M,Elad M.Dictionaries for Sparse Representation Modeling[J].IEEE,Proceedings of the IEEE,2010,98(6):1045-1057.

[8] Elad M,Aharon M.Image denoising via sparse and redundant representations over learned dictionaries[J].IEEE Transaction on Image Processing,2006,15(12):3736-3745.

[9] Lee H,Battle A,Raina R,A Y.Ng.Efficient sparse coding algorithms[J].Advances in Neural Information Processing Systems,2007,20:801-808.

[10] Mallat S, Zhang Z. Matching pursuit with time-frequency dictionaries[J].IEEE Transaction on Signal Processing,1993,41(12):3397-3415.

[11] Pati Y C,Rezaiifar R,Krishnaprasad P S.Orthogonal matching pursuit:Recursive function approximation with applications to wavelet decomposition[C]//Asilomar Conference on Signals,Systems and Computers,California,USA,1993,1:40-44.

[12] Chen SS,Donoho D L,Saunders M A.Atomic decomposition by basis pursuit[J].SIAM Journal on Scientific Computing,2001,43(1):129-159.

[13] Censor Y,Zenios S.Parallel Optimization:Theory,Algorithms,and Applications[M].New York:Oxford University Press,1998.

[14] Cai D,Wang X,He X.Probabilistic dyadic data analysiswith local and global consistency[C]//Proceedings of the 26th Annual International Conference on Machine Learning,2009,105-112.

[15] Cai D,He X,Han J.Locally consistent concept factorization for document clustering[J].IEEE Transaction on Knowledge and Data Engineering,2011,23(6):902-913.

猜你喜欢

拉普拉斯流形字典
紧流形上的SchrÖdinger算子的谱间隙估计
迷向表示分为6个不可约直和的旗流形上不变爱因斯坦度量
字典的由来
Nearly Kaehler流形S3×S3上的切触拉格朗日子流形
我是小字典
正版字典
基于超拉普拉斯分布的磁化率重建算法
基于多故障流形的旋转机械故障诊断
位移性在拉普拉斯变换中的应用
具有吸收项和局部源的一维p-拉普拉斯方程解的熄灭